4.2.1 재해통계 분석
최근 10년간(2010년~2019년)의 업무상 재해로 승인된 사고사망자 통계 자료를 바 탕으로 이동식사다리에서 발생한 294명을 대상으로 사고사망 재해의 특성을 분석하 였다(한국산업안전보건공단, 2010~2019). 재해 발생의 주요 특징을 분석하기 위해 업종별, 건설현장의 규모별, 공사 규모에 따른 공정률별, 사고 상병명을 분석하였다.
분석 방법은 도수분포표와 검정을 사용하였다.
4.2.2 기계학습을 이용한 이동식사다리 및 안전모 탐지
2장에서 설명한 바와 같이 기계학습을 이용한 물체 탐지는 CNN을 기반으로 여러 알고리즘이 지속적으로 개발되었다. 본 연구에서는 물체 탐지 알고리즘 중에서 YOLO(You Only Look Once)를 사용하였다(Redmon et al., 2016). YOLO는 1단계 탐 지기로 실시간에 가까운 탐지 속도를 보유하고 있어, CCTV에서 촬영된 영상에서 이동식사다리와 안전모를 실시간으로 탐지하려는 본 연구에 적합할 것으로 판단하 였다. YOLO는 현재 v1~3의 버전이 있으며, 점진적으로 속도 및 정확성에서 개선되 고 있다(Redmon & Farhadi, 2017). 본 연구에서는 YOLO v3를 사용하였다.
YOLO는 하나의 네트워크를 이용하여 물체의 위치와 종류를 동시에 예측하는 회 귀(Regression) 문제로 물체 탐지를 한다. YOLO v1의 기본적인 작동방법은 [그림 4-1]과 같이 입력 이미지를 S×S 개의 그리드(Grid)로 분할한 후, 각 그리드에 대해 2개의 경계상자를 예측한다. 각 예측 경계상자는 물체의 위치를 표시하기 위한 위 치정보(중심좌표, 크기), 경계상자 내에 물체의 존재 가능성을 나타내는 신뢰값 (Confidence)
를 가지며, 각 그리드는 클래스에 대한 확률
을 가진다. 이를 곱하여 각 경계상자의 클래스 값을 계산한다.
(4-1)이를 이용하여 일정 이상의 신뢰값을 가지는 경계상자를 합하여 결과를 표시한 다. YOLO v1은 실시간 탐지기로서 매우 빠른 속도를 보여주었으나, 정확도는 다른 실시간 탐지기에 비해서는 높지만 기존의 2단계 탐지기보다는 다소 부족하였다.
YOLO v3는 성능을 높이기 위해 기존의 알고리즘에 여러 가지 추가적인 기법을 적 용하였다. Faster R-CNN에 적용된 앵커 상자(Anchor box)의 사용, 큰 물체부터 작 은 물체까지 탐지하기 위하여 3개의 다른 크기의 특징맵에 대해서 예측 수행 등을 통해 개선하였다. YOLO v1의 GoogleNet을 기반으로 하여 24개의 합성곱층과 2개의 완전연결층을 사용한 백본 네트워크(Backbone network)는 v3에 이르러서는 합성곱 층을 53개로 확장하였다.
[그림 4-1] YOLO 모델의 물체 탐지 예시 (최승주 & 정기효, 2021)
4.2.3 데이터셋(Dataset)
기계학습 모델이 충분한 성능을 내기 위해서는 학습에 필요한 양질의 많은 데이 터가 필요하다. 이런 데이터셋을 직접 모으기에는 시간이 매우 많이 걸리게 된다.
최근 딥러닝 기술의 급속한 발전요인에는 GPU 등의 하드웨어의 발달, 적극적인 지 식의 공유와 더불어 대규모 학습 데이터의 구축 및 공개도 있다. 컴퓨터 비전 기술 연구에 활용되고 있는 대규모 공개 이미지 데이터셋은 ImageNet, Open Image, MS COCO, LVIS 등이 있다. 각 데이터셋은 물체 탐지, 의미 분할, 자세 추정(Pose
있다.
본 연구에서는 이동식사다리와 안전모 착용 여부를 탐지하기 위해 해당 이미지를 분류하고 경계상자가 라벨링 되어 있는 데이터셋이 필요하다. 공개 이미지 데이터 셋 중 두 가지 이미지를 정확히 제공하는 것은 없었다. Open Image의 경우, 이동식 사다리는 아니더라도 사다리(Ladder)를 분류해 제공하고 있으나, 헬멧(Helmet)은 안 전모보다 자전거용, 오토바이용 등이 상당부분을 차지하고 있다(Krasin et al., 2017).
이에 따라 안전모 착용 여부는 다른 연구 등에서 사용되었거나 인터넷에서 무료로 제공하고 있는 자료를 수집하여 데이터셋으로 사용하였다(Nath et al., 2020; Xie &
Liangbin, 2019). 구축된 데이터셋을 나누어 학습용으로 6,023장, 모델 검증용으로 839장의 이미지를 각각 사용하였다.
[그림 4-2] 데이터셋의 예시 (Krasin et al., 2017; Xie & Liangbin 2019)
물체 탐지 모델의 성능평가 방법으로는 F1-score와 mAP를 사용하였으며, 실시간 탐지 가능성 검토를 위해서 FPS(Frames per second)로 탐지 속도를 평가하였다.