3. 산업안전 분야의 기계학습 적용 방안
3.2 기계학습 적용 사례 및 선행연구
기계학습은 데이터를 분석하여 맞춤형 서비스를 제공하거나 예측예방 시스템을 구축하는 데 널리 사용되고 있다. 특히 딥러닝은 방대한 데이터를 분석하여 고수준 특징(High-level feature)을 학습하여 차이점을 찾고 유사점을 분류해야 하는 이미지 및 영상, 언어 처리에서 강점을 보이고 있다.
국내외에서 다양한 산업에 기계학습이 적용되고 있으며 공공영역에도 확대되고 있다. 기계학습을 통한 맞춤형 서비스는 데이터를 분석하여 마케팅, 금융, 교육 분 야에서 많이 활용되고 있다. 넷플릭스(Netflix), 유튜브(YouTube)는 사용자가 관심이 있을 만한 영상을 추천해주고, 아마존(Amazon)은 고객 맞춤형 책 추천서비스를 통 해 매출의 상당부분을 올리고 있다. 예측예방 시스템은 앞으로 일어날 일을 예측하 거나 비정상 상황을 예방하는 것으로, 보건복지부에서는 사회보장 데이터와 전기・
가스 데이터 등을 연계하여 기계학습을 통해 복지 사각지대의 발굴에 활용하였다.
미국 네바다주에서는 식중독 예방을 위한 위생검사 대상 선정에 인공지능을 도입하 여 문제 식당의 발견 비율을 9%에서 15%로 향상하기도 하였다(이상길, 2018). 미국 뉴욕시 소방청은 건축물의 화재・부상사고 데이터, 건축물의 위치와 인접한 건물의 수, 세금・보건위생 관련법 위반 내역 등의 자료를 활용하여 건축물 화재 위험도 예 측 모델을 구축하였으며 2017년 분석결과 화재 위험이 높은 건축물 예측의 정확도 를 20% 이상 높였다(행정안전부, 2020). 일본 히타치에서는 범죄통계, 소셜 미디어, 순찰기록 등으로 범죄를 예측하는 분석 플랫폼을 만들었다.
(a) 위생검사 대상 식당 선정 (b) 일본 범죄 예측 플랫폼 [그림 3-2] 기계학습 적용 사례
산업안전을 포함하여 위험성평가를 지원하기 위해 기계학습을 활용하여 위험성을 분석하고 평가하기 위한 연구는 지속적으로 증가하고 있다. Guzman et al.(2016)은 중요 인프라에 대한 위험성평가에 기존의 전문가 시스템(Expert system), 인공신경 망 등을 적용하여 비교한 결과, 인공신경망을 결합한 방법이 위험성의 추정에 가장 좋은 선택이라고 하였다. Hegde et al.(2020)은 다양한 분야에서 위험성평가를 위해 기계학습을 적용한 연구논문 124편을 분석하였다. 연구결과에 따르면, 자동차 산업 에서 위험성평가에 기계학습을 적용한 사례가 가장 많았으며, 인공신경망이 가장 많이 사용한 알고리즘이고 다음으로는 SVM이 선택되었다. 그리고 위험성평가의 단 계 중에서는 유해・위험요인의 파악을 지원하기 위한 연구가 가장 많이 수행되었다.
산업안전 분야에서는 기계학습을 적용하여, 사고를 분석하여 위험을 예측하려는 연구와 딥러닝 등을 사용하여 이미지, 영상을 통해 위험요인을 찾아 안전관리를 향 상하려는 연구가 많이 수행되었다.
사고를 분석한 연구는 안전관리를 위해 통계 자료, 사업장 정보 등을 활용하여 피해 규모, 사고 유형을 예측하거나 위험요인을 파악하는 것이다.
Tixier et al.(2016)은 470여 개소의 건설 현장에서 수집한 4,398건의 사고 리포트 에 있는 78개 항목의 구조화된 데이터셋을 이용하여, Random Forest와 Stochastic Gradient Tree Boosting(SGTB)을 이용하여 사고의 발생확률을 예측하고자 하였다.
사용한 항목은 사고 장소, 작업, 불안전한 행위 등의 정보이며, 사고의 에너지원, 발 생형태, 부상부위, 사고 심각도를 결과 값으로 사용하였다. 예측 모델의 평가는 Rank Probability Skill Score (RPSS)를 사용하였다.
Sarkar et al.(2019)은 사고 데이터를 SVM과 인공신경망에 적용하여 부상, 아차사 고, 재산상 손실을 예측하고자 하였다. 사고 데이터는 2010년부터 2013년까지의 인 도의 철강회사에서 수집된 1,500여개를 사용하였다. 데이터셋은 사고일자, 사고발생 월, 사고형태, 기계상태 등의 범주형 데이터 위주의 16개로 구성되어 있다. 카이제 곱 검정으로 도출한 중요도는 발생형태, 종사자지위 등이 가장 중요한 변수로 나타 났다. 예측결과로부터 사고 등의 핵심 원인 식별을 위한 9가지 규칙을 제안하였다.
Poh et al.(2018)은 기계학습을 적용하여 건설현장의 위험을 분류할 수 있는 안전
선행지표를 개발하고자 하였다. 2010년부터 2016년까지의 27개 건설 현장으로부터 785개의 안전점검 결과, 418개 사고사례 등을 수집하였다. 항목은 공사유형, 공사금 액, 건설기계 상태, 비계, 떨어짐 위험/개구부 등이며, 결과값은 사고 없음, 경미한 사고, 중대사고 등을 사용하였다. 기계학습 알고리즘은 의사결정나무, Random Forest, SVM 등의 5가지를 사용하였고, 정확도, 정밀도, 재현율로 모델의 성능을 평 가하였다. 불균형 데이터 문제는 SMOTE를 사용하였다. 학습 및 평가 결과 Random Forest가 정확도 0.78로 가장 높은 것으로 나타났다.
Choi et al.(2020)은 2011년부터 2016년까지의 건설 산업재해자 140,169명의 데이 터를 로지스틱 회귀분석, 클러스터 분석, 의사결정나무, Random Forest, AdaBoost를 사용하여 부상과 사망 발생을 예측하고자 하였다. 데이터셋은 재해자 연령, 성별, 근속연수, 공사유형, 고용규모 등의 항목으로 구성되어 있다. 부상자와 사망자의 데 이터 불균형 문제 해결을 위해 무작위 과대표본화를 적용하였다. 예측모델의 평가 는 ROC-AUC를 사용하였다. 로지스틱 회귀분석 결과 중대재해와 성별, 고용규모, 근속년수, 발생월, 발생요일이 유의미한 요소로 도출되었다. 예측모델 중 Random Forest를 적용하였을 때, ROC-AUC가 0.920으로 가장 높게 나타났다.
Zhu et al.(2021)은 건설사고의 심각도 예측을 위해 기계학습 기법을 사용하였다.
데이터는 571개의 건설사고를 수집하였다. 이전 연구로부터 사고원인으로 분류된 안전부서, 안전전문가, 위험관리, 안전문화 등 16개의 항목을 사용하였다. 결과는 사 고의 크기(사망자 수)를 사용하였다. 기계학습 알고리즘은 로지스틱 회귀분석, 의사 결정나무, SVM, Naive-Bayes, Random Forest, MLP, AutoML 등 8가지를 사용하였 다. SMOTE를 적용하였으며, 10겹 교차검증과 F1-score를 사용하여 모델을 평가하 였다. 로지스틱 회귀분석과 AutoML의 F1-score가 0.8, 0.844로 가장 높게 나타났다.
Random Forest로부터 도출한 중요도는 사고 유형, 안전감독, 계약 순으로 나타났다.
딥러닝을 사용한 연구는 이미지, 영상으로부터 물체 탐지를 통해 안전 기준을 준 수하는지, 안전에 문제가 있는 결함이 존재하는지에 대한 연구가 많이 수행되었다.
Fang et al.(2018)은 고소작업자의 추락방지를 위해 SSD 알고리즘을 사용하여 안 전모, 안전대 등 개인보호구 착용을 감지하였다. 다양한 상황을 고려하여 2만 여장 의 이미지를 학습하여, 0.9 이상의 평균 정밀도와 재현율의 성능을 보였다.
박상윤 등(2019)은 건설현장의 안전모 착용 감지를 위해, R-FCN의 알고리즘과 전 이학습기법을 적용하여 딥러닝 모델을 제안하였다. ImageNet에서 수집한 사람과 안 전모가 포함된 1,089장의 이미지를 사용하여 학습을 진행하였다. 사람과 안전모의 mAP는 각각 0.86, 0.83으로 측정되었다.
Zhao et al.(2019)은 YOLO v3 알고리즘을 사용하여 안전모, 안전조끼의 착용여부 를 탐지하고, Kalman filter 등을 사용하여 보행자의 궤적을 추적하였다. mAP는 0.89의 성능을 보였으며, FPS는 18로 나타났다.
김명호 등(2019)은 Inception-v2와 ResNet-101 네트워크를 적용한 Faster R-CNN 의 알고리즘을 사용하여 안전모 착용 상태 인식모델을 제안하였다. 직접 및 ImageNet에서 수집한 이미지 2,260장을 데이터셋으로 구축하여 학습 및 평가에 사
용하였다. mAP는 0.930, 0.936으로 나타났으며 FPS는 각각 6.3, 2.3으로 나타났다.
Perez et al.(2019)은 CNN 기반의 VGG-16 네트워크와 2,622장의 데이터셋을 사용 하여 건물 벽의 습기에 의한 결함을 0.84 이상의 F1-score로 검출하였다.
Nath et al.(2020)은 건설현장의 사망사고예방을 위해 개인보호구(안전모, 조끼)의 착용여부를 인식하고자 하였다. 이를 위해 YOLO 아키텍처를 기반으로 작업자, 안 전모, 조끼를 인식하고, 분류기를 통해 착용여부를 검증하였다. 첫 번째는 신경망, 의사결정나무 등의 분류기를 적용하였고, 두 번째는 단일 아키텍처만을 사용하였다.
세 번째는 작업자만을 감지한 후 잘라서 CNN 기반 분류기(VGG-16, ResNet-50 등) 를 적용하여 분류하였다. 학습에는 약 1,500개의 이미지를 사용하였으며, 그 결과 단일 아키텍처를 사용한 경우가 mAP 72.3의 최고 성능으로, 초당 11 프레임을 처리 할 수 있는 것으로 나타났다. 첫 번째 방법은 mAP 63.1에 초당 13 프레임으로 가장 빠르고, 세 번째 방법은 mAP가 67.93으로 나타났다.