• 검색 결과가 없습니다.

본론

문서에서 『기상기술정책』 (페이지 86-95)

논 단

II. 본론

화재 기상예보 서비스란 기상예보에 따라 각 지역별 화재 위험등급을 제시하여 일상생활 에서 화재에 대한 주민의 경각심을 고취시킬 수 있는 범국민 서비스이다. 제안한 서비스는 [1 단계]기상예보에 따라 화재가 일어날 확률을 추정하는 단계, [2단계]추정된 화재발생 확률을 가지고 화재 위험성을 평가하는 단계로 구분된다.

1. 기상조건에 따른 화재발생 확률 추정

기상조건에 따른 화재발생 확률을 추정하기 위한 예측모델을 생성하기 위해 과거에 발생한 화재조사 데이터 와 관측된 기상데이터를 표 1과 같이 시간을 기준으로 두 데이터 집합을 통 합하여 학습데이터(training data)1)를 생성한다. 통합데이터는 여섯 개의 속성(attribute)으로 구성되어 있으며, 그 중 ‘화재발생 여부’는 예측모델을 생성하기 위한 종속변수(dependant variable)로 사용하기 위해 화재

조사 데이터로부터 생성한 것이다. 만약 2017년 1월 1 일 1시대(1시부터 2시까지) 에 화재가 2건 발생하였다 면, 그림 2와 같이 해당 시 간대에 동일한 데이터를 화 재 건수만큼 생성하여 통 합데이터를 생성한다. 이렇 게 생성된 통합데이터로부

1 학습데이터란 예측모델을 생성하기 위한 데이터 집합이다.

<표 1> 화재조사데이터와 기상데이터를 통합한 데이터

일시 강수량 온도 풍향 풍속 습도 화재발생 여부

2017010100 0.0 0.9 NE 1.2 50.6 YES 2017010101 0.0 0.4 NE 1.6 54.0 YES 2017010101 0.0 0.4 NE 1.6 54.0 YES

2017010102 0.0 0.5 NE 0.8 51.4 NO

2017010103 0.0 0.4 NE 1.1 54.3 YES

[그림 2] 의사결정트리에 의해 생성된 분할영역과 생성규칙

논 단 화재 기상예보 서비스

터 종속변수인 ‘화재발생 여부’와 독립변수인 기상데이터 간의 관계분석을 통해 화재가 발생 한 기상조건을 분석할 수 있다. 특정 기상조건에서 화재발생 확률이 높은지를 화재 기상예보 에서 알려주기 위해서는 데이터마이닝 기법 중 모델의 가독성이 높은 의사결정트리(decision tree)를 활용하여 예측모델을 생성한다.

의사결정트리 모델은 노드(node)와 링크(link)로 형성되어 있으며, 노드는 트리(tree)를 생 성하기 위한 학습데이터의 부분집합(subset)을 의미하고, 링크는 부분집합의 데이터들을 분 할하여 새로운 부분집합들을 생성하기 위한 기준을 의미한다. 부분집합이 학습데이터의 전 체집합일 경우 해당 노드를 루트노드(root node)라 하고, 더 이상 분할되지 않은 부분집합 을 단말노드(leaf node)라 한다. 가장 많이 사용되는 의사결정트리 생성 알고리즘인 C4.5 알 고리즘은 무질서도(entropy) 개념으로 부분집합들을 생성하기 위한 분할 기준을 결정한다.

예를 들어, 두 개의 독립변수 모두가 온도()와 습도() 같이 수치적 속성이고 양의(positive) 값을 가질 때 문제영역(problem space)은 2차원 벡터공간이 된다. 문제영역에 분포된 학습 데이터를 가지고 그림 2의 (a)와 같은 의사결정트리가 생성되었다면, 의사결정트리에 의해 생 성된 각 부분집합의 학습데이터가 분포된 영역은 그림 2(b)와 같이 형성된다. 그림 2(b)에서 각 분할영역은 그림 2(a)에서 사각형으로 표현된 5개의 단말노드를 의미한다.

의사결정트리의 단말노드들은 그림 2(c)와 같이 각각 IF~THEN~ 형식의 생성규칙 (production rules)들로 표현할 수 있다. 즉, 의사결정트리에서 규칙은 루트노드에서 단말 노드에 이르는 하나의 경로를 말한다. Quinlan(1987)은 각 단말노드를 규칙으로 표현할 때 규칙의 신뢰성을 나타내는 확신도(Certainty factor, CF)를 식 (2)로 계산하였다. 여기서

  는 단말노드 i에 포함된 학습데이터 집합을 의미하고,  는 단말노드 i에 포함된 데이터 중에 클래스 k인 데이터 집합을 의미한다. CLASS는 클래스의 집합이다.

즉, 단말노드에 포함된 데이터 중 가장 많은 비율의 클래스로 규칙의 확신도를 계산한다. 예 를 들어 표 1에서 “화재발생 여부”를 클래스(종속변수)로 설정하였을 때, 그림 2(a)에서 ‘단말 노드 1’(또는 그림 2(b)에서 ‘분할영역 1’)에 포함된 학습데이터가 100개이고 그 중 ‘화재발생 여부’가 ‘NO’인 데이터 개수가 80개, ‘YES’인 데이터 개수가 20개일 경우, 해당 단말노드로부 터 추출된 ‘규칙.1’(그림 2(c)에서)의 확신도는 0.8이 된다.

 max∈





 

(2)

의사결정트리에서 추출된 IF~THEN~ 규칙의 확신도는 규칙의 조건부(IF 절)인 기상조건 에서 과거에 화재가 발생한 비율을 의미하기 때문에 해당 기상조건에서 화재가 발생할 확률 로 활용할 수 있다. 그러나 시간을 기준으로 화재조사 데이터와 기상데이터를 통합하였기 때 문에 지역(region)에 대한 정보가 통합데이터에는 없다. 다시 말하면, 서울지역에서 ‘0≦온도

<10 이고 습도<5’일 때 화재발생 비율이 0.8이면 서울지역에서 해당 기상조건을 만족할 때가 10번 있었다고 가정할 경우 그 중에 8번이 화재가 발생하였다는 의미이다. 그러나 서울지역 모든 곳에서 화재 발생확률이 0.8이라는 것은 현실적으로 타당하지 않다. 따라서 지역별 화 재발생 확률을 고려하기 위해 식 (3)과 같이 인구밀도에 따른 화재발생 확률을 계산하였다.

즉 각 단말노드   에서(규칙의 결론부에서) 화재발생 확률을 식 (3)과 같이 정의된 확률함수,    로 계산한다.     는 단말노드 i에 포함된

“화재발생 여부”가 ‘NO’인 데이터 개수와 ‘YES’인 데이터 개수를 각각 나타낸다.  는 단말노드 i 에 포함된 ‘화재발생 여부’가 ‘YES’인 데이터 중에 시간대가 서로 다른 데이터 의 개수를 의미한다. 예를 들어, 매시간 기상데이터가 관측된다면, 서울지역에서 하루 동안 생성될 수 있는 관측데이터는 24개이다. 만약 14시부터 15시 사이에 화재가 5건 발생되었다 면   는 23이고   은 5가 된다. 그리고 는 1이 된다.

       ×   

 

(3)

정확한 화재발생확률을 계산하기 위해 해당 지역을 일정 인구수의 셀(cell) 단위로 나누 어 적용함으로서 일반 사람들에게 좀 더 의미 있는 확률 정보를 제시할 수 있다. 따라서 식 (3)의   를 식 (4)와 같이 해당 지역의 인구수를 이용하여 결정하였다. 이것은 해 당 지역을 십만 명이 거주할 수 있는 영역으로 세분화한다는 의미를 가지고 있기 때문에

   은 십만 명이 거주하는 지역에서 화재가 발생할 확률을 의미한다.

논 단 화재 기상예보 서비스

    

인구수  

(4)

2. 화재 위험성을 평가

화재 기상예보 서비스는 화재 위험성 평가를 통해 식중독지수나 부패지수와 같은 생활 안 전지수처럼 날씨에 따라 지역의 화재 위험등급을 제공하고, 기상조건 하에서 주변 화재요인 들의 선택 여부에 따라 위험등급을 저감(低減)시킬 수 있는 시뮬레이션을 제공한다.

기존 화재 위험성 평가는 주택, 고층건물, 다중영업소와 같이 점검항목이 명확한 대상에 서 정성적(定性的)으로 체크리스트(check list)의 항목을 결정하고, 이를 통해 대상에 대한 위 험성을 평가한다. 이와 같은 체크리스트 방법은 점검 대상에 대한 화재요인을 도출할 수 있 을 때만 사용 가능하기 때문에 기상조건에 따른 지역의 화재 위험성을 체크리스트로 평가하 기는 어렵다. 위험을 정량화하는 기법으로 가장 널리 사용되고 있는 위험도 매트릭스(risk matrix)를 활용하여 화

재 위험등급을 산출한다.

위험도 매트릭스는 확 률(probability)과 피해 (consequences)로 구성 되어 있으며, 그림 3과 같 이 위험도 매트릭스를 생성 하여 기상조건에 따라 지역 의 화재 위험등급을 산출 한다.

화재조사데이터와 기상데이터가 통합된 특정지역의 데이터로부터 생성된 의사결정트리에 서는 해당 지역에서 화재가 발생할 수 있는 기상조건들을 추출할 수 있다. 의사결정트리에서 기상조건이란 루트노드에서부터 단말노드까지의 경로를 말한다(규칙의 IF절). 따라서 각각 의 기상조건에서는 식 (3)과 같이 화재가 발생될 확률 값을 계산할 수 있고, 해당 기상조건을

[그림 3] 의사결정트리로부터 위험도 매트릭스 생성 과정

만족하는 화재조사데이터로부터 화재피해(재산피해와 인명피해)를 산정할 수 있다. 즉 그림 3과 같이 확률과 피해로 구성된 이차원 벡터공간에 의사결정트리의 단말노드, 즉 화재가 발 생할 수 있는 기상조건들을 표현할 수 있다. 이러한 산점도(scatter plot)는 화재확률과 화재 피해로 표현된 기상조건의 분포를 보여주고 있으며, 자연적 구분법(Jenks 최적화 방법)으로 데이터 분포에 따라 화재확률과 화재피해를 각각 5등급으로 구분한다.

1) 화재 위험성 평가 시스템

기상예보에 따라 화재 위험등급을 제시하는 서비스가 구현 가능한지 확인하기 위해 화재 위험성 평가 시스템을 개발하였다. 개발된 시스템은 기상청에서 제공되는 실시간 기상예보 서비스를 이용하여 각 시도별로 화재 위험등급을 산출하고, 사용자는 온라인상에서 시스템 을 통해 거주 지역에서의 화재 위험등급을 기상예보와 함께 확인할 수 있을 뿐만 아니라 자 기 주변에 있는 화재요인을 가지고 해당 기상조건에서 화재 위험성을 평가할 수 있다. 그림 4 는 개발된 시스템에서 제공되는 화재 기상예보 서비스를 보여주고 있다. 그림 4(a)처럼 시스템 메인화면에서는 전국 시도별로 가장 가까운 시간대의 기상예보에 따른 각 시도별 화재 위험 등급을 지도상에 표시하고, 왼쪽 테이블에서는 선택된 지역에서 기상예보별 화재 위험등급 을 확인할 수 있다. 여기서 제시한 위험등급을 클릭하 면 그림 4(b)같이 사용자는 위험도 매트릭스 상에서 현 재 화재 위험등급의 정도 를 확인할 수 있으며, 이를 통해 해당 위험등급의 의 미가 화재발생 확률이 높 거나 화재피해 정도가 큰지 여부를 확인할 수 있다.

또한 시스템에서는 사용자가 세부정보를 확인할 수 있도록 그림 5와 같은 웹 페이지를 개

[그림 4] 화재 위험성 평가 시스템

논 단 화재 기상예보 서비스

발하였다. 제공되는 세부 정보로는 Ⓐ화재 기상예 보, Ⓑ기상예보 Ⓒ화재요 인에 따른 화재위험도 Ⓓ 화재 발생지점 분포, Ⓔ선 택된 지역의 통계정보이다.

화재 기상예보인 Ⓐ에서 는 화재 기상조건, 해당 기 상조건에서 화재발생 확률 과 화재 위험등급 그리고 지금까지 해당 기상조건에 서 발생된 화재건수를 확 인할 수 있고, Ⓑ에서는 기

상청에서 제공되는 기상예보를 확인할 수 있다. Ⓓ영역에서는 Ⓐ에서 제시된 해당 기상조건 에서 과거에 화재사고가 일어난 지점을 사용자가 지도상에서 확인할 수 있으며, 화재요인별 로 발생 분포를 지도상에서 분석할 수 있다. Ⓔ영역에서는 선택된 지역의 건축물 현황, 공장 수와 같은 지역적 통계정보를 보여줌으로써 기상이외의 화재요인을 분석할 수 있도록 제시 한다.

화재 위험성 평가 시스템에서는 화재요인의 빈도를 가지고 식 (5)와 같이 화재위험도를 평 가한다. 표 2는 특정 기상조건에서 발생된 총 133건의 화재를 ‘발화열원’과 ‘발화요인’의 항 목별로 화재빈도를 조사한 표이다. 식 (5)에서 은 화재요인 에 대한 비율을 의미한다. 예 를 들어 표 2에서 총 133건의 화재 중에 ‘작동기기(actuated equipment)’에 의해 발생된 화 재 건수는 81건으로 작동기기는 0.61(=81/133)된다. 따라서 작동기기에 의함 화재 위험성 은 0.61(=1.0–0.39)이 된다.

화재 위험성     

   (5)

[그림 5] 화재 기상예보와 화재와 관련된 정보

만약에 주변에 작동기기와 담뱃불이 있다면 그 때의 화재 위험성은 아래 계산식에 의해 0.68로 계산되고, 만약 주변에 작동기기와 담뱃불 그리고 전기적 요인까지 존재한다면 그 때 의 화재 위험성은 0.83이 된다. 이와 같이 같은 공간에 화재요인이 많을수록 화재 위험성이 커지는 것을 확인할 수 있다. 반대로 화재 위험성을 저감시키기 위해서는 같은 공간에서 화재 요인을 제거하면 된다.

화재위험성작동기기담뱃불      ×    

화재위험성작동기기 담뱃불전기적요인      ×  ×  

 

III. 결론

화재 기상예보 서비스 실행 가능성 여부를 확인하기 위해 화재 위험성 평가 시스템을 개발 하였다. 화재 기상예보 서비스란 기상청에서 제공되는 기상예보를 이용하여 각 지역별로 화 재 위험등급과 해당 기상조건에서 화재 가능성이 높은 화재요인들을 확인할 수 있는 서비스 이다. 또한 날씨와 관련된 생활지수처럼 활용한다면, 화재 기상예보 서비스를 통해 주민들은 자신의 거주 지역에 대한 화재 위험성을 확인하고 관련된 정보를 제공받음으로써 화재예방

<표 2> 화재요인 별 “화재 빈도수” & “화재 비율” & “화재 위험성”

Source of ignition Fire frequency

Fire

rate(xi) 1-xi Cause of ignition Fire frequency

Fire rate(xi) 1-xi Actuated equipment 81 0.61 0.39 Gas leak-explosion 0 0.00 1.00 Cigarette & lighter 25 0.19 0.81 Traffic accident 0 0.00 1.00 Flame, sparks 7 0.05 0.95 Mechanical factor 12 0.09 0.91 Chemical combustion 0 0.00 1.00 other 0 0.00 1.00

other 5 0.04 0.96 unknown 9 0.07 0.93

unknown 10 0.08 0.92 Careless 50 0.38 0.62

Friction, conduction, radiation 5 0.04 0.96 Electrical factor 62 0.47 0.53 Spontaneous combustion 0 0.00 1.00 Chemical factor 0 0.00 1.00 Explosive, fireworks 0 0.00 1.00 Sum 133 1.00 7.00

Sum 133 1.00 8.00

논 단 화재 기상예보 서비스

에 대한 경각심을 높일 수 있다.

화재 기상예보 서비스가 기여한 점은 (1)화재조사데이터와 기상데이터를 가지고 데이터마 이닝 기법인 의사결정트리를 이용하여 정량적 위험성 평가를 수행했다는 점이다. 정량적 위 험성 평가는 정성적 위험성 평가보다 정확한 위험도 평가가 가능한 것으로 알려져 있다. 의사 결정트리 알고리즘으로 화재 기상조건을 생성하고 생성된 각각의 화재 기상조건은 화재발생 확률과 화재피해 정도를 갖는다. 이와 같은 값들을 이용하여 위험도 매트릭스를 생성하고, 위험도 매트릭스의 등급 간격은 자연적 구분법을 이용하여 데이터 분포에 따라 화재확률과 화재피해를 각각 5 등급으로 구분하였다. (2)동일한 시공간에서 존재하는 화재요인을 가지 고 화재위험도를 계산할 수 있다. 화재 기상조건에 따라 화재 위험등급을 제시하고, 해당 화 재 기상조건에서 발생한 화재요인의 빈도를 분석하여 화재위험성을 계산한다. 제안한 화재위 험성은 사용자 주위에 존재하는 화재요인에 따라 위험성이 평가되기 때문에 사용자가 화재 요인을 공간에서 제외 혹은 다른 공간으로 옮긴다면 화재 위험성은 저감된다. 따라서 화재 기 상예보 서비스는 사용자의 상황에 따라 화재를 예방할 수 있는 조치 사항을 제시할 수 있다.

향후에는 화재 기상조건에 따른 화재 위험등급과 화재요인에 따른 화재위험성을 통합하여 보다 효과적으로 화재의 위험성을 평가할 수 있는 방법론을 개발할 수 있다. 화재 기상조건은 화재조사 데이터가 한 건도 없는 지역에 대해서는 추출될 수 없다. 이러한 문제를 화재요인에 따른 화재위험성 평가 방법을 적용하여 해결할 수 있을 것이다.

문서에서 『기상기술정책』 (페이지 86-95)