• 검색 결과가 없습니다.

Development and its APPLIcation of Computer Program for Slope Hazards Prediction using Decision Tree Model

N/A
N/A
Protected

Academic year: 2021

Share "Development and its APPLIcation of Computer Program for Slope Hazards Prediction using Decision Tree Model"

Copied!
11
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

地 盤 工 學

大 韓 土 木 學 會 論 文 集

第29卷 第2C 號·2009年 3月 pp. 59~69

의사결정나무모형을 이용한 급경사지재해 예측프로그램 개발 및 적용

Development and its APPLIcation of Computer Program for Slope Hazards Prediction using Decision Tree Model

송영석*·조용찬**·서용석***·안상로****

Song, Young-Suk·Cho, Yong-Chan·Seo, Yong-Seok·Ahn, Sang-Ro

···

Abstract

Based on the data obtained from field investigation and soil testing to slope hazards occurrence section and non-occurrence section in crystalline rocks like gneiss, granite, and so on, a prediction model was developed by the use of a decision tree model. The classification standard of the selected prediction model is composed of the slope angle, the coefficient of per- meability and the void ratio in the order. The computer program, SHAPP ver. 1.0 for prediction of slope hazards around an important national facilities using GIS technique and the developed model. To prove the developed prediction model and the computer program, the field data surveyed from Jumunjin, Gangneung city were compared with the prediction result in the same site. As the result of comparison, the real occurrence location of slope hazards was similar to the predicted section.

Through the continuous study, the accuracy about prediction result of slope hazards will be upgraded and the computer pro- gram will be commonly used in practical.

Keywords :slope hazards, prediction computer program, prediction model, decision tree model, GIS technique

···

요 지

본 연구에서는 화강암, 편마암 등 결정질암 지역에서의 급경사지재해 발생지역 및 미발생지역에 대한 현장조사자료 및 토 질시험자료를 토대로 의사결정나무모형을 이용한 급경사지재해 예측모델을 개발하였다. 선정된 급경사지재해 예측모델의 분 리기준은 최상위부터 사면경사, 투수계수 및 간극비로 선정되었다. 그리고 이를 토대로 GIS기법을 이용한 국가 주요시설물 주변 급경사지 재해 예측프로그램 SHAPP ver 1.0을 개발하였다. 개발된 예측모델 및 예측프로그램을 검증하기 위하여 강 릉시 주문진읍 일대의 현장조사결과와 대상현장에 대한 예측결과를 비교 검토하였다. 검토결과 실제 급경사지 재해가 발생된 구간과 급경사지재해 예측구간이 유사하게 일치하고 있는 것으로 나타났다. 추후 지속적인 연구를 통하여 급경사지재해 예측 결과에 대한 정확도를 높이고, 이를 실용화하여 범용적으로 사용이 가능하도록 할 예정이다.

핵심용어

:

급경사지재해, 예측프로그램, 예측모델, 의사결정나무모형, GIS기법

···

1.

서 론

우리나라 연평균 강우량중 절반이상이 7월과 8월에 집중 되며, 이 시기에 급경사지재해가 대부분 발생한다. Olivier

(1994)

는 24시간 동안의 강우량이 연평균 강우량의 20%를

초과할 경우 대형 급경사지재해가 일어날 수 있다고 보고한 바 있다. 그리고 Brand(1981)는 짧은 시간에 내리는 집중강 우는 지질조건이나 수문지질 조건과 관계없이 대형 급경사 지재해를 일으킬 수 있다고 보고한 바 있는데 이는 집중강 우가 지표물질을 완전히 포화시킬 수 있는 상태의 강우량을

의미한다.

그런데 동일한 강우량을 갖는 지역에서도 급경사지재해가 발생되는 지역과 발생되지 않는 지역으로 구분된다. 이는 강 우량이 급경사지재해를 발생시키는 가장 큰 요인임에도 불 구하고 지반 및 지질매체의 특성에 따라 급경사지재해 발생 정도가 다름을 의미한다. 즉, 지반 및 지질매체의 공학적 특 성에 따라 동일한 강우조건에서도 급경사지 재해가 발생되 는 경우와 발생되지 않는 경우로 나눌수 있다. 따라서 일정 강우조건하에서 대상지역의 어떤 지반조건 및 지질조건일 때 과연 급경사지재해가 발생하며 정량적으로 급경사지재해 발

*정회원·교신저자·한국지질자원연구원 지구환경연구본부 선임연구원 (E-mail : [email protected])

**한국지질자원연구원지구환경연구본부선임연구원 (E-mail : [email protected])

***충북대학교자연과학대학지구환경과학과교수 (E-mail : [email protected])

****정회원·한국시설안전공단 네트워크연구단 단장 (E-mail : [email protected])

(2)

생가능성을 예측하는 것은 매우 중요한 사항이다.

김원영 등(2003) 및 조용찬(2006)은 광역적인 지역을 대상 으로 산사태 발생가능성을 예측하기 위하여 로지스틱 회귀 모델을 이용한 산사태 예측모델을 개발한 바 있다. 홍원표 등(2004)은 지형, 지질 및 지반공학적 특성을 고려하여 인공 신경망모델을 이용한 산사태 예측프로그램을 개발한 바 있 다. 송영석과 채병곤(2008)은 편마암 지역에서의 급경사지재 해 현장조사 및 토질시험자료를 토대로 의사결정나무모형을 이용하여 급경사지재해 예측기법을 개발한 바 있다.

본 연구에서는 기존 송영석과 채병곤(2008)에 의해 제안된 급경사지재해 예측기법을 수정보완하여 새로운 통합 예측모 델을 개발하고, 본 기술의 범용화 및 실용화를 위하여 일반 지질 및 토목기술자가 쉽게 활용할 수 있는 예측프로그램을 개발하고자 한다.

이를 위하여 최근 10년 동안 결정질암 지역에서 발생된 급경사지 재해 자료수집 및 분석을 실시하였다. 이들 자료를 활용하여 통계적인 분석방법인 의사결정나무모형이론을 이용 한 급경사지재해 예측모델을 수정 및 보완하였다. 이와 같이 새롭게 개발된 예측모델을 토대로 GIS기반의 급경사지재해 정밀예측프로그램을 개발하였다. 개발된 예측프로그램에 대 한 검증을 수행하기 위하여 강원도 강릉시 주문진읍 장덕리 및 삼교리 일대의 급경사지재해 발생구간을 대상으로 급경 사지재해예측을 수행하고, 기 발생결과와 비교 검토하였다.

2.

급경사지재해 자료수집

새로운 급경사지재해 정밀예측모델 개발하기 위하여 가장 먼저 수행되어야 할 사항은 현재까지 발생된 급경사지재해 에 대한 자료수집 및 발생특성을 분석하는 것이다. 본 연구 에서는 최근 10년간 급경사지재해가 발생된 지역을 대상으 로 급경사지재해 발생지역 및 미발생지역을 구분하고 각각 의 지역에 대한 현장조사자료 및 토질시험자료를 이용하였 다. 이들 자료는 자연사면에서의 급경사지재해 발생지역에 대한 야외 정밀조사를 토대로 수집된 것이다. 최근 10년간 급경사지재해가 발생된 지역가운데 경기북부지역(1998년), 상 주지역(1998년) 및 속초지역(2002년 및 2003년)을 대상으로 한국지질자원연구원에서 조사된 자료를 활용하여 기 개발된 급경사지재해 정밀예측모델을 수정 및 보완하고자 한다. 대 상지역은 모두 결정질암인 화강암과 편마암 계열의 지질조 건을 가지고 있다. 국내의 경우 화강암과 편마암 계열이

60%

이상으로 가장 넓게 분포하고 있으며, 급경사지 재해가 집중적으로 많이 발생된 지역의 지질조건이 대부분 결정질 암인 화강암과 편마암 계열이었다.

경기북부지역은 포천, 성동, 문산, 서울일대로서 1998년 8 월 4일부터 7일까지 최고 588.5mm의 집중호우가 내렸으며, 이로 인하여 많은 급경사지 재해가 발생된 지역이다. 경기북 부지역의 경우 급경사지재해 발생구간 69개소와 미발생구간

27

개소에 대한 조사자료를 활용하였다. 상주지역은 1998년 8 월 10일부터 12일까지 최고 522mm의 집중호우가 내렸으며, 이로 인하여 상주지역에 788개의 급경사지재해가 발생된 지 역이다. 상주지역의 경우 급경사지재해 발생구간 63개소와 미발생구간 29개소에 대한 조사자료를 활용하였다. 그리고

속초지역은 2002년 8월 31일 당일 295.5mm의 집중호우와

2003

년 9월 12일 당일 118mm의 집중호우가 내렸으며, 이 로 인하여 많은 급경사지 재해가 발생된 지역이다. 속초지역 의 경우 급경사지재해 발생구간 114개소와 미발생구간 20개 소에 대한 조사자료를 활용하였다.

표 1은 본 연구에서 수집된 지역별 급경사지재해 발생구 간 및 미발생구간의 개소수를 정리한 것이다. 이들 개소수는 모두 정밀조사를 수행한 구간이다. 표에서 보는 바와 같이 급경사지재해 발생구간은 246개소이고, 미발생구간은 76개소 로서 총 322개소에 대한 자료를 수집하였다. 이들 정밀조사 된 자료를 토대로 의사결정나무모형을 이용한 새로운 급경 사지재해 예측모델을 개발하였다.

3.

급경사지재해 예측모델

방대한 지리정보는 공간 데이터베이스 또는 공간 데이터 웨어하우스 등에 저장되어 공간 데이터 마이닝에 이용된다.

공간 데이터 마이닝이란 공간 데이터 저장소로부터 함축적 인 지식, 공간적 관계 또는 명시적으로 저장되어 있지 않은 패턴들의 추출을 의미한다. 이러한 유용한 패턴들을 발견하 기 위해 연관분석, 분류, 군집 등 여러 가지 데이터 마이닝 기법이 소개되었다(장윤경 외, 2006). 이러한 데이터 마이닝 기법으로는 의사결정나무기법, 로지스틱회귀분석기법, 신경망 기법, 베이시안 기법 등이 있다.

의사결정나무는 데이터 마이닝의 분류와 예측 작업에 주로 사용되는 기법으로 과거에 수집된 데이터의 레코드들을 분 석하여 이들 사이에 존재하는 패턴을 분류 모형트리의 형태 로 만드는 것이다. 이 기법은 신경망기법보다 훈련시간이 짧 기 때문에 데이터의 규모가 클 경우 유리하고 결과에 대해 분류나 예측의 근거를 알려주기 때문에 이해하기 쉽다.

의사결정나무는 분석대상에 대한 분류나 예측을 수행하기 위해서 사용되는 분석기법으로 대용량의 데이터 내에 존재 하는 관계, 패턴 및 규칙 등을 탐색하고 모형화하는 역할을 수행하며, 신경망이나 판별분석 등에 의한 방법과는 달리 적 용결과에 의해 규칙을 명확하게 나타낼 수 있다. 또한, 예측 모형 자체뿐만 아니라 최적의 결과를 검색하거나 분석에 필 요한 변수 간의 교호효과, 즉 두 개 이상의 입력변수가 결 합하여 목표변수에 어떻게 영향을 주는지를 찾아내는데 이 용된다(김종규 외, 2006). 특히, 나무모형구조로 표현되기 때 문에 다른 기법들과 비교하여 쉽게 이해되고 설명할 수 있 으며, 임의의 데이터 범주에서 동일한 특성을 갖는 집합으로 구분하여 특성을 정의하고, 목표변수에 대한 규칙을 추론하 여 미래에 대한 예측을 할 경우 유용하게 활용할 수 있다

Table 1. Number of slope hazards occurrence section and

non-occurrence section

지역 급경사지재해

발생구간 미발생구간 합계

서울북부지역

69 27 96

상주지역

63 29 92

속초지역

114 20 134

총계

246 76 322

(3)

(

최기헌, 1995). 따라서 급경사지재해 예측을 위하여 의사결 정나무모형을 이용하는 방법은 매우 유용할 것으로 판단된다.

본 연구에서는 화강암, 편마암 등 결정질암지역의 급경사 지재해 발생지역 및 미발생지역에 대한 현장조사자료 및 토 질시험자료를 토대로 의사결정나무모형을 이용하여 급경사지 재해 정밀예측모델을 개발하였다. 그리고 의사결정나무모형 을 이용한 급경사지재해 예측결과의 정확성을 검증하기 위 하여 정오분류표를 적용하였다.

3.1

의사결정나무모형 이론

3.1.1

의사결정나무모형의 정의

의사결정나무모형은 의사결정규칙(decision rule)을 나무구 조로 도표화하여 관심대상이 되는 몇 개의 소집단으로 분류

(classification)

하거나 예측(prediction)을 수행하는 분석방법이

다. 이 방법은 분류 또는 예측의 과정이 나무구조에 의한 추론규칙에 의해 표현되기 때문에 신경망, 판별분석 등에 비 해 연구자가 그 과정을 쉽게 이해하고 설명할 수 있다는 장 점을 가지고 있는 분석방법이다.

데이터마이닝에서의 의사결정나무모형은 탐색(exploration) 과 모형화(modeling)라는 두 가지 특성을 모두 가지고 있다 고 할 수 있다. 차원축소 및 변수선택, 교호작용 효과의 파 악, 범주의 병합 또는 연속형 변수의 이산화는 탐색단계에 포함된다고 할 수 있고 세분화, 분류 및 예측은 모형화 단 계에 포함된다고 할 수 있다.

의사결정나무구조는 마디(node)로 구성되며, 뿌리마디(root

node)

로부터 시작하여 분리기준(splitting criterion), 정지규칙

(stopping rule),

가지치기(pruning) 등에 의해 각 가지

(branch)

가 끝마디(종단마디, terminal node)에 이를 때까지

자식마디(child node)를 계속 형성해 나감으로써 완성된다.

뿌리마디와 반대로 트리의 가장 끝에 위치하여 가지가 분리 되지 않는 마디를 끝마디라고 하며, 뿌리마디부터 종단마디 까지의 분리단계를 깊이(depth)라고 한다.

그림 1은 의사결정나무모형의 분석과정을 나타낸 것으로 일반적으로 의사결정나무의 형성, 가지치기, 타당성 평가, 해 석 및 예측의 과정을 거쳐 수행된다.

(1)

의사결정나무의 형성 : 분석의 목적과 자료구조에 따라 서 적절한 분리기준과 정지규칙을 지정하여 의사결정나무를 얻는다.

(2)

가지치기 : 분류오류(classification error)를 크게 할 위험(risk)이 높거나 부적절한 추론규칙(induction rule)을 가 지고 있는 가지를 제거한다.

(3)

타당성 평가 : 이익도표(gains chart)나 위험도표(risk

chart)

또는 검증용 자료(test data)에 의한 교차타당성(cross

validation)

등을 이용하여 의사결정나무를 평가한다.

(4)

해석 및 예측 : 의사결정나무를 해석하고 분류 및 예 측모형을 설정한다.

3.1.2

의사결정나무모형의 알고리즘

의사결정나무분석을 위해서 CHAID, CART, QUEST 등 과 같은 다양한 알고리즘이 제안되어 있으며 최근에는 이들 의 장점을 결합하여 보다 개선된 알고리즘들이 제안되고 상 용화되고 있다. 의사결정나무모형의 대표적인 알고리즘은

CHAID(Chi-squared Automatic Interaction Detection)

알고 리즘(Kass, 1980)으로 명목형, 순서형, 연속형 등 모든 종류 의 목표변수와 분류변수에 적용이 가능하며, Exhaustive

CHAID

알고리즘(Biggs et al., 1991)으로 발전하였다. 그

밖에 CART(Classification and Regression Tree), QUEST

(Quick, Unbiased, Efficient, Statistical), C5.0, C4.5

알고 리즘 등이 있다.

순수도(purity) 또는 불순도(impurity)를 기준으로 자식마디 를 형성해 나가는 순수도 지수(purity index)중 목표변수가 이산형인 경우에는 목표변수의 각 범주에 속하는 빈도

(frequency)

에 기초하여 분리가 일어난다. 이때 사용되는 주

요 분리기준(partitioning criterion)으로는 카이제곱 통계량

(chi-square statistic)

의 p-값, 지니 지수(gini index), 엔트로 피 지수(entropy index) 등이 있다.

(1)

카이제곱 통계량(Chi-Square statistic)의 p-값

Pearson

의 카이제곱 통계량은 다음과 같이 정의된다.

(1)

여기서, e

ij: i

번째 그룹의 j번째 결과에 대한 기대도수

fij: i

번째 그룹의 j번째 결과에 대한 기대도수 이것은 자유도(I-1)(J-1)을 가지는 카이제곱분포를 따르므로 유의수준을 α로 할 때 χ

2

의 값이 에 비해서는 매우 작다는 것은 예측변수의 각 범주에 따른 목표변수의 분포가 서로 동일하다는 것을 의미한다. 자유도에 대한 카이 제곱 통계량 값의 크고 작음은 p-값(유의확률)으로 표현될 수 있는데 χ

2

의 값이 에 비해서 작으면 p-값은 커지게 된다. 결국 p-값이 가장 작은 예측변수와 그때의 최 적분리에 의해서 자식마디를 형성한다.

(2)

지니 지수(Gini index)

지니 지수는 각 마디에서의 불순도(impurity) 또는 다양도

(diversity)

를 재는 측정중의 하나로써 다음과 같이 표현될

수 있다.

(2)

여기서,

j : 1, 2, …, c

로서, c는 목표변수의 범주수

P(j):

해당마디에서의 j번째 그룹에 속하는 자료의

비율을 추정치로 사용 χ

2

(

fijeij

)

2

eij ---

j 1=

I i 1=

I

=

χα I 12,( ) J 1( )

χα I 12,( ) J 1( )

G P

i

c

( ) 1 P j()

j

(

) 1 P j

( )

2 1 nj ----n

⎝ ⎠ ⎛ ⎞

2

j=1

c

= = =

Fig. 1. Analysis process of decision tree model

(4)

지니 지수는 n개의 원소 중에서 임의로 2개를 추출하였을 때 추출된 2개가 서로 다른 그룹에 속해 있을 확률을 의미 하며 Simpson의 다양도 지수(diversity index)로도 알려져 있다. 2개의 자식마디로 분리된다고 할 때 지니계수의 감소 량은 ∆G = G − (n

L/n)GL

− (n

R/n)GR

과 같이 계산되는데 여기 서 n은 부모마디의 관측치 수를 말하고, n

L

과 n

R

은 각각 자 식마디의 관측치 수를, G

L

과 G

R

은 각각 자식마디에서의 지 니지수를 의미한다. 즉, 자식마디로 분리되었을 때의 불순도 가 가장 작도록 (순수도가 가장 크도록) 자식마디를 형성하 는 것이며 지니 지수를 가장 많이 감소시켜주는 예측변수와 그때의 최적분리에 의해서 자식마디를 형성한다.

(3)

엔트로피 지수(Entropy Index) 엔트로피지수는 다음과 같이 표현된다.

(3)

여기서,

j: 1, 2, …, c

로서, c는 목표변수의 범주수

P(j):

해당마디에서의 j번째 그룹에 속하는 자료의

비율을 추정치로 사용

다항분포에서의 우도비 검정통계량을 사용하는 것과 같은 것으로 알려져 있고 최근에 널리 알려진 알고리즘인 C4.5는 엔트로피 지수를 분리기준으로 사용한다.

3.1.3

예측모형의 평가방법

일반적인 모형평가(model assessment)의 기준으로는 모형 이 얼마나 효과적으로 구축되었는가 즉, 얼마나 적은 입력변 수로 모형을 구축했는가의 문제나 혹은 같은 모집단 내의 다른 데이터에 적용하는 경우 얼마나 안정적인 결과를 제공 해 주는가 즉 일반화의 가능성 등 여러 각도에서 생각할 수 있다. 그러나 무엇보다도 우선적으로 고려되어야 할 사항은 구축된 모형이 얼마나 예측과 분류에서 뛰어난 성능을 보이 는가를 알아보는 것이다. 이는 아무리 안정적이고 효과적인 모형도 실제 문제에 적용했을 경우 빗나간 결과만을 양산한 다면 아무런 의미가 없기 때문이다.

따라서 모형의 평가는 예측을 위해 만든 모형이 임의의 모형보다 우수한지, 고려된 다른 모형과 비교하여 어느 것이 가장 우수한 예측력을 보유하고 있는지를 비교 분석하는 과 정이라 할 수 있다. 모형의 평가방법으로는 정오분류표((mis)

classification table), Lift Chart

의 %Response 이익도표,

ROC

도표 등이 있다.

오분류표 평가방법은 목표변수가 범주형인 경우에 적용할 수 있을 것이다. 통계모형의 평가분석을 위해 사후확률

(posterior probability)

을 비교할 수 있다. 일반적으로 분류의

기준으로 삼는 사후확률(posterior probability)의 경계는 “1/

(

목표변수의 범주 개수)”로 삼는 것이 보통이다.

또한 구축된 모형에 대하여 예측과 분류가 얼마나 뛰어난 성능을 보이는가, 그리고 얼마나 안정적인가를 비교하기 위 해서 training data(분석용 자료)와 validation data(평가용 자료)의 정분류율(판별력)을 비교하여 validation data의 오분 류율을 선정한다. 추가적으로 구축된 모형별 오분류율에 대

해서도 검토한다. 식 (4) 및 식 (5)는 정분류율 및 오분류율 을 산정하는 방법이다.

정분류율 =

(4)

오분류율 =

(5)

3.2

분석자료

본 연구에서는 화강암, 편마암 등 결정질암지역에서 조사 된 급경사지재해 발생지역 및 미발생지역에 대한 현장조사 자료 및 토질시험자료를 토대로 의사결정나무모형(decision

tree model)

을 이용하여 급경사지재해 예측모델을 새롭게 개

발하였다. 표 2는 예측모델개발을 위해 경기북부지역, 상주 지역 및 속초지역을 대상으로 조사된 자료수를 나타낸 것으 로 총 322개소의 조사자료 가운데 결측치를 제외한 108개소 의 자료를 활용하였다.

기존 급경사지재해 관련 연구에서는 급경사지재해 유발인 자의 선정을 조사자 또는 자료처리자의 주관과 직관에 의존 해 결정한 경향이 있었다. 또한 유발인자에 대한 가중치도 객관적 방법으로 설정하지 못하거나 가중치를 고려하지 않 은 상태에서 급경사지재해 발생가능성을 추정하였다. 이 경 우 급경사지재해 발생가능성이 잘못 예측되어 왜곡된 결과 가 도출될 수 있다. 이러한 오류를 배제하기 위하여 본 연 구에서는 통계적 기법인 “주성분 분석”을 통하여 현장조사결 과 및 실내시험에서 획득한 결과를 대상으로 각 인자별 상 호관련성을 검토하였다.

표 3은 각 지역별로 의사결정나무모형 분석에 포함된 변 수를 나타낸 것이다. 표에서 *표시는 범주형 변수를 나타낸 것이며, 그 외는 연속형의 변수를 나타낸 것이다. 표에서 보 는 바와 같이 급경사지재해에 영향을 미치는 변수로 총 15 개의 변수가 선정되었다. 변수간의 상호 연관성 및 구조적 특징을 파악하기 위하여 주성분 분석을 실시하였다. 이를 통 하여 통계적으로 급경사지재해에 유의한 영향을 미치는 변 수를 찾아내고 이 변수를 토대로 급경사지재해 발생여부를 예측하고자 한다. 본 연구에서 주성분 분석을 통하여 사면경 사, 투수계수 및 간극비가 주요 변수로 선정되었다.

3.3

분석결과

화강암, 편마암 등과 같은 결정질암 지역에서의 급경사지 재해 예측모델을 개발하기 위하여 전술한 분석자료(n=108) 를 토대로 의사결정나무모형을 이용한 통계적인 분석을 실

E P j

( )lnP j()

j=1

c

=

(

실제0, 예측0)의 빈도 + (실제1, 예측1)의 빈도 × 100(%) 관찰치의 빈도

(

실제0, 예측1)의 빈도 + (실제1, 예측0)의 빈도 × 100(%) 관찰치의 빈도

Table 2. Number of analysis data

지 역 총자료 분석용 자료

경기북부지역

96 53

상주지역

92 24

속초지역

134 31

합계

322 108

(5)

시하였다. 의사결정나무모형을 이용한 통계적인 분석은 카이 제곱 통계량, 지니 지수 및 엔트로피 지수를 적용하였다. 본 의사결정나무모형에 대한 통계분석에는 SAS와 SAS/E-miner 프로그램을 사용하였다.

통계적인 분석을 실시한 결과 카이제곱 통계량 방법과 지 니지수 방법에 의한 의사결정나무모형은 동일한 것으로 나 타났다. 그림 2는 카이제곱 통계량 방법과 지니지수 방법을 이용하여 의사결정나무모형 예측모델을 구축한 결과이다. 그 림에서 보는 바와 같이 예측모델의 최상위 분리기준변수로 는 사면경사가 선택되었으며, 하위 분리기준변수로는 각각 투수계수와 간극비가 선택되었다. 급경사지재해 발생을 일으 키는 사면경사의 기준은 27.5

o

인 것으로 나타났으며, 사면경 사가 27.5

o

이상인 경우 급경사지재해 발생을 일으키는 토층 의 투수계수 는 0.00998cm/sec 이상인 것으로 나타났다. 그 리고 사면경사가 27.5

o

이하인 경우 급경사지재해 발생을 일 으키는 토층의 투수계수는 0.0395cm/sec 이상이며, 간극비는

0.95

이상인 것으로 나타났다.

이와 같이 개발된 의사결정나무모형을 이용한 예측모델을 평가하기 위하여 정오분류표를 활용하였다. 이 방법은 예측 치와 관측치를 비교함으로서 추정된 예측모델이 얼마나 적 합한가를 평가하는 것이다. 표 4는 카이제곱 통계량 방법 및 지니지수 방법을 이용한 의사결정나무모형 예측모델의 정 오분류표를 나타낸 것이다. 전체 자료중에서 급경사지재해 예측모델에 의해 옳게 예측된 지역은 103개 지역이며, 이와 반대로 급경사지재해 예측모델에 의해 잘못 예측된 지역은

5

개 지역이다. 그리고 정오분류 계산식을 이용하여 정오분류 표의 정분류율을 계산해보면 95.37%, 오분류율을 계산해보 면 4.63%로 나타났다.

이상의 분석결과 및 평가를 토대로 개발된 급경사지재해 예측모델은 비교적 정확도가 높은 것으로 나타났으며, 분리 기준도 합리적이라고 판단되었다. 따라서 이를 급경사지재해 예측모델로 선정 및 제안하고자 한다.

Table 3. Variable items

구분 변수 설명 적용가능여부

목표변수 산사태 발생 여부 1:발생, 0:미발생 ○

입력변수

lithology (*)

gneiss

granite

mudstone ×

tuff ×

weathering (*)

풍화정도

×

elevation

지형고도 ○

slope direction

사면방향

×

slope angle

사면경사 ○

length

산사태 길이

×

width

산사태 폭

×

thickness

토층두께

×

specific gravity

비중 ○

moisture content

함수비 ○

void ratio

간극비 ○

porosity

공극률 ○

degree of saturation

포화도 ○

wet(bulk) density

전체밀도 ○

saturation density

포화밀도 ○

dry density

건조밀도 ○

USCS (*)

입도분포

×

permeability

투수계수 ○

triggering position

산사태발생위치

×

gravel

자갈

×

sand

모래

×

silt/clay

실트/점토

×

liquid limit

액성한계 ○

plastic limit

소성한계 ○

plasticity index

소성지수 ○

shear strength-cohesion

점착력

×

shear strength-friction angle

내부마찰각

×

(6)

4.

급경사지재해 예측프로그램

4.1

프로그램 개요

본 프로그램은 앞서 개발된 의사결정나무모형의 급경사지 재해 예측모델을 토대로 GIS기법을 적용하여 국가 주요시설 물 주변에 분포하고 있는 급경사지 재해를 사전에 예측하기 위한 것이다. 특히, 주요시설물이 분포하는 비교적 좁은 지 역을 대상으로 적용이 가능하도록 개발되었다. 본 프로그램 은 Slope Hazards Prediction Program의 약자를 따서

SHAPP ver 1.0(

등록번호: 2008-01-129-003872)으로 명명하

였다.

본 프로그램에서는 각종 토질조사자료 및 수치지도로부터 얻어진 자료를 GIS기법을 활용하여 도면으로 작성할 수 있 는 기법과 의사결정나무모형을 이용한 예측모델을 적용하여 급경사지재해 발생여부를 판단할 수 있는 기법이 가능하도 록 하였다. 이를 위하여 다음과 같은 네가지 모듈을 개발하 여 GIS기반 급경사지 재해예측 프로그램을 구성하였다(송영

석 등, 2008).

1)

데이터 입력 및 출력구조 설계 모듈

2)

급경사지재해 DB모듈

3)

통계분석 모듈

4)

예측결과 가시화 모듈

4.2

프로그램 개발환경 및 설계

본 프로그램은 MS-Windows XP, 2000 등에서 호환이 가능하도록 제작하였으며, 개발에 사용된 언어는 모듈의 특 성에 따라 Visual Basic을 적용하였다. 또한 GIS tool은 국 내에서 가장 널리 알려져 있는 Arc계열 엔진인 ArcGIS

9.2

에서 작동되도록 최적화되었다. 본 프로그램의 개발을 위 하여 사용된 언어와 GIS tool을 정리하면 그림 3과 같이 나타낼 수 있다.

그림 4는 GIS기반 급경사지재해 예측프로그램의 흐름도를 나타낸 것이다. 그림에서 보는 바와 같이 개발된 프로그램은 먼저 수치지형도로부터 얻은 지형자료를 선택 및 분석하여 사면경사를 추출하고, 시험결과로부터 얻은 토질자료(투수계 수, 간극비)를 입력하여 각각의 주제도를 작성한다. 그리고 급경사지재해 예측지도 작성범위를 설정한 후 의사결정나무 모형을 이용한 예측을 실시한다. 이러한 예측결과를 토대로 급경사지재해 예측지도를 작성한다.

5.

급경사지재해 예측프로그램 적용

5.1

현장개요

본 연구에서 개발된 프로그램을 검증하기 위하여 실제 급 경사지재해가 발생된 지역의 현장조사결과와 개발된 프로그

Fig. 2. The proposed decision tree model

Table 4. Classification table of analysis result

실제 관측된 값 예측값 급경사지재해

미발생 급경사지재해

발생 합 계

산사태 미발생

56 4 60

산사태 발생

1 47 48

합 계

57 51 108

-

정분류율 =

-

오분류율 =

56 47+

( )

--- 100 %108 × ( )=95.37 %( ) 4 1+

( )

--- 100 %108 × ( )=4.63 %( )

(7)

램의 예측결과를 비교분석하고자 한다. 연구대상지역은 2002 년 태풍 ‘루사’에 의해 산사태가 많이 발생한 강릉시 주문진 읍 일대로 선정하였다. 대상지역의 전체적인 지형적 특징은 동해 바다와 인접한 동쪽은 지형윤회 주기로 노년기에 해당 하는 구릉지형을 잘 보여주고 있으며 주 하천 주변에는 평 야지대가 발달하고 있다. 오대산이 위치한 서쪽으로 갈수록 해발고도는 높아지고 산세도 험준해지는 장년기 지형의 양

상을 보여주고 있다. 연구지역의 주 계곡은 이 지역에 흐르 는 하천과 일치하는데, 북쪽에서부터 신리천, 연곡천이 동으 로 흘러 동해로 유입되고 있다.

대상지역은 연곡천 계곡과 그 북쪽의 신리천 계곡이 동-서 방향으로 직선적으로 잘 발달하고 있으며, 두 계곡 사이의 소계곡들은 북북서-남남동 내지 북동-남서방향으로 발달하면 서 주 계곡에 접하고 있다. 주능선부를 기준으로 사면의 길 이는 남향사면이 북향사면보다 더 길고, 사면의 경사는 남향 사면이 북향사면에 비해 완만하게 나타나고 있다.

연구지역일대의 지질은 선캠브리아기 편마암류와 쥬라기 화강암류로 구성된다. 선캠브리아기 편마암류는 복잡한 변형 및 변성작용으로 층석적 분류가 불가능하여 경기편마암복합 체로 분류되는 암석이며, 화강암은 연구지역 서쪽에 분포하 고 있는 선캠브리아기 편마암류를 중생대 쥬라기에 관입한 대보화강암에 해당한다(김정찬 외, 2001).

현장조사에 의하면 연구지역의 화강암은 흑운모 화강암 보 다는 복운모 화강암이 흔히 나타나고 있으며, 중립질 내지 거정질로서 암석의 풍화가 진행되는 곳에서는 거정의 백운 모 광물들을 흔히 관찰할 수 있다(조용찬, 2006). 따라서 연 구지역은 대체로 우백질화강암이 넓게 분포하고 있으며, 이 화강암에 대한 절대연령은 Rb-Sr 흑운모 연대로 173±0.4

Ma, 175±1.4Ma

가 보고된 바 있다(Jin et al., 1984).

5.2

토질특성

대상지역의 토층시료에 대한 실험결과 토질은 화강암 풍화

Fig. 3. Environment of program development

Fig. 4. Flow chart of slope hazards prediction program

(8)

토로 분류되며, 입도가 양호 혹은 불량한 모래로 이루어져 있다. 대상지역 토층의 비중은 2.40~2.66의 범위에 있으며, 평균 2.57인 것으로 나타났다. 이는 모암인 화강암의 비중과 유사하며, 일반적인 모래의 비중과도 거의 같다.

대상지역 토층시료의 공극률은 35.74~54.78% 범위에 평균

44.49%

의 값을 갖고, 간극비는 0.56~1.21의 범위에 평균

0.81

인 것으로 나타났다. 대상지역 토층시료의 건조단위중량 은 1.10~1.67t/m

3

의 범위에 평균 1.42t/m

3

의 값을 갖는다.

한편, 입도분석결과에 의하면 대상지역 토층의 모래 함량 비는 87.60~97.47%의 범위에 있으며, 평균 93.98%로서 토 층시료의 거의 대부분이 모래로 구성되어 있음을 알 수 있 다. 그리고, 자갈의 함량비는 평균 1.34%로서 매우 낮은 편 이며, 실트 및 점토의 함량은 평균 4.68%인 것으로 나타났 다. 그리고 입도분포곡선을 조사한 결과 사천지역은 대부분 기울기가 완만하고 균등계수 및 곡률계수도 양입도(well

grading)

의 조건을 충족하나, 일부 빈입도(poor grading)의

조건을 충족하는 경우도 있는 것으로 나타났다. 즉, 이는 통 일분류법에서 SP 혹은 SW로 분류된다.

대상지역 토층시료의 투수계수는 1.15×10

-3~1.93×10-2cm/

sec

범위에 평균 5.95×10

-2cm/sec

의 값을 갖는다. 대상지역 의 투수계수 평균값은 Das(1990)에 의해 제안된 굵은 모래 의 투수계수에 해당 한다.

5.3

급경사지재해 발생특성

대상지역은 지리좌표로 동경 128° 41' 48.01"~48' 50.3", 북위 37° 50' 23.0"~53' 32.7"에 해당 한다. 그림 5는 대상 지역에 대한 현장조사를 통하여 조사된 급경사지재해의 발 생위치를 지형도에 표현한 것이며, 840여개의 산사태를 기재 하였다. 이 지역에서 발생한 산사태의 유형은 사면의 상단부 에서 전이형 산사태로 시작하여 계곡부를 따라 토석류 산사 태로 변하는 유형이 대부분이다(조용찬, 2006).

대상지역에서 발생한 급경사지재해의 기하학적 특징은 그 림 6에 나타내었다. 이 지역에서 발생한 급경사지재해의 길 이는 21m~30m가 전체의 30.2%로 가장 높은 빈도를 보여 주며 30m 이하를 모두 합하면 49.9%로 절반의 급경사지재

해가 포함된다. 길이가 50m 이하는 전체의 86.5%, 60m 이 하는 92.6%로 사천지역의 사태보다는 다소 더 긴 것들이 분포하고 있다(그림 6(a)). 급경사지재해가 발생한 지점의 사 면경사는 20° 이하는 거의 없으며, 31°~35°의 경사가

42.1%

로 가장 많은 빈도를 나타내고 있다. 사면경사가

26°~35°

의 경우는 전체의 74.1%의 빈도를 보여주고 있으나

36°

이상은 20.3%에 불과하다(그림 6(b)). 발생한 급경사지 재해의 폭은 평면적 모양으로 분류하기 위하여 재해가 시작 한 상단부의 폭(그림 6(c))과 재해가 끝나는 하단부의 폭(그 림 6(d))으로 구분하여 조사하였다. 상단부와 하단부의 폭은

10m

이하가 각각 75.2%, 61.5%로 가장 많은 빈도를 보여 주고 있으며, 상단부 보다는 하단부의 폭이 다소 더 넓은 경향을 보여주고 있다. 이 지역에서 발생한 급경사지재해 규 모의 최대빈도값은 길이 30m, 폭 10m 및 발생한 지점의 사면경사는 35° 정도에 해당한다.

5.4

급경사지재해 예측

본 연구에서 개발된 예측프로그램을 이용하여 대상지역의 일부구간에 대한 급경사지재해 예측 및 예측지도를 작성하 였다. 그림 7(a)는 예측프로그램 상에서 대상지역의 수치지 형도를 불러서 지형자료를 입력한 것이다. 그림 7(b)는 입력 된 지형자료를 토대로 TIN(Triangulated Irregular Network) 을 생성하여 대상지역의 고도와 사면경사를 분석한 결과이 다. TIN은 2차원 요소의 수치 지형도를 3차원의 연속된 면 자료로 변환하는 방법으로 이를 기반으로 해발고도 및 사면 경사를 추출할 수 있다. 그림 7(c)은 대상지역에 대한 토질 시료 채취위치와 각 위치에 대한 토질시험결과를 입력한 것 이다. 토질시험 결과값을 토대로 보간법 중 IDW기법을 이 용하여 인자별 주제도를 작성하였다. 그림 7(d)는 대상지역 의 간극비에 대한 주제도를 작성한 것이다. 그리고 그림

7(e)

는 대상지역에 대한 급경사지재해 예측지도를 작성한 것 이다.

그림 8은 대상지역의 일부구간을 선정하여 개발된 프로그 램을 이용하여 급경사지재해 예측지도를 작성한 결과이다.

그림에서 보는 바와 같이 일부예측구간의 중상부에서 급경

Fig. 5. The occurrence location of slope hazards and the selection of prediction section

(9)

Fig. 6. Geometrical chracteristics of slope hazards in the study area

Fig. 7. Producing sequence of slope hazrds map using SHAPP ver 1.0

(10)

사지재해가 발생될 것으로 나타났다. 그리고 급경사지재해가 발생 가능성이 있는 구간에 대한 범위가 픽셀의 수로 표현 되어 있다.

본 연구에서 개발된 예측모델 및 예측프로그램의 예측능력 과 적용가능성에 대한 검증을 수행하기 위하여 대상지역 일 부구간에 대한 예측결과, 기존 로지스틱회귀모형을 이용한 예측결과(조용찬, 2006) 및 실제 급경사지재해가 발생된 지 점을 각각 중첩하였다. 그림 9는 기존 로지스틱회귀모형을 이용하여 예측한 결과와 본 연구에서 개발된 예측프로그램 의 예측결과를 비교한 것이다. 기존 예측모델을 이용한 결과 의 경우 비교적 세부적인 위치에 대한 예측결과를 나타내며, 확률로서 표현되는 장점이 있다. 그러나 GIS전문가와 지질 전문가에 의해서 작성이 되며, 작성과정이 복잡한 단점이 있 다. 본 프로그램을 이용하여 예측한 결과는 기존 모델을 이 용하여 예측한 결과와 약간의 차이가 있는 것으로 나타났으 며, 일부 서로 중첩되는 구간도 있는 것으로 나타났다. 따라 서 실제 발생된 현장조사 결과와 비교하여 본 프로그램에 대한 적용성 검토가 필요할 것으로 판단된다.

그림 10은 대상지역에 대한 현장조사결과와 본 연구에서 개발된 예측프로그램의 예측결과를 서로 비교한 것이다. 그 림에서 보는 바와 같이 실제 급경사지 재해가 집중적으로 발생된 구간과 급경사지재해 발생 예측구간이 유사하게 일 치하고 있는 것으로 나타났다. 그러나 일부구간에서는 예측 결과가 다소 맞지 않는 것으로 나타났다. 한편, 예측구간의 하부에서는 기존 예측모델을 이용한 결과가 보다 좋은 일치 성을 나타내는 반면 예측구간의 중앙부에서는 본 연구로부 터 개발된 예측모델을 이용한 결과가 보다 좋은 일치성을 보이는 것으로 나타났다. 이러한 경향은 본 예측프로그램을 개발할 때 가정한 강우량의 차이에 의한 것으로 판단된다.

본 예측프로그램에서는 급경사지재해를 발생시키는 강우량이

2

일간 약 250mm이상(김원영 외, 2000)을 전제로 하고 있 다. 그러나 대상지역의 경우 2일간 895mm의 강우량이 측정 되었으므로 가정한 강우량의 3.5배가 넘는다. 따라서 본 예

측지도에서 제시된 구간 뿐만아니라 더 넓은 지역에서 급경 사지재해가 발생된 것으로 판단된다.

이상의 결과를 살펴보면 본 연구에서 개발된 급경사지재해 예측프로그램은 우리나라의 결정질암지역에서 적용할 수 있 는 가능성이 높은 것으로 판단된다. 물론 급경사지재해 예측 결과에 대한 정확도를 높이기 위하여 추후 프로그램을 수정 및 보완할 여지는 있다. 추후 지속적인 연구를 통하여 급경 사지재해 예측결과에 대한 정확도를 높이고, 이를 실용화하 여 범용적으로 사용이 가능하도록 할 예정이다.

6.

결론 및 요약

본 연구에서는 의사결정나무모형을 이용하여 화강암, 편마 암 등 결정질암 지역에서의 급경사지재해 예측모델을 개발 하였다. 그리고 이를 토대로 GIS기반의 급경사지재해 예측

Fig. 8. Prediction result of slope hazards Fig. 9. Comparison with the existed model (Cho, 2006)

Fig. 10. Comparison with the field data

(11)

프로그램을 개발하였다. 새롭게 개발된 급경사지재해 예측프 로그램을 검증하기 위하여 2002년 태풍 ‘루사’에 의해 급경 사지재해가 많이 발생한 강릉시 주문진읍 일대의 현장조사 결과와 대상현장에 대한 예측결과를 비교 검토하였다. 이들 결과를 정리하면 다음과 같다.

1.

경기북부지역, 상주지역 및 속초지역에 대한 현장 및 토 질자료를 토대로 화강암, 편마암 등의 결정질암지역에 적 용가능한 급경사지재해 예측모델을 개발하였다. 예측모델 은 의사결정나무모형을 이용하여 개발되었으며, 사면경 사, 투수계수 및 간극비가 변수로 활용되며, 정분류표에 의한 예측모델의 신뢰도 평가결과 정확도가 95.37%인 것 으로 나타났다.

2.

의사결정나무모형의 급경사지재해 예측모델을 토대로 GIS 기법을 이용한 국가 주요시설물 주변 급경사지 재해 예측 프로그램 SHAPP ver 1.0(등록번호: 2008-01-129-003872) 을 개발하였다.

3.

개발된 예측모델 및 예측프로그램을 검증하기 위하여 급 경사지재해가 많이 발생된 강릉시 주문진읍 일대의 현장 조사결과와 대상현장에 대한 예측결과를 비교 검토하였 다. 검토결과 실제 급경사지 재해가 집중적으로 발생된 구간과 급경사지재해 예측구간이 유사하게 일치하고 있는 것으로 나타났다.

4.

개발된 급경사지재해 예측프로그램은 우리나라에 넓게 분 포되어 있는 결정질암지역을 대상으로 적용가능한 것으로 판단된다. 추후 지속적인 연구를 통하여 다수 지역에 대 한 급경사지재해 예측결과를 도출하여 이에 대한 정확도 를 높고자 한다.

5.

본 연구를 통하여 개발된 예측프로그램은 일반 지질 및 토목기술자가 쉽게 활용할 수 있는 단순화한 것이며, 이 에 대한 실용화 방안을 마련할 예정이다.

감사의 글

본 연구는 2006 건설기술혁신사업인 ‘국가 주요시설물 안 전관리 네트워크 시범구축 및 운영시스템 개발’의 세부협동 과제인 ‘GIS기반 급경사지 재해위험 취약지구 선정기법 연 구’의 일환으로 수행되었습니다.

참고문헌

김원영, 채병곤, 김경수, 기원서, 조용찬, 최영섭, 이사로, 이봉주

(2000)

산사태 예측 및 방지기술연구, 과학기술부, 한국자원

연구소, KR-00-(T)-09, p. 642.

김원영, 채병곤, 김경수, 조용찬, 최영섭, 이춘오, 이철우, 김구영, 김정환, 김준모(2003) 산사태 예측 및 방지기술연구, 과학기 술부, KR-03-(T)-03, p. 339.

김정찬, 고희재, 이승렬, 이창범, 최성자, 박기화(2001)

1:250,000

강릉

-

속초 지질도폭 설명서, 한국지질자원연구원, p. 76.

김종규, 사공명, 이준석, 이용주(2006) 의사결정트리 기법을 이용 한 터널 보조공법 선정방안 연구, 대한토목학회논문집, 대한 토목학회, 제26권 제4C호, pp. 255-264.

송영석, 채병곤(2008) 의사결정나무모형을 이용한 편마암지역에서 의 급경사지재해 예측기법 개발, 지질공학, 제18권 제1호,

pp. 45-54.

송영석, 채병곤, 조용찬, 김경수, 이춘오(2008)

GIS

기반 급경사지 재해위험 취약지구 선정기법 연구

(2

차년도), 국토해양부, 한국 지질자원연구원, p. 114.

장윤경, 유병섭, 이동욱, 조숙경, 배해영(2006) 공간 데이터의 분 포를 고려한 공간 엔트로피 기반의 의사결정 트리 기법, 정 보처리학회논문지, 한국정보처리학회, 제13-B호, 제7권, pp.

643-652.

조용찬(2006) 화강암지역 산사태의 특성과 예측

-

강릉지역을 중심 으로-, 박사학위논문, 경북대학교 대학원. p. 152.

최기헌(1995) 데이터 마이닝

:

개념 및 기법, 자유아카데미.

홍원표, 김원영, 송영석, 임석규(2004) 인공신경망모델을 이용한 산사태 예측, 한국지반공학회 논문집, 한국지반공학회, 제20권 제4호, pp. 67-75.

Biggs, D., de Ville, B., and Ville, E. (1991) A method of choosing multiway partitions for classification and decision tree. Jour- nal of Applied Statistics, Vol. 18, pp. 46-62.

Brand, E.W. (1981) Some thoughts on rainfall-induced slope fail- ures, Proceedings of 10th International Conference on Soil Mechanics Foundation Engineering, Stockholm, The Nether- lands, pp. 373-376.

Das, B.M. (1990) Principles of Geotechnical Engineering, PWS- KENT, Boston.

Jin, M.S., Gleadow, A.J.W., and Lovering, J.F. (1984) Fission track dating of apatite from Jurassic and Cretaceous granite in South Korea. Jour. Geological Society of Korea, Vol. 20, pp. 257-265.

Kass, G. (1980) An exploratory technique for investigating large quantities of categorical data, Applies Statistics.

Olivier, M., Bell, F.G., and Jemy, C.A. (1994) The effect of rainfall on slope failure, with examples from the Greater Durban area.

Proceedings of 7th int. Congress on IAEG, Vol. 3, pp. 1629- 1636.

(

접수일: 2008.12.29/심사일: 2009.2.3/심사완료일: 2009.3.2)

수치

Fig. 1. Analysis process of decision tree model
Table 2. Number of analysis data
Table 3. Variable items
Table 4. Classification table of analysis result 실제 관측된 값예측값 급경사지재해 미발생 급경사지재해 발생 합 계 산사태 미발생 56 4 60 산사태 발생 1 47 48 합 계  57 51 108 -  정분류율 = -  오분류율 = 56 47+( ) --------------------- 100 %108× ( ) = 95.37 % ( )4 1+()--------------- 100 % 108 × ( ) = 4.63
+5

참조

관련 문서

Micro- and nano-sized pores were formed on the surface of the alloy using PEO and anodization methods, and the pore shape change according to the Zr

 Settlement estimation based on realistic deformation characteristics measured from stress path tests which duplicate field stress paths and probable deformation modes of

In Section 2, social deficiency, various deficits in relation to society were considered based on various social phenomena, and by referencing Erik

model development and empirical testing. Brand authenticity: Towards a deeper understanding of its conceptualization and measurement.. Brand authenticity: Testing

¾ In the CMOS philosophy, the PMOS section can be obtained from the NMOS section by converting series combinations to the parallel combinations and

In this study, Ply can be stacked on Different to predict the strength and stiffness using the fiber and Matrix properties obtained from

To confirm the characteristics and field application of lightweight air-mixed soil, compressive strength, capillary rise height, permeability coefficient,

- Computer modeling of the function of the human heart - Writing software for analysis of medical research data - Analysis of medical device hazards for safety and