A Study on the Effective Selection of Tunnel Reinforcement Methods using Decision Tree Technique

(1)

터 널 工學

大韓土木學會論文集

第26卷第4C 號·2006年 7月 pp. 255~264

의사결정트리 기법을 이용한 터널 보조공법 선정방안 연구

A Study on the Effective Selection of Tunnel Reinforcement Methods using Decision Tree Technique

김종규·사공명·이준석·이용주****

Kim, Jong-Gyu ^· Sagong, Myung ^· Lee, Jun S. ^· Lee, Yong-Joo

···

Abstract

The auxiliary reinforcement method is normally applied to prevent a possible collapse of the tunnel face where the ground condition is not favorable or geologic information is not sufficient. Recently, several engineering approaches have been made to choose the effective reinforcement methods using expert system such as neural network and fuzzy theory field, among oth- ers. Even if the expert system has offered many decision aid tools to properly select the reinforcement method, the quantitative assessment items are not easy to estimate and this is why the data mining technique, widely used in the field of social science, medical treatment, banking and agriculture, is introduced in this study. Using decision tree together with PDA, the decision aids for reinforcement method based on field construction data are created to derive the field rules and future study will be con- centrated on the application of the proposed methods in a variety of underground development cases.

Keywords : Data mining, decision tree, tunnel, reinforcement method, PDA

···

요 지

터널 시공시 지반상황이 불량하거나 불확실한 지질정보로 인한 붕락사고를 방지하기 위하여 지보재와 병용하여 터널보조 공법을 사용한다. 현재 보조공법에 관련된 전문가 시스템은 인공신경망, 퍼지추론 등의 연구가 진행되었고 터널 기술자에게 보조공법을 결정하는데 많은 도움을 주고 있는 상황이나 보조공법을 결정하는데 있어 정량적인 평가항목을 정하는데 어려움 이 많은 것으로 파악되고 있다. 따라서, 본 연구에서는 사회과학, 의료, 금융, 농업 등 다양한 분야에 걸쳐 데이터분석에 이 용되는 데이터마이닝 기법을 공학분야에 적용시켜 보조공법 설계자료를 바탕으로 보조공법의 의사결정 규칙을 추론하고 PDA를 적용한 전문가 시스템을 구축하였다.

핵심용어 : 데이터 마이닝, 의사결정트리, 터널, 보조공법, PDA

···

1. 서 론

급속한 산업과 사회 발달로 인해 지하공간 개발에 대한 관심이 증가하면서 도로 및 철도터널 , 지하철 건설의 안전성 이 주요 이슈가 되고 있다 . 최근 터널 건설이 증가하면서 다양한 문제점에 제기된 바 있으며 , ^특히 ^{산악터널과} ^달리

도심지 터널의 경우 시공 중 소음 및 진동 , 붕괴 등의 사고 가 발생할 개연성이 높다 . 도심지 터널에서 발생한 사고는 막대한 인명피해와 재산손실을 야기시키므로 시공 중 보조 공법을 적용하여 가능한 불확실하고 불안정한 사고를 방지 하는 노력이 필요하다 . 하지만 지반의 불확실성으로 뚜렷한 보조공법을 제시하기가 어려우며 , 터널현장 기술자의 경험을 바탕으로 보조공법을 결정하는 경우가 빈번히 발생하게 된다 . 1982 ^년 ^제 1 ^기 ^{서울지하철} ^건설 ^이후 ^{도입단계부터} ^지금까

지 보조공법의 시공경험 및 이론적 개념이 발전하고 있으나

( ^이인기 ^외 , 2004) ^{과다설계의} ^가능성이 ^{대두되면서} ^효율적

인 보조공법을 결정하기 위한 전문가 시스템 구축연구가 수 행된 바 있다 . 특히 인공신경망과 퍼지추론을 적용한 연구가 활발히 이루어지고 있으며 실제 터널현장의 데이터를 학습 시켜 상관성을 도출한 후 부족한 지질자료를 획득하는 인공 신경회로망의 개발이나 ( 문현구 외 , 1994), 기존 RMR 분류 법의 항목을 신경망을 이용하여 국내 터널현장의 데이터로 학습시켜 한국형 터널 암반분류법을 제시한 경우도 있다 ( 양

형식 외 , 1999). 또한 터널의 안정성을 퍼지추론을 이용하여

판단하고 , 안정성 등급에 따른 터널 보강공법을 선정하는 전

문가 시스템이 연구된 바 있고 ( 김창용 외 , 2000), 퍼지추론

과 인공신경망을 동시에 적용한 뉴로 - 퍼지기법을 이용하여 터널지반의 등급을 평가하기 퍼지추론 시스템이 연구되었다

*한국철도기술연구원연구원

(E-mail : [email protected])

**정회원ㆍ한국철도기술연구원선임연구원

(E-mail : [email protected])

***정회원ㆍ한국철도기술연구원책임연구원

(E-mail : [email protected])

****정회원ㆍ포항산업과학연구원선임연구원

(E-mail : [email protected])

(2)

( 조만섭 외 , 2003). 국외의 경우 터널의 지보공결정을 위해 퍼지추론을 이용한 전문가시스템을 구성하였고 (Kalamaras,

1997), 터널의 불안정 정도를 퍼지추론을 이용하여 분류하고 ,

분류등급별 보강대책을 선정할 수 있는 시스템을 연구하였 으며 (Chikahisa 등 , 1997), NATM 터널의 RMR 등급별 안 정성을 인공신경망을 통해 제시한 바 있다 (Sou-Sen Leu 등 , 2001).

본 연구에서는 데이터 마이닝 (Data mining) 을 이용한 터 널 보조공법의 선정기법과 선정과정의 자동화를 위한 PDA S/W 를 개발하였다 . 데이터 마이닝은 대용량의 자료로부터 사 용목적에 부합한 유용한 정보를 선별하는 기법으로 데이터 사이에 숨겨진 패턴을 발견하고 규칙을 추론함으로써 , 의사 결정을 지원하는 기법이다 . 특히 , 지난 수십 년간 축척된 전 자상거래 , 주식거래 , 은행거래 , 신용카드결제 및 세금 등의 대용량 자료의 경우 , 데이터의 양은 계속 증가하는 상황에서 의미있는 정보를 찾아내는 과정을 데이터마이닝이라 부를 수 있다 . 특히 과거의 경우 제한된 정보범주에서는 단지 의사 결정자의 직관에 근거하여 의사결정을 내리는 전문가시스템 ,

즉 전문가의 지식을 지식베이스에 수동으로 입력하여 구축 한 경우 왜곡과 오류를 낳기 쉬운 반면 , 데이터마이닝을 통 해 중요한 데이터 패턴을 찾아내는 일련의 과정을 통해 보 다 객관적이고 효율적인 의사결정을 수행할 수 있다 ( 최기헌 ,

1995). 따라서 본 연구에서는 터널 보조공법 선정분야에 데

이터 마이닝 기법을 적용시켜 , 국내 시공된 터널 설계데이터 에서 터널 보조공법에 관련된 인자의 교호효과를 분석함으 로써 터널 시공 중 현장 상황에 따른 보조공법을 제시할 수 있는 방안을 연구하였다 .

2. 데이터마이닝기법의 적용 2.1 의사결정트리

의사결정트리는 분석대상에 대한 분류나 예측을 수행하기 위해서 사용되는 분석기법으로 대용량의 데이터 내에 존재 하는 관계 , 패턴 및 규칙 등을 탐색하고 모형화하는 역할을 수행하며 , ^{신경망이나} ^판별분석 ^등에 ^의한 ^방법과는 ^달리 ^적

용결과에 의해 규칙을 명확하게 나타낼 수 있다 . 또한 예측 모형 자체뿐만이 아니라 최적결과를 검색하거나 분석에 필 요한 변수 간의 교호효과 , 즉 두 개 이상의 입력변수가 결 합하여 목표변수에 어떻게 영향을 주는지를 찾아내는데 이 용된다 . 특히 트리구조로 표현되기 때문에 다른 기법들과 비 교하여 쉽게 이해되고 설명할 수 있으며 , 임의의 데이터 범

주에서 동일한 특성을 갖는 집합으로 구분하여 특성을 정의 하고 목표변수에 대한 규칙을 추론하여 미래의 대한 예측을

할 경우 유용하게 활용할 수 있다 ( ^최기헌 , 1995).

그림 1 은 의사결정트리구조로서 마디 (node) 로 구성되며 , 뿌

리마디 (root node) 로부터 시작하여 하위마디로 자식마디 (child

node) 를 계속적으로 분리 , 형성해 나감으로써 완성된다 . 뿌리

마디와 반대로 트리의 가장 끝에 위치하여 가지가 분리되지

않는 마디를 끝마디 ( 종단마디 , leaf node) 라고 하며 , 뿌리마

디부터 종단마디까지의 분리단계를 깊이 (depth) 라고 한다 . 그 림 1 에서 총 6 개의 최종마디가 생성되었고 상위마디의 규칙

을 가정 - 결론 (IF-THEN) 방식으로 추론할 수 있다 . 예를 들

어 , 최종마디 “No(45%) ” 의 경우 “IF Own home=Rent AND Family income=High THEN Savings=No" 와 같은 규칙이 추론된다 .

2.2 의사결정트리의 알고리즘

의사결정트리는 뿌리마디에서 최종마디인 종단마디까지 가 지를 분리시켜 마디를 생성하는 일련의 과정으로 구성된다 .

이때 상위마디에서 하위마디로 분리되는 분리기준은 분할 알 고리즘에 따라 결정된다 . 의사결정트리의 대표적인 알고리즘 은 CHAID(Chi-squared Automatic Interaction Detection)

알고리즘 (Kass, 1980) 으로 명목형 , 순서형 , 연속형 등 모든

종류의 목표변수와 분류변수에 적용이 가능하며 , Exhaustive CHAID 알고리즘 (Biggs 등 , 1991) 으로 발전하였다 . 그 밖에

CART(Classification and Regression Tree), QUEST(Quick, Unbiased, Efficient, Statistical), C5.0, C4.5 ^알고리즘 ^등이

있으며 , 표 1 은 각각의 알고리즘의 특징을 나타낸다 ( 강현철 외 , 2001).

그림 1. 의사결정트리의 흐름도(강현철 외, 2001)

표 1. 의사결정트리의 알고리즘

구분 CHAID CART QUEST

목표변수 명목형 , 순서형 , 연속형 명목형 , 순서형 , 연속형 명목형 설명변수 명목형 , ^순서형 , ^연속형 ( ^{사전그룹화} ) ^명목형 , ^순서형 , ^연속형 ^명목형 , ^순서형 , ^연속형

분리기준 카이제곱 - 검정 , F- 검정 지니지수 , 분산의 감소카이제곱 - 검정 , F- 검정 (Levene 검정 )

분리개수 다지분리 (multiway) ^이지분리 (binary) ^이지분리 (binary)

가지치기 알고리즘에 포함되어 있지 않음 알고리즘에 포함되어 있지 않음 알고리즘에 포함되어 있음 결손값의 대체규칙 알고리즘에 포함되어 있지 않음 알고리즘에 포함되어 있지 않음 알고리즘에 포함되어 있음

비용함수 변수선택에 직접적으로 사용되지 않음 변수선택에 사용 변수선택에 직접적으로 사용되지

않으나 비용함수에 의해서 사전확률 조정

(3)

CHAID 은 카이제곱 - 검정 ( 이산형 목표변수 ) 또는 F- 검정 ( 연 속형 목표변수 ) ^을 ^이용하여 ^분리와 ^병합을 ^{반복하면서} Pearson 카이제곱 또는 우도비 (Likelihood ratio) 카이제곱 통계량을 분리기준으로 사용한다 . 카이제곱 통계량은 관측도 수 ( f

ij

) 로 이루어진 r ( 설명변수 ) × c ( 목표변수 ) 분할표로부터 계산되며 , 분할표의 구조는 표 2 와 같다 .

분할표로부터 Pearson 의 카이제곱 통계량은 다음과 같다 . (1)

여기서 두 통계량의 자유도 (degree of freedom) 는 ( r− 1)( c−

1) 로 통일하며 e

ij

는 분포의 통일성 또는 독립성의 가설 하에

서 계산된 기대도수 (expected frequency) 로서 다음과 같다 . (2)

분할표로부터 우도비 카이제곱 통계량은 다음과 같다 . (3)

카이제곱 통계량이 자유도에 비해서 매우 작다는 것은 설 명변수의 각 범주에 따른 목표변수의 분포가 서로 동일하여 설명변수가 목표변수의 분류에 영향을 미치지 않는 것이다 .

한편 자유도에 대한 카이제곱 통계량이 크고 작음은 해당집 단에서 그 조건이 틀렸다고 잘못 생각할 확률인 p- 값으로 표현되는데 , 카이제곱 통계량이 자유도에 비해 작으면 p- 값 은 증가하므로 , p- 값이 가장 작은 설명변수에서 최적분리가

발생하는 것이다 . 표 3 은 Pearson 의 카이제곱 통계량을 이

용한 분할표의 예이다 .

표 3 의 분할표에서 자유도는 가로축이 GOOD, BAD 의 2

개 항목과 세로축 RIGHT, LEFT 의 2 개 항목으로 (2-1) ×

(2-1) 로 1 이다 . 이때 관측도수로부터 기대도수를 계산하고 ,

기대도수와 관측도수로부터 카이제곱통계량을 계산한 결과

46.75 가 산출되었다 . 카이제곱통계량 분포표에서 자유도가 1

인 경우 유의확률을 0.05 로 정의할 때 p- 값은 0.03841 이 산 출되며 , p- 값이 카이제곱통계량보다 작기 때문에 가지의 분 리가 가능하게 된다 .

분리알고리즘을 통해 자식마디를 형성시키는 과정은 그림

2 와 같다 .

3. 터널 보조공법의 분류 및 예측

3.1 터널 보조공법 결정을 위한 입력변수와 목표변수의 결정

터널단면의 계획 , 굴착방법의 선정 , 지보형식의 결정 등을 지배하는 주요 요소는 암종 , 풍화도 , 절리 , 파쇄대 등 암반 상태와 역학적 특성 , 변형특성 및 지하수 상태 등이다 . 이들 요소 중 터널의 굴착방법이나 지보형식을 선정하는데 중요 한 사항은 암반상태와 역학적 특성이며 특히 지보형식을 결 정하기 위한 암반의 분류는 암질의 상태에 의존하고 터널보 조공법 적용시 암질의 상태는 중요한 항목이다 ( 한국철도시

설공단 , 2004). 따라서 터널 보강계획을 수립하는데 있어서

보강목적에 적합한 공법을 선정하기 위해서는 해당 지점의 지반조건과 시공환경을 고려한 조사항목을 표 4 와 같이 선 정하였다 .

x

²

( f

_ij

– e

_ij

)

²

e

_ij

---

∑

i j,

=

e

_ij

f

_i

× f

_.j

f ..

---

=

x

²

2 f

_ij

i j,

∑ × ^log

^e

⎝ ⎠ ⎛ ⎞ _e ^--- ^f

^ij_ij

=

표 2. 카이제곱 통계량의 분할표 목표변수

설명변수 범주 1 범주 2 … 범주 c 합계 범주 1 ^f

¹¹

^f

¹²

… f

1c

f

1.

범주 2 ^f

²¹

^f

²²

^… ^f

^2c

^f

^2.

… … … … … …

범주 r f

r1

f

r2

… f

rc

f

r.

합계 f

.1

f

.2

… f

.c

f

..

표 3. 카이제곱통계량

구분 GOOD BAD TOTAL

RIGHT ^관측도수 32 48

기대도수 80

LEFT ^관측도수 178 42

기대도수 220

TOTAL 210 90 300

Chi-square statistics

56 80

300 --- 210 × 300 --- × 300

= 24 80

300 --- 90 × 300 --- × 300

=

154 220 = 300 --- 210 × 300 --- × 300 66 220 = 300 --- 90 × 300 --- × 300

x

²

( 56 32 – )

²

--- 24 48 56 ( – )

²

--- 154 178 24 ( – )

²

--- 66 42 154 ( – )

²

--- 66

+ + + 46.75

= =

그림 2. 의사결정트리의 평가과정

(4)

수집된 자료는 총 151 개로 구성되었으며 , 최종 목표변수는

Fore-poling 및 강관다단 보강그라우팅 , 대구경 강관다단 보

강그라우팅 , 조합공법의 보조공법과 굴착공법으로 표 5 와 표

6 은 각각의 구성을 나타내고 있다 .

표 4 에서 각 입력변수와 목표변수는 명목형변수 , 즉 성별 ,

상품의 종류 , 지역 등과 같이 순서를 가지지 않는 변수들로 구성되었기 때문에 변수별 코딩형식을 추가하여 의사결정트 리의 모형을 구축하였다 .

보조공법과 굴착공법에 미치는 입력변수의 영향을 분석하

기 위해 시공위치 , 갱구부 , RMR, 토피고 , 단층 , 인접구조물

의 6 개 입력변수를 이용하였고 , 유의수준은 p<0.15 로 하였 다 . 세부적인 알고리즘은 CHAID 법을 이용하여 의사결정트 리의 모형을 구축한 후 이익도표의 분석과 위험도표의 분석 을 통해 안정성 있는 모형인지의 적합도를 검증하였다 .

3.2 터널 보조공법의 의사결정트리 분석

의사결정트리 분석 결과 보조공법의 부모마디에서 뿌리마

디까지 5 depth, 총 42 개의 마디 중 24 개의 최종마디로 이

루어진 트리구조가 형성되었다 . 그림 3 은 도심지터널과 산악 터널의 의사결정트리로서 굵은 외곽선으로 표시된 부분이 최 종마디를 나타내고 있다 . 보조공법을 결정하는 처음 변수로 시공조건 항목이 선정되었으며 , 특히 대구경 강관다단 보강 그라우팅의 경우 산악터널 (4/28, 16%) ^보다는 ^{도심지터널} (24/

28, 86%) 에 많이 적용되는 것을 알 수 있다 . 또한 도심지터

널 입력변수 중 토피고가 20m 이하인 경우 64%(53/83), 인

접구조물이 있는 경우 63%(52/83) 이지만 산악터널은 34%

(23/68), 24%(16/68) 로 나타나는 것으로 보아 도심지터널의

특수한 시공환경이 반영된 것으로 판단된다 . 도심지 터널의 경우 인접구조물의 유 , 무와 토피고 항목이 시공조건 항목 다음으로 영향을 끼치며 , 인접구조물이 없고 토피고가 2D 이

상이면 주로 Fore-poling, 인접구조물이 있고 토피고가 2D 이

하이면 주로 강관다단보강 그라우팅과 대구경 강관다단보강 그라우팅이 적용되었다 .

반면 산악터널의 경우 도심지 터널과 달리 인접구조물이 아닌 갱구부 여부의 영향을 받았으며 , 이는 산악터널의 특성 이 반영된 것으로 판단된다 . 특히 갱구부에 해당할 경우

RMR 값이 영향을 끼치며 , RMR 값이 유리한 경우 토피고에

따라 보조공법이 결정되는 것을 알 수 있다 . 갱구부에 해당 하지 않는 본선구간에서는 RMR 값에 따라 보조공법이 결정

되었으며 , RMR 값이 불리한 20-0 구간은 단층의 유 , 무 그

리고 단층이 없는 경우 인접 구조물의 유 , 무에 따라 보조 공법이 결정되었다 . ^특히 RMR ^값이 ^유리한 100-60 ^구간에서

도 보조공법이 적용되었는데 , 이는 단층의 영향으로 기인하 며 단층이 없는 경우 인접구조물의 유 , 무에 따라 보조공법 이 적용된 것을 알 수 있다 .

24 개의 최종마디를 추론규칙으로 활용하기 위해서는 이익 도표를 분석하는 평가작업이 이루어져야 한다 . 이익도표는 표본의 부분집합에서 목표변수의 예측치에 대한 기술통계량 을 분석하여 모형 구축의 타당성을 평가하고 목표변수의 특 징을 파악할 수 있는 도표로서 이익도표에는 최종마디별 목

표변수에 대한 빈도가 높은 순서로 나타나며 표 7 은 Fore-

poling 에 대한 이익도표이다 .

이익도표의 첫 번째 행인 30 번 마디를 보면 총 7 개의 데 이터로 구성되었고 , Fore-poling ^의 ^빈도는 7 ^개로 ^총 151 ^개의

데이터에 대해서는 4.64%( ③ ), 61 개의 Fore-poling 에 대해서 는 11.48%( ⑤ ), 그리고 응답률 ( ⑥ ) 은 100% 로 30 번 마디는

Fore-poling 을 적용할 수 있는 최종마디로 판단할 수 있다 .

또한 Index(%) ^는 ^해당 ^마디에 ^대한 ^{응답비율이} ^{전체자료에}

대한 응답비율과 얼마나 비교되는지를 나타내는데 , 전체 평

균치와 해당 구간을 비교하는 개념으로 247.54%( ⑦ ) 로 2.4

배 높은 것을 알 수 있다 .

반면 40 번 마디의 경우 Index 값은 82.51%( ⑦ ) 로 100% 보 표 4. 보조공법 결정을 위한 조사항목

변수이름 입력 / 목표 변수값 ( 코딩값 ) RMR 입력 100-40(1), 40-20(2). 20-0(3)

토피고 입력 2D 이상 (1), 2D 이하 (2)

단층유무 -

단층이격거리 입력 유 - ^통과 (1), ^유 -2D ^이하 (2), ^유 -2D ^이상 (3), ^무 (0)

인접구조물 입력 유 (1), 무 (0)

시공환경 입력 도심지터널 (1), ^산악터널 (2)

갱구부 입력 갱구부 (1), 본선구간 (0)

굴착공법 목표 전단면굴착 (1), ^{상하반분할굴착} (2),

링컷굴착 (3)

보조공법 목표

Fore-poling(1),

강관다단 보강그라우팅 (2),

대구경 강관다단 보강그라우팅 (3), Fore-poling + 강관다단 보강그라우팅

(4)

표 5. 보조공법별 데이터 구성

구분 Fore-poling _{보강그라우팅} ^강관다단 ^대구경 _{보강그라우팅} ^강관다단 Fore-poling + 강관다단

보강그라우팅 계

도심지터널 23 26 24 10 83

산악터널 38 26 4 0 68

계 61 52 28 10 151

표 6. 굴착공법의 데이터 구성

구분 전단면굴착 상하반 분할굴착 링컷굴착 계

도심지터널 0 47 36 83

산악터널 4 61 3 68

계 4 108 39 151

(5)

다 작으며 이는 전체자료보다 낮은 응답율을 갖는다는 것을 의미하며 , 이후 마디에 대해서는 추론규칙에서 제외시킬 수 있다 . 최종마디 중 추론규칙을 정하기 애매한 마디에 대해서 는 Fore-poling 에 대한 응답비율 ( ⑤ ) 이 5% 이하인 경우 자 료의 오차범위를 고려하여 제외하였다 . ^또한 ^{최종마디에서}

보조공법의 % ^가 ^동일하여 ^우위가 ^결정되지 ^않을 ^때에는 ^해

당 보조공법 모두를 추론규칙으로 하여 선택할 수 있도록 하였다 . 그러나 % 가 동일하거나 서로 우위를 결정할 수 없 는 마디에서는 각 보조공법의 전체 개체수에 대한 해당마디 의 보조공법 % ^가 10% ^이하인 ^경우 ^{추론규칙으로} ^정의하지

그림 3. 보조공법의 의사결정트리 분석

(6)

표 7. Fore-poling의 이익도표

Node ① Node: n

② Node: %

③ Resp: n

④ Resp: %

⑤ Gain (%)

⑥ Index (%)

30 7 4.64 7 11.48 100.00 247.54 ⑦

32 6 3.97 6 9.84 100.00 247.54

39 6 3.97 6 9.84 100.00 247.54

43 3 1.99 3 4.92 100.00 247.54

20 7 4.64 6 9.84 85.71 212.18

42 5 3.31 4 6.56 80.00 198.03

23 5 3.31 4 6.56 80.00 198.03

29 6 3.97 4 6.56 66.67 165.03

35 3 1.99 2 3.28 66.67 165.03

41 4 2.65 2 3.28 50.00 123.77

24 9 5.96 4 6.56 44.44 110.02

40 3 1.99 1 1.64 33.33 82.51

34 3 1.99 1 1.64 33.33 82.51

26 10 6.62 3 4.92 30.00 74.26

44 4 2.65 1 1.64 25.00 61.89

• • • • • • •

① : ^각 ^마디의 ^번호 , ^② : ^각 ^마디의 ^데이터 ^수 , ^③ : ^② /( ^전체 ^자료수 , 151 ^개 ) ^× 100(%), ^④ : Fore-poling ^에 ^대한 ^데이터 ^수 , ^⑤ :

④ /(Fore-poing ^자료수 , 61 ^개 ) ^× 100(%), ^⑥ : ^④ / ^②× 100(%), ^{해당마디내의} Fore-poling ^빈도비율 , ^⑦ : ^⑤ / ^③× 100(%), ^{해당마디의} Fore-poling ^응답비율

표 8. 터널 보조공법 적용의 분류 규칙

Node

No. IF THEN

16 시공조건 = “ 산악터널 ” AND 갱구부 = “ 갱구부 ” AND RMR= “ 40-21” 강관다단그라우팅

17 시공조건 = “ 산악터널 ” AND 갱구부 = “ 갱구부 ” AND RMR= “ 20-0” ^{강관다단그라우팅} , ^필요시

대구경 강관다단그라우팅

18 시공조건 = “ 도심지터널 ” AND 인접구조물 = “ 무 ” AND 토피고 = “ 2D 이상 ” AND RMR= “ 100-41” 미적용

19 시공조건 = “ ^{도심지터널} ” AND ^{인접구조물} = “ ^무 ” AND ^토피고 = “ 2D ^이상 ” AND RMR= “ 40-21” ^미적용 20 시공조건 = “ 도심지터널 ” AND 인접구조물 = “ 무 ” AND 토피고 = “ 2D 이상 ” AND RMR= “ 20-0” Fore-poling 22 ^시공조건 = “ ^{도심지터널} ” AND ^{인접구조물} = “ ^무 ” AND ^토피고 = “ 2D ^이하 ” AND ^단층 = “ ^유 ( ^통과 , 2D

이하 )” Fore-poling +

강관다단그라우팅

23 시공조건 = “ 도심지터널 ” AND 인접구조물 = “ 유 ” AND 토피고 = “ 2D 이상 ” AND RMR= “ 100-41” Fore-poling 24 시공조건 = “ 도심지터널 ” AND 인접구조물 = “ 유 ” AND 토피고 = “ 2D 이상 ” AND RMR= “ 40-21” Fore-poling ^또는 Fore-poling

+ ^{강관다단그라우팅} 25 시공조건 = “ 도심지터널 ” AND 인접구조물 = “ 유 ” AND 토피고 = “ 2D 이상 ” AND RMR= “ 20-0” ^대구경 또는 ^{강관다단그라우팅} Fore-poling +

강관다단그라우팅

26 시공조건 = “ 도심지터널 ” AND 인접구조물 = “ 유 ” AND 토피고 = “ 2D 이하 ” AND RMR= “ 100-41” ^대구경 _필요시 ^강관다단 Fore-poling ^그라우팅 27 시공조건 = “ ^{도심지터널} ” AND ^{인접구조물} = “ ^유 ” AND ^토피고 = “ 2D ^이하 ” AND RMR= “ 40-21, 20-0” _대구경 ^{강관다단그라우팅} _{강관다단그라우팅} ^또는 28 시공조건 = “ ^산악터널 ” AND ^갱구부 = “ ^본선구간 ” AND RMR= “ 100-41” AND ^단층 = “ ^무 ” Fore-poling 29 시공조건 = “ 산악터널 ” AND 갱구부 = “ 본선구간 ” AND RMR= “ 100-41” AND 단층 = “ 유 ( 통과 )” Fore-poling 30 시공조건 = “ ^산악터널 ” AND ^갱구부 = “ ^본선구간 ” AND RMR= “ 100-41” AND ^단층 = “ ^유 (2D ^이하 )” Fore-poling 32 시공조건 = “ 산악터널 ” AND 갱구부 = “ 본선구간 ” AND RMR= “ 40-21” AND 단층 = “ 유 ( 통과 , 2D 이하 )” Fore-poling 34 시공조건 = “ ^산악터널 ” AND ^갱구부 = “ ^본선구간 ” AND RMR= “ 20-0” AND ^단층 = “ ^유 ( ^통과 )” Fore-poling 35 시공조건 = “ 산악터널 ” AND 갱구부 = “ 갱구부 ” AND RMR= “ 100-41” AND 토피고 = “ 2D 이상 ” Fore-poling 36 시공조건 = “ ^산악터널 ” AND ^갱구부 = “ ^갱구부 ” AND RMR= “ 100-41” AND ^토피고 = “ 2D ^이하 ” ^{강관다단그라우팅} 37 ^시공조건 = “ 도심지터널 ” AND 인접구조물 = “ 무 ” AND 토피고 = “ 2D 이하 ” AND 단층 = “ 무 ” AND

RMR= “ 100-41” ^{강관다단그라우팅}

(7)

않고 현장조건에 따라 필요시 적용 가능토록 하였다 .

Fore-poling 이외의 강관다단보강 그라우팅과 대구경 강관

다단보강 그라우팅 및 조합공법에 대한 이익도표 분석과 그 림 3 의 의사결정트리 분석을 요약하여 추론규칙을 나타내면 표 8 ^과 ^같다 . ^{의사결정트리에} ^표현된 ^규칙은 IF-THEN ^형태

를 가지며 , 하나의 규칙이 뿌리마디에서 최종마디까지의 각 경로에 대해 형성된다 .

CHAID 알고리즘 의한 분류의 타당성을 검증하기 위한 오

분류확률을 표 9 에 나타내었다 . p- 값 ( 유의확률 ) 이 0.15 로 유 의할지라도 향후예측을 위한 모델을 구축할 목적으로 위험

도표 분석을 통해 오분류확률과 표준오차를 확인하였다 . ^오

분류확률은 33.11% ± 3.82% 로써 전체적인 분류의 정확도

는 약 70% 내외로 판명된다 .( 오분류확률의 계산은 “(6+6+1)

+ (9+10+1) + (3+6+0) + (1+0+7) = 50 에서 50/151 × 100 = 33.11% ^” ^이다 .)

3.3 터널 굴착공법의 의사결정트리 분석

총 11 개의 최종 마디로 이루어진 트리구조가 그림 4 와 같 이 형성되었으며 , 굴착공법에 가장 큰 영향을 미치는 설명변 수는 시공위치 항목으로 나타나고 있다 . 상하반분할 굴착공 표 8. 터널 보조공법 적용의 분류 규칙(계속)

Node

No. IF THEN

38 ^시공조건 = “ 도심지터널 ” AND 인접구조물 = “ 무 ” AND 토피고 = “ 2D 이하 ” AND 단층 = “ 무 ” AND

RMR= “ 40-21, 20-0” ^{강관다단그라우팅}

39 ^시공조건 = “ 산악터널 ” AND 갱구부 = “ 본선구간 ” AND RMR= “ 40-21” AND 단층 = “ 무 ” AND 인접

구조물 = “ 무 ” Fore-poling 또는

강관다단그라우팅

40 ^시공조건 = “ 산악터널 ” AND 갱구부 = “ 본선구간 ” AND RMR= “ 40-21” AND 단층 = “ 무 ” AND 인접

구조물 = “ 유 ” Fore-poling

41 ^시공조건 = “ 산악터널 ” AND 갱구부 = “ 본선구간 ” AND RMR= “ 20-0” AND 단층 = “ 무 ” AND 인접

구조물 = “ 무 ” Fore-poling

42 ^시공조건 = “ 산악터널 ” AND 갱구부 = “ 본선구간 ” AND RMR= “ 20-0” AND 단층 = “ 무 ” AND 인접

구조물 = “ 유 ” ^대구경 그라우팅 ^강관다단

표 9. 보조공법의 위험도표(오분류확률)

실제 예측 Fore-poling _{보강그라우팅} ^강관다단 ^대구경 _{보강그라우팅} ^강관다단 조합공법 계

Fore-poling 48 9 3 1 61

강관다단 보강그라우팅 6 32 6 0 44

대구경 강관다단 보강그라우팅 6 10 19 7 42

조합공법 1 1 0 2 4

계 61 52 28 10 151

오분류확률 0.331126

표준오차 0.038298

그림 4. 터널 굴착공법의 의사결정트리 분석

(8)

법의 경우 도심지터널과 산악터널의 비율이 거의 비슷하나 ,

링컷굴착의 경우 도심지터널에서 90%(26/29) ^정도 ^적용되는

것을 알 수 있다 . 도심지터널의 경우 토피고 , 인접구조물 , RMR 값의 순으로 , 산악터널의 경우 RMR 값 , 단층 및 인접 구조물과 같은 설명변수가 영향을 미치고 있다 . 굴착공법도 보조공법과 동일하게 시공조건이 가장 상관성있는 설명변수 로 나타나고 있으며 , 이는 도심지터널과 산악터널의 차이점 에 기인하는 것으로 판단된다 . 총 11 개의 최종마디 중 3 개 마디에서 링컷굴착이 적용되었으며 , 나머지 최종마디는 상하 반분할 굴착공법이 적용되었다 . 링컷굴착이 적용되는 마디는 인접구조물 또는 토피고 및 RMR 값이 불리한 경우에 적용 된 것으로 판단된다 .

그림 4 의 의사결정 규칙을 추론하면 표 10 과 같이 나타나 며 , 전단면 굴착공법의 경우 표 11 의 위험도표에 포함되지 않았기 때문에 분석과정에서 생략하였다 .

굴착공법의 의사결정트리 분석 오분류확률은 표 11 과 같으

며 , 17.88% ± 3.11% 로써 전체적인 분류의 정확도는 약

80% 내외로 판명된다 .

4. PDA를 이용한 의사결정 지원 시스템의 구축 터널 시공은 대부분 외업 중심으로 이루어지는 작업으로 ,

시공 중 발생하는 불확실한 상황에 능동적으로 대처할 수 있어야 하는데 , 의사결정 과정에서 적절한 공학적 판단이 지 연되는 경우 인명 및 재산 피해의 결과를 초래할 수 있다 .

따라서 터널 기술자의 공학적 판단을 보조할 수 있는 의사

결정 지원 시스템을 구축하여 터널 보조공법을 결정할 수 있도록 해야 한다 . ^본 ^연구에서 ^추론된 ^규칙을 ^기반으로 ^터

널 현장에서 쉽게 사용할 수 있는 PDA(Personal Digital

Assistant) 를 이용한 전문가 시스템을 구축하였으며 , 현장 작

업자가 막장면 상태를 판단하여 PDA 에 입력함으로써 적용 될 수 있는 보조공법을 제시하도록 구성하였다 .

본 프로그램 및 시스템은 Embedded Visual Basic 3.0 으

표 11. 굴착공법의 위험도표(오분류확률) 예측

실제 전단면

굴착 상하반

분할굴착 링컷 굴착 계

전단면굴착 0 0 0 0

상하반분할굴착 4 102 17 123

링컷굴착 0 6 22 28

계 4 108 39 151

오분류확률 0.178808

표준오차 0.031184

표 10. 터널 굴착공법의 분류 규칙

Node No. IF THEN

8 시공조건 =“ ^{도심지터널} ” AND ^{인접구조물} =“ ^무 ” AND ^토피고 =“2D ^이상 ” ^{상하반분할} ^굴착

12 시공조건 =“ 산악터널 ” AND 갱구부 =“ 본선구간 ” AND RMR=“100-41, 40-21” 상하반분할 굴착

13 시공조건 =“ ^산악터널 ” AND ^갱구부 =“ ^본선구간 ” AND RMR=“20-0” ^{상하반분할} ^굴착

14 시공조건 =“ 산악터널 ” AND 갱구부 =“ 갱구부 ” AND RMR=“100-41, 40-21” 상하반분할 굴착

15 시공조건 =“ ^산악터널 ” AND ^갱구부 =“ ^갱구부 ” AND RMR=“20-0” ^{상하반분할} ^굴착

16 시공조건 =“ 도심지터널 ” AND 인접구조물 =“ 무 ” AND 토피고 =“2D 이하 ” AND RMR=“100-41” 상하반분할 굴착

17 시공조건 =“ ^{도심지터널} ” AND ^{인접구조물} =“ ^무 ” AND ^토피고 =“2D ^이하 ” AND RMR=“40-21, 20-0” ^링컷 ^굴착 18 시공조건 =“ 도심지터널 ” AND 인접구조물 =“ 유 ” AND 토피고 =“2D 이상 ” AND RMR=“100-41, 40-21” 상하반분할 굴착

19 시공조건 =“ ^{도심지터널} ” AND ^{인접구조물} =“ ^유 ” AND ^토피고 =“2D ^이상 ” AND RMR=“20-0” ^링컷 ^굴착 20 시공조건 =“ 도심지터널 ” AND 인접구조물 =“ 유 ” AND 토피고 =“2D 이하 ” AND RMR=“100-41” ^{상하반분할} _또는 _링컷 _굴착 ^굴착 21 시공조건 =“ 도심지터널 ” AND 인접구조물 =“ 유 ” AND 토피고 =“2D 이하 ” AND RMR=“40-21, 20-0” 링컷 굴착

표 12. PDA S/W 개발 장비 및 프로그램

구분 종류 및 제원

개발언어 Microsoft Embedded Basic 3.0 (Software Development Kit) Microsoft Pocket PC 2002 SDK SDK

Platform Microsoft Window CE Platform Manager 4.0

Synch Microsoft Active Synch 3.7 버젼

PDA PDA (hp IPAQ Pocket PC h2210)

그림 5. PDA에서 시작화면

(9)

로 개발하였으며 , 시스템 개발시 PDA 와 PC 에 설치한 프로 그램 및 장비는 표 12 와 같다 .

그림 5 ^는 ^{프로그램의} ^최초 ^{시작화면으로} ^사용자가 ^시공위

치에 따라 도심지터널과 산악터널을 선택하여 시작할 수 있 도록 화면을 구성하였다 . 의사결정트리 분석을 통해 추론된 보조공법 및 굴착공법 결정 규칙을 기반으로 터널 시공 중 작업자가 터널 상태를 입력하면 현장상황에 적절한 보조공 법과 굴착공법을 제시하게 된다 . 그 예로써 , 그림 6 은 그림

5 에서 도심지터널을 선택할 경우 생성되는 화면으로 도심지 터널의 보조공법을 결정하기 위한 항목으로 인접구조물 ,

RMR, ^단층 , ^토피고를 ^각각 ^선택하여 “ ^{강관다단그라우팅} ^또

는 대구경강관다단 그라우팅 ” 의 보조공법과 “ 상하반분할 ” 의 굴착공법을 제시하였으며 , 그림 7 은 산악터널의 경우로 갱구

부 , RMR, 단층 , 토피고 , 인접구조물을 각각 선택하여

“Fore-poling ” 과 굴착공법으로 “ 상하반분할 ” 을 제시하였다 .

5. 결론 및 향후 연구계획

터널의 보조공법은 설계부터 시공까지 모든 상황이 고려되 어 가장 안정하고 효율적으로 결정되어야한다 . 그러나 지반 의 불확실성을 고려한다면 보조공법의 결정은 항상 불리한 여건에서 실행되어지기 때문에 이를 보완하기 위한 전문가 시스템이 필요하다 . 따라서 본 연구에서는 터널의 보조공법

을 시공 중 결정하기 위한 규칙을 찾고자 2000 년 이후 터

널설계자료 중 보조공법이 적용된 구간을 수집하여 데이터 마이닝 기법인 의사결정트리분석을 적용시켜 여러 설계변수 가 보조공법에 미치는 교호효과를 분석하였다 . ^터널 ^천단부

를 보강하는데 주로 적용되는 Fore-poling, 강관다단 보강그 라우팅 , 대구경 강관다단 보강그라우팅 공법과 터널의 굴착 공법을 목표변수로 하여 의사결정을 수행하였고 , 본 연구 결 과를 요약하면 다음과 같다 .

그림 6. 도심지터널에서의 터널 보조공법과 굴착공법

그림 7. 산악터널에서의 터널 보조공법과 굴착공법

(10)

1. 보조공법을 결정하는데 가장 큰 영향을 미치는 설계변수 는 시공조건으로 도심지터널과 산악터널에 따라 주로 적 용되는 보조공법의 종류가 상이한 것으로 나타나고 있다 . 2. 도심지터널의 경우 토피고가 낮고 , 도로 및 빌딩 등의 구 조물이 인접하여 산악터널에 비해 고강도의 보조공법이 주 로 적용되었으며 , 특히 인접구조물이 있으며 토피고가 낮 은 조건하에서는 주로 강관다단 그라우팅과 대구경강관다 단 그라우팅 공법이 적용되었다 .

3. 산악터널은 도심지터널과 달리 갱구부의 영향에 따라 보 조공법이 적용되며 , 갱구부 조건하에서는 RMR 에 따라 적 용되는 보조공법이 결정되었다 . 갱구부가 아닌 본선구간의

경우 RMR, 단층 , 인접구조물에 따라 보조공법이 적용되

었다 .

4. 굴착공법은 보조공법과 비슷한 의사트리가 형성되었으며 , RMR 이 낮을 경우 인접구조물 또는 토피고 조건이 불리 하면 링컷 굴착공법이 적용된 것으로 나타나고 있다 . 5. 보조공법과 굴착공법의 의사결정트리 분석을 통해 설계변

수간 규칙을 추론하여 PDA 상에서 사용가능하도록 프로그 램화함으로써 , ^터널 ^기술자의 ^보조공법 ^및 ^{굴착공법의} ^의

사결정시 도움을 주고자 하였다 .

본 연구에서는 터널의 천단부를 보강하기 위한 보조공법과 굴착공법 위주로 수행되었으나 , 차후 지반보강공법과 지수 및 차수 공법에 관련된 설계자료를 수집하여 각 변수간 교 호효과를 분석하여 천단부 보강과의 연관성을 찾고자 한다 .

참고문헌

강현철 , 한상태 , 최종후 , 김은석 , 김미경 (2001) ^{데이터마이닝 방법}

론 및 활용 , ^{자유아카데미} .

김창용 , 박치현 , 배규진 , 홍성완 , 오명렬 (2000) 터널 시공 중 보 강공법 선정용 퍼지 전문가 시스템 개발 , ^{한국지반공학회논문}

집 , 한국지반공학회 , Vol. 16, No. 6, pp. 127-139.

문현구 , ^이철욱 (1994) ^암반터널 ^{예비설계를} ^위한 ^{인공신경회로망}

전문가 시스템의 개발 , ^{터널과 지하공간} , 한국지반공학회 , Vol. 10, No. 3, pp. 79-96.

양형식 , 김재철 (1999) 인공신경망을 이용한 한국형 터널 암반분 류 , 터널과 지하공간 , 한국암반공학회 , Vol. 9, No. 3, pp.

214-220.

이인기 , 박태수 , 신영완 (2004) 국내 NATM 터널에서 보조공법의 변천 및 적용방법의 이해 , 제4회 터널시공기술향상 대토론회 ,

대학토목학회 , pp. 51-62.

조만섭 , ^김영석 (2003) ^터널지반 ^평가의 ^객관화를 ^위한 ^퍼지추론

시스템 연구 , ^{터널과 지하공간} , 한국암반공학회 , Vol. 13, No. 1 pp. 6-19.

최기헌 (1995) 데이터 마이닝 : 개념 및 기법 , 자유아카데미 .

한국철도시설공단 (2004) 철도설계편람, 터널편(VII) .

Biggs, D., B. de Ville and E. Ville (1991) A method of choosing multiway partitions for classification and decision tree, Jour- nal of Applied Statistics , Vol. 18, pp. 46-62

Chikahisa, H., Matsumoto, K., Nakahara, H., Tsutsui, M. (1997) Measurement control method and expert system for tunneling by fuzzy set theory, Environmental and Safety Concerns in Underground Construction , Lee, Yang & Chung (eds), Balkema, Rotterdam, pp.261-266

Kass, G. (1980) An exploratory technique for investigating large quantities of categorical data, Applies Statistics .

Kalamaras, G. S. (1997) A computer-based system for supporting decision for tunneling in rock under conditions of uncertainly, Int. J. Rock Mech & Min. Sci. Vol. 34, No. 3-4, Paper No. 147.

Sou-Sen Leu, Chee-Nan Chen, Shiu-Lin Chang (2001) Data min- ing for tunnel support stability-neural network approach, Auto- mation in Construction , Vol. 10, pp. 429-441.

( 접수일 : 2006.1.18/ 심사일 : 2006.4.27/ 심사완료일 : 2006.6.7)

A Study on the Effective Selection of Tunnel Reinforcement Methods using Decision Tree Technique

터 널 工 學

의사결정트리 기법을 이용한 터널 보조공법 선정방안 연구

A Study on the Effective Selection of Tunnel Reinforcement Methods using Decision Tree Technique

김종규*·사공명**·이준석***·이용주****

Kim, Jong-Gyu · Sagong, Myung · Lee, Jun S. · Lee, Yong-Joo

···

Abstract

Keywords : Data mining, decision tree, tunnel, reinforcement method, PDA

···

요 지

핵심용어 : 데이터 마이닝, 의사결정트리, 터널, 보조공법, PDA

···

1. 서 론

지 보조공법의 시공경험 및 이론적 개념이 발전하고 있으나

( 이인기 외 , 2004) 과다설계의 가능성이 대두되면서 효율적

형식 외 , 1999). 또한 터널의 안정성을 퍼지추론을 이용하여

판단하고 , 안정성 등급에 따른 터널 보강공법을 선정하는 전

문가 시스템이 연구된 바 있고 ( 김창용 외 , 2000), 퍼지추론

과 인공신경망을 동시에 적용한 뉴로 - 퍼지기법을 이용하여 터널지반의 등급을 평가하기 퍼지추론 시스템이 연구되었다

(E-mail : [email protected])

(E-mail : [email protected])

(E-mail : [email protected])

(E-mail : [email protected])

( 조만섭 외 , 2003). 국외의 경우 터널의 지보공결정을 위해 퍼지추론을 이용한 전문가시스템을 구성하였고 (Kalamaras,

1997), 터널의 불안정 정도를 퍼지추론을 이용하여 분류하고 ,

분류등급별 보강대책을 선정할 수 있는 시스템을 연구하였 으며 (Chikahisa 등 , 1997), NATM 터널의 RMR 등급별 안 정성을 인공신경망을 통해 제시한 바 있다 (Sou-Sen Leu 등 , 2001).

1995). 따라서 본 연구에서는 터널 보조공법 선정분야에 데

이터 마이닝 기법을 적용시켜 , 국내 시공된 터널 설계데이터 에서 터널 보조공법에 관련된 인자의 교호효과를 분석함으 로써 터널 시공 중 현장 상황에 따른 보조공법을 제시할 수 있는 방안을 연구하였다 .

2. 데이터마이닝기법의 적용 2.1 의사결정트리

주에서 동일한 특성을 갖는 집합으로 구분하여 특성을 정의 하고 목표변수에 대한 규칙을 추론하여 미래의 대한 예측을

할 경우 유용하게 활용할 수 있다 ( 최기헌 , 1995).

그림 1 은 의사결정트리구조로서 마디 (node) 로 구성되며 , 뿌

리마디 (root node) 로부터 시작하여 하위마디로 자식마디 (child

node) 를 계속적으로 분리 , 형성해 나감으로써 완성된다 . 뿌리

마디와 반대로 트리의 가장 끝에 위치하여 가지가 분리되지

않는 마디를 끝마디 ( 종단마디 , leaf node) 라고 하며 , 뿌리마

디부터 종단마디까지의 분리단계를 깊이 (depth) 라고 한다 . 그 림 1 에서 총 6 개의 최종마디가 생성되었고 상위마디의 규칙

을 가정 - 결론 (IF-THEN) 방식으로 추론할 수 있다 . 예를 들

어 , 최종마디 “No(45%) ” 의 경우 “IF Own home=Rent AND Family income=High THEN Savings=No" 와 같은 규칙이 추론된다 .

2.2 의사결정트리의 알고리즘

의사결정트리는 뿌리마디에서 최종마디인 종단마디까지 가 지를 분리시켜 마디를 생성하는 일련의 과정으로 구성된다 .

이때 상위마디에서 하위마디로 분리되는 분리기준은 분할 알 고리즘에 따라 결정된다 . 의사결정트리의 대표적인 알고리즘 은 CHAID(Chi-squared Automatic Interaction Detection)

알고리즘 (Kass, 1980) 으로 명목형 , 순서형 , 연속형 등 모든

종류의 목표변수와 분류변수에 적용이 가능하며 , Exhaustive CHAID 알고리즘 (Biggs 등 , 1991) 으로 발전하였다 . 그 밖에

CART(Classification and Regression Tree), QUEST(Quick, Unbiased, Efficient, Statistical), C5.0, C4.5 알고리즘 등이

있으며 , 표 1 은 각각의 알고리즘의 특징을 나타낸다 ( 강현철 외 , 2001).

그림 1. 의사결정트리의 흐름도(강현철 외, 2001)

표 1. 의사결정트리의 알고리즘

구분 CHAID CART QUEST

목표변수 명목형 , 순서형 , 연속형 명목형 , 순서형 , 연속형 명목형 설명변수 명목형 , 순서형 , 연속형 ( 사전그룹화 ) 명목형 , 순서형 , 연속형 명목형 , 순서형 , 연속형

분리기준 카이제곱 - 검정 , F- 검정 지니지수 , 분산의 감소카이제곱 - 검정 , F- 검정 (Levene 검정 )

분리개수 다지분리 (multiway) 이지분리 (binary) 이지분리 (binary)

가지치기 알고리즘에 포함되어 있지 않음 알고리즘에 포함되어 있지 않음 알고리즘에 포함되어 있음 결손값의 대체규칙 알고리즘에 포함되어 있지 않음 알고리즘에 포함되어 있지 않음 알고리즘에 포함되어 있음

비용함수 변수선택에 직접적으로 사용되지 않음 변수선택에 사용 변수선택에 직접적으로 사용되지

않으나 비용함수에 의해서 사전확률 조정

) 로 이루어진 r ( 설명변수 ) × c ( 목표변수 ) 분할표로부터 계산되며 , 분할표의 구조는 표 2 와 같다 .

분할표로부터 Pearson 의 카이제곱 통계량은 다음과 같다 . (1)

여기서 두 통계량의 자유도 (degree of freedom) 는 ( r− 1)( c−

1) 로 통일하며 e

는 분포의 통일성 또는 독립성의 가설 하에

서 계산된 기대도수 (expected frequency) 로서 다음과 같다 . (2)

분할표로부터 우도비 카이제곱 통계량은 다음과 같다 . (3)

카이제곱 통계량이 자유도에 비해서 매우 작다는 것은 설 명변수의 각 범주에 따른 목표변수의 분포가 서로 동일하여 설명변수가 목표변수의 분류에 영향을 미치지 않는 것이다 .

발생하는 것이다 . 표 3 은 Pearson 의 카이제곱 통계량을 이

용한 분할표의 예이다 .

표 3 의 분할표에서 자유도는 가로축이 GOOD, BAD 의 2

개 항목과 세로축 RIGHT, LEFT 의 2 개 항목으로 (2-1) ×

(2-1) 로 1 이다 . 이때 관측도수로부터 기대도수를 계산하고 ,

기대도수와 관측도수로부터 카이제곱통계량을 계산한 결과

46.75 가 산출되었다 . 카이제곱통계량 분포표에서 자유도가 1

인 경우 유의확률을 0.05 로 정의할 때 p- 값은 0.03841 이 산 출되며 , p- 값이 카이제곱통계량보다 작기 때문에 가지의 분 리가 가능하게 된다 .

분리알고리즘을 통해 자식마디를 형성시키는 과정은 그림

2 와 같다 .

3. 터널 보조공법의 분류 및 예측

3.1 터널 보조공법 결정을 위한 입력변수와 목표변수의 결정

설공단 , 2004). 따라서 터널 보강계획을 수립하는데 있어서

보강목적에 적합한 공법을 선정하기 위해서는 해당 지점의 지반조건과 시공환경을 고려한 조사항목을 표 4 와 같이 선 정하였다 .

x

( f

터 널 工學

김종규·사공명·이준석·이용주****

Kim, Jong-Gyu ^· Sagong, Myung ^· Lee, Jun S. ^· Lee, Yong-Joo

( ^이인기 ^외 , 2004) ^{과다설계의} ^가능성이 ^{대두되면서} ^효율적

할 경우 유용하게 활용할 수 있다 ( ^최기헌 , 1995).

CART(Classification and Regression Tree), QUEST(Quick, Unbiased, Efficient, Statistical), C5.0, C4.5 ^알고리즘 ^등이

목표변수 명목형 , 순서형 , 연속형 명목형 , 순서형 , 연속형 명목형 설명변수 명목형 , ^순서형 , ^연속형 ( ^{사전그룹화} ) ^명목형 , ^순서형 , ^연속형 ^명목형 , ^순서형 , ^연속형

분리개수 다지분리 (multiway) ^이지분리 (binary) ^이지분리 (binary)

∑ × ^log

⎝ ⎠ ⎛ ⎞ _e ^--- ^f

설명변수 범주 1 범주 2 … 범주 c 합계 범주 1 ^f

^f

범주 2 ^f

^f

^… ^f

^f

RIGHT ^관측도수 32 48

LEFT ^관측도수 178 42