터널시설물 점검진단 데이터의 텍스트마이닝 분석을 통한 유형별・지역별 중점 유지관리요소의 이해
Understanding Facility Management on Tunnel through Text Mining of Precision Safety Diagnosis Data
서 정 은* Seo, Jeong-eun
오 진 탁**
Oh, Jintak
Abstract
The purpose of this paper is to understand the key factors for efficient maintenance of rapidly aging facilities. Therefore, the safety inspection/diagnosis reports accumulated in the unstructured data were collected and preprocessed. Then, the analysis was performed using a text mining analysis method. The derived vulnerabilities of tunnel facilities can be used as elements of inspections that take into account the characteristics of individual facilities during regular inspections and daily inspections in the short term. In addition, if detailed specification information and other inspection results(safety, durability, and ease of use) are used for analysis, it provides a stepping stone for supporting preemptive maintenance decision-making in the long term.
Keywords : Text mining, Tunnel, Road Tunnel, Rail Tunnel, Management
Journal of Korean Association for Spatial Structures Vol. 21, No. 3 (통권 85호), pp.85~92, September, 2021
1. 서론
1)
국내의 기반 시설물들은 1980~90년대 급속한 산업화 와 함께 집중적으로 건설되었다. 2020년 기준 시설물통 합정보관리시스템(이하 FMS)에 등록되어 있는 기반 시 설물 54,441개 중 30년 이상인 노후 시설물은 9,768개 (17.9%) 이지만 향후 10년 이내에 준공 후 30년 이상 된 시설물은 24,618개(45.2%)로 앞으로 노후 시설물은 급격히 증가할 것으로 추정된다(<Fig. 1>, <Fig. 2>).1)
<Table 1>의 최근 들어 지속적으로 발생하는 노후 기반 시설물 관련 사고에서 확인할 수 있듯이 사용연수가 30 년 이상이 넘어가는 노후 시설물에 발생되는 다양한 사 회문제를 대비해야 할 때이기도 하다.
* 정회원, 국토안전관리원, 차장, 공학석사
Korea Authority of Land & Infrastructure Safety
** 정회원, 경일대학교 건축학부 조교수, 공학박사 School of Architecture, Kyungil University Tel: 053-600-5432 Fax: 053-600-5459 E-mail: [email protected]
<Fig. 1> Aging Infrastructure Facility Status
(2020.12.)
<Fig. 2> The increment prospect of infrastructure within 10yr(2020.12.)
Years Accident Damage Cost (million won)
Human Damage (person)
2008 3 81 801
2009 3 16 22
2010 3 16 7
2011 2 12 0
2012 0 0 0
2013 4 10 1,683
2014 7 767 237
2015 3 138 365
2016 7 37 489
2017 8 123 120
<Table 1> Safety accidents of aging infrastructure within10yr
기반 시설물은 국민 삶의 질을 결정하는 기초이자 경 제 성장의 핵심 공공재이므로 성능 유지를 위해 충분한 관리 비용이 지속적으로 투입되어야 하지만2) 앞서 살펴 보았듯이 노후 시설물의 급증으로 인해 안전성을 확보 하기 위한 충분한 재원 마련과 전문 관리 인력의 확충 이 어렵기 때문에 유지관리 효율화 방안이 강구 되어야 한다.
특히 점검보고서에 기록된 손상 정보는 해당 시설물 의 공용 중 유지관리 이력을 설명해주며, 발생할 수 있 는 손상을 사전에 예측하고 이를 미리 방지하기 위한 대 책을 세우는 데 활용될 수 있다.3)
점검보고서에 포함된 손상 정보를 수집, 분석, 활용하 는 것은 국내외적으로 많은 관심을 끌고 있으며,4),5),6) 효 율화 방안의 일환으로 디지털 정보 기반의 효율적인 유 지관리 기술이 필요하지만 국내의 데이터는 안전점검 및 진단 결과가 비정형 데이터인 PDF 텍스트 형태로 관 리되고 있어 데이터 활용이 어려운 실정이다.7)
활용하기 어려운 비정형 데이터이지만 안전점검 및 정밀안전진단 결과와 같이 정해진 손상유형과 손상부재 단어를 사용하는 문서 데이터의 경우 단어의 빈도수를 기반으로 자주 등장하는 단어를 도출하는 텍스트마이닝 분석 기법을 적용할 수 있고8) 이를 통해 손상의 전체적 인 경향을 파악하는데 적합하다.
따라서 본 연구에서는 터널 시설물의 안전점검 및 정 밀안전진단 보고서의 책임기술자 종합의견을 대상으로 텍스트마이닝 분석 기법을 활용하여 손상과 관련된 단 어 빈도수를 분석하여 터널 시설물의 주요 손상유형과
손상부재를 도출하고 유지관리 시 중점적으로 고려해야 하는 중점관리요소를 제안하고자 한다.
2. 연구 방법론
본 연구에 활용한 3가지 분석 절차로 이루어진 연구 방법을 <Fig. 3>에 나타내었다. 연구의 첫 번째 절차는 FMS에서 관리하고 있는 터널의 안전점검 및 정밀안전 진단 데이터의 수집이다. 두 번째 절차는 수집된 데이터 를 분석 가능하도록 하는 전처리 과정으로 텍스트 데이 터를 분석하기 위해서는 토큰화(Tokenization)와 불용 어 처리(Stopword Removal) 등의 전처리를 수행해야 한다.9) 마지막 세 번째 절차는 데이터 분석으로 단어 빈 도 분석, 시각화 및 워드 네트워크 분석으로 손상의 유 형과 손상부재를 도출하고 연계성을 확인하는 과정이 다.8),10),11)
1. Data Collection
⚫ Inspection data collection of tunnel
⚫ Diagnostic data collection of tunnel
⚫ Data Filtering
⇩ 2. Text
Preprocessing
⚫ Tokenization
⚫ Remove(general word)
⚫ Extraction tagging noun
⇩ 3. Data Analysis
⚫ TF-IDF
⚫ Word Cloud
⚫ Word Network
<Fig. 3> Research methodology
2.1 데이터 수집
본 연구의 분석 데이터는 2019년 9월을 기준으로 FMS에 등록된 터널 시설물 안전점검 및 정밀안전진단 요약보고서이다. 요약보고서는 총 4,336건으로 터널 시 설물의 기본제원, 상세제원, 점검 및 진단 결과 등을 포 함하고 있으며, 데이터에서 결측치가 없고 책임기술자 종합 의견이 충실히 작성되어 데이터 분석이 가능하다 고 판단되는 정밀안전점검, 긴급안전점검, 정밀안전진단 데이터 2,068건을 선별하였다.
터널 시설물은 용도에 따라 도로터널과 철도터널로 구분되며 라이닝 시공방법에 따라 개착터널과 굴착터널
(재래식터널, NATM터널, SHIELD터널), 재료형식에 따 라 조적식, 무근콘크리트, 철근콘크리트 라이닝 등으로 구분된다.12) 이와 같은 용도, 라이닝 시공방법, 재료형식 등의 구분에 따라 취약요소 및 유지관리 관점의 차이가 있을 것이나 주요 공법과 대표 형식 데이터만 수집할 수 있었기에 세분화하여 분석할 수 없는 한계가 있어 터널 용도(도로터널/철도터널)에 따른 분류 기준만을 적용하 여 분석에 활용하였다(<Fig. 4>, <Table 2>).
Road Tunnel Using type
Rail Tunnel
Tunnel Gangwon-do
Capital area Region Gyeongsang-do
Jeolla-do Chungcheong-do
<Fig. 4> Data collection and categorization
Category Total (unit)
Road Tunnel
Rail Tunnel
Total 2,068 1,140 928
Gangwon-do 213 187 26
Capital area 823 296 527
Gyeongsang-do 591 326 265
Jeolla-do 117 152 25
Chungcheong-do 262 179 85
<Table 2> Summary reports of Tunnel
2.2 데이터 전처리 과정
2,068건의 요약보고서를 분석하기 위하여 데이터 입 력 값의 적정성 검토, 키워드 자동 추출을 위한 사용 용 어 정리의 2단계로 구분하여 전처리 과정을 실시하였다.
1단계 입력값 적정성 검토는 시설물 관리대장, 점검・
진단 보고서에 입력된 값을 중심으로 준공년도, 시설물 종류, 책임기술자 종합의견 등에 결측치가 없고 일관된 수준으로 작성되었는지 확인하고 정제하였다. 2단계 사 용 용어 정리는 파이썬 프로그램을 사용하여 문장・단 어・품사 태깅(Tagging)을 실시하고 점검・진단 책임기술 자 종합의견에서 사용되는 명사가 효과적으로 추출될 수 있도록 사용자 용어를 정의하였으며, 복합명사가 각 각의 명사가 아닌 하나의 명사로 추출되도록 명사 추출 규칙을 정의하였다.
2.3 데이터 분석
비정형 데이터인 FMS 요약 보고서의 책임기술자 종 합의견을 전처리 후 터널 유형별, 공용 연수별, 지역별 주요 단어에 대해 전체 빈도(Total Frequency, 이하 TF) 및 역문서빈도(Total Frequency-Inverse Document Frequency, 이하 TF-IDF)를 도출하고 이를 바탕으로 결과치를 직관적으로 살펴볼 수 있는 Word Cloud와 Word Network 분석을 수행하였다.
점검・진단 요약보고서 내 책임기술자 종합의견에서 많이 언급되는 TF의 의미도 중요하지만 이는 모든 문서 마다 공통적으로 많이 사용되는 ‘내구성’, ‘상태평가’와 같은 손상과는 관련도가 낮은 단어의 중요도도 높게 평 가할 수 있기 때문에 여러 문서로 이루어진 문서 군에서 해당 단어가 특정 문서 내에서 얼마나 자주 등장하는지 나타내는 TF-IDF의 빈도 패턴 변화 분석이 더욱 의미 가 있을 것으로 판단하여 중점적으로 분석하였다.
TF-IDF의 경우 점검 데이터가 상대적으로 적을 경 우 약간의 차이에 의해 값이 크게 증가할 수 있기 때문 에 함께 자주 등장하는 단어를 보여주는 Word Network 분석을 함께 수행하여 TF-IDF 분석을 보완 하고자 하였다.
Word Network 분석은 함께 등장하는 횟수의 정도에 따른 occurrence 분석, 함께 등장하는 거리에 가중치를 부여한 distance 분석이 있는데, 책임기술자 종합의견에 서 함께 등장하는 단어가 문장 내에서 가까울수록 상호 연관성이 큰 것으로 사전 검토되어 distance 분석 방법 을 채택하였다.
3. 분석 결과
3.1 데이터 전처리 결과
<Table 3>에서 표현한 바와 같이 1단계 입력값 적정 성 검토를 진행하였다. 책임기술자 종합의견은 작성자에 따라 상이한 수준으로 작성되어 있고 터널의 위치, 제원 정보 등의 일반적인 내용이 포함되어 있거나 점검・진단 에 대한 구체적인 결과가 아닌 모호한 내용으로 작성된 부분이 다수 확인되어 육안으로 스크리닝(screening) 후 불필요한 내용을 삭제하였다. 그 외에도 준공년도, 시설물 종류를 잘못 입력한 정보를 직접 확인하여 수정
하였다.
1단계 처리를 마친 데이터로 <Table 4>에서 확인 할 수 있듯이 사용자 용어와 명사 추출 규칙을 정의하고 유 사단어의 동의어 사전을 구축하는 2단계 처리과정을 진 행하였다.
Data Overall opinion of engineer
Raw data
현장조사 결과, 구조적으로 중대한 결함 및 문제가 될만한 손상 및 결함은 없는 것으로 조사되었으나, 누수 및 백태 손상과 균열 등 이 발생되어 손상집중구간을 선정하여 현장여 건을 고려한 보수·보강을 수행하는 것이 바람 직 할 것으로 판단된다.
Revised data
누수 및 백태, 균열 등이 발생되어 보수·보강 을 수행하는 것이 바람직 할 것으로 판단된다.
<Table 3> Example of appropriate investigation of input data
Category
Example of semantic relationships Raw word Representative
word
Synonym
천장/천장부,
천단/천단부 천단
측벽/측벽부,
벽체/벽체부 측벽
배수시설, 배수로,
배수관 배수시설
Compound noun
재료 분리 재료분리
철근 노출 철근노출
건조 수축 건조수축
<Table 4> Example of semantic relationships in thesaurus
3.2 터널유형별 데이터 분석
터널 유형별(도로터널, 철도터널) TF-IDF, Word Cloud 분석 결과를 <Fig. 5>, <Fig. 6>에 나타내었다.
터널 유형별 TF-IDF 분석 결과, 도로터널에서 높은 빈도로 조사된 손상부재는 ‘배수시설’, ‘타일’, ‘포장’, ‘천 단’, ‘이음부’ 등이고, 주요 손상유형으로는 ‘파손’, ‘박리’,
‘박락’, ‘철근노출’, ‘백태’ 등으로 나타났다. 철도터널의 경우 손상부재는 ‘배수시설’, ‘측벽’, ‘이음부’, ‘천단’, ‘슬 래부’ 순이었고, 주요 손상유형은 ‘박락’, ‘백태’, ‘망상균 열’, ‘철근노출’, ‘누수’ 등으로 조사되었다.
Road Tunnel
Word TF TF-IDF
1 파손 1694 310.9907
2 배수시설 767 284.6814
3 박리 740 270.7086
4 박락 601 248.4842
5 타일 641 244.3015
6 철근노출 420 243.5085
7 포장 729 232.4903
8 백태 437 229.0532
9 천단 541 222.0806
10 망상균열 440 221.8636
11 이음부 522 221.5611
12 누수 305 218.5199
13 측벽 537 217.3011
14 공동구 620 212.9164
15 탈락 357 206.9822
16 덮개 350 196.9621
17 갱구 298 189.8103
18 라이닝 967 189.5007
19 단면 235 186.6961
20 들뜸 203 169.3397
21 사면 180 162.2818
22 재료분리 172 151.0031 23 건조수축 160 150.8733
24 옹벽 183 150.3114
25 불량 149 147.8740
Rail Tunnel
Word TF TF-IDF
1 배수시설 413 269.1007
2 측벽 517 261.1618
3 이음부 409 211.5746
4 천단 259 203.4967
5 박락 413 197.2439
6 백태 748 192.5575
7 슬래브 242 188.0857
8 라이닝 276 183.9584
9 망상균열 370 183.6143
10 철근노출 548 181.9706
11 누수 1112 181.7095
12 철근 204 171.4497
13 박스 214 169.3711
14 재료분리 264 166.0796
15 박리 265 165.6577
16 건조수축 214 161.6465
17 환기구 191 159.2951
18 단면 204 142.3987
19 불량 156 138.5846
20 면적 113 135.2258
21 균열 3076 125.1648
22 승강장 130 115.9597
23 파손 111 114.6679
24 피복 105 112.3411
25 부족 113 111.8496
:Damage Type :Damaged Member
<Fig. 5> TF-IDF comparision by Tunnel type
(a) Road Tunnel
(b) Rail Tunnel
<Fig. 6> Word Cloud comparision by tunnel type
‘배수시설’은 도로 및 철도 터널 모두에서 손상빈도가 높았는데 지하구조물 특성상 배수 기능이 중요하지만 이물질 퇴적 등으로 성능 저하가 우려되는 경우가 많이 조사되어 빈도수가 높은 것으로 추정되고, ‘이음부 (joint)’ 및 ‘단면 변화부(단면)’가 점검 대상 부재가 아님 에도 도출된 것은 이 부분에서 결함 및 손상이 많은 것 으로 유추할 수 있으며 실제로 구조적으로도 취약한 부 위이므로 점검・진단 시 유의해서 관리할 필요가 있을 것 으로 판단된다.
(a) Road Tunnel
(b) Rail Tunnel
<Fig. 7> Word Network comparision by tunnel type
Total
Word TF-IDF 1 파손 310.9907 2 배수시설 284.6814 3 박리 270.7086 4 박락 248.4842 5 타일 244.3015 6 철근노출 243.5085 7 포장 232.4903 8 백태 229.0532 9 천단 222.0806 10 망상균열 221.8636 11 이음부 221.5611 12 누수 218.5199 13 측벽 217.3011 14 공동구 212.9164 15 탈락 206.9822 16 덮개 196.9621 17 갱구 189.8103 18 라이닝 189.5007 19 단면 186.6961 20 들뜸 169.3397 21 사면 162.2818 22 재료분리 151.0031 23 건조수축 150.8733 24 옹벽 150.3114 25 불량 147.874
Gangwon-do Word TF-IDF 1 파손 45.94742 2 박리 45.87798 3 배수시설 42.53104 4 박락 40.56419 5 망상균열 39.14727 6 철근노출 37.87599 7 탈락 36.6331 8 백태 36.09683 9 타일 35.18906 10 라이닝 34.77798 11 천단 34.72818 12 포장 34.48407 13 이음부 34.03698 14 측벽 33.95394 15 들뜸 32.81877 16 덮개 32.56385 17 단면 31.45983 18 갱구 30.37146 19 누수 29.83821 20 공동구 28.81475 21 옹벽 27.44961 22 재료분리 27.31631 23 사면 26.74837 24 균열부백태 24.97491 25 균열 23.38233
Capital area Word TF-IDF 1 파손 81.14331 2 배수시설 71.59755 3 타일 71.59755 4 누수 66.43275 5 박리 66.38077 6 박락 62.10489 7 공동구 61.77175 8 철근노출 60.79629 9 백태 59.8535 10 망상균열 58.96287 11 이음부 56.96011 12 탈락 56.81686 13 측벽 55.51744 14 천단 55.17565 15 라이닝 54.55471 16 단면 51.06776 17 포장 50.72775 18 사면 47.88341 19 들뜸 46.92897 20 주행성 46.71851 21 토사퇴적 44.34832 22 불량 43.78336 23 갱구 42.72637 24 덮개 42.11672 25 옹벽 39.98416 Gyeongsang-do
Word TF-IDF 1 파손 89.27153 2 배수시설 76.87469 3 박리 74.78033 4 박락 73.30759 5 포장 70.59114 6 철근노출 67.11014 7 백태 67.02986 8 측벽 65.11129 9 이음부 64.96068 10 천단 62.0988 11 타일 60.68801 12 공동구 59.67085 13 망상균열 59.26327 14 덮개 59.00389 15 탈락 57.03163 16 누수 56.56247 17 건조수축 56.41923 18 갱구 52.41408 19 단면 51.32412 20 불량 47.37963 21 재료분리 45.59797 22 슬래브 44.90736 23 사면 43.34067 24 덕트 42.42581 25 라이닝 41.40176
Jeolla-do Word TF-IDF 1 배수시설 48.11693 2 파손 41.19492 3 철근 33.14393 4 철근노출 32.5224 5 공동구 32.1382 6 갱구 31.86908 7 박리 30.59556 8 타일 30.4816 9 포장 30.0356 10 박락 28.77604 11 이음부 27.53176 12 덮개 26.81203 13 망상균열 26.74531 14 백태 25.99379 15 들뜸 25.89211 16 천단 25.26318 17 라이닝 25.16369 18 측벽 23.91134 19 단면 23.51659 20 누수 23.47975 21 탈락 21.58292 22 옹벽 20.38104 23 토사퇴적 19.51206 24 불량 17.64202 25 건조수축 15.08585
Chungcheong-do Word TF-IDF 1 파손 45.84623 2 박리 45.59445 3 철근노출 42.65733 4 배수시설 42.23357 5 박락 41.18263 6 포장 40.63479 7 타일 39.73147 8 누수 36.97054 9 백태 36.83998 10 천단 35.71524 11 측벽 34.12867 12 이음부 33.49908 13 망상균열 32.36693 14 덮개 30.38999 15 탈락 29.72334 16 라이닝 28.91089 17 단면 26.43573 18 사면 26.40191 19 공동구 26.06613 20 갱구 25.96901 21 들뜸 25.78174 22 토사퇴적 22.84432 23 사용성 21.75335 24 재료분리 21.4041 25 건조수축 20.94868
:Damage Type :Damaged Member
<Fig. 8> TF-IDF comparision of regional road tunnel 손상유형으로는 도로터널에서는 ‘파손’이 높은 빈도로
나타났는데 ‘라이닝’, ‘포장’, ‘타일’, ‘공동구’ 및 ‘배수로 덮개’ 등 다양한 부재가 차량통행으로 인한 외부 환경에 노출되어 발생하는 것으로 추정된다. 철도터널에서는
‘백태’와 ‘누수’가 도로터널에 비해 높은 순위로 나타났 는데 분석에 활용된 철도터널 데이터의 68%가 도시철 도 터널이고 개착박스 형식으로 시공된 경우가 대부분 이어서 이음부를 통한 누수가 많이 발생한 것으로 추정 된다.
<Fig. 7>은 책임기술자 종합의견에서 문장 내 함께 자주 가까이 등장하는 단어 관계를 보여주는 Word Network 분석 결과이다.
도로터널의 경우 ‘균열’과 ‘파손’을 중심으로 키워드 간 네트워크가 형성되어 있으며 ‘배수시설’, ‘공동구’, ‘포 장’, ‘타일’ 등의 손상부재가 비교적 높은 연결성을 가지 고 있고, 철도터널은 경우 ‘균열’, ‘누수’ 및 ‘백태’를 중심 으로 키워드 간 네트워크가 형성되어 있으며 ‘천단(슬래 브)’, ‘측벽(벽체)’, ‘배수시설’ 등이 손상유형과 높은 연결 관계를 가지는 것으로 나타나 모두 TF-IDF 분석 결과 와 일치함을 확인할 수 있다.
그리고 터널 주요 점검대상 부재는 아니지만 ‘타일’,
‘포장’, ‘공동구’(이상 도로터널), ‘환기구’, ‘승강장’(이상 철 도터널) 등이 Word Network상 여러 손상 유형과 밀접한 연결성을 가지는 것으로 나타났다.
3.3 지역별 데이터 분석
3.3.1 도로터널 지역별 데이터 분석
도로터널의 지역별 TF-IDF, Word Cloud 분석 결과 를 <Fig. 8>, <Fig. 9>에 나타내었다.
지역과 관계없이 주요 손상유형으로 ‘파손’, ‘박락’, ‘박 리’, ‘철근노출’ 등이 높은 빈도로 조사되었고 주요 손상 부재(부위)로는 ‘배수시설’, ‘타일’, ‘포장’ 등의 키워드가 나타났다.
Total Gangwon-do(187건) Capital area(296건)
Gyeongsang-do(326건) Jeolla-do(152건) Chungcheong-do(179건)
<Fig. 9> Word Cloud comparision of regional road tunnel 강원지역은 전국 평균보다 낮은 기온으로 인해 날씨
와 관련된 ‘우기’, ‘결빙’ 키워드를 확인할 수 있다. 특히 동결-융해로 인한 터널 ‘갱구’, ‘포장’, ‘사면’ 및 ‘옹벽(지 반)’의 내구성능 저하 등을 유의하여 점검할 필요가 있 다.
수도권에서는 차량 통행량이 많은 특성으로 인해 주 행과 관련된 키워드가 높은 빈도로 출현하였다. 차량에 서 배출되는 가스의 영향으로 이산화탄소 및 아황산가 스의 농도가 상대적으로 높아 탄산화의 진행속도가 이 론 추정치 대비 빠른 것으로 추정되며 이로 인해 ‘탄산 화’, ‘환기’ 등의 키워드가 순위권에서 같이 조사되었다.
경상지역도 수도권과 같이 차량 통행량이 많아 주행 과 관련된 키워드가 높은 빈도로 출현하였는데, 고속도 로가 집중되어 있고 부산과 같은 대도시가 집중되어 있 는 영향일 것으로 판단된다.
수도권과 경상지역에서 타 지역 대비 덕트부가 높은 빈도로 출현한 것을 확인할 수 있는데, 차량 통행으로 인한 매연 및 미세먼지 등은 철근콘크리트 구조체의 열 화를 촉진시키며, ‘균열(망상 균열)’, ‘박락’, ‘파손’ 또는 보수부 재손상 등이 빠르게 진행될 우려가 있으므로 덕 트부에서 진행된 열화가 라이닝 또는 주행 도로 2차 피 해로 확산되지 않도록 특별한 주의관찰이 필요하다.
이와 같이 지역별로 일부 특징을 가지고 있지만 책임 기술자 종합의견만으로 지역 간 차이를 명확하게 분류 하기 어려웠는데, 이는 대부분 지역에서 ‘균열’, ‘파손’,
‘박리’ 등의 손상유형과 ‘라이닝’, ‘포장’, ‘타일’, ‘공동구’,
‘배수시설’ 등의 손상부재가 비교적 높은 중심성 및 연결 성을 가지는 Word Network 분석 결과를 통해 확인할 수 있다.
3.3.2 철도터널 지역별 데이터 분석
철도터널의 지역별 TF-IDF, Word Cloud 분석 결과 를 <Fig. 10>, <Fig. 11>에 나타내었다.
강원지역의 경우 분석에 활용된 요약보고서가 26건으 로 전체 특성을 대변한다고 단정하기 어렵지만 지반과 관련된 ‘지반’, ‘파쇄대’, ‘절리’ 등의 키워드가 다수 확인 되었다. Raw data를 확인한 결과 터널이 위치한 지반 내 절리 및 파쇄대가 발견되는 등 지반이 불안정한 경우 가 다수였고, 도로터널과 마찬가지로 시・종점부가 외부 환경조건(결빙, 동상, 동결-융해 등)의 영향을 많이 받아
‘망상균열’, ‘박락’, ‘파손’ 등의 열화가 집중적으로 발생 한 것으로 나타났다.
경상지역에서는 배수시설 관련한 키워드들이 높은 순 위로 분석되었는데, 이물질 퇴적 등으로 배수 기능저하 와 체수 등이 높은 비중으로 조사되었다. 또한 부산지역 도시철도 터널들은 해안가에 인접한 지리적 특성으로 터널 내 수질검사에서 염화물 함유량이 높은 편으로 조 사되었으며 콘크리트 내구성능 저하 등의 영향을 미칠 수 있으므로 외부 유입수가 들어오지 못하도록 원인 부 위를 확인하여 보수・보강하고 지속적인 관찰을 해야 할 것으로 판단된다.
Total
Word TF-IDF 1 배수시설 269.1007 2 측벽 261.1618 3 이음부 211.5746 4 천단 203.4967 5 박락 197.2439 6 백태 192.5575 7 슬래브 188.0857 8 라이닝 183.9584 9 망상균열 183.6143 10 철근노출 181.9706 11 누수 181.7095 12 철근 171.4497 13 박스 169.3711 14 재료분리 166.0796 15 박리 165.6577 16 건조수축 161.6465 17 환기구 159.2951 18 단면 142.3987 19 불량 138.5846 20 면적 135.2258 21 균열 125.1648 22 승강장 115.9597 23 파손 114.6679 24 피복 112.3411 25 부족 111.8496
Gangwon-do Word TF-IDF 1 재료분리 6.3209
2 지반 5.0939
3 백태 5.0675
4 박락 4.9814
5 이음부 4.7005
6 불량 4.5585
7 박리 4.4824
8 시종점 4.4572
9 전단 4.4549
10 결빙 4.1461 11 라이닝 4.0859 12 파손 3.9886 13 안전성 3.5795 14 지하수 3.2512 15 배면공동 3.2512 16 부족 3.1837 17 변형 2.8636 18 사용성 2.8636 19 건축한계 2.8131 20 측벽 2.8131 21 운행 2.8131 22 열차 2.8131 23 대피소 2.8131 24 누수 2.5016 25 균열 2.5016
Capital area Word TF-IDF 1 측벽 175.8278 2 배수시설 152.1932 3 이음부 130.4212 4 천단 126.0282 5 슬래브 123.5344 6 박스 116.2309 7 철근 114.4147 8 백태 111.9120 9 환기구 110.4346 10 누수 107.4536 11 건조수축 105.7107 12 망상균열 105.6434 13 철근노출 105.2574 14 면적 100.4473 15 재료분리 96.3226 16 박락 95.3842 17 단면 84.5144 18 불량 84.0991 19 승강장 81.4905 20 라이닝 79.9294 21 피복 75.1950 22 부족 73.4235 23 기둥 72.0149 24 균열 70.4943 25 박리 63.6802 Gyeongsang-do
Word TF-IDF 1 배수시설 83.9936 2 박락 56.0006 3 라이닝 55.2852 4 천단 54.9780 5 백태 54.4058 6 망상균열 53.9033 7 측벽 53.0198 8 누수 52.8887 9 박리 51.5898 10 이음부 49.6731 11 철근노출 48.0005 12 파손 46.0072 13 슬래브 43.3465 14 철근 39.8788 15 재료분리 39.5448 16 단면 37.8417 17 불량 34.1625 18 방수 32.4252 19 건조수축 28.7080 20 덮개 27.5251 21 조적 27.0200 22 안전성 26.6575 23 탄산화 26.5374 24 갱구 25.3231 25 염화물 25.2493
Jeolla-do Word TF-IDF 1 라이닝 5.3476
2 박리 5.3236
3 박락 5.1018
4 이음부 4.8801 5 철근노출 4.8800
6 파손 4.4222
7 단면 4.3380
8 면적 3.9788
9 들뜸 3.9788
10 측벽 3.9583 11 재료분리 3.9583 12 망상균열 3.5810 13 천단 3.3166 14 배면공동 3.1830 15 피복 3.1830 16 부족 3.0985 17 백태 2.8528 18 개착 2.7955 19 우기 2.7955 20 방수 2.7955 21 철근 2.7955 22 시종점 2.7955 23 배수시설 2.3873 24 계곡 2.3873 25 건조수축 2.3873
Chungcheong-do Word TF-IDF 1 배수시설 22.7652 2 측벽 16.4708 3 이음부 16.4303 4 라이닝 16.1795 5 철근노출 15.1860 6 천단 14.6725 7 백태 14.3769 8 박락 13.8903 9 균열 13.8676 10 망상균열 13.3712 11 박리 13.1186 12 재료분리 13.0723 13 누수 12.1939 14 들뜸 10.6515 15 건조수축 10.2578 16 불량 10.2188 17 단면 9.7639 18 피복 9.2320 19 조적 9.2043 20 유입 8.6070 21 박스 7.5859 22 노후 7.5859 23 부족 7.5859 24 용탈 7.3774 25 면적 7.2542
:Damage Type :Damaged Member
<Fig. 10> TF-IDF comparision of Regional rail tunnel 철도터널의 지역별 Word Network 분석 결과, 대부 분 지역에서 ‘균열’, ‘누수’ 및 ‘백태’를 중심으로 단어 간 네트워크가 형성되어 있는 것으로 나타났으며, 손상 부 재(부위)로는 ‘라이닝’, ‘배수시설’, ‘시공 이음부’ 등이 비 교적 높은 중심성과 연결성을 가지는 것으로 나타나 TF-IDF 기반의 출현빈도 분석 결과와 일치하는 것을 확인할 수 있다.
4. 결론
급속히 노후화 되는 시설물의 효율적 유지관리를 위 한 중점요소를 파악하기 위해 비정형 데이터로 축적되 어 있는 안전점검・진단 보고서를 수집하여 데이터 전처 리 과정을 거친 후, 텍스트마이닝 분석 기법을 이용해 분석하였다.
높은 빈도로 언급된 단어를 워드 클라우드 및 네트워 크 분석을 통해 손상유형과 손상부재를 시각화 하는 한 편 손상유형 및 부재 간 영향거리를 파악하여 향후 유지 관리 시 중점적으로 고려해야 할 요소를 터널 유형별(도 로터널/철도터널), 지역별(강원도, 수도권, 경상도, 전라 도, 충청도)로 확인하였다.
1) 터널 유형별 분석결과를 살펴보면 손상유형으로는 도로터널에서는 ‘파손’, 철도터널에서는 ‘백태’와 ‘누수’가 가장 많이 확인되었고, 손상부재는 공통적으로 ‘배수시 설’의 빈도수가 가장 높았다.
2) 지역별 터널의 손상유형 및 손상부재는 강원도 지 역의 ‘우기’, ‘결빙’ 키워드, 수도권과 경상도 지역의 ‘탄 산화’, ‘환기’ 키워드와 같이 일부 지역적인 특징을 확인 할 수 있었지만 전반적으로 유사한 결과를 보이고 있을 확인할 수 있었다.
본 연구에서 도출된 시설물의 취약요소는 터널 시설 물에 대한 기본 제원정보와 정밀안전점검 및 정밀안전 진단 책임기술자 종합의견 데이터로 분석한 결과로, 단 기적으로 정기점검 및 일상점검 시 개별 시설물의 특성 을 고려한 점검요소로 활용할 수 있을 것이다. 나아가 중·장기적으로 자원을 효율적으로 투입하기 위한, 보 수・보강의 우선순위를 판단하는 선제적 유지관리 의사 결정을 지원하는 기초 자료로 활용하기 위해서는 상세 제원에 대한 정보와 안전성, 내구성, 사용성에 대한 점 검 결과의 종합적 분석과 보수・보강에 따른 비용에 대 한 빅 데이터 분석을 포함한 추가 연구가 필요할 것으 로 보인다.
감사의 글
본 연구를 수행할 수 있도록 데이터를 제공해주신 국토 교통부에 감사의 말씀을 드립니다.
Total Gangwon-do(26건) Capital area(527건)
Gyeongsang-do(265건) Jeolla-do(25건) Chungcheong-do(85건)
<Fig. 11> Word Cloud comparision of regional rail tunnel
References
1. Korea Authority of Land & Infrastructure Safety(KALIS) “Facility statistical yearbook 2021”, 2021 (in Korean)
2. Kobayashi, K., & Kaito, K., “Big data-based deterioration prediction models and infrastr- ucture management: towards assetmetrics”, Structure and Infrastructure Engineering, Vol.13 No.1 pp.84~93, 2017
3. Chung, S. H., Moon S. H. & Chi, Seokho.,
“Bridge Damage Factor Recognition from Inspection Reports Using Deep Learning”, Journal of the Korean Society of Civil Engineers, Vol.38, No.3: pp.621-625., 2018 4. Liu, K., & El-Gohary, N., “Ontology-based
semi-supervised conditional random fields for automated information extraction from bridge inspection reports.” Automation in Construction, Vol.81, pp.313-327., 2017
5. Ryu, J. M., & Shin, E. C., “Database construction plan of infrastructure safety inspection and in-depth inspection results.”, Journal of Korean Geosynthetics Society, Vol.13, No.4, pp.133-141., 2014
6. Lee, I. K., Moon, M. K, Park, H. S., Jeon, J. C.
& Lee, H. H., “Statistical analysis of damages in expressway bridges.” Magazine of the Korea Institute for Structural Maintenance and Inspection, Vol.18, No.2, p.2-9., 2014
7. Korea Authority of Land & Infrastructure Safety(KALIS), “Facility standardization of code System & development and management of integrated information system for safety management”, 2018 (in Korean)
8. Baker, H., Hallowell, M. R., & Tixier, A. J. P.,
“Automatically learning construction injury precursors from text”, Automation in Cons- truction, Elsevier B.V., Vol.118, 103145., 2020 9. Manning, C. D., Raghaven, P. & Schutze, H.,
“Introduction to Information Retrieval”, Cambridge University Press, 2008
10. Jung, H., & Lee, B. G., “Research trends in text mining: semantic network and main path analysis of selected journals”, Expert Systems With Applications, Elsevier Ltd, Vol.162, 113851, 2020
11. Berry, M. W., & Kogan, J. (2010). “ Text Mining: Applications and Theory” John Wiley
& Sons Ltd, Chichester
12. Ministry of Land, Infrastructure and Transport (MOLIT), “Detailed guideline for Safety and maintenance of facilities(safety inspection・
diagnosis)”, 2019 (in Korean)
▪ Received : August 17, 2021
▪ Revised : August 25, 2021
▪ Accepted : August 27, 2021