Issue
데이터 기반 중대형 누수인지 모형의 03
동향과 개선방향
1. 서론
수자원 공학 분야에서 다루는 하천, 댐, 상하수도 등의 사회기반시설물은 ‘바람직하지 않은 결과가 발 생할 확률 또는 이 확률을 높일 수 있는 요소 (WHO World Health Report, 2002)’라고 정의될 수 있는 위험 (Risk) 요소를 항시 가지고 있으며, 이 위험 요 소들은 ‘개인, 집단, 공동체 또는 전체 사회에 영향 을 미치는 불안정한 사건 (Wikipedia)’으로 설명될
수 있는 위기 (Crisis) 상황을 초래한다. 이와 같은 사회기반시설물의 위기상황을 발생이전에 모두 제 어한다는 것은 불가능하며, 위기 발생에 따른 효과 적인 대응을 통해 피해 규모 저감과 신속한 복구를 달성해야한다.
2018년 기준 국내 수돗물 공급량의 48%를 담당하 고 있는 광역상수도시스템의 경우, 대규모 용수공급 관로는 점점 노후화 되고 있으며, 대부분 구간의 경 우 육안으로 확인이 불가능하고 타 시설과 함께 지 하에 매설되어 있다는 점에서 위험 요인이 크다고 할 수 있다. 용수공급관로의 파손은 대규모 단수지 역의 발생과 통수지연의 피해를 초래하게 된다. 그 림 1은 관 파손에 따른 누수 복구 단계를 나타내고 있다. 실제 누수가 발생하더라도, 누수 인지 및 파손 위치 확인까지는 일정 시간이 소요되게 되며 복구 작업 뿐 만 아니라 충수 및 세척 작업에 있어서도 상 당부분 시간이 소요된다. 신병호 (2018)에 따르면, 2006년부터 2016년까지 발생된 광역상수도 관로사 고 자료를 분석한 결과 관 파손에 의한 단수 이후 소 비자까지 평균통수시간은 약 12시간으로 나타났다.
이 값은 평균적인 값으로 실제 배수, 충수 작업과 누 수인지를 위한 시간의 경우 많은 불확실성이 존재하 므로 관 파손 사고의 양상에 따라 더 긴 통수시간이 발생될 수 있다.
유 도 근
수원대학교 공과대학 건설환경에너지공학부 조교수 [email protected]
최 두 용
K-water 융합연구원 스마트워터연구소 수석연구원 [email protected]
김 경 필
K-water 융합연구원 스마트워터연구소 책임연구원 [email protected]
이에 따라, 최근 국내외적으로 대규모 상수도시 스템에서 발생할 수 있는 누수사고를 탐지하는 누수 인지시스템에 대한 연구가 활발히 진행되고 있다.
일반적으로 좋은 누수인지시스템이 가져야할 기능 은 크게 1) 누수 사고의 정확하고 빠른 인지 (Burst Detection)와 2) 누수 지점의 정확한 파악 (Burst Localization)로 구분할 수 있으나, 누수 지점의 정 확한 파악을 위해서는 오․경보율을 줄이는 동시에 누수 사고를 빠르게 인지하는 시스템이 선행적으로 구축되어야한다.
본 학술기사에서는 대규모 관 파손사고 인지를 위 한 방법론에 대해 조사하고, 대표적인 자료 분석 기 법중 하나인 통계적 공정관리 기법 (누적합관리도 중심)의 장단점과 적용한계점에 대한 검토를 수행하 였다. 또한 기 개발된 데이터 기반 관 파손사고 감지 모델의 현장 적용 및 신뢰도 제고 방안, 그리고 효율 적인 중대형 누수인지 시스템의 구축을 위한 기법별 연계방안을 제안하였다.
2. 관 파손 탐지 기법의 분류와 데이터 기 반 기법
2.1 관 파손 탐지 기법의 분류
일반적으로 관 파손 탐지 기법은 장치기반 누수 탐지 기술 (Hardware-based Techniques)과 모델 기반 누수탐지 기술 (Model-based Techniques) 로 구분이 가능하다. 실제 관망 현장에서 누수를 탐 지하는 방법은 음향 (청음봉, 노이즈 로거 등), 추적 가스 등을 통해 탐지가 가능하나, 노동 집약적인 특 성에 따라 비싸고 많은 시간이 소요된다는 문제점이 있다. 또한 누수인지시스템에서 주요하게 탐지되어 야할 중대규모누수사고의 경우 상대적으로 짧은 지 속기간동안 순간적으로 발생되는 관 파열을 빠르게 인지하는 것을 목적으로 하고 있기 때문에, 장치기 반 탐지로는 한계가 있다. 물론, 관 파손에 의한 부 압을 직접 탐지할 수 있는 장치를 설치하여 누수를 인지하는 방법도 있으나, 이의 실행을 위해서는 데 그림 1. 관 파손 복구 단계와 광역상수도 관로 사고 통수시간
이터 수집주기가 매우 짧고 그에 따른 전송 비용이 상대적으로 높은 측면이 있다.
[장치기반 누수탐지 기술 (Hardware-based techniques)]
• 청음봉, 노이즈 로거 등 (Sounding methods)
• 추적가스기반 방법 (Tracer gas based methods)
• 온도변화 기반 방법 (Temperature change based methods)
• 관 내부 검사방법 (Inline pipe inspection methods)
• 레이더 기반 방법 (Radar based methods)
모델 기반 누수탐지 기술은 다시 수리해석 기반 방법 (Hydraulic model based techniques)과 계측 데이터 기반 방법 (Hydraulic measurement based methods)으로 구분될 수 있다. 상수관망에서의 수 리해석기법은 수리특성의 시간적 변화를 고려하지 않는 정상류 해석과 시간적 변화를 고려하는 부정 류 해석으로 구분할 수 있으며, 각 해석 결과를 활용 하여 누수탐지를 수행한다. 정상류 해석의 대표적인 프로그램은 EPANET2 (Rossman, 2000)로 일반적 으로 누수 탐지 전후의 에미터 계수의 변화 또는 보 정 수요량의 변화를 통해 누수여부를 판별하게 된 다. 부정류 해석의 경우 실측자료와 수리해석 자료 의 일치를 위한 마찰계수 (Friction factor)와 누수 량의 검․보정을 수행하고 그 결과를 통해 누수여부 및 위치를 결정하는 방법이 주로 활용된다. 수리해 석 기반 방법의 성공을 위한 핵심은 아주 잘 보정된 수리해석 입력 자료의 확보에 있으나, 이를 위해서 는 관망운영상황 변화에 따른 지속적인 검․보정 모 델의 구동과 갱신된 수리해석 입력 자료의 재구축이 요구된다.
특히 부정류해석 기반 수리해석의 경우 잘 보정 된 수리해석 자료를 사용할 경우, 관 파손에 의해 유 도 된 압력의 변화를 감지 할 수 있다. 그러나 현재 까지 대부분의 부정류 해석기반 연구는, 일반적으로 간결한 시뮬레이션이나 엄격하게 통제 된 실험실 작 업 상태 (예 : 일정한 직경의 단일 파이프)를 기반으
로 한 연구가 일반적으로 수행되었다. 몇 가지 현장 시험이 수행되었고 성공적인 관 파손 위치 탐지결과 가 제시된 바 있지만, 사용 된 실제 네트워크의 크 기는 대부분 작고 관제원도 동일한 경우가 많이 있 었다. 따라서 부정류 수리해석 기반의 누수탐지 모 형은 불확실성이 높은 복잡한 네트워크에서 더 많은 현장 검증이 수행되어야 할 필요가 있으며. 특히 실 시간 누수인지모형의 사용을 위해서는 수리해석 및 매개변수 검․보정 시간의 단축이 반드시 필요하다.
[모델 기반 누수탐지 기술 (Model-based techniques)]
수리해석 기반 방법 (Hydraulic model based techniques)
• 정상류 해석 기반 방법 (Steady state analysis-based methods)
• 부정류 해석 기반 방법 (Transient analysis-based methods)
계측 데이터 기반 방법 (Hydraulic measurement based methods)
• 단계시험 (Step tests)
• 물수지분석 (Water audits)
• 통계적 분석 (Statistical based methods)
• 인공지능 (기계학습, 딥러닝) 기반 분석 (Artificial intelligence based methods)
수리학적으로 계측된 데이터 기반 접근방식의 경 우, 블록시스템 내의 누수량 분석을 위해서는 단계 시험과 물수지분석 등이 활용될 수 있으나, 관 파손 의 인지를 위해서는 유량계 또는 압력계로부터 계측 된 시계열 자료의 통계적 분석을 통한 이상치 탐지 방법이 활용되고 있으며, 계측기성능과 컴퓨팅 기술 의 발달을 통해 실제 관망시스템에 활발히 적용되고 있다. 최근에는 과거와 달리 방대한 계측자료가 실 시간으로 모니터링 되고 있어, 빅 데이터를 바탕으 로 반복해서 기계가 학습할 수 있도록 하는 알고리 즘을 개발하여 관 파손 사고 탐지에 적용하는 인공
지능 (기계학습, 딥러닝) 기반방법도 제안되고 있다 (Mounce et al., 2010; Romano et al., 2014a).
2.2 데이터 기반 관 파손 탐지 기법
Wu and Lui (2017)는 관 파손 탐지를 위한 데이 데 기반 관 파손 탐지 기법을 예측 단계 고려 여부와 통계 중심처리를 기준으로 그림 2와 같이 분류기반 방법, 예측-분류 기반 방법, 그리고 통계 기반 방법 으로 구분하여 제시하였다.
1) 분류기반 방법 (Classification method)
분류기반 방법은 정상 데이터와 누수(관 파손)를 구별하기 위해 분류 모델을 구성한다. 분류는 데이 터 분석의 대표적인 기법으로 누수여부판단을 위한 결과를 범주형 레이블(예, 누수와 정상)로 고려하고, 입력되는 관망 계측데이터를 분석하여 분류규칙, 의 사결정트리, 수학공식 등의 형식을 빌어 학습을 위 한 분류모델을 구축한다. 구축된 모델을 통해 학습 을 통한 모델의 정확도 검증을 수행하게 되며, 검증 이 완료된 모델을 활용하여 새로운 계측데이터가 입 력되었을 경우의 누수여부를 판단하게 된다.
이와 같은 대표적인 연구는 Mounce and Machell (2006)에 의해 제시된 바 있다. Mounce and Machell (2006)은 관 파손을 검출하기 위해 시간 지연 인공신경망 (ANN, Artificial Neural
Network)을 적용했으며, 이 두 ANN은 다른 신경 구조를 가지고 있다. 시간 지연 ANN은 과거 데이터 신호를 모두 반영한 네트워크 입력방식을 채택하고 있으며, 시간에 따른 입력 간의 관계를 표현하기 위 해 시간 차원을 추가한 모형이다. 이와 같은 분류모 형의 구성은 상수관망의 압력 계측 자료와 같은 시 계열 자료를 대상으로 할 때 우수한 결과를 도출하 였다. 분류모형에서 모델의 정확도를 높이는 가장 중요한 과정은 학습단계이다. 특히 인공신경망은 분 류모델에 적절한 정보를 제공하기 위해 훈련 과정이 중요하며, 모델 구축을 위해서는 정규 데이터와 이 상치 (누수자료)의 제공이 반드시 필요하다.
2) 예측-분류 기반 방법 (Prediction-classification method)
예측-분류 기반 방법은 분류가 수행되기 전 예측 단계가 수행된다. 분류가 범주형 속성으로 관파손 여부를 판단한다면, 예측은 연속형 속성에 대한 모 형을 구축함으로써 미래 데이터 경향을 예측하게 된 다. 일반적으로 누수탐지 모형에 있어 분류 모델과 달리 예측 모델에는 정상적인 수리학적 자료만 활용 되며, 이 값은 특이치를 제외하는 데이터 선택 프로 세스가 중요하다.
Ye와 Fenner (2011)는 선형 칼만 필터 (Linear Kalman Filter, LKF)를 사용하여 누수를 감지하고 자 하였다. 이 필터는 모든 기록 자료를 고려하여 동
그림 2. 데이터 기반 파손 탐지 기법의 분류
적 시스템의 현재 상태에 대한 통계적 설명을 제공 한다. 정상적인 데이터에 의해 훈련 된 선형 칼만 필 터는 매 시간 단계마다 추정을 제공한다. 또한 필터 가 학습 데이터를 사용하여 수렴한 결과를 제공하 면, 예측을 위한 현재 자료만 필요하므로 상대적으 로 효율적인 방법이다. 정상적인 자료를 활용하여 시스템의 변동을 예측하기 때문에, 관망내에서 누수 가 발생되면 예상치가 실제 관측되는 계측기의 값과 크게 달라진다. 일반적으로 정상적인 수리학적인 상 황을 예측하기 위한 시도가 여러 방법들에서 이루어 졌으며, 예측 값과 관측 값의 절대 차를 계산하는 비 교적 간단한 방식을 사용한다.
Mounce et al. (2011)은 서포트 벡터 머신 (SVM, Support Vector Machine)을 사용한 관 파손 예측 연구를 수행한 바 있다. 서포트 벡터 머신 기계 학습 의 분야 중 하나로 패턴 인식, 자료 분석을 위한 지 도 학습 모델이며, 주로 분류와 회귀 분석을 위해 사 용한다. 두 범주 중 어느 하나에 속한 데이터의 집합 이 주어졌을 때, SVM 알고리즘은 주어진 데이터 집 합을 바탕으로 하여 새로운 데이터가 어느 범주에 속할지 판단하는 비확률적 이진 선형 분류 모델을 만든다. 만들어진 분류 모델은 데이터가 사상된 공 간에서 경계로 표현되는데 SVM 알고리즘은 그 중 가장 큰 폭을 가진 경계를 찾는 알고리즘이다. ANN 은 분류모델 뿐 만 아니라 예측 단계에서도 광범위 하게 사용 된다 (Mounce et al., 2002; Mounce et al., 2003; Mounce et al., 2010; Romano et al., 2014b). 이 경우 ANN의 결과는 0에서 1까지 변화 하는 값 대신 유량 또는 압력의 예측된 값으로, 예측 결과는 분류에 대한 정보를 제공하지는 않는다.
3) 통계 기반 방법 (Statistical method)
통계기반방법에서는 예측 또는 분류 모델이 구 성되지 않으며 관 누수인지는 통계 이론에 완전 히 의존한다. 여기서 통계적 공정 관리 (Statistical Process Control, SPC)는 범주의 핵심 기술이다.
일반적으로 SPC는 자료의 분석을 통해 시각적 분
석 도구인 관리도를 사용한다. 관리도는 시계열 프 로세스의 변동을 시각적으로 나타낸 그래프로, 수리 학적 자료의 측정 중 누수에 의해 야기되는 아웃라 이어 (이상점)를 판단하는 근거로 사용된다. Jung et al. (2015)은 세 가지 단 변수 및 세 가지 다 변수 방법을 포함하여 다른 관리도 표현 방법을 비교했 다. 이 중 단 변량 분석 방법의 경우 WEC (Western Electric Company) 규칙에 따라 하나의 이상 값 또 는 여러 가지 표준 외 편차를 초과하는 연속 외각 값 을 식별 할 수 있다. 누적합 (CUSUM) 및 지수 가중 이동 평균 (EWMA) 관리도는 과거 데이터를 통합하 여 WEC 규칙보다 더 긴 메모리를 사용하게 된다.
Loureiro et al. (2016)은 오․경보를 줄이기 위한 목 적으로 이상치 판단 범위의 변동을 통한 수정 된 관 리도 제어 방법을 제안한바 있다. 실제로 통계기반 방법은 누수인지 분야에서 모형을 상대적으로 쉽게 구축할 수 있다는 점에서, 실무에서의 활용도가 상 당히 높다.
3. 통계적 공정관리 기법과 누적합 관리도
3.1 통계적 공정관리 기법 (SPC, Statistical Process Control)
통계적 공정관리 기법 (SPC, Statistical Process Control)은 일반적으로 공정의 활동 상태를 통계적 자료와 분석기법을 활용하여 품질의 변동 원인과 공 정상태를 파악하고 목표가 달성될 수 있도록 관리 해 나가는 활동을 의미한다(그림 3). 상수도시스템 의 경우 누수탐지를 위해 수압 및 유량계 자료를 기 반으로 자료의 변동성을 파악하고, 누수의 빠른 인 지 및 계획적 관리가 될 수 있도록 하는 일련의 과정 을 의미한다고 할 수 있다.
시계열 자료에서 발생되는 품질문제 또는 이상치 탐지문제는 주로 7가지의 품질관리 도구(체트시트, 파레토도, 히스토그램, 특성요인도, 산점도, 층별,
관리도)로 해결을 모색하게 된다.
이 중 자료의 관리 및 이상치 탐지 등과 같은 활 용에 중요하게 사용되는 것은 관리도 (Control Charts) 이다. 관리도란 품질의 산포를 관리하기 위 한 관리한계선 (Control Limits)이 있는 그래프를 의미한다. 공정 및 자료의 상태를 그래프로 조사하 여, 이상치 판별 및 안정 상태로 유지하기 위해 사용 하는 관리기법으로, 관리도는 그림 4와 같이 한 개 의 중심선과 두 개의 관리한계선으로 구성된다.
누수와 같은 이상치 탐지에 사용되는 관리도는 표 1과 같이 슈와르츠 관리도, 누적합관리도(CUSUM), 이동평균관리도 (MA), 지수가중이동평균 관리도 (EWMA), 그리고 다변량 관리도 등이 있다.
3.2 누적합관리도 (CUSUM, Cumulative Sum)
누적합 관리도는 과거의 표본으로부터 정보를 누 적하기 때문에, 공정의 작은 변동을 감지하기 위해 서는 슈와르츠 관리도보다 더 유용하다. 슈와르츠 관리도에서, 어떤 시점에서의 공정의 관리 상태에 대한 의사결정은 과거의 자료로부터 관리한계선 추 정의 정확성에 의존하고, 고정으로부터 가장 최근 하나의 자료만으로 의사결정을 해야한다. 그러나 누 적합 관리도의 의사결정은 가장 최근의 자료를 포함 하는 모든 이전의 누적합인 통계량에 의존한다.
누적합 통계량은 다음과 같은 식으로 정의된다.
그림 3. 통계적 공정관리(SPC)의 정의
▶ 중심선 : CL (Center Line)
▶ 관리한계 (Control Limit) - 관리 상한
: UCL (Upper Control Limit) - 관리 하한
: LCL (Lower Control Limit)
그림 4. 통계적 공정관리(SPC)에 있어 관리도
여기서 K는 허용값이며, 일반적으로 목표 와 우리가 빨리 감지하는데 관심이 있는 이상상태의 평 균 과의 차이의 절반이다. 따라서, 만약에 변동이
와 같이 표준편차로 표현된다면, K의 변동의 절반이 된다.
식 (3)
여기서, 과 는 K보다 큰 목표값 로부터 편차를 축적한다. 는 표준편차에서 변동의 크기를 나타낸다. 만약, 과 중 하나가 의사결정 구간 H를 벗어나면, 공정은 이상상태라고 판단해야한다.
K와 H는 누적합 관리도에서 상당한 영향을 주기 때 문에 어떻게 선택하는지는 매우 중요하다.
와 로 정의한다. 여기서 는 표본분포의 표 준편차이다.
4. 통계적 공정관리 기반 방법 개선 방안 4.1 통계적 공정관리 기법의 제한사항 및 한계
1) 품질관리를 위한 특성치 분포 가정 (정규분포)의 제약
통계적 공정관리 기법은 정교한 예측이나 분류 모 델이 필요 없기 때문에 상대적으로 간결하지만, 그 결과는 불확실성이 일반적으로 높다. 그와 같은 이유 결과 나타나는 이유는 통계적 공정관리 기법은 품질 관리를 위한 공정 변수가 정상적으로 분포되어 있음 을 가정하기 때문이다. 즉, 관망의 수리학적 자료 분 포는 대부분의 통계 방법에서 정규분포를 따른다고 가정한다. 그러나 실제 관망의 수리학적 자료는 계측 기 오류, 오․결측자료, 수요량의 변동, 그리고 정상 적 운영상황의 변동 등으로 인해 변화되며 이러한 경 우 비대칭적인 분포를 나타나게 된다. 따라서 이와 같은 자료의 비대칭적인 분포는 오경보율의 증가와 원인 분석의 어려움을 초래하게 된다. 이와 같은 문 제점을 해결하기 위하여 누적합 관리도의 의사결정 범위 (제어한계)를 동적변화를 고려하여 탄력적으로 변화시키는 방법 등이 제안될 필요가 있다.
2) 이상감지 모듈 매개변수에 따른 탐지성능 변화 의 민감성
누적합관리도의 경우 이상감지 모듈에서 사용하 는 매개변수로 안정적 상태를 나타내는 계측자료 의 범위를 벗어났다고 판단하는 기준인 허용값 (K) 과 누적된 허용값 초과치로 인해 시스템의 관리 통 제를 벗어난 상황이 발생하였다고 보는 의사결정 구 표 1. 누수인지에 사용되는 관리도의 종류
종 류 방 법 설 명
슈와르츠 관리도 (Shewhart)
과거의 평균값을 기준으로 현재의 관측값이 표준편차의 3배 이상이거나 또는 이하에 데이터가 찍히면 이상 원인이 작용한다고 판단하는 방법
누적합관리도
(CUSUM) 현재의 관측값과 함께 과거의 관측값도 공정상태의 판단에 사용하는 관리도 기법 이동평균관리도
(MA) 공정에 나타나는 경향을 파악하는데 사용
지수가중이동 평균관리도
(EWMA)
공정평균의 작은 변화를 잘 감지하도록 고안한 관리도
다변량 관리도 (Multivariate)
여러 개의 품질 특성치들이 서로 상관성이 있을 때 평균벡터의 가설검정에 사용되는 Hotelling의 T²통계량을 이용
간 (H)를 사용한다. K와 H는 모두 표본분포의 표준 편차( )에 계수값 k와 h를 각각 곱한 것으로 정의되 므로, k와 h의 값의 설정은 누적합 관리도의 성능 을 결정하는 결정적인 인자가 된다. 누적합관리도에 서의 k와 h의 값은 두 인자의 여러 조합에 따른 구 축된 모형의 결과를 분석하여 하나의 값을 제시하는 것이 일반적이나, 보다 정량적인 탐지성능 평가 기 준을 활용하여 객관적인 값의 선정이 필요하다.
4.2 누수인지 모델의 개선 필요사항
1) 통계적 공정관리 전 과정 구현 필요 (현 시스템 의 정량적 상태판단과 변동 요인 분석)
기 개발된 대부분의 누수인지 모델의 경우 통계적 공정관리 기법을 적용하고 있으나, 통계적 공정관리 기법의 전 전 과정을 구현한 것은 아니다. 특히 일반 적인 통계적 공정관리의 품질관리 도구 7가지 중 관 리도 (누적합 관리도)만을 고려하여 누수탐지 여부 만을 의사결정 함에 따라, 적용하고자 하는 현 시스 템의 정량적 상태 판단과 변동 요인의 분석은 수행 되지 않게 된다. 따라서 그림 5와 같은 통계적 공정 관리의 전 과정에 대한 시스템의 구현이 필요하다.
2) 모형 평가를 위한 정량적 평가 지표 시스템 구축 대부분의 기 개발된 누수인지 모델의 성능검토 시 사용한 지표는 오경보율 (모형에서 발생된 총 알람
개수 중 실제 누수가 발생한 개수를 제외한 나머지 비율)과 미감지율 (총 실제누수 건수 중 모형에서 누 수라고 판단하지 않는 건수의 비율) 두 개다. 개발 모형에 사용된 두 개의 지표는 모형의 누수인지 여 부를 직접적으로 평가하는 인자이긴 하지만, 개발 된 모형의 평균적인 성능을 나타내기에는 한계가 있 다. 따라서 누수판단 모형의 평가 결과를 실제누수 여부와 모형의 누수판단여부에 따라 매트릭스 형태 로 나타내고, 그 결과에 따른 정량화 지표를 제시하 는 방법을 제시할 수 있다. 이와 같은 결과 표출로 모형이 얼마나 현실의 상태를 그대로 재현하는지에 대한 정량지표 (재현율, True Positive Rate)와 제 안된 모형이 실제 누수를 얼마나 정확하게 구별해 내는지에 대한 지표 (정밀도, Positive Predictive Value) 등을 정량적으로 표현할 수 있으며, 이를 모 형의 성능을 정량화 하고 고도화하는데 활용할 수 있다. 또한, 모형 평가를 위한 정량화 방안으로 제 시될 수신자 조작 특성곡선 (Receiver Operating Characteristic, ROC)에도 이와 같은 지표들을 활 용가능하다.
수신자 조작 특성 (ROC)은 신호탐지이론에 서 적중확률 (Y축, True Positive Rate, TPR, Sensitivity) 대 오․경보확률 (X축, False Positive Rate, FPR, 1- Specificity)의 그래프이다. ROC 그래프는 정기각률이 늘어나면 탈루률이 늘어나 는 관계를 효용 대 비용의 관계로 설명하고 있다
그림 5. 통계적 공정관리 전 과정 구현을 위한 도구 및 프로세스
(Wikipedia, 2018).
수신자 조작 특성 (ROC)의 Y축에 표현되는 TPR 과 X축에 표현되는 FPR은 아래식을 통해 계산될 수 있다. TPR은 전체 실제누수의 횟수에 대해 모형 이 얼마만큼의 재현율로 누수를 찾아내는가를 의미 하고, 민감도라는 용어로도 사용된다. FPR은 실제 정상상황의 횟수에 대해 모형이 얼마나 잘못된 누수 판정을 내리는지에 대한 비로 표현되어, 1의 값에서 실제정상상황의 횟수에 대해 정확한 정상판정을 내 리는지를 나타내는 특이도 (Specificity)를 뺀 것과 같이 산정될 수 있다.
그림 6과 같은 ROC 그래프에서 왼쪽 하단(0,0) 은 절대 "있음"이라고 하지 않는 구분자를 말하는 데 탈루를 발생시키지 않지만 적중하지도 않는다.
이와 반대로 오른쪽 상단(1,1)은 무조건 "있음"이 라고 하는 경우이다. 왼쪽 상단(0,1)은 완벽한 구 분을 해내는 것을 뜻한다. 일반적으로 ROC그래 프의 공간에서 왼쪽 하단의 방향으로 갈수록 '보수 적' 이며 오른쪽 상단의 방향으로 갈수록 '모험적'이
다 (Wikipedia, 2018). 그림에 나타난 붉은 대각선 은 y=x의 관계인 무작위적 추정치를 나타내고 있 다. 예를 들어 구분자가 90%로 "있음"이라고 추정한 다면 90%의 확률로 "있음"을 맞추게 되지만 동시에 오경보확률도 90%가 된다. 만약 구분자가 무작위적 추정보다 못한 구분을 한다면 이 붉은 선 보다 오른 쪽 아래에 있게 될 것이다. 하지만 어떤 정보를 이용 하여 더 나은 판단을 한다면 왼쪽 위에 있게 될 것이 다 (Wikipedia, 2018).
이와 같은 ROC 공간에, 여러 누수 현장 실험과 누수인지 모형 구동결과를 수치화하여 나타내면 그 모형의 성능을 정량화할 수 있다. 만약 구축된 누수 인지 모형이 여러 개인 경우, ROC 곡선을 통해 모 형의 우수성을 정량적으로 비교해 볼 수 있다.
그림 7에는 두 모형 (Model F와 G)의 성능을 비 교하기 위한 ROC 곡선의 예시를 보여주고 있다.
ROC 곡선에서는 ROC curve 아래 면적을 구할 수 있으며, 이 값을 AUC (Area Under Curve)이라고 하며 하나의 수치로 계산되어서 성능 비교를 간단히 할 수 있다. 그림 7에 표시된 노란 점선은 가장 이상 적인 탐지 모델을 나타내고 있다. 임계값과 상관없 이 민감도와 특이도가 100%일 때를 말하고, 이 때 의 AUC 값은 1이 된다. 붉은 점선은 기준선으로서 AUC 값이 0.5일 때이다. 앞서 언급한 바와 같이 붉 표 2. ROC 곡선에 활용되는 정량화 지표 TPR과 FPR
전체집단 실제누수여부 (실제상태)
Positive Negative
모형누수판단여부 (예측상태)
Positive True Positive (TP) False Positive (FP) (Type I Error)
Negative False Negative (FN)
(Type II Error) True Negative (TN)
정량화 지표 (ROC 곡선에 활용)
True Positive Rate (TPR) Detection Rate (재현율, Recall; 민감도, Sensitivity)
= TP/(TP+FN)
False Positive Rate (FPR)
= FP/(FP+TN)
은 점선이 나타내는 y=x의 관계식은 누수탐지를 무 작위적으로 추정하였을 경우의 확률적 성능의 추정 치를 나타낸다. 예를 들어 의사결정자가 50%로 "누 수"이라고 추정한다면 50%의 확률로 "누수"을 맞추 게 되지만 동시에 오․경보확률도 50%가 된다는 것 이다. 만약 개발됨 모형이 무작위적 추정보다 못한 누수 구분을 한다면 이 붉은 점선 보다 오른쪽 아래 에 ROC 곡선이 나타나게 될 것이다. 반대로 더 나 은 누수인지를 한다면 왼쪽 위에 ROC 곡선이 표현 되게 된다. 따라서 일반적인 이상탐지 모델은 붉은 점선보다 상위에 ROC 곡선이 나타나게 된다. 그림 7에 표시된 모델 F와 모델 G를 비교해보면, 모델 F 가 모델 G보다 상위에 있고, 그 면적 (AUC)도 모델 F가 더 넓은 면적을 갖는 것을 확인할 수 있다.
다시 말해, 모든 누수 인지 방법은 ROC 곡선을 사용하여 표현 될 수 있는 민감도와 특이성의 균형 이 필요하게 된다. ROC 곡선은 TPR을 해당 FPR의 함수로 정의하며, 곡선 아래의 면적 (AUC)은 방법 의 효과에 대한 정량화 된 정보를 제공한다. 동일한 자료 조합에서 두 개의 관 파손 인지 방법을 비교할 때 AUC가 큰 것이 좋습니다. 그리고 상수관망의 경 우 정상적인 상황에 비해 관 누수가 거의 발생하지
않는다는 것을 고려할 때, 일반적인 좋은 탐지 방법 은 TPR을 허용 가능한 범위 내로 줄이는 대신 FPR 을 작게 유지하는 것이 좋다. 그렇지 않으면 잘못된 경보가 운영자에게 부담이 되며, 운영자가 모형에서 산출되는 경보를 무시하기 시작할 위험이 있다.
3) 매개변수 설정 절차 마련 (목표 인지 누수량 설정) 앞 절에서 제시된 정량적 지표와 ROC 곡선을 이 용하면, 실제 관망 시스템에 적용된 누수인지 모형 의 매개변수 설정 절차를 마련할 수 있다. 기 개발 모형들에서는 누적합관리도에서의 k와 h의 값을 두 인자의 몇몇 조합에 따른 구축된 모형의 결과를 분 석하여 하나의 값을 고정하여 분석을 수행하였으나, 다른 값의 매개변수 조합에 대한 정량적인 성능평가 는 수행되지 않았다.
따라서 다양한 조합의 k와 h의 값을 이용하여 모 형을 구동한 후 그 결과를 ROC 곡선으로 나타내고, 곡선의 아래 부분 면적(AUC)을 계산하여 비교한다 면, 최적의 매개변수 조합을 결정 할 수 있다. 그리 고 이와 같은 매개변수 조합에 의한 정량적 누수인 지 성능을 확보한다면, 매개변수의 설정 값에 따라 인지 가능한 누수사고의 특성을 분석할 수 있게 되 그림 6. ROC 공간 (Wikipedia, 2018) 그림 7. 모형 별 ROC 곡선의 비교 (김태영, 2017)
며, 다양한 누수사고 특성을 가진 테스트를 수행할 경우 누수사고의 관리 측면에서 목표로 설정할 수 있는 “관리가 가능한 누수량”의 크기의 설정이 가능 하다.
4) 운영상황을 고려한 모형의 현장 맞춤화
누수인지 모형의 구축이 잘 되었더라도 개발된 모 형을 적용 관망의 특성 (현장상황, 운영상황 등)에 맞춰 적절히 수정하지 않는다면 모형의 성능은 급격 히 저하될 수밖에 없다. 이와 같은 운영조건에 따른 수리학적 계측 자료의 변화는 적용 관망의 운영 상 태, 구역화 정도, 용수수요자의 수수패턴 등에 의하 여 각기 변하게 되므로, 운영조건에 따른 변화가 나 타나는 구간 또는 구역을 정의하여 적용대상 관망을 다시 세부화 하고, 예측 가능한 운영상황에 대한 유 량 및 압력 값의 변화 정도를 분석한 후, 기 개발 모 형의 적용 시 이 값을 고려할 수 있도록 하는 현장 커스터마이징 기술이 필요하다.
5) 데이터 기반 예측, 분류기법의 결합
일반적으로 분류기법만을 활용한 이상탐지 방법 은 실제 모니터링 데이터의 한계로 인해 거의 활용 되지 않는다. 또한 기 개발모형에서 중심적으로 사 용된 통계적 공정관리 방법은 자료의 정규분포를 가 정한 모형이므로, 이와 관련된 한계점은 분명 존재 한다. 그러나 최근의 여러 연구를 살펴보았을 때, 통 계적공정관리 기술은 필수적이며 특히 예측과 분류 를 동시에 적용하는 이상탐지 기법에서도 핵심적인 역할을 한다. 그리고 통계적 공정관리 기법의 결과 를 기반으로 예측, 분류 기반의 이상탐지 기법을 추 가로 활용할 경우 그 활용도는 더 높아질 수 있다.
5. 중대형 누수인지 시스템 구축을 위한 기 법 간 결합 방안
지금까지 관 파손 탐지 기법의 최신동향을 알아보
고 최근 활용도가 급격히 높아진 데이터 기반 관 파 손 탐지 기법에 대한 검토를 수행한 결과, 계측기로 부터 전송된 자료기반 관 파손 탐지는 타 방법에 비 해 활용도가 높으며, 모형의 구축도 상대적으로 용 이하다는 측면에서 충분히 가치가 있음을 확인하였 다. 그러나 모든 상황에 대해 항상 우수한 기법은 존 재하지 않으며 (No free lunch theorem, Wolpert and Macready, 1997), 통계적 공정관리 기법 역시 데이터 분포의 가정과 같은 여러 제한요소들이 존 재한다. 예측-분류 모델역시 최근에 많은 이상탐지 기법에서 적용되고 있으며, 그 우수성이 여러 논문 에서 보고되고 있다. 그러나, 머신러닝 기법을 활용 한 분류모형에서 모델의 정확도를 높이는 가장 중요 한 과정은 학습단계이다. 따라서 효율적인 인공신경 망 모델 구축을 위해서는 정규 데이터와 이상치 (누 수자료)의 제공이 반드시 필요하다. 일반적으로 평 균 이상의 수준에서 관리되고 있는 상수관망 시스템 에서는 관 파손에 의한 비정상적인 상황자료의 양이 정상적인 상황의 자료보다 훨씬 적으며, 이와 같은 데이터 범주 (실제누수와 정상의 비율)의 불균형은 모형의 누수여부 또는 누수판단의 정확도에 영향을 미치게 된다. 특히, 대부분의 수도시스템에서는 과 거에 발생한 관 파손 이력과 그에 상응하는 수리학 적 정보를 상세히 기록하지 않는 경우가 많으므로, 실제 모형의 검•보정을 위한 검증 자료가 매우 부 족하다. 이와 같은 학습 및 검증에 필요한 자료의 확 보방법은 크게 1) 실제 누수 테스 수행을 통한 자료 축적과 2) 매우 잘 검•보정된 정상류 및 부정류 수 리해석 모형 구축 후 시나리오 기반 자료 생성의 방 법이 있다. 물론 실제 누수 테스트 수행 건수가 충분 할 경우 수리해석 모형을 활용하지 않아도 되나, 충 분한 자료의 학습을 위해서는 수리해석 모형의 구축 은 필수적이다.
최근 압력 및 유량 계측기의 발달은 아주 짧은 시 간 간격의 수리학적 인자를 저비용 및 효율적으로 계측가능하게 하였으며, 이와 같은 수리학적 관측 자료와 부정류 수리해석 모델의 결과를 함께 활용
할 경우 우수한 성능의 누수인지 모형의 구축이 가 능하다. 일반적으로 부정류 해석의 경우 실측자료 와 수리해석 자료의 일치를 위한 마찰계수와 누수 량의 검·보정을 수행하고 그 결과를 통해 누수여 부 및 위치를 결정하는 방법이 주로 활용된다. 대 표적인 방법이 역부정류해석 (Inverse Transient Analysis) 기법이다. 이와 같은 수리해석 기반 방법 의 성공을 위한 핵심은 아주 잘 보정된 수리해석 입 력 자료의 확보에 있다. 특히 부정류해석 기반 수리 해석의 경우 잘 보정된 수리해석 자료를 사용할 경 우, 관 파손에 의해 유도 된 압력의 변화를 감지 할 수 있다. 그러나 지금까지 부정류 해석 모형과 최적 화 기법의 결합모형이 상수관망 분야에 실무적으로 많이 활용되지 않았는데, 그 이유는 기 개발된 부정 류해석 모형 자체가 가지고 있는 수렴성 확보를 위 한 계산시간의 장기화로 인한 대규모 실제 관망의 적용성 저하에 있었다. 또한 이와 같은 부정류 수리 해석 모형 기반 매개변수 최적화 모델을 일부 수정 할 경우 그 결과자료는 누수인지 시스템의 학습을 위한 입력 자료로도 활용될 수 있어, 실제 누수자료 가 부족한 상수관망 시스템에 있어 반드시 필요하다 고 할 수 있다.
중대형 누수인지 시스템의 고도화를 위한 기존 기법 간 결합방안을 두 가지로 요약하여 제시하면 다음과 같다. 첫 번째, 빠른 연산 시간을 가진 부 정류 해석 모형 (예시, 최근 K-water에서 개발된 K-NPulse 모형)과 매개변수 최적화 기법을 활용한 누수인지 모델의 구축이다. 이의 구현을 위해서는 부정류 해석에 사용가능한 절절한 압력계의 설치가 필요하며, 부정류해석 모형과 최적화 기법의 연계시 스템 구축이 필요하다.
두 번째, 상수관망 누수인지 모형에 활용되어 그 적용성이 입증된 바 있는 ANN (또는 딥러닝) 기반 누수탐지 모형의 구축이다. 모형의 효율적인 구축을 위해서는 학습관련 매개변수의 최적화 모듈의 구축 이 필요하며, 또한 절대적으로 부족한 비정상(누수) 상황 자료를 부정류 해석 모형의 구동을 통해 생성
해내어 학습을 위한 입력 자료로 활용해야 한다.
6. 결론
본 학술기사에서는 관 파손사고 감지를 위한 방법 론에 대한 조사를 통하여, 기 개발된 통계적 공정관 리 기반 누수인지 모델의 신뢰도 제고 방안을 제시하 고, 중대형 누수인지 시스템의 고도화를 위한 기 개 발 기법의 결합 및 적용성 증대방안을 소개하였다.
제안된 통계적 공정관리 기반 누수인지 모델의 개 선방안은 누수를 인지하는데 중점적으로 적용될 수 있으며, 중대형 누수인지 시스템 고도화를 위한 기 법 간 결합 방안의 경우 누수 발생지점의 구역화 (지 점화)에 활용될 수 있을 것이다. 결국, 최종적인 중 대형 누수인지 시스템은 누수 여부를 판단할 수 있 는 누수 탐지 (Burst Detection) 모듈과, 누수 발생 시 그 지점을 특정화 할 수 있는 누수 구역화 (Burst Localization) 모듈으로 구분되어 개발할 수 있다.
누수탐지 모듈은 개선방향으로 제시된 표준적 통계 적 공정관리 방법의 프로세스 구축과 모형 평가를 위한 정량적 평가 지표 시스템, 그리고 매개변수 선 정 절차 마련/고도화를 통한 목표하고자 하는 인지 누수량의 결정으로 구성될 수 있으며, 누수 구역화 모듈은 부정류 해석 기반의 최적화된 관망 시스템을 구축하고, 이 결과를 기반으로 한 머신러닝 기반의 누수 구역화를 추진하는 것으로 짧은 연산속도를 가 지는 부정류 해석 모형이 활용되어야 한다. 향후, 제 안된 기법들이 수정, 보완되어 실제 누수인지시스템 의 모듈로 구현되고 실무검증을 거쳐, 최종적으로는 단수에 의한 국민의 피해 저감에 기여할 수 있는 현 장 맞춤형 기술이 될 수 있기를 기대한다.
김태영 (2017) 블록과 함께하는 파이썬 딥러닝 케라스.
신병호 (2018) 광역상수도 관로사고 대응을 위한 배수구간 적정 설계기법 개발, 박사학위논 문, 충남대학교
Jung, D., Kang, D., Liu, J., & Lansey, K. (2015). Improving the rapidity of responses to pipe burst in water distribution systems: a comparison of statistical process control methods. Journal of Hydroinformatics, 17(2), 307-328.
Loureiro, D., Amado, C., Martins, A., Vitorino, D., Mamade, A., & Coelho, S. T.
(2016). Water distribution systems flow monitoring and anomalous event detection:
a practical approach. Urban Water Journal, 13(3), 242-252.
Mounce, S. R., Day, A. J., Wood, A. S., Khan, A., Widdop, P. D., & Machell, J. (2002). A neural network approach to burst detection. Water science and technology, 45(4-5), 237-246.
Mounce, S. R., Khan, A., Wood, A. S., Day, A. J., Widdop, P. D., & Machell, J.
(2003). Sensor-fusion of hydraulic data for burst detection and location in a treated water distribution system. Information Fusion, 4(3), 217-229.
Mounce, S. R., Boxall, J. B., & Machell, J. (2009). Development and verification of an online artificial intelligence system for detection of bursts and other abnormal flows. Journal of Water Resources Planning and Management, 136(3), 309-318.
Mounce, S. R., Mounce, R. B., & Boxall, J. B. (2011). Novelty detection for time series data analysis in water distribution systems using support vector machines.
Journal of hydroinformatics, 13(4), 672-686.
Mounce, S. R., & Machell, J. (2006). Burst detection using hydraulic data from water distribution systems with artificial neural networks. Urban Water Journal, 3(1), 21-31.
Romano, M., Kapelan, Z. and Savic, D.A., 2014a. Automated detection of pipe bursts and other events in water distribution systems. Journal of Water Resources Planning and Management, 140 (4), 457–467.
Romano, M., Kapelan, Z. and Savic, D.A., 2014b. Evolutionary algorithm and expectation maximization strategies for improved detection of pipe bursts and other events in water distribution systems. Journal of Water Resources Planning and Management, 140 (5), 572–584.
Rossman (2000) EPANET2 User's Manual, EPA
WHO (2002) DISASTERS & EMERGENCIES DEFINITIONS. Training Package, Panafrican Emergency Training Centre, Addis Ababa.
참고문헌
Wikipedia (2018a) 2018.11.15. 접속기준, https://en.wikipedia.org/wiki/Crisis
Wikipedia (2018b) 2018.11.15. 접속기준, https://ko.wikipedia.org/wiki/%EC%88%98%EC%8B%A0%E C%9E%90_%EC%A1%B0%EC%9E%91_%ED%8A%B9%EC%84%B1
Wolpert, D. H., & Macready, W. G. (1997). No free lunch theorems for optimization. IEEE transactions on evolutionary computation, 1(1), 67-82.
Wu, Y., & Liu, S. (2017). A review of data-driven approaches for burst detection in water distribution systems. Urban Water Journal, 14(9), 972-983.
Ye, G.L. and Fenner, R.A., 2011. Kalman filtering of hydraulic measurements for burst detection in water distribution systems. Journal of Pipeline Systems Engineering and Practice, 2 (1), 14–22.