• 검색 결과가 없습니다.

빅데이터를 활용한 계절강수량 전망

N/A
N/A
Protected

Academic year: 2021

Share "빅데이터를 활용한 계절강수량 전망"

Copied!
7
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

Issue

01

1. 머리말

우리나라는 여름철에 연강수량의 대부분이 집중 되는 특성으로 인해 여름철 강수량에 따라 일년의 물관리가 좌우된다. 작년에는 2013년부터 계속된 가뭄으로 충남 서부권 및 남부지방을 중심으로 물이 부족해 큰 고통을 겪었으나 올해 여름은 장기간의 가뭄과는 사뭇 다른 여름 강수 특성을 보였다. 6월 말에서 7월 초까지는 국지적인 집중호우가 지역별 로 발생하였고, 7월 내내 비가 거의 오지 않는 상황 에서 관측 이래 최고 수준의 이상 고온으로 급성가 뭄(flash drought)이 발생해 농작물 피해가 발생하 였다. 반면 8월에는 태풍 ‘솔릭’이 6년 만에 한반도 를 관통했으나 예상과는 달리 비를 거의 뿌리지 않 았고 오히려 8월에 전국적으로 강우가 집중 발생하 여 가뭄이 해소되는 것을 넘어 도로시설과 하천제방 이 유실되고 주택과 농경지가 침수되는 등의 피해가 발생하였다.

이렇듯 여름철 강수량은 물의 이용과 방재 측면 모두에서 매우 중요한 의미를 갖고 있지만, 이상기 후로 인한 변동성의 심화로 여름강수의 전망은 더 욱 어려워지고 있는 실정이다. 기상청에서는 다양 한 목표기간에 대해 기상전망 또는 예측 정보를 생 산, 제공하고 있다. 레이더를 이용한 초단기예측부 터 GCM(global climate model), RCM(regional climate model) 등을 활용한 중장기 전망까지 그 종 박 명 기

K-water 물정보종합센터장 mkpark@kwater.or.kr

강 신 욱

K-water 융합연구원 책임연구원 sukang@kwater.or.kr

이 정 주

K-water 물정보종합센터 책임위원 jeongju@kwater.or.kr

이 현 호

K-water 물정보종합센터 과장 hyunho@kwater.or.kr

김 한 주

K-water 물정보종합센터 대리 khj0911@kwater.or.kr

빅데이터를 활용한 계절강수량 전망

(2)

류는 매우 다양하다. 하지만 이러한 전망 값들은 주 로 물리모형을 기반으로 슈퍼컴퓨터를 이용해 분석 되고 있어 자료의 구축, 분석, 결과해석 등이 매우 복잡하고 일반인이 접근하기 어렵다. 또한 정량적인 예측 결과를 쉽게 제공받기도 힘들다. 따라서 본 분 석에서는 통계적인 기법을 기반으로 웹에서 취득 가 능한 기상 관측 빅데이터를 활용하여 정량적 계절강 수량 전망을 수행하고자 하였다. 분석된 결과를 기 상청의 장기 기상전망 결과와 병행하여 활용한다면 댐․보 운영계획 수립 및 실무에 참고할 수 있을 것 이다.

2. 연구방법

기상인자를 활용한 우리나라의 강수량 예측 은 권현한과 이정주(2011)가 과거 해수면온도 (sea surface temperature, SST)와 외향장파복사 (outgoing longwave radiation, OLR)을 활용하여 낙동강 유역의 여름강수량을 전망한 사례가 있으며 본 분석도 이에 바탕을 두었다. 최근에는 이강진과 권민호(2016)가 동서바람 편차와 적설을 활용하여 동아시아 지역의 6월 강수를 예측한 바 있다. 안상 진 등(2000)은 결측지점의 3시간 후 강수를 인공신 경망을 통해 예측하였으며, 강부식과 이봉기(2008) 는 인공신경망과 중규모 기상수치예보를 이용하 여 강수확률 예측 정확성을 개선하였고 하지훈 등 (2015)은 딥러닝 기법과 태양 및 달의 궤도 등을 활 용하여 다음날의 강수 유무 예측 모형을 개발한 사 례들이 있다.

본 분석은 베이지안 마코프체인 몬테카를로 (Markov Chain Monte Carlo, MCMC) 기법과 인 공신경망 두 가지 방법을 이용해 우리나라의 여름철 (7∼9월) 강수량을 전망하고자 하였다. 대상 지역의 공간적 범위는 전국을 하나의 대상으로 한 모형과, 권역별(한강, 금강․영산강․섬진강, 낙동강) 모형으 로 총 4개 모형이다. 선행연구를 토대로 SST, OLR

와 동아시아 몬순과 관계가 있다고 알려진 북서태 평양 몬순지수(Western North Pacific Monsoon Index, WNPMI)와 북대서양 진동지수(North Atlantic Oscillation, NAO)를 입력 변수로 활용을 검토하였으며 강수량은 강우관측소 700개의 데이터 를 Thiessen법으로 산정하였다. Bayesian MCMC 및 인공신경망 모형 모두 통계분석 프로그램인 R을 활용하였다.

3. Bayesian MCMC 3.1 예측모형

Bayesian MCMC 기법은 수학적으로 적분이 불 가능한 경우 이를 확률적으로 추론할 수 있는 장 점이 있다. 본 분석에서는 깁스 샘플링(Gibbs sampling)을 통해 마코프 연쇄를 구현하였다. 깁스 샘플링은 N차원의 확률결합분포에서 샘플링이 어 려운 경우 다른 차원은 고정하고 한 개의 차원만 이 동을 N번 수행하여 샘플링을 하는 방법이다. 초기 값이 영향을 미치는 Burn-in 구간을 지나면 특정 확률분포로 수렴하게 되는 특징을 갖는데, 본 분석 에서는 총 12,000회의 샘플링 중 앞의 10,000회는 Burn-in 구간으로 제외하고 마지막 2,000개의 샘 플을 활용하였다.

Windows기반의 WinBUGS(Bayesian inference Using Gibbs Sampling) 툴을 활용하여 깁스 샘플 링을 활용한 Bayesian MCMC모형을 구성하였으며 R2WinBUGS 패키지를 통해 R과 WinBUGS를 연 동하여 자료 입출력 및 결과분석을 수행하였다.

3.2 입력자료 구성

대상 공간범위인 3개 권역 및 전국의 1980~2017 년 여름철 강수량과 미국 국립해양대기국(NOAA) 에서 제공하는 SST, OLR, WNPMI를 활용하였다

(3)

(Table 1). 시공간상관성 분석 결과 예측대상별로 약간의 편차는 있으나 SST는 영국 인근과 LA서쪽 부근의 3∼5월 평균, OLR은 멕시코 주변과 동해 인

근의 5월 데이터가 높은 상관관계를 갖는 것으로 나 타나 입력자료로 활용하였다(Fig. 1).

Fig. 2. 북서태평양 몬순지수

Table 1. Bayesian MCMC 모형 입력자료 (1980∼2017)

입력자료 대상위치 대상기간 비고

SST 영국 인근, 미국 서부 3∼5월 평균값

OLR 동해 인근, 멕시코 인근 5월 월별값

WNPMI 북서태평양 지역 1월 월별값

(a) 해수면온도(SST) (b) 외향장파복사(OLR)

Fig. 1. 기상인자와 전국 여름철 강수량의 상관관계

Fig. 2의 WNPMI는 5°∼15°N, 90°∼130°E 지역의 U850과 22.5°∼32.5°N, 110°∼140°E 지역 U850의 차이를 의미하며, 동아시아의 여름 몬순과 관계가 있다고 알려져 있다(Wang et al., 2008). WNPMI

와 우리나라 권역별 강수량과 상관관계 분석결과 상 관성이 가장 큰 1월의 WNPMI 데이터를 입력하였다 (Table 2).

Table 2. 북서태평양 몬순지수와 권역별 강수량의 상관관계

R2 1월 2월 3월 4월 5월 6월

전국 -0.46 -0.19 0.06 -0.01 -0.01 0.19 한강 -0.45 -0.32 -0.02 -0.09 0.16 0.12 금영섬 -0.40 -0.12 0.02 0.02 0.00 0.23 낙동강 -0.34 -0.11 0.20 0.06 -0.14 0.15

(4)

3.3 과거년도 평가결과

구축된 모형의 예측 정확도 검증을 위해 과거년도 (2001∼2017)의 여름철 강수량 예측을 수행한 후 이 를 관측 값과 비교해보았다(Table 3).

금․영․섬 유역을 제외한 전국, 한강, 낙동강 유역 에서 WNPMI를 활용한 모형이 그렇지 않은 모형보 다 RMSE, 상관계수가 더 낮게 나타났으며 금․영․

섬 유역의 경우 타 유역과 반대의 결과가 나타났으나 유의미한 차이는 나타나지 않았다. 따라서 Bayesian MCMC를 활용한 2018년도 여름철 강수량 전망에는 WNPMI를 제외한 SST, OLR을 활용하였다.

4. 인공신경망 4.1 예측모형

인간의 뉴런 구조에 착안한 인공신경망은 입력

층(input layer), 은닉층(hidden layer), 출력층 (output layer)로 구성되어 있으며 은닉층의 개수에 따라 단층 또는 심층신경망(deep neural network) 으로 구분된다. 본 연구에서는 R의 Keras 패키지를 활용하여 인공신경망을 구성하였으며 훈련을 통해 학습된 모형을 검증 데이터 세트로 평가하였다.

4.2 입력자료 구성

인공신경망을 통한 여름철 강수량 전망에는 앞 에서 분석한 Bayesian MCMC 모형과 마찬가지로 SST, OLR 및 WNPMI를 활용하였으나, SST는 1

∼5월의 월별 및 이동평균값을 모두 활용하였고, 1

∼5월의 WNPMI도 모두 입력 자료로 구성하였다 (Table 4). 또한 추가 기상인자로 북대서양 진동지 수(NAO)를 도입하였다. 인공신경망 모형은 훈련 과 정에서 상관성이 높지 않은 입력 값은 연결강도가 약화되어 자연 도태되므로, 입력 자료의 추가 등이 유연한 특성을 활용하였다.

Table 3. 과거 여름철 강수량 전망결과(2001∼2017) (Bayesian MCMC)

WNPMI 미활용 WNPMI 활용

RMSE (root mean square

error)

Correlation coefficient

RMSE (root mean square

error)

Correlation coefficient

전국 166.6 0.54 171.9 0.54

한강 162.5 0.74 172.8 0.66

금·영·섬 234.0 0.32 238.4 0.33

낙동강 198.9 0.42 219.4 0.31

Table 4. 인공신경망 모형 입력자료 (1980∼2017)

입력자료 대상위치 대상기간 비고

SST 영국 인근, 미국 서부 1~5월 월별 및 이동평균값

OLR 동해 인근, 멕시코 인근 5월 월별값

WNPMI 북서태평양 1~5월 월별값

NAO 북대서양 1~5월 월별값

(5)

4.3 과거년도 평가결과

인공신경망 모형의 정확도 검증은 학습 데이터의 확보를 위해 2011년도부터 평가를 실시하였다.

Bayesian MCMC는 추가 기상인자를 입력하지 않았던 경우가 정확도가 더 높았으나, 인공신경망의 경우 북서태평양 몬순지수(WNPMI) 및 북대서양 진 동지수(NAO)를 입력 자료로 활용한 경우 전망 성능 이 개선되었다(Table 5). 2018년도 여름철 강수량 전망에는 기상인자를 추가한 인공신경망 모형을 활 용하였다.

5. 2018년도 여름철 계절강수량 전망결과

5.1 Bayesian MCMC

Bayesian MCMC를 활용한 모형의 경우 2018년 여름철 계절강수량은 전국 672.5㎜, 한강 662.9㎜, 금․영․섬 631.1, 낙동강 621.8㎜를 전망(가장 높은 확률 기준)하였으며 이는 평년의 약 90%내외 수준 이다(Fig. 3). 전국 및 금·영·섬 유역은 작년과 비 슷한 강수량, 한강 유역은 작년보다 적게, 낙동강 유 역은 작년보다 많은 강수가 올 것으로 전망되었다.

Table 5. 과거 여름철 강수량 전망결과(2011∼2017) (인공신경망)

WNPMI 및 NAO 미활용 WNPMI 및 NAO 활용

RMSE (root mean square

error)

Correlation coefficient

RMSE (root mean square

error)

Correlation coefficient

전국 216.9 0.57 167.5 0.70

한강 234.0 0.51 214.0 0.57

금·영·섬 237.3 0.54 184.7 0.63

낙동강 284.6 0.34 186.4 0.52

(a) 전국(672.5㎜) (b) 한강(662.9㎜)

(c) 금·영·섬(631.1㎜) (d) 낙동강(621.8㎜)

2018년도 강수량 전망 확률분포 평년 강수량 2017년도 강수량

Fig. 3. 2018년도 7∼9월 강수량 전망 결과 (Bayesian MCMC)

(6)

5.2 인공신경망

인공신경망을 활용한 2018년도 여름강수량 전망 은 전국 567.5㎜, 한강 579.9㎜, 금․영․섬 533.8㎜, 낙동강 509.6㎜로 평년의 75% 수준으로 Bayesian MCMC보다 다소 적은 강수가 전망되었다.

6. 2018년도 여름철 강수량 전망 평가

2018년도 여름철(7∼9월)은 전국 평균 631.4㎜

의 강수량을 기록하여 평년(727.9㎜)의 약 87%

수준의 강수를 기록하였으며, 본 분석에서 수행 한 Bayesian MCMC 모형은 6.5%, 인공신경망은 10.1%의 오차를 나타냈다(Table 6). 전체적으로 Bayesian MCMC 모형의 전망값이 실측값과 근접 하였으며 오차는 0.1% ∼ 6.5%의 분포를 보였다.

특히 한강 유역의 경우 매우 근사하여 오차가 거의 발생하지 않았다.

인공신경망 모형은 전체적으로 10%대의 오차 를 나타냈으며, 전국의 오차가 가장 적었고 낙동 강 유역의 오차가 가장 크게 발생하였다. 전국보 다 유역별 오차가 더 적은 Bayesian MCMC와는 달리 인공신경망은 전국 단위 전망의 정확도가 가 장 높았다.

7. 맺음말

본 분석에서는 빅데이터를 활용하여 2018년 우리 나라 여름철 강수량을 전망하고 실측값과 비교분석 하였다. 변동성이 큰 기상현상의 특징 및 3개월 장 기전망에 따른 불확실성이 다소 존재하지만 활용 가 능성을 확인할 수 있었다.

다른 수자원 분야에서도 자연현상을 예측하기 위 해 빅데이터를 활용하는 연구가 활발하게 진행되고 있다. 가뭄을 사전에 예측하여 일반 국민을 대상으 로 예․경보를 시행하고 있으며 홍수량 예측, 녹조 예측 등 특히 물재해와 직접적인 관련이 있는 분야 에서 시도가 활발하게 이루어지고 있으나, 현재까지 는 이론에 기초한 물리 및 통계모형에 대부분 근거 하고 있다. 한편 이용 가능한 수문관측 자료의 기간 이 증가함에 따라 원인인자와 결과 간의 상관관계를 명확히 규명하기 어려운 현상에 대해서도 원하는 예 측 값을 데이터 기반 모형을 통해 도출하기 용이해 졌다.

빅데이터는 이미 우리 생활의 많은 부분에 적용되 어 있다. 차량번호 인식기, 인터넷 쇼핑몰의 맞춤 추 천 상품 등은 우리 주변에 빅데이터가 활용되고 있 는 좋은 예이다. 최근에는 한걸음 더 발전한 빅데이 터 분석기법을 활용하여 인공신경망, 랜덤포레스트 등 기존의 방법들에서 강화학습, 순환신경망의 한 종류인 GRU(gated recurrent unit) 등 다양한 기

Table 6. 2018년 여름철 계절강수량 전망결과

분류 실측

(㎜)

Bayesian MCMC 인공신경망

전망(㎜) 오차(%) 전망(㎜) 오차(%)

전국 631.4 672.5 6.5% 567.5 10.1%

한강 662.5 662.9 0.1% 579.9 12.5%

금·영·섬 621.0 631.1 1.6% 533.8 14.0%

낙동강 600.8 621.8 3.5% 509.6 15.2%

(7)

술이 개발되고 있다. 여기서 더 나아가 미국의 한 기 업은 축적된 농업 관련 빅데이터를 기반으로 최적의 파종 시기를 예측하고 이를 농민들에게 알려준 결 과 수확량이 기존 대비 30%이상 증가하였으며 국내 에서도 그간 측정된 데이터를 통해 공기의 질을 예

측하는 서비스를 추진하고 있다. 빅데이터를 활용한 물관리 또한 관련 기술의 지속적인 축적 및 충분한 검증을 통해 일상생활에 밀접하게 활용되는 날을 기 대해본다.

Ahn S., Yeon I. and Kim K. (2000). “Rainfall Forecasting Using Neural Network”, JOURNAL OF THE KOREAN SOCIETY OF CIVIL ENGINEERS B, Vol. 20, No. 5B, pp. 711~722.

Ha J., Kim Y. and Lee Y. (2015). “Forecasting the Precipitation of the Next Day using Deep Learning. KIIS Autumn Conference 2015, Vol. 25, No. 2, pp. 173-174.

Kang B. and Lee B. (2008). “Predicting Probability of Precipitation Using Artificial Neural Network and Mesoscale Numerical Weather Prediction”, JOURNAL OF THE KOREAN SOCIETY OF CIVIL ENGINEERS B, Vol. 28, No. 5B, pp. 485~493.

Kwon H. and Lee J. (2011). “Seasonal Rainfall Outlook of Nakdong River Basin Using Nonstationary Frequency Analysis Model and Climate Information”, JOURNAL OF KOREAN WATER RESOURCES ASSOCIATION, Vol.44 No. 5, pp.

339~350.

Lee K. and Kwon M. (2016). “A Prediction of Precipitation Over East Asia for June Using Simultaneous and Lagged Teleconnection,” ATMOSPHERE, Vol. 26, No. 4, pp. 711~716.

Wang et al. (2008). “How to measure the Strength of the East Asian Summer Monsoon”, JOURNAL OF CLIMATE, Vol. 21, pp. 4449~4463.

참고문헌

수치

Table	6.	2018년	여름철	계절강수량	전망결과 분류 실측 (㎜) Bayesian MCMC 인공신경망 전망(㎜) 오차(%) 전망(㎜) 오차(%) 전국 631.4 672.5 6.5% 567.5 10.1% 한강 662.5 662.9 0.1% 579.9 12.5% 금·영·섬 621.0 631.1 1.6% 533.8 14.0% 낙동강 600.8 621.8 3.5% 509.6 15.2%

참조

관련 문서

농촌지역, 특히 농촌재생과 관련된 전국적 단위의 통계자료 구축이 미흡한 상황에서 일반적인 논 의의 시도를 위해 빅데이터를 활용한 텍스트 네트워크 분석은 현시점의

타이젠 OS 를 활용한 미세먼지 공기청정기 만들기..

STS 와 SCE 방식은 도메인 온톨로지 (Domain Ontology) 또는 워드넷을 지식베이스로 활용한 연구로써 각 문서의 핵심 키워드 문맥 정보 를 추출함에 ( )

김명식 (2001) 은 5 학년의 2 개의 학급을 선정하여 노래와 챈트를 활용한 영 어 학습이 학습자들에 미치는 영향을 연구하였는데 영어를 학습하는데 있어 ,

스마트 토이를 활용한 STEAM

게임화를 활용한 첼로 프로그램의 개발을 위하여 선행 연구를 통한 게임화의 정 의와 게임 요소들을 알아본다 그리고 게임화를 활용한 교육 사례들을 참고하여

The data are corrected for temperature error due to solar radiation and the effect of low temperature on the anerod capsule and curvature of the surface of

태양 빛을 렌즈에 집중하면 종이나 나무를 태울 수 있는 정도이지만, 레이저 빛의 경우에는 에너지양이 크기 때문에 철판까지도 녹일 수 있습니다. 레이저