韓國水資源學會論文集 第48卷 第10號 2015年 10月 pp. 793~806
유역특성인자를 활용한 Sacramento 장기유출모형의 매개변수 지역화 기법 연구
A Study on Regionalization of Parameters for Sacramento Continuous Rainfall-Runoff Model Using Watershed Characteristics
김 태 정* / 정 가 인** / 김 기 영*** / 권 현 한****
Kim, Tae-Jeong / Jeong, Ga-In / Kim, Ki-Young / Kwon, Hyun-Han
...
Abstract
The simulation of natural streamflow at ungauged basins is one of the fundamental challenges in hydrology community. The key to runoff simulation in ungauged basins is generally involved with a reliable parameter estimation in a rainfall-runoff model. However, the parameter estimation of the rainfall-runoff model is a complex issue due to an insufficient hydrologic data. This study aims to regionalize the parameters of a continuous rainfall- runoff model in conjunction with a Bayesian statistical technique to consider uncertainty more precisely associated with the parameters. First, this study employed Bayesian Markov Chain Monte Carlo scheme for the estimation of the Sacramento rainfall-runoff model. The Sacramento model is calibrated against observed daily runoff data, and finally, the posterior density function of the parameters is derived. Second, we applied a multiple linear regression model to the set of the parameters with watershed characteristics, to obtain a functional relationship between pairs of variables. The proposed model was also validated with gauged watersheds in accordance with the efficiency criteria such as the Nash-Sutcliffe efficiency, index of agreement and the coefficient of correlation.
Keywords : ungauge, parameter, regionalization, sacramento, multiple linear regression
...
요 지
미계측유역의 유출량 모의는 수문학 분야에서 필수적인 사항이다. 강우-유출 모형을 이용하여 신뢰성 있는 유출량을 모의하기 위한 핵심사항은 강우-유출 모형의 매개변수를 추정하는 것이다. 하지만 현재 우리나라는 불충분한 수문자료로 인해 매개변수 추정에 어려움이 존재한다. 본 연구의 목표는 불확실성 반영을 위한 Bayesian 통계기법 기반의 강우-유출 모형의 매개변수를 지역화 하는 것이다. 그 방법은 다음과 같다. 첫째, 본 연구는 세계적으로 널리 사용되고 있는 Sacramento 강우-유출 모형에 Bayesian Markov Chain Monte Carlo 기법을 연계한 Bayesian Sacramento 강우-유출 모형을 사용하여 계측유역을 대상으로 13개 매개변수를 최적화하고 각 매개변수의 사후분포를 도출하였다. 둘째, 매개변수와 유역특성인자 사이에 회귀특성을 얻기 위해 다중선형회귀분석을 적용하여 유역특성을 고려한 지역화 매개변수를 결정하였다. 다중회귀분석을 통하여 산정된 지역화 매개변수를 계측유역에 전이하여 유출량을 모의 후 통계적 효율기준인 N-S계수, 일치계수 및 상관계수를 사용하여 지역화 매개변수 검증을 수행하였다.
핵심용어 : 미계측유역, 매개변수, 지역화, Sacramento, 다중선형회귀분석
...
* 전북대학교 토목공학과 박사과정, 방재연구센터 (e-mail: [email protected])
Ph. D Course, Department of Civil Engineering, Chonbuk National University, Jeonju, Korea
** 전북대학교 토목공학과 석사과정, 방재연구센터 (e-mail: [email protected])
Graduate Student, Department of Civil Engineering, Chonbuk National University, Jeonju, Korea
*** 한국수자원공사 K-water 연구원 기반시설연구소 책임연구원 e-mail: [email protected]) General Manager, Infrastructure Research Center, K-water Institute
**** 교신저자, 전북대학교 토목공학과 교수, 방재연구센터 (e-mail: [email protected])
Corresponding Author, Professor, Dept. of Civil Engineering, Chonbuk National University, Jeonju, Korea
J. Korea Water Resour. Assoc.
Vol. 48, No. 10:793-806, October 2015 http://dx.doi.org/10.3741/JKWRA.2015.48.10.793 pISSN 1226-6280 • eISSN 2287-6138
Data from Gauged basins
Estimation of parameters of Bayesian Sacramento model
Regionalization of the parameters based on MLR
Validation of the estimated parameters
Fig. 1. The Proposed Regionalization Process using Bayesian Sacramento Model 1. 서 론
수문순환의 여러 성분과정 중 유출은 유역의 지형특성, 식생분포, 토지이용상태, 토양성질 및 기상상태에 따라 복 잡한 과정을 거쳐 하천유량 형태로 흐르며, 용수공급과 홍수방어의 목적으로 이용되는 대표적 수공구조물인 댐 및 저수지의 유역은 가용수자원을 최적배분하기 위해 수 문순환 분석과정에서 가장 면밀히 검토되어야하는 요소 이다. 유역의 가용수자원을 최적배분하기 위한 핵심사항 은 상류유역의 신뢰성 있는 강우량 및 유입량 자료이다.
우리나라를 포함한 많은 나라의 수문조사 기술은 과거에 비하여 비약적인 발전을 해오고 있으나, 미계측유역이 많 아 장기유출 분석을 수행하는데 어려움이 있어 여전히 수 문순환의 전반적인 과정을 신뢰성 있게 모의하기 위한 수 문자료가 질적 및 양적으로 부족한 실정이다. 신뢰성 있 는 수문분석을 위해서는 최소한의 계획기간을 상회하는 자료연한이 필요하나 우리나라를 포함하여 많은 나라에 서 30년 이상의 수문자료를 찾아보기 어렵다. 수자원계획 수립 시 유출량 자료는 댐 유역을 제외하고 10년 이상의 자료를 확보하기 어려우며, 미계측유역의 유출량 자료는 원천적으로 취득이 불가능한 실정이다.
유입량 자료의 경우 시험유역을 제외한 미계측유역은 수문자료의 신뢰성과 지속성 확보가 원활하지 못하여 미 계측유역과 같이 신뢰성 있는 장기유출량 관측 자료의 부 족은 수자원관리를 위하여 유역특성을 반영한 신뢰성 있 는 강우-유출 관계를 유도하는데 문제점을 초래하고 있으 며 특히, 댐 및 저수지의 효율적인 운영에 필요한 자료의 불확실성을 증가시키는 주요 원인으로 작용하고 있다. 이 와 같은 미계측유역 유출량 산정에 어려움을 해소하고자 일반적으로 인근 유역의 유출량을 이용하여 면적비에 의 해 추정하는 비유량법을 사용하거나, 계측유역에 대한 유 출모형 매개변수를 계측유역에서 미계측유역으로 전이하 여 미계측유역 유출량을 산정하게 된다(Jung et al., 2012).
본 논문은 유입량 자료가 구축되지 않은 미계측유역의 신뢰성 있는 유출량 산정을 위해서 계측유역의 유역특성인 자(watershed characteristics)를 기준으로 강우-유출 모형 매개변수를 회귀분석을 통하여 지역화(regionalization) (Yokoo et al., 2001; Mwakalila, 2003; Kim and Kaluarachchi, 2008)를 수행하였다. 우리나라에서는 강우-유출 모형의 매개변수 지역화 연구가 많이 수행되어지고 있다. Lee and Kang (2007)은 미계측유역의 장기유출을 모의하기 위해 수정 3단 Tank 모형의 지역화 매개변수를 추정하기 위하 여 다중회귀식으로 추정된 매개변수를 사용하여 충주댐
과 설마천 유역에 대해 검증하였다. Park and Yoo (2008) 은 IHACRES 모형의 매개변수 중 지형특성 관련 매개변 수를 지역화기법을 이용하여 정량화하고, 이를 대상유역 인 충주댐 유역의 여러 수위 관측지점에 적용하였다. 이 처럼 강우-유출 모형의 지역화 연구는 다양한 강우-유출 모형을 활용한 다수의 연구가 수행되어 왔지만 강우-유 출 모형의 적용과정에서 추정된 매개변수의 불확실성을 정량적으로 고려한 연구는 상대적으로 미진하다.
본 연구의 진행은 국내외에서 적용사례가 많은 Sacra- mento 강우-유출 모형에 Bayesian Markov Chain Monte Carlo기법을 연계한 Bayesian Sacramento 강우-유출 모 형을 기본적으로 적용하여 양질의 관측 자료가 구축된 계 측유역을 대상으로 매개변수를 최적화함과 동시에 각 매 개변수의 불확실성을 평가하였다. 이어서 다중선형회귀 분석(Multiple Linear Regression, MLR)을 활용한 최종 적으로 추정된 매개변수 지역화를 수행하고 유역특성인 자에 따라 산정된 지역화 매개변수를 검증유역에 적용시 켜 분석을 수행하였다(Fig. 1).
2. 연구방법 및 자료
2.1 Sacramento 유출 모형의 Bayesian 매개변 수 추정
2.1.1 Sacramento 장기유출모형
Burnash et al. (1973)은 미국 국립기상국(National Weather Service, NWS)의 수문예측을 위하여 Sacra- mento 모형을 개발하였다. Fig. 2는 Sacramento 장기유출 모형 모식도를 나타낸 것으로 상부토양층은 높은 대수층 에서와 같은 차단 저류(interception storage)를 나타내고 하부토양층은 토양 수분함량과 지하수 저류를 의미한다.
토양층 내에서 수분의 저류는 수분이동이 자유로운 자
Precipitation Input
Pervious Area
Direct Runoff
Interflow
Stream flow Distribution
Function
Primary
Base flow Total
Base flow
Subsurface Discharge Total
Channel flow
Free Water (Primary)
Free Water (Secondary) Reserve Tension Water
Surface
Upper Zone
Lower Zone
Impervious Area
Surface Runoff
Evapotranspiration
Percolation
Supplemental Base flow Tension
Water Free Water Evapotranspiration
Fig. 2. Schematic Representation of the Sacramento Model (Sorooshian et al., 1993)
유수(free water) 형태와 토양입자의 흡습력(hygroscopic force)에 의하여 부착되어 있는 부착수(tension water) 형 태로 이루어진다. 토양수분상태 특징의 정의에 따라 Sacramento 모형의 부착수 저류용량은 이용 가능수와 관 계되며 자유수 저류용량은 중력수에 관계된다고 가정된 다. 부착수는 증발산에 의해서만 탈수(depletion)되며 자 유수는 침투와 증발산에 의해 탈수된다. 상부토양층에서 하부토양층으로 수분이 이동하는 침루현상(percolation) 은 상부토양층의 가용 자유 수량과 하부토양층 수분부족 량의 함수로 정의된다. 하부토양층의 수분 저류형태는 장 기간 동안 하천으로 배수되어 기저유출에 기여하는 기본 자유수 저류(primary free water)와 비교적 가까운 시기 에 강우가 발생하여 신속히 하천으로 배수되어 기저유출 에 기여하는 보조 자유수 저류(supplemental free water) 로 구분된다. 이러한 유출에 영향을 미치는 저류량으로 산정되는 유출량은 불투수영역으로부터 유출되는 직접 유출과 상부토양층의 자유수 저류공간이 포화되거나 강 우강도가 침투율을 초과할 때 발생하는 지표면유출, 상 부토양층의 저류된 자유수의 횡방향 배수에 의한 중간유 출, 보조 기저유출 및 기본 기저유출로 구분된다. 처음 3 가지 유출성분으로 구성되는 총 하도 유입량은 운동파 (kinematic wave) 추적법이나 단위도와 Muskingum 방 법에 의해 하도추적이 이루어지며 마지막으로 2가지의 성 분으로 구성되는 지표하 유출(subsurface flow)은 선형 감소 가중 함수(linear decay weighting function)로 계산한 후 유역 출구에서 합산된다. Table 1은 본 연구에 사용된 Sacramento 모형의 13개 매개변수를 나타낸 것이다.
2.1.2 Bayesian Markov Chain Monte Carlo 기법 두 확률변수의 조건부확률(conditional probability)과 주변 확률(marginal probability) 사이의 관계를 나타내는 Bayes 정리(Bayes’ rule)는 Thomas Bayes (UK, 1702∼
1761)에 의해 개념이 정립되었으며, Scargle (1998)에 의하 여 확장되었다. 주어진 확률변수와가 있을 때, 두 확률 변수들의 결합 확률분포는 사전분포(prior distribution)
와 우도(likelihood) 의 곱으로 사후분포를 추론 할 수 있다. 다시 정리하면 Bayes 정리의 사후분포는 기 본적으로 사전분포와 우도의 곱에 비례하는데, 모형의 매 개변수를 추정하는데 있어서 갱신되는 강우-유출 자료를 바탕으로 우도와 사후분포가 갱신되며 이를 통해 모형 매 개변수 전반의 불확실성을 정량적으로 해석이 가능하다.
수문학적 모형을 로 표시하면 강우-유출 모형을 통한 유출의 추정치 는 다음과 같이 나타낼 수 있다.
∣ (1)
여기서, 는 매개변수들을 나타내며는 입력자료를 나타내며, 는 평균이 0이고 일정한 분산 를 갖는 오차항을 의미한다. 본 연구에서는 매개변수들이 정규분포를 따른다고 가정하였다. 따라서 매개변수의 우 도함수는 평균이 0, 일정한 분산를 갖는 정규분포로 다 음 Eq. (2)와 같이 나타낼 수 있다(Box and Tiao, 1973).
exp
(2)
Parameter Description
UZTWM Maximum capacity of the upper zone tension water storage UZFWM Maximum capacity of the upper zone free water storage LZTWM Maximum capacity of the lower zone tension water storage
LZFPM Maximum capacity of the lower zone free water primary storage LZFSM Maximum capacity of the lower zone free water supplemental storage ADIMP Additional impervious area, decimal fraction
UZK Upper zone free water lateral depletion rate LZPK Lower zone primary free water depletion rate LZSK Lower zone supplemental free water depletion rate
ZPERC Maximum percolation rate
REXP Exponent of the percolation equation
PCTIM Impervious fraction of the watershed area
PFREE Fraction of water percolating from upper zone which goes directly to lower zone free water storage Table 1. Parameters of Sacramento Model and their Description
본 연구에서는 사전분포로서 ∝ 의 형태를 가지는 비정보적 사전분포(noninformative prior distribution) 를 활용하였다. Bayes 정리에서 매개변수와 의 조건 부확률과 주변 확률관계는 Eq. (3)과 같으며, Eq. (4)의 좌 변는 사후분포(posterior distribution)를 나타내며 사전분포 와 우도 의 곱으로 추정될 수 있다 (Kim et al., 2014).
(3)
(4)
∝ (5) Markov Chain Monte Carlo (MCMC) 기법은 다변량확 률분포(multivariate probability density function)가 복잡 하여 결합 확률(joint probability)을 정확히 고려하기 어 려운 경우에 적용하는 방법으로 서로 독립인 형태의 변량 대신에 Markov Chain을 따르는 변량을 연속적으로 추출 하여 사용하게 되는데, Markov Chain을 통해서 초기에 추출된 변량들은 연속적인 모의를 통해서 충분한 시간이 흐르게 되면 가정한 확률분포에 수렴하게 된다.
본 연구에서는 Sacramento 모형의 13개 매개변수
의 사후분포 추정을 하는데 있어서 매 개변수의 다변량확률분포가 복잡하여 수학적인 계산이나 각 매개변수들에 대한 주변분포(marginal distribution)의 계산이 난해한 이유로 Bayesian MCMC 기법을 적용하였 다. Bayesian 모형을 기반으로 매개변수를 추정하는 가장 큰 이유는 매개변수의 인지능력(identifiability)을 향상시
키기 위함이다. 지역화를 위해서는 최적화된 매개변수들 이 물리적으로 타당해야 한다. 즉, 지역화 시 매개변수간 의 상관성을 고려한 해석이 기본적으로 요구되며 상관성 을 무시한 채 단순최적화만을 수행한 경우 매개변수와 유 역특성인자간의 상관성을 확보하기 어렵다. 이와 더불어 최적화 Bayesian 모형은 매개변수 추정과 불확실성을 동 시에 수행할 수 있는 방법으로 추정된 매개변수의 신뢰성 을 용이하게 평가할 수 있는 장점이 있다.
Bayesian MCMC 기법은 사후분포에 대한 모의기법 중 가장 널리 사용되는 기법으로 Markov Chain과 Monte Carlo 모의기법을 이용하여 사후분포로부터 변수를 추출 하고 Bayesian 기반으로 통계적 특성치를 도출하는 방법 이다. 즉, Markov Chain을 이용하여 매개변수간의 관계 를 구성하고 이를 무한히 큰 수만큼 반복하는 적분기법을 이용하여 최종적으로 매개변수의 통계적 특성을 산정하 는 방법이다(Kim and Lee, 2008; Kwon et al., 2012).
본 연구에서는 MCMC 기법 중 기각 표본 알고리즘인 메 트로폴리스 해스팅 방법(Metropolis-Hastings, MH)을 활 용하였다. 이렇게 생성된 수열은 가정한 다변량분포에 근 사적 해석에 적용이 가능하다. MH기법은 Metropolis et al.
(1953)이 제안하고 Hasting (1970)에 의해서 일반화 되었다.
MH 방법 알고리즘의 장점은 확률분포형에서 직접 표본을 추출할 수 없는 경우에도 간접적으로 표본추출이 가능하 다는 점이다. MCMC 운영을 위해서는 임의의 확률분포 에 표본을 생성하여 그 값이 기본 확률분포에서 생성되었 다면 Markov Chain의 한 값을 형성하고 그렇지 않으면 기각하여 연속적으로 다시 생성하는 과정이 반복되는데, 본 연구에서는 Kwon et al. (2008)과 Kwon et al. (2013)에
Major Basin Dam Name Basin Area
(km2) Basin
Length (m) Mean elevation
of basin (El. m) Mean slope
of basin (%) Unity Shape Factor (L/L) Han River
Chungjudam 6648.0 115.32 475.33 48.43 2.31
Hoengseongdam 209.0 37.00 436.47 41.13 2.24
Pyeonghwauidam 3227.0 46.80 492.23 45.41 2.50
Soyanggangdam 2703.0 156.46 607.58 55.06 3.66
Nakdong River
Andongdam 1584.0 172.00 548.09 49.22 4.24
Imhadam 1361.0 97.50 386.56 47.36 2.54
Hapcheondam 925.0 63.00 503.88 41.16 2.11
Namgangdam 2285.0 108.00 427.57 40.39 2.33
Milyangdam 95.4 22.90 616.10 39.20 4.43
Geum River
Yongdamdam 930.0 61.30 510.29 43.43 2.07
Daecheongdam 3204.0 25.73 192.28 39.07 3.27
Boryeongdam 163.6 22.30 232.25 40.19 1.74
Seomjin River
Buandam 59.0 15.40 175.31 43.15 2.00
Seomjingangdam 763.0 85.40 359.64 37.91 3.13
Juamdam 1010.0 99.00 269.83 36.93 2.97
Sueodam 49.0 17.00 410.23 42.78 2.44
Yeongsan River Jangheungdam 193.0 193.00 231.68 27.00 1.94
Table 2. Watershed Characteristics Used in this Study 서 적용한 MH MCMC기법을 적용하여, 각 매개변수의 사 후분포를 추정하여 매개변수의 불확실성 정량화를 수행하 였다. 이를 통하여 광범위한 범위에서 전역 최적해(global optimum) 탐색을 가능케 할 수 있으며, 조건부로 추출된 매개변수들이 안정 상태에 도달하면 매개변수들의 퍼짐정 도가 상대적으로 수축하게 된다. 매개변수의 수렴정도를 정량적으로 평가하기 위하여 추적곡선(trace plot)의 일정 한 수렴조건을 만족시키면 최적해로 판단하였다. 본 연구 에서 사용된 알고리즘을 서술하면 다음과 같다.
1) 사전분포로부터 매개변수 공간에서 표본을 무 작위로 추출한 후 아래의 Eq. (2)을 이용하여 각 점 의 사후분포 를 추정한다.
2) 새로운 표본 을 제안된 확률분포 로부터 추 출한다.
3) Eq. (5)를 이용하여 ∣ 를 계산하고
∣ ∣ 를 추정한다.
4) 만약 ≦ 를 만족하면 추출된 표본을 활용하고 그 렇지 않으면 이전 표본을 활용한다. 즉,
5) 이러한 과정을 제안된 모의횟수 만큼 반복 시행한다.
2.2 다중선형회귀분석(MLR)
MLR은 두 개 이상의 독립변수(independent variable) 와 하나의 종속변수(dependent variable)의 관계를 분석 하는 기법으로 종속변수값을 선형모형(linear model)에
적용하여 다중회귀식(mutiple regression equation)을 추 정하는 것이다. 종속변수 를 설명하는데 개의 독립변 수인 를 도입할 때 다중회귀식은 다음 Eq. (6) 과 같이 정의된다.
(6) 여기서, 는 모집단의 회귀계수(regression coef- ficients)로 잔차의 제곱의 합이 최소가 되는 방법인 최소 자승법(least squares method)을 적용하여 추정할 수 있 다. 는 절편 는 각각 독립변수의 기울기이 고, 는 서로 독립이고 정규분포를 따르는 오차항이다.
본 연구에서 종속변수는 Bayesian Sacramento 강우- 유출모형의 매개변수를 의미하고, 독립변수인 는 연구대상유역의 유역특성인자인 유역면적, 유로연장, 유 역평균표고, 유역평균경사 및 형상계수를 의미한다. 본 연 구에서는 13개 매개변수와 유역특성인자의 모든 경우를 조 합(combination)하여 MLR을 수행하였다. 유역특성인자의 결정은 ‘경향성이 존재하지 않는다.’의 가설검정을 통하여 결정하였으며,P-value가 0.05 이하인 것을 기준(신뢰구간 95%)으로 설정하였다.P-value가 0.05 이상으로 경향성이 존재하지 않는 매개변수는 평균값을 사용하여 산정하였다.
2.3 대상자료
우리나라 댐은 용도에 따라 다목적 댐, 홍수조절 댐, 생
0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2 x 104 1
1.5 2 2.5 3
No. function evaluations
Gelman-Rubin convergence diagnostic Milyangdam
UZTWM UZFWM UZK PCTIM ADIMP ZPERC REXP LZTWM LWFSM LZFPM LZSK LZPK PFREE
0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2
x 104 1
1.2 1.4 1.6 1.8 2
No. function evaluations
Gelman-Rubin convergence diagnostic Daecheongdam
UZTWM UZFWM UZK PCTIM ADIMP ZPERC REXP LZTWM LWFSM LZFPM LZSK LZPK PFREE
Fig. 3. Trace Plots of Parameters of the Sacramento Model Derived from Bayesian MCMC Simulation 활·공업용수 댐, 수력발전 댐 및 농업용수 댐으로 구분된
다. 댐 운영의 주체는 한국농어촌공사(Kr), 한국수력원자 력(KHNP), 한국수자원공사(Kwater)이며, 이 중 Kwater 는 60년대부터 소양강, 안동, 대청 및 충주댐 등 15개의 다 목적 댐과 낙동강하구둑, 5개 다기능보를 건설(16개 보 운 영·관리) 하고 운영하고 있다.
본 연구에서는 Kwater에서 운영 중인 17개 댐의 관측 자료를 활용하였다. 매개변수를 산정하기 위해서 양질의 자료가 구축된 기간의 자료를 이용하였으며, 각각의 댐 유역특성인자와 강우-유출 모형을 통해서 산정된 매개변 수에 대하여 MLR을 통하여 지역화 매개변수를 산정하였 다. 지역화 매개변수 검증을 위해 계측유역을 미계측유역 으로 가정하고 Sacramento 강우-유출 모형에 입력하여 유입량을 모의하여 Bayesian MCMC 기법을 통해 산정된 유입량과 통계적 특성을 비교하였다.
3. Bayesian Sacramento 모형 적용결과 3.1 Bayesian Sacramento 모형 매개변수 산정결과 Sacramento 모형과 Bayesian MCMC 기법을 연계한 Bayesian Sacramento 모형의 적합성 평가를 위하여 대상 자료 17개 댐 유역에 대하여 강우-유출 모형 매개변수 적 합도 검정을 수행하였다. 강우-유출 모형의 정확성은 주로 모형의 매개변수에 의존하게 되며, 강우-유출 모형에서 산 정된 매개변수 최적치는 사용자에 의해 정해진 기준 또는 목적함수(objective function)를 만족하는 값을 말한다. 사 용자는 가능한 최적의 예측치를 얻을 수 있는 모형 매개 변수를 산정하기 위하여 목적함수를 설정한다. 매개변수 검정을 위하여 각각의 댐의 관측자료 중 양질의 자료가 구 축된 기간의 자료를 선정하여 Sacramento 모형 매개변수 산정에 활용하였으며 매개변수 추정에 이용되는 초기 값 (initial value)은 모형 자체가 가질 수 있는 매개변수의 범 위를 초기 값으로 설정하였다. 매개변수를 추출하는 과정에
서 추출된 매개변수들이 안정 상태에 도달함에 따라 평행연 쇄의 수렴을 진단하는 것으로 Gelman and Rubin (1992) 통 계치 추적곡선을 사용하여 매개변수의 안정 상태 도달 여 부를 확인하였다. Gelman-Rubin (GR) 인덱스는 2개 이상 의 변수의 사후분포를 사용하여 수렴을 판단하는 것으로 각 연쇄에 대해 연쇄 내 변동(within-sequence variance) 과 연쇄 간 변동(between-sequence variance)을 비교하는 데 기초를 두고 있다. 이 GR 인덱스은 Eq. (7)과 같다.
(7)
여기서,
이고 은 연쇄의 진행 횟수, 는 연쇄 내 변동, 는 연쇄 간 변동을 나타낸다.
만약 연쇄가 무한대로 진행됨에 따라 이 통계치의 값이 1에 가까워지면 두 연쇄에 의해 생성된 들이 동일한 분 포로 수렴한다는 것을 나타낸다(Gelman et al., 2004). Fig.
3은 Bayesian MCMC기법으로 산정된 13개 매개변수 추 적곡선의 통계치가 1에 수렴하고 이는 매개변수가 수렴하 는 것을 보여주고 있다.
수자원관리 및 수공구조물 설계에서 제한된 수문자료로 인하여 수문모형의 매개변수를 추정하는데 많은 어려움이 따르며 이러한 관점에서 추정된 결과에 신뢰성을 부여하 기 위해서 필수적으로 불확실성 분석이 요구된다. 본 연구 에서는 불확실성을 반영한 매개변수를 산정하는데 있어 총 20,000번의 Bayesian MCMC 모의를 수행하여 그 중 수 렴이 이루어진 이후 2,000개 표본을 이용하여 매개변수의 사후분포를 추정하였으며, 각 매개변수 사후분포를 핵밀 도함수(kernel density function)를 이용하여 Fig. 4에 나타 내었다. 본 연구에서는 Gaussian 핵함수(Gaussian kernel function)를 활용하여 사후분포를 평가하였다. Fig. 4에서 빨간색 점선은 매개변수 사후분포의 최빈값을 나타낸다.
각 매개변수의 사후분포는 향후 유출분석시 매개변수의 불확실성을 평가하는데 활용하였다.
0 100 200 300 0
1 2x 10-5
UZTWM
f(x)
0 50 100
0 2 4x 10-5
UZFWM
f(x)
0 0.5 1 1.5
0 2 4x 10-3
UZK
f(x)
0 0.2 0.4
0 0.01 0.02
PCTIM
f(x)
0 0.2 0.4
0 0.01 0.02
ADIMP
f(x)
0 500 1000
0 5x 10-6
ZPERC
f(x)
0 2 4 6
0 1 2x 10-3
REXP
f(x)
0 1000 2000
0 2 4x 10-6
LZTWM
f(x)
0 50 100 150
0 5x 10-5
LWFSM
f(x)
0 200 400
0 1 2x 10-5
LZFPM
f(x)
0 0.2 0.4
0 0.01 0.02
LZSK
f(x)
0 0.01 0.02
0 0.1 0.2
LZPK
f(x)
0 0.2 0.4
0 0.05 0.1
PFREE
f(x)
Milyangdam
0 100 200 300
0 2 4x 10-5
UZTWM
f(x)
0 50 100 150
0 2 4x 10-5
UZFWM
f(x)
0 0.5 1 1.5
0 2 4x 10-3
UZK
f(x)
0 0.1 0.2
0 0.1 0.2
PCTIM
f(x)
0 0.1 0.2
0 0.05 0.1
ADIMP
f(x)
0 500 1000
0 2 4x 10-6
ZPERC
f(x)
0 2 4 6
0 1 2x 10-3
REXP
f(x)
0 1000 2000
0 2 4x 10-6
LZTWM
f(x)
0 50 100 150
0 0.5
1x 10-4
LWFSM
f(x)
0 200 400 600
0 1 2x 10-5
LZFPM
f(x)
0 0.5 1
0 0.005 0.01
LZSK
f(x)
0 0.01 0.02 0.03 0
0.1 0.2
LZPK
f(x)
0 0.05 0.1
0 0.1 0.2
PFREE
f(x)
Daecheongdam
Fig. 4. Posterior Distributions of Parameter of Sacramento Model Derived from Bayesian Markov Chain Monte Carlo Simulation
3.2 Bayesian Sacramento 모형 유출량 산정결과 수문모형의 모의 결과를 평가하기 위하여 수학적인 계산 을 통한 여러 종류의 통계적 효율기준(efficiency criteria, EC)을 사용하여 관측 값과 모의 값의 적합성 검정을 수행 하고 있다(Beven, 2001; Krause et al., 2005). 상관계수 (coefficient of correlation, )는 두 변량간의 상대적인 경 향성을 나타내기에 적합한 지표로 많이 활용되고 있으며 상관계수 은 항상 부등식 ≤≤ 을 만족시키며, 양의 상관성이 있을 경우 을 만족시키며, 음의 상관 성이 있을 때는 이고, 상관이 전혀 없는 무상관일 경 우에는 이 된다(Walpole et al., 2002). 상관분석을 통 한 상관계수만 사용하는 경우 자료의 선형적인 특징만을 가지고 산정되는 문제점이 있으므로, 본 연구에서는 유출 량의 양적특성까지 고려할 수 있는 추가적인 효율기준을 도입하였다. 이를 위해 사용된 통계적 효율기준은 Nash- Sutcliffe 계수, 평균제곱오차(Root Mean Square Error, RMSE), 일치계수(Index of Agreement, IoA)이다.
(8)
(9)
(10)
여기서, 는 관측유량, 는 모의유량을 의미한다. 세 가지 통계량의 최적값은 N-S 계수와 IoA는 ‘1’, RMSE는 ‘0’이다.
강우-유출 관계를 규명하고자 할 때 일반적으로 두 가 지 오차를 생각할 수 있다. 첫 번째로 유출모형에 내재되 어 있는 불확실성과 매개변수의 불확실성으로 구분할 수 있다. 매개변수 표본추출을 수행함에 있어 매개변수의 불 확실성을 추정했음에도 불구하고 추정된 불확실성 구간 이 관측 값을 현실적으로 반영하지 못한다면, 모형의 구 조 자체에서 발생하는 불확실성으로 간주할 수 있다. 본 연구에서 적용한 Bayesian 기법의 장점은 이러한 불확실 성을 정량적으로 평가할 수 있다는 것이다. 즉 다수의 수 문곡선을 앙상블 형태로 추정하여 모형 구조 자체에서 발 생하는 불확실성과 매개변수에서 발생하는 불확실성을 각각 추정할 수 있다는 것이다.
Bayesian MCMC 기법으로 추정된 최적의 매개변수 조 합으로부터 추정된 유출량과 강우량에 대한 수문곡선을 Figs. 5 and 6에 나타내었다. 논문의 지면 관계상 밀양댐 및 대청댐 유역의 결과를 도시하였다. Figs. 5b and 6b에서 빨간점은 관측유량을 의미하며 파란실선은 모의유량을 의 미한다. 매년 발생하는 극치 강우사상에 대하여 Bayesian Sacramento 모형의 모의유출이 동일한 경향성으로 반응하 고 있는 것을 확인할 수 있으며, 모의유량이 관측된 극치유 량사상을 효과적으로 재현하는 것을 확인할 수 있다. Figs.
5c and 5d는 Fig. 5b에서 관측기간 동안 연평균 최고유량 과 최저유량에 해당되는 기간의 그림을 확대한 것이다.
Fig. 5c와 5d에서 진한 회색으로 표시한 불확실성 구간이 매개변수로부터 유발된 불확실성 구간이고, 연한 회색으로 표시한 구간은 Sacramento 모형으로부터 유발된 불확실성 구간이다. 즉, 두 가지 불확실성 구간의 범위는 Bayesian 기법으로 추정된 최적 매개변수 조합으로부터 추정된 유출 수문곡선의 차이로 판단할 수 있다. Figs. 5c and 5d에서 확인할 수 있듯이 매개변수로 인한 불확실성은 상대적으로 모형 자체에서 발생한 오차보다 매우 작음을 알 수 있다.
Fig. 5e의 산점도(scatter plot)를 통한 모형의 적합성 검증 결과 저유량에서 고유량까지 효율성 있는 모의가 수행되었 음을 확인하였다. 논문의 지면 관계상 각 댐의 통계적 효율 기준을 Table 3에 정리하였다. 각 댐의 결과를 살펴보면 한 강권역 횡성댐은 상관계수, N-S계수 및 일치계수 등 효율 기준에서 전체 댐 유역 중에서 가장 우수하게 나타났다.
4. MLR 적용결과 4.1 MLR을 통한 매개변수 산정결과
본 연구에서는 Bayesian Sacramento 모형에서 산출된 13개 매개변수를 지역화하기 위하여 MLR을 적용하여 미 계측유역의 매개변수를 산정하였다. 전체 계측유역의 매개 변수를 사용한 이유는 전반적인 다양한 유역특성을 반영하 기 위함이다. Table 4는 유역특성인자의 모든 조합을 고려 하여 MLR을 수행하여 각 경우의P-value를 나타낸 것이 다. 이 중P-value가 0.05 이하이고 결정계수(coefficient of determination, )가 가장 큰 조합을 매개변수에 미치는 영향이 가장 큰 유역특성인자로 채택하였다. 모든 조합 에서P-value가 0.05 이상인 3번, 6번, 9번, 10번, 11번 및 12번 매개변수는 유역특성인자와 매개변수간의 상관성 이 존재하지 않는다고 판단하여 17개 댐 유역에 서 각 매 개변수 평균값을 사용하였다. Table 5에는 유역 특성인 자에 의한 매개변수 지역화 회귀식을 정리하였다.
Efficiency criteria
Dam Name R N-S RMSE (m3/s) IoA Bias (m3/s)
Chungjudam 0.931 0.839 210.904 0.955 -87.977
Hoengseongdam 0.961 0.894 7.284 0.973 -3.726
Pyeonghwauidam 0.532 -0.048 161.359 0.713 -24.843
Soyanggangdam 0.946 0.874 81.395 0.967 -32.400
Andongdam 0.915 0.760 46.707 0.941 -24.442
Imhadam 0.896 0.747 43.408 0.928 -20.368
Hapcheondam 0.928 0.783 29.379 0.946 -16.733
Namgangdam 0.938 0.862 99.597 0.961 -34.373
Milyangdam 0.954 0.895 3.845 0.973 -1.440
Yongdamdam 0.932 0.830 32.759 0.956 -15.002
Daecheongdam 0.919 0.821 103.614 0.947 -35.161
Boryeongdam 0.858 0.712 8.925 0.907 -2.407
Buandam 0.891 0.778 3.226 0.937 -0.857
Seomjingangdam 0.862 0.689 33.666 0.913 -13.399
Juamdam 0.908 0.721 39.073 0.928 -23.283
Sueodam 0.728 0.527 4.687 0.820 0.374
Jangheungdam 0.924 0.802 7.485 0.950 -3.566
Mean 0.884 0.734 53.960 0.924 -19.977
Table 3. Efficiency Criteria in Calibration Process for Bayesian Sacramento Model
2002 2004 2006 2008 2010 2012
0 100 200 300 400 500
Time(day)
Rainfall(mm)
Milyangdam
2002 2004 2006 2008 2010 2012
0 200 400 600
Time(day) Inflow(m3/s)
Model Uncertainty Bound Parameter Uncertainty Bound Oberved Inflow Modeled Inflow
b a
20020 2002.2 2002.4 2002.6 2002.8 2003 100
200 300 400 500
Time(day) Inflow(m3/s)
Milyangdam
c
20070 2007.2 2007.4 2007.6 2007.8 2008 10
20 30 40 50 60 70
Time(day) Inflow(m3/s)
Milyangdam
d
0 50 100 150 200 250 300 350 400 450 0
50 100 150 200 250 300 350 400 450
Observed Inflow(m3/s) Modeled Inflow(m3/s)
Milyangdam
e
Fig. 5. Model Calibration Results Based on Bayesian Markov Chain Monte Carlo Simulation. (Milyangdam) (a) Rainfall Hyetograph, (b) Simulated Inflow using the Estimated Parameters, (c) High Flow Year 2002,
(d) Low Flow Year 2007, and (e) Scatter Plot of Observed and Simulated Inflow
No. Parameter
Characteristics Par.1 Par.2 Par.3 Par.4 Par.5 Par.6 Par.7 Par.8 Par.9 Par.10 Par.11 Par.12 Par.13
1 Area 0.02 0.02 0.51 0.03 0.05 0.93 0.04 0.08 0.37 0.78 0.26 0.25 0.06
2 Basin Length 0.11 0.77 0.62 0.26 0.79 0.56 0.02 0.89 0.57 0.82 0.69 0.24 0.06
3 Elevation 0.02 0.57 0.69 0.42 0.68 0.60 0.65 0.04 0.56 0.43 0.50 0.26 0.22
4 Slope 0.02 0.07 0.96 0.27 0.71 0.11 0.68 0.05 0.75 0.91 0.60 0.48 0.10
5 Shape Factor 0.59 0.74 0.72 0.90 0.18 0.54 0.42 0.70 0.66 0.57 0.22 0.71 0.33
6 Area, Basin Length 0.03 0.05 0.64 0.09 0.16 0.82 0.02 0.21 0.47 0.92 0.53 0.35 0.06
7 Area, Elevation 0.01 0.08 0.78 0.10 0.11 0.88 0.08 0.05 0.62 0.74 0.49 0.35 0.12
8 Area, Slope 0.02 0.05 0.77 0.11 0.14 0.21 0.11 0.09 0.67 0.96 0.54 0.52 0.12
9 Area, Shape Factor 0.06 0.08 0.74 0.11 0.07 0.84 0.10 0.19 0.59 0.82 0.27 0.51 0.12
10 Basin Length, Elevation 0.03 0.79 0.78 0.45 0.87 0.69 0.04 0.14 0.67 0.69 0.78 0.33 0.12
11 Basin Length, Slope 0.01 0.20 0.89 0.30 0.91 0.22 0.07 0.17 0.81 0.97 0.82 0.42 0.04
12 Basin Length, Shape Factor 0.28 0.89 0.86 0.53 0.42 0.64 0.07 0.91 0.81 0.85 0.48 0.51 0.15
13 Elevation, Slope 0.03 0.19 0.90 0.54 0.71 0.26 0.65 0.08 0.85 0.68 0.79 0.54 0.25
14 Elevation, Shape Factor 0.07 0.85 0.76 0.70 0.19 0.81 0.45 0.03 0.61 0.41 0.48 0.53 0.43
15 Slope, Shape Factor 0.07 0.21 0.93 0.54 0.42 0.28 0.72 0.09 0.82 0.82 0.47 0.77 0.23
16 Area, Basin Length, Elevation 0.01 0.12 0.80 0.19 0.23 0.86 0.02 0.09 0.63 0.86 0.71 0.45 0.11 17 Area, Basin Length, Slope 0.02 0.08 0.80 0.19 0.28 0.35 0.04 0.20 0.69 0.98 0.75 0.55 0.08 18 Area, Basin Length, Shape Factor 0.08 0.12 0.81 0.20 0.14 0.83 0.04 0.36 0.67 0.93 0.47 0.56 0.11 19 Area, Elevation, Slope 0.02 0.12 0.86 0.23 0.23 0.36 0.18 0.10 0.79 0.84 0.69 0.54 0.22 20 Area, Elevation, Shape Factor 0.02 0.19 0.84 0.22 0.03 0.94 0.07 0.03 0.67 0.63 0.47 0.56 0.22 21 Area, Slope, Shape Factor 0.05 0.13 0.89 0.24 0.10 0.39 0.16 0.13 0.80 0.94 0.45 0.72 0.20 22 Basin Length, Elevation, Slope 0.03 0.34 0.91 0.51 0.84 0.39 0.06 0.18 0.86 0.82 0.91 0.54 0.11 23 Basin Length, Elevation, Shape Factor 0.06 0.92 0.85 0.63 0.36 0.81 0.06 0.08 0.73 0.61 0.70 0.53 0.24 24 Basin Length, Slope, Shape Factor 0.04 0.37 0.96 0.48 0.65 0.39 0.16 0.20 0.90 0.94 0.69 0.64 0.11 25 Elevation, Slope, Shape Factor 0.07 0.36 0.90 0.74 0.29 0.43 0.54 0.04 0.81 0.60 0.70 0.75 0.41 26 Area, Basin Length, Elevation, Slope 0.02 0.17 0.84 0.33 0.39 0.51 0.04 0.18 0.74 0.90 0.84 0.63 0.16 27 Area, Basin Length, Elevation, Shape 0.03 0.22 0.87 0.32 0.07 0.92 0.02 0.06 0.71 0.78 0.65 0.62 0.20 28 Area, Basin Length, Slope, Shape Factor 0.05 0.17 0.91 0.33 0.16 0.52 0.08 0.25 0.82 0.98 0.63 0.73 0.15 29 Area, Elevation, Slope, Shape Factor 0.04 0.23 0.90 0.37 0.07 0.52 0.15 0.06 0.81 0.76 0.64 0.72 0.35 30 Basin Length, Elevation, Slope, Shape Factor 0.04 0.52 0.94 0.66 0.45 0.53 0.08 0.10 0.87 0.75 0.84 0.71 0.21 31 Area, Basin Length, Elevation, Slope, Shape Factor 0.04 0.29 0.91 0.48 0.13 0.65 0.04 0.11 0.81 0.86 0.78 0.77 0.26
Table 4. P-values of the Estimated Parameters for the Multiple Regression Analysis
1985 1990 1995 2000 2005 2010
0 50 100 150
200
Time(day)
Rainfall(mm)
Daecheongdam
1985 1990 1995 2000 2005 2010
0 2000 4000 6000 8000
Time(day) Inflow(m3/s)
Model Uncertainty Bound Parameter Uncertainty Bound Oberved Inflow Modeled Inflow
b a
20020 2002.2 2002.4 2002.6 2002.8 2003 1000
2000 3000 4000 5000 6000 7000 8000
Time(day) Inflow(m3/s)
Daecheongdam
c
19940 1994.2 1994.4 1994.6 1994.8 1995 100
200 300 400 500 600 700 800 900
Time(day) Inflow(m3/s)
Daecheongdam
d
0 1000 2000 3000 4000 5000 0
1000 2000 3000 4000 5000
Observed Inflow(m3/s) Modeled Inflow(m3/s)
Daecheongdam
e
Fig. 6. Model Calibration Results Based on Bayesian Markov Chain Monte Carlo Simulation. (Daecheongdam) (a) Rainfall Hyetograph, (b) Simulated Inflow using the Estimated Parameters, (c) High Flow Year 2002,
(d) Low Flow Year 1994, and (e) Scatter Plot of Observed and Simulated Inflow
Parameter Regression Equation
Par.1 Par.1=-8.696+6.699×10⁻³×Area(㎢)+0.171×Length(㎞)+9.622×10⁻²×Elevation(m)+1.386×Slope(%)- 8.450×Shape(L/L)
Par.2 Par.2=53.799+4.880×10⁻³×Area(㎢)-5.738×10⁻²×Length(㎞) Par.4 Par.4=-6.391×10⁻²-1.299×10⁻⁵×Area(㎢)
Par.5 Par.5=6.347×10⁻²+1.025×10⁻⁵×Area(㎢)+1.107×10⁻4×Elevation(m)-2.159×10⁻²×Shape(L/L) Par.7 Par.7=1.292-3.454×10⁻⁵×Area(㎢)-1.196×10⁻³×Length(㎞)+4.914×10⁻4×Elevation(m)-1.786×10⁻³×
Slope(%)-5.194×10⁻²×Shape(L/L)
Par.8 Par.8=713.335+1.673×10⁻²×Area(㎢)+0.380×Elevation(m)-45.960×Shape(L/L) Par.13 Par.13=-5.892×10⁻²+2.552×10⁻4×Length(㎞)+2.080×10⁻³×Slope(%)
Table 5. A Regression Equation of the Parameters using Watershed Characteristics
10-4 10-2 100 102 104
10-4 10-2 100 102 104
Bayesian MCMC Parameter
Regionalized parameter
Soyanggangdam Par.1
Par.2 Par.3 Par.4 Par.5 Par.6 Par.7 Par.8 Par.9 Par.10 Par.11 Par.12 Par.13
= .
10-4 10-2 100 102 104
10-4 10-2 100 102 104
Bayesian MCMC Parameter
Regionalized parameter
Juamdam Par.1
Par.2 Par.3 Par.4 Par.5 Par.6 Par.7 Par.8 Par.9 Par.10 Par.11 Par.12 Par.13
= .
Fig. 7. Comparisons between Estimated and Regionalized Parameters for Soyanggangdam and Juamdam Watershed
4.2 검증유역의 적용결과
지역화 매개변수를 계측유역에 전이하기 위하여 사전 에 계측유역을 미계측유역으로 가정하여 MLR을 통하여 산정된 지역화 매개변수와 Bayesian MCMC 기법을 통하 여 산정된 매개변수를 비교·분석하였다. 전체 17개 댐 유 역에 대하여 두 기법을 통해 산정된 매개변수 간의 결정 계수 평균값이 약 0.99로 매우 근사함을 확인할 수 있었 다. 따라서 지역화한 매개변수를 미계측유역에 전이시켜 강우-유출 모형에 적용할 수 있다고 판단하였다. 지면관 계상 Fig. 7에는 소양강댐 유역과 주암댐 유역에서 두 기 법으로 산정된 매개변수의 산점도를 도시하였다.
MLR을 통하여 산정된 지역화 매개변수를 사용하여 유
출모의 결과 정확도를 분석하기 위해 소양강댐 및 주암댐 유역의 Bayesian Sacramento 모형의 유출결과를 도시하 였다. Fig. 8a와 8b는 각각 소양강댐 및 주암댐 유역의 관 측유량 및 Bayesian Sacramento 모형에 MLR을 통하여 산정된 매개변수를 입력하여 모의한 유량을 함께 보여주 고 있다.
빨간실선은 관측유량을 의미하며 파란점은 모의유량 을 의미하는데, 소양강댐 결과에서 극치유량의 경우 관 측 값과 모의 값이 일부 강우사상에 다소 차이는 있으나 전체적인 강우사상에 따른 유출반응의 경우 높은 정확 도를 나타내고 있다. 주암댐 결과는 모의결과를 통한 극 치유량이 관측 값을 현실성 있게 재현하고 있는 것을 확 인할 수 있다. 관측 값과 모의 값과의 상관관계의 정도를