수 공 학
대 한 토 목 학 회 논 문 집제32권 제3B 호·2012년 5월 pp. 161 ~ 168
Copula 이론을 이용한 수문학적 가뭄 분석
Hydrological Drought Analysis using Copula Theory 곽재원*·김덕길**·이종소***·김형수****
Kwak, Jae Won · Kim, Duck Gil · Lee, Jong Soo · Kim, Hung Soo
···
Abstract
Drought is a normal and recurrent phenomenon. But, recurring prolonged droughts have caused consequences and diverse impacts on human system. Therefore, understanding drought characteristics is indispensable element in well-prepared drought management. This study aims to investigate the hydrological droughts of Pyongchang stream and Upstream of Namhan-river in Korean peninsula. For modelling of the joint distribution of drought duration and drought severity, the copula method is used to construct the bivariate drought distribution and return period from the predetermined marginal distributions of drought dura- tion and drought severity. As the result, the most severed drought of the Pyongchang stream and Upstream of Namhan-river occuring during period 1967 to 2007 is the 1981 and 1973. Return period for this drought derived from copula is 550 and 110 years.
Keywords : run theory, hydrological drought, drought parameter, copula theory
···
요 지
가뭄은 인간과 자연 환경 모두에 큰 영향을 주는 자연현상으로 이러한 가뭄의 분석 및 예측은 수자원 관리 부분에서 매 우 중요한 요소가 된다. 본 연구에서는 한강의 상류유역인 평창강과 남한강 상류 유역을 대상으로 수문학적 가뭄을 정의하 고 copula 이론을 이용하여 수문학적 가뭄의 결합 확률 분포를 유도하였다. 또한 이를 이용하여 가뭄의 재현기간을 산정하 여 분석하였다. 연구에서 도출된 주요한 결과로부터, 1967년부터 2007년 사이에서 평창강 유역은 1981년에 발생한 550년 빈도, 남한강 상류 유역은 1973년의 110년 빈도의 가뭄이 가장 큰 가뭄 사상으로 나타났다.
핵심용어 : 연속이론, 수문학적 가뭄, 가뭄 변수, Copula
···
1. 서 론
자연적으로 일어나는 자연현상 중에 하나인 가뭄은 인간과 자연환경에 큰 영향을 준다 . 가뭄은 일반적으로 강수량의 부 족으로부터 유발되며 도시 및 농업지역의 수자원 이용 전역 에 영향을 미치게 된다 . 특히 , 홍수와는 달리 광범위한 지역 에 대하여 영향을 미치게 되므로 이로 인한 피해도 크게 나
타난다 . 이 때문에 Wilhite(2000) 는 자연재해 중에서 가장
큰 피해를 입히는 재해로 가뭄을 지목한 바 있다 . 특히 우 리나라는 대략적으로 2 년에 한번마다 가뭄에 의한 수자원 공급에 있어서 긴장상태를 경험하고 , 심한 경우에는 2 년 이
상 지속되는 가뭄으로 용수 공급에 심각한 차질이 발생하는
것으로 나타나고 있다 ( 유철상과 류소라 , 2003). 이렇듯 가뭄
의 영향범위가 막대하기 때문에 가뭄의 특성을 이해하는 것 은 가뭄 대응을 위한 중요한 요소가 된다 .
기존의 우리나라의 연구 ( 변희룡 , 1996; 한국수자원공사 , 2002; 유철상 등 , 2006; 장연규 등 , 2006) 는 강수량 기준의 연구가 주로 이루어졌다 . 물론 이러한 연구로 인하여 가뭄 해석 기법의 발전이 이루어졌으나 수문학적인 가뭄의 상태 를 고찰하기에는 다소 어려움이 있는 것이 사실이다 . 또한 ,
가뭄은 동적이고 다수의 특성이 연동하여 작용하는 현상이 기 때문에 이러한 다수의 특성을 동시에 고려하는 다변량 가뭄 분석이 이루어져야 신뢰성 있는 가뭄 분석이 가능하다 .
기존의 연구 (Zelenhastic and Salvai, 1987; Frick et al ., 1990; Kendall and Dracup, 1992; Chung and Salas, 2000;
Cancelliere and Salas, 2004) 에서 확률적인 방법을 통해서
가뭄 특성을 분석하였으나 , 여러 특성을 동시에 고려하지는 않았으며 , Shiau and Shen(2001), Bonaccorso et al .(2003), Gonzalez and Valdes(2003), Kim et al. (2006a, 2006b) 등 이 단일변량 가뭄분석을 다변량 가뭄분석으로 확장하기 위
*정회원·인하대학교사회기반시스템공학부토목공학과연구교수
(E-mail : [email protected])
**정회원·교신저자·인하대학교사회기반시스템공학부토목공학과연구교수
(E-mail : [email protected])
***인하대학교사회기반시스템공학부토목공학과박사과정
(E-mail : [email protected])
****정회원·인하대학교사회기반시스템공학부토목공학과정교수
(E-mail : [email protected])
한 연구를 수행한 바 있다 .
이를 보완하기 위하여 다변량 모형을 통한 가뭄의 분석 필요성이 여러 차례 거론되었으나 가뭄의 특성 변수들이 각 각 다른 분포를 나타내는 경우가 많아서 실제 적용에는 어 려움이 있었다 . 국내에서는 경민수 등 (2007) 과 김호성 등
(2010) 이 기후모형과 군집분석을 통하여 SAD 곡선을 작성하
여 가뭄의 기간과 심도를 분석한 바 있으며 , 유지영 등
(2010) 은 비매개변수 방법인 핵밀도함수를 이용하여 가뭄의
기간과 심도에 대한 결합확률 분포를 추정하였다 . 국외에서 의 가뭄에 대한 다변량 모형은 여러 방법이 제시되고 적용 되어 왔으나 Shiau(2006) 의 연구에서 가뭄에 Copula 방법을 이용한 가뭄 분석방법이 제시된 이후로는 각각의 한계 분포
를 Copula 를 이용하여 결합하는 방법이 자주 사용되고 있다 .
특히 Zhang and Singh(2006) 에서 도출된 것과 같이 Copula
방법은 기존의 이변량 빈도 해석법이 서로 다른 분포형을 가지는 확률변수에 대해서는 결합확률분포를 산정할 수 없 었던 한계를 극복할 수 있기 때문에 가뭄과 같이 특성에 대 한 확률변수가 서로 다른 분포형을 가지는 경우에 대한 적 용상의 이점이 있으며 , 이는 Kao and Govindaraju(2007) 가
여러 가지의 극치 분포를 바탕으로 Copula 모형을 적용하여
동일한 자료에 대해 빈도 해석을 통한 적합한 모형을 선정 하는 방안을 통하여 더욱 일반화 되었다 . 특히 , 우리나라의
경우에는 연제문 등 (2007) 의 연구에서 도출된 것과 같이 기
존의 단변량 가뭄빈도해석은 가뭄의 심도와 지속기간 각각 에 따른 빈도 해석결과가 서로 상이하게 나타날 수 있으므
로 Copula 방법을 이용한 가뭄 빈도해석이 더욱 타당성을
획득할 수 있을 것으로 보인다 .
따라서 , 본 연구에서는 한강수계의 상류권역인 평창강 및
남한강 상류 유역을 대상으로 하여 Copula 방법을 이용하여
가뭄의 심도와 지속기간에 대한 결합확률 분포를 추정하고 이를 바탕으로 가뭄의 결합 확률을 고려한 재현기간을 산정 하고 분석하고자 한다 .
2. 적용 이론
2.1 가뭄의 정의 : 연속이론
가뭄의 정의에는 여러 가지 관점이 있으나 일반적으로 강 수량의 부족 및 이로 인하여 발생하는 환경적 , 사회적 , 경제 적인 현상을 나타낸다 . 다양한 개념의 가뭄 정의를 위하여 가뭄 발생 , 가뭄 종결 , 가뭄 지속기간 , 가뭄 심도 , 가뭄 빈 도 등의 여러 정량적인 판단 기준이 개발되었으며 , 특히
Yevjevich(1967) 는 연속이론을 이용하여 가뭄을 정의하고 가
뭄의 변수 ( 가뭄의 지속기간 , 심도 , 간격 ) 를 산정하는 방법을 제안하였다 . Fig. 1 에서 나타낸 것과 같이 가뭄은 수문기상 학적 변수인 가 이미 결정되어진 절단 수준인 이하 로 떨어지는 기간으로 정의될 수 있으며 , 이때 가뭄을 정의 하는 기준인 절단 수준 는 상수 또는 시간에 따른 함수 로서 적용할 수 있다 . 절단 수준을 기준으로 하여 , 유출량이 절단 수준 이하로 내려간 시간을 가뭄의 지속기간으로 정의 하며 , 가뭄의 지속기간 동안에 절단 수준 이하로 내려간 누 적 부족량을 가뭄의 심도로 정의한다 . 또한 가뭄 발생시점 사이의 기간을 가뭄의 간격으로 간주한다 . 이러한 연속이론 은 적용 상의 잇점 때문에 몇몇 가뭄 모형과 분석에 이용된 바 있다 (Sen 1980; Dracup et al . 1980; Loaiciga and Leipnik 1996; Mishra et al. 2007). 연속이론을 통하여 정의되는 가 뭄의 변수 중에서는 일반적으로 가뭄의 지속기간과 심도가 중요하게 사용되며 , 본 연구에서도 가뭄의 지속기간과 심도 를 이용하였다 .
2.2 Copula 기반 가뭄분석
Copula 함수는 여러 확률변수 사이의 복잡한 의존성 구조
를 파악하기 위한 방안으로 1959 년 Sklar 에 의해 처음으로
제시되었다 . Copula 는 상관계수처럼 두 개 이상의 확률변수 의 관계를 측정하기 위해 사용된다 . 하지만 상관계수는 타원 형 분포일 때 유효하기 때문에 동일 방향성을 나타내는 경 향이 있는 변수의 경우 상관계수보다 Copula 를 이용하여 의 존성구조를 파악하는 것이 타당하다고 알려져 있다 .
Copula 적용에 반드시 필요한 Sklar 의 정리를 살펴보면 다음
과 같다 . 확률분포 가 주변분포
을 가지는 n 차원 분포함수일 때 , 식 (1) 의 관계를 만족하는
Copula 함수 C 가 존재한다 .
(1)
만약 , 이 연속인 경우에는 Copula 함수
C 는 유일하게 존재한다 . 또한 Copula 함수 C 는 식 (2) 와 같 이 주어진다 .
(2)
여기서 이고 는 의 역행렬이다 . 또한 ,
Copula 함수 C 에 대한 상기의 두 식의 양변을 에
대하여 편미분하면 식 (3) 이 된다 .
(3)
상기의 식으로부터 다변량 확률밀도함수를 개별 확률밀도 함수와 Copula 함수를 통하여 구할수 있게 되며 , 식 (3) 에
서 Copula 함수는 결합확률분포와 개별 주변확률분포의 비
율이라는 것을 알 수 있다 . 본 연구에서는 가뭄의 기간과 심도에 대한 결합확률분포를 구하기 위하여 Clayton copula
를 이용하였다 . Clayton copula 는 적용상의 잇점으로 인하여 금융 (Hurlimann, 2004) 및 수문학 (Favre et al. , 2004) 부문
x
i t,x
0,tx
0,tF x (
1, , … x
n) F
1( ) … x
1, , F
n( ) x
nF x (
1, , … x
n) = C F (
1( ) … x , , F
n( ) x
n)
F
1( ) … x
1, , F
n( ) x
nC u (
1, , … u
n) = F F (
1–1( ) … u
1, , F
1–1( ) u
n)
u
1∈ [ 0 1 , ] F
1–1F
ix
1, , … x
nf x (
1, , … x
n) cF
1( ( ) … x
1, , F
n( ) x
n) f
i( ) x
ii=1
∏
n=
c u (
1, , … u
n) f F (
1–1( ) … u
1, , F
1–1( ) u
n)
f
i( F
1–1( ) u
i)
i=1∏
n---
=
Fig. 1 Drought characteristics using the run theory
에서 널리 사용되고 있다 . Clayton copula 의 식은 식 (4) 와 같이 표현된다 .
(4)
특히 , Clayton copula 의 경우 자료의 꼬리 구조를 잘 반
영하는 것으로 알려져 있으므로 가뭄 모의에 적합하다고 판
단된다 . Clayton copula 의 매개변수를 결정하기 위한 방법으
로 , Canonical Maximum Likelihood Method(CML) 를 사 용하였다 . CML 방법은 먼저 개별 자료를 Empirical marginal
transformation 을 이용하여 균일 분포로 변환시킨 후 개별
분포함수들의 모수를 이용하여 Copula 모수를 추정하는 방 법이다 .
3. 단변량 가뭄분포 분석 3.1 대상유역 및 자료수집
본 연구에서 가뭄의 특성을 분석하기 위한 대상 유역으로 충주댐 상류 유역인 남한강 상류와 평창강 유역을 선정하였 다 . 유역의 선정기준은 해당 2 개 유역이 한강 유역의 최상 류 유역에 해당하기 때문에 가뭄의 영향을 독립적으로 분석 하기 용이하며 , 여타의 다른 가뭄 연구와 비교분석이 가능하
기 때문이다 . 연속 이론의 경우 전체적인 유출량 계열이 중 요하게 고려되기 때문에 주로 년 및 월 단위의 유출량 자료 를 대상으로 하며 본 연구에서는 월 단위의 유출량을 대상 으로 연속이론을 적용하였다 . 본 연구에서는 관측자료 조건
을 고려하여 1967 년에서부터 2007 년까지의 월 단위의 유출
량 자료를 사용하였다 .
수집한 남한강 상류 및 평창강 유역의 유출량 자료는 앞
절에서 설명한 연속이론 (run theory) 에 의하여 가뭄 지속기
간 (drought duration), 가뭄 심도 (drought severity), 가뭄 간 격 (drought inter-arrival) 으로 정의될 수 있다 . 이 때 절단 수준은 각 월별로 다른 수준으로 정의 된다 ( , t = 1,2,3, … ,
12). 가뭄의 지속기간 및 심도는 2.1 절에서와 같이 설명되며 ,
가뭄의 간격은 가뭄 사이의 기간으로 n 번째의 가뭄 시작지
점에서 n+1 번째 가뭄 시작지점까지의 월 (month) 으로 설명
된다 . 본 연구에서 적용한 남한강 상류 및 평창강 유역의
1967 년부터 2007 년까지의 유출량 자료는 국가수자원관리종
합정보시스템 (WAMIS, http://www.wamis.go.kr) 에서 제시하 는 보정 및 검증 완료된 장기유출량 자료를 이용하였으며 ,
수집된 유출량 자료는 Fig. 3 및 Fig. 4 와 같다 .
3.2 절단수준의 산정 및 가뭄시계열 작성
수집한 유출량 자료를 이용하여 수문학적 가뭄을 정의하기 위하여는 해당 유출량을 가뭄으로 정의하기 위한 절단 수준 을 산정하여야 한다 . 연속이론에서 절단 수준은 고정된 상수 이거나 시간에 따른 함수로서 정의될 수 있으며 해당 수준 이하로 내려간 유출량을 통하여 가뭄을 정의한다 . 절단 수준 은 수문학적 가뭄의 특성을 결정짓는 중요한 매개변수이며 ,
적합한 절단 수준의 산정은 수문학적인 가뭄 분석에서 중요 한 요인이 된다 . 본 연구에서는 우선 전체적인 유출량의 부 족과 이로 인하여 유발되는 수문학적 가뭄의 전체적인 경향 성을 파악하기 위하여 절단수준으로 월평균 유출량을 사용 하였다 . 물론 월 평균유출량을 절단 수준으로 사용할 경우 실제 가뭄뿐만 아니라 저유량 상황도 가뭄으로 정의될 수 있다 . 그러나 , 전체적인 유출량의 부족경향을 가뭄으로 연관 짓기 위해서 월 평균 유출량을 사용하는 것이 유리하다고 판단되며 , 이러한 이유로 인하여 기존의 외국의 연구에서도 월별 유출량의 평균치를 절단 수준으로 이용하는 방법이 많 이 사용되고 있다 (Serinaldi, 2007; Serinaldi, 2009; Shiau, 2006; Wong, 2009; Zhang, 2006; 2007a; 2007b).
월별 평균유출량을 절단수준으로 하여 남한강 상류 및 평 창강의 유출량을 절단하여 가뭄 시계열을 얻을 수 있으며 가뭄 시계열이 산정된 후에는 해당 가뭄 시계열의 지속기간 과 면적 , 가뭄 간 간격을 측정하여 가뭄에 대한 특성치 분
석이 가능하다 . 남한강 상류 및 평창강 유역의 1967~2007
년 기간의 가뭄에 대한 기본적인 통계적 특성은 다음의
Table 1 과 같다 .
평창강 유역에 대한 1967 년부터 2007 년까지의 약 40 년간
의 수문학적 자료에서 총 85 회의 가뭄이 나타난 것으로 산 정되었으며 , 평균적인 가뭄의 지속기간은 약 3.7 개월 , 평균적
인 가뭄의 심도는 65.6 cms.month, 평균 가뭄간 간격은
C
θ( u v , ) max [ u
–θ+ v
–θ– 1 ]
1θ --- –
, 0
⎝ ⎠
⎜ ⎟
⎜ ⎟
⎛ ⎞
=
φ
θ( ) t 1
θ --- ( t
–θ– 1 )
=
x
0tFig. 2 Watershed identification of study area
Fig. 3 Monthly streamflow at upstream of Namhan-river (1967-2007)
Fig. 4 Monthly streamflow at Pyongchang stream (1967-2007)
5.6 개월인 것으로 산정되었다 .
남한강 상류 유역에 대한 가뭄 특성은 수문학적 자료에서 총 77 회의 가뭄이 나타난 것으로 산정되었으며 , 평균적인 가 뭄의 지속기간은 약 3.9 개월 , 평균적인 가뭄의 심도는 88.79
cms.month, 평균 가뭄간 간격은 6.2 개월인 것으로 산정되었
다 . 각각의 유역에서 산정된 가뭄 시계열의 산점도 (scatter
diagram) 은 Fig. 5 및 Fig. 6 과 같다 .
3.3 단변량 가뭄분포 분석
가뭄 시계열 자료의 분포를 모의하기 위해서는 우선적으로
분포형을 결정하여야 한다 . 일반적인 수문기하학적인 자료의
분포형에 대해서는 Exponential distribution 과 Weibull
distribution 이 적합한 것으로 알려져 있으며 , 특히 가뭄의
지속기간에 대해서는 Weibull distribution 이 적합하게 모의 하는 것으로 나타나고 있다 (Shiau 2003, 2005; Wong et al., 2008) 또한 , Gamma distribution 의 경우 가뭄의 심도를
적합하게 모의하고 있는 것으로 알려져 있다 (Shiau 2006).
본 연구에서는 2 변수 Weibull 분포형을 가뭄의 지속기간을
모의하기 위하여 사용하며 , 2 변수 Gamma 분포형을 가뭄의
심도를 위하여 선정하였다 .
가뭄의 지속기간에 대한 Weibull 분포는 식 (5) 와 같다 . (5)
여기서 α는 분포의 규모에 대한 매개변수이며 , β는 분포의 형상에 대한 매개변수 , x
0는 위치에 대한 매개변수이다 .
일 경우 2 변수 Weibull 분포가 되며 , 각각의 유역에 대한 가뭄 기간의 분포형은 식 (6) 과 같다 .
(6)
또한 , 가뭄의 심도에 대한 Gamma 분포는 식 (7) 과 같다 . (7)
여기서 α는 분포의 규모에 대한 매개변수이며 , β는 분포의 형상에 대한 매개변수 , x
0는 위치에 대한 매개변수이다 .
일 경우 2 변수 Gamma 분포가 되고 , 각각의 유역에
f x ( ) β
α --- x ⎝ ⎠ ⎛ ⎞ α ---
β 1–e
–αβ=
x
o= 0
F
Pyeongchang d,( )( ) x 1 e
3.983x ---
⎝ ⎠
⎛ ⎞1.284
–
–= F
Nomhan d,( )( ) x 1 e
4.024x ---
⎝ ⎠
⎛ ⎞1.111
–
–=
f x ( ) 1
α
βΓ β ( )
--- x
β 1–e
–(x⁄α)=
x
o= 0
Table 1. Basic statistics of drought variables
Variable Mean Standard
deviation Coefficient of
variation Coefficient
of skewness Coefficient of kurtosis
Pyeongchang stream Duration( 월 ) 3.7 3.1 0.86 1.57 5.35
Serverity(cms. 월 ) 65.6 73.1 1.11 1.62 5.31
Interval( 월 ) 5.6 3.5 0.63 1.16 3.91
Upstream of Namhan-river Duration( 월 ) 3.9 4.4 1.15 4.75 34.33
Serverity(cms. 월 ) 88.8 117.4 1.32 4.01 26.26
Interval( 월 ) 6.2 4.8 0.77 3.34 21.31
Fig. 5 Scatter plot of observed drought duration and drought serverty for the Pyeongchang stream (1967-2007)
Fig. 6 Scatter plot of observed drought duration and drought serverty for the Upstream of Namhan-river (1967-2007)
Fig. 7 Comparison of the observed drought duration and the fitted distribution (Pyeongchang stream, 1967-2007)
대한 가뭄 심도의 분포형은 식 (8) 과 같으며 , Fig. 7 과 Fig.
8 에 각 누적확률밀도함수를 나타내었다 .
(8) 4. 이변량 가뭄분포 분석
4.1 Copula를 이용한 이변량 가뭄분포 분석
각각 가뭄의 지속기간과 심도는 Weibull 및 Gamma 분
포로 모의되고 있으며 , 확률적인 모형을 통하여 가뭄의 지 속기간과 가뭄의 심도 간에 큰 상관성이 있다는 것을 알 수 있다 . 이러한 분포형 사이에 나타나는 종속적인 의존관 계는 일반적인 다변량 분포형을 나타내는 이변량
Expotential 분포나 이변량 Gamma 분포로는 나타낼 수 없
다 . 따라서 , 이러한 종속적인 의존관계를 고려한 이변량 분
포를 모의하기 위하여 Copula 기반의 가뭄 분포형을 분석
한다 . 우선적으로 가뭄중에서 가장 중요한 특성인 가뭄의
지속기간과 가뭄의 심도를 대상으로 결합확률분포를 산정하 여 본다 .
몇몇의 Copula 함수가 이러한 목적으로 사용될 수 있는데 ,
본 연구에서는 Clayton Copula 함수를 이용하여 나타내기로
한다 . Clayton copula 는 간단한 형태로 인하여 널리 사용되
고 있는 Copula 함수이다 . 우선 Copula 기반의 가뭄의 지 속기간 및 심도에 대한 결합누적확률밀도함수는 식 (9) 와 같 이 나타낼 수 있다 .
(9)
여기서 F
s및 F
d는 각각 가뭄의 지속기간 및 심도에 대한 단일 변량 누적확률밀도함수 이며 , θ는 Copula 를 이용해서 산정한 F
s와 F
d사이의 연관성에 대한 매개변수이다 .
Copula 모수 추정방법인 CML 방법에 의하여 추정된 모수가
평창강이 0.8934, 남한강 상류유역이 0.9925 이므로 각각의 유
역에 대한 가뭄의 지속기간 및 심도에 대한 분포형은 식 (10)
과 같이 나타낼 수 있다 ( 과 과 같이 표기한다 ). Fig. 9 와 Fig. 10 은 각각의 결합확률분포를
나타낸 것이다 .
(10)
4.2 이변량 가뭄 빈도해석
수문학적 자료에 대해서 전통적인 빈도 해석은 단일 확률 변수를 기준으로 이루어졌으며 재현 기간도 단일 확률변수 개념으로 산정되었다 . 재현 기간은 어떤 강도의 수문학적 사
상이 발생하는 평균적인 발생 기간으로서 수자원 계획이나 기타 분야에 대한 가장 기본적인 판단 기준이 된다 . 본 연 구에서 산정한 가뭄의 분포를 고려할 때 가뭄의 지속기간과 심도에 대한 재현기간은 식 (11) 과 같이 정의된다 .
FPyeongchang s
,( )( ) x 1 87.047
0.754Γ 0.754 ( )
--- x
0.754 1–e x
–( ⁄87.047)d x
0∫ x
= FNamhan s
,( )( ) x 1
124.912
0.711Γ 0.711 ( )
--- x
0.711 1–e x
–( ⁄124.912)d x
0∫ x
=
C Fduration d (
( ), Fseverity x
( )) Fduration d
–θ ( )Fseverity s
–θ ( )– 1 +
( )
θ1 –---