• 검색 결과가 없습니다.

Comparison of quantitative precipitation estimate using geostatistical models<sup>†</sup>

N/A
N/A
Protected

Academic year: 2021

Share "Comparison of quantitative precipitation estimate using geostatistical models<sup>†</sup>"

Copied!
13
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

2019, 30

(

1)

,

77–89

공간통계모형을 이용한 정량적 강우 추정 성능 비교

이

ᆷ지은

1

· 윤상후

2

1대구대학교 일반대학원 통계학과 · 2대구대학교 수리빅데이터학부, 대구대학교 기초과학연구소

ᄌ ᅥ

ᆸᄉ ᅮ 2018ᄂ ᅧ ᆫ 12ᄋ ᅯ ᆯ 3ᄋ ᅵ ᆯ, ᄉ ᅮᄌ ᅥ ᆼ 2019ᄂ ᅧ ᆫ 1ᄋ ᅯ ᆯ 2ᄋ ᅵ ᆯ, ᄀ ᅦᄌ ᅢ ᄒ ᅪ ᆨᄌ ᅥ ᆼ 2019ᄂ ᅧ ᆫ 1ᄋ ᅯ ᆯ 2ᄋ ᅵ ᆯ

요 약

ᅡ ᆼᄋ ᅮᄂ ᅳ ᆫ ᄌ ᅵ ᆸᄌ ᅮ ᆼ ᄒ ᅩᄋ ᅮᄋ ᅪ ᄀ ᅡ ᇀᄋ ᅳ ᆫ ᄀ ᅵᄉ ᅡ ᆼᄌ ᅢᄒ ᅢ ᄑ ᅵᄒ ᅢᄅ ᅳ ᆯ ᄀ ᅧ ᆼᄀ ᅡ ᆷᄉ ᅵᄏ ᅵᄀ ᅵ ᄋ ᅱᄒ ᅡ ᆫ ᄉ ᅮᄆ ᅮ ᆫ ᄒ ᅡ ᆨ ᄋ ᅧ ᆫᄀ ᅮᄋ ᅴ ᄀ ᅵᄎ ᅩ ᄌ ᅡᄅ ᅭᄅ ᅩᄊ ᅥ ᄉ ᅡᄋ ᅭ ᆼᄃ ᅬ ᆫ ᄃ

ᅡ. ᄌ ᅥ ᆼᄅ ᅣ ᆼᄌ ᅥ ᆨ ᄀ ᅡ ᆼᄋ ᅮ ᄎ ᅮᄌ ᅥ ᆼᄋ ᅳ ᆯ ᄀ ᅢᄉ ᅥ ᆫᄒ ᅡᄀ ᅵ ᄋ ᅱᄒ ᅢ ᄌ ᅵᄉ ᅡ ᆼ ᄀ ᅡ ᆼᄋ ᅮ ᄌ ᅡᄅ ᅭᄋ ᅪ ᄅ ᅦᄋ ᅵᄃ ᅥ ᄌ ᅡᄅ ᅭᄅ ᅳ ᆯ ᄒ ᅡ ᆸᄉ ᅥ ᆼᄒ ᅡᄂ ᅳ ᆫ ᄋ ᅧ ᆫᄀ ᅮᄀ ᅡ ᄋ ᅵᄅ ᅮᄋ ᅥᄌ ᅵᄀ ᅩ ᄋ ᅵ

ᆻᄃ ᅡ. ᄅ ᅦᄋ ᅵᄃ ᅥᄂ ᅳ ᆫ ᄂ ᅥ ᆲᄋ ᅳ ᆫ ᄌ ᅵᄋ ᅧ ᆨᄋ ᅦᄉ ᅥ ᄀ ᅡ ᆼᄋ ᅮ ᄒ ᅧ ᆫᄉ ᅡ ᆼᄋ ᅳ ᆯ ᄆ ᅩᄂ ᅵᄐ ᅥᄅ ᅵ ᆼᄒ ᅡᄆ ᅧ ᄆ ᅵ ᄀ ᅪ ᆫᄎ ᅳ ᆨ ᄌ ᅵᄌ ᅥ ᆷᄋ ᅦᄉ ᅥ ᄀ ᅡ ᆼᄋ ᅮᄅ ᅣ ᆼᄋ ᅳ ᆯ ᄎ ᅮᄌ ᅥ ᆼᄒ ᅡ ᆯ ᄉ ᅮ ᄋ ᅵ ᆻᄃ ᅡ.

ᅩ ᆫ ᄋ ᅧ ᆫᄀ ᅮᄂ ᅳ ᆫ ᄌ ᅥ ᆼᄅ ᅣ ᆼᄌ ᅥ ᆨ ᄀ ᅡ ᆼᄋ ᅮ ᄎ ᅮᄌ ᅥ ᆼᄋ ᅳ ᆯ ᄋ ᅱᄒ ᅢ ᄀ ᅩ ᆼ ᄀ ᅡ ᆫᄐ ᅩ ᆼ ᄀ ᅨᄆ ᅩᄒ ᅧ ᆼᄋ ᅵ ᆫ ᄋ ᅧ ᆨᄀ ᅥᄅ ᅵᄀ ᅡᄌ ᅮ ᆼᄇ ᅥ ᆸ, ᄋ ᅵ ᆯᄇ ᅡ ᆫᄒ ᅪᄀ ᅡᄇ ᅥ ᆸᄆ ᅩᄒ ᅧ ᆼ, ᄏ ᅳᄅ ᅵᄀ ᅵ ᆼ, ᄀ ᅩ ᆼ ᄀ ᅡ ᆫᄅ ᅢ ᆫᄃ ᅥ ᆷ ᄑ

ᅩᄅ ᅦᄉ ᅳᄐ ᅳᄅ ᅳ ᆯ ᄀ ᅩᄅ ᅧᄒ ᅡᄋ ᅧ ᆻᄃ ᅡ. ᄋ ᅨᄎ ᅳ ᆨᄉ ᅥ ᆼᄂ ᅳ ᆼᄋ ᅳ ᆯ ᄑ ᅧ ᆼᄀ ᅡᄒ ᅡᄀ ᅵ ᄋ ᅱᄒ ᅢ 10-ᄀ ᅧ ᆸ ᄀ ᅭᄎ ᅡᄀ ᅥ ᆷᄌ ᅳ ᆼ ᄋ ᅵ 50ᄇ ᅥ ᆫ ᄉ ᅮᄒ ᅢ ᆼᄒ ᅡᄋ ᅧ RMSE, MAE, rBIAS, CCᄅ ᅳ ᆯ ᄀ ᅨᄉ ᅡ ᆫᄒ ᅡᄋ ᅧ ᆻᄃ ᅡ. ᄀ ᅳ ᄀ ᅧ ᆯᄀ ᅪ, ᄇ ᅵᄀ ᅡ ᄌ ᅥ ᆨᄀ ᅦ ᄂ ᅢᄅ ᅵᄀ ᅩ ᄀ ᅮ ᆨ ᄌ ᅵᄉ ᅥ ᆼ ᄀ ᅡ ᆼᄋ ᅮᄋ ᅵ ᆯ ᄄ ᅢᄂ ᅳ ᆫ ᄋ ᅧ ᆨᄀ ᅥᄅ ᅵᄀ ᅡᄌ ᅮ ᆼᄇ ᅥ ᆸᄋ ᅵ ᄋ ᅨᄎ ᅳ ᆨᄉ ᅥ ᆼᄂ ᅳ ᆼ ᄋ

ᅵ ᄋ ᅮᄉ ᅮᄒ ᅡᄋ ᅧ ᆻᄋ ᅳᄂ ᅡ, ᄇ ᅡ ᆫᄃ ᅢᄋ ᅴ ᄉ ᅡ ᆼ ᄒ ᅪ ᆼᄋ ᅦᄉ ᅥᄂ ᅳ ᆫ ᄌ ᅥ ᆼᄀ ᅲᄏ ᅳᄅ ᅵᄀ ᅵ ᆼᄋ ᅵ ᄋ ᅮᄉ ᅮᄒ ᅡᄋ ᅧ ᆻᄃ ᅡ. ᄀ ᅩ ᆼ ᄀ ᅡ ᆫᄅ ᅢ ᆫᄃ ᅥ ᆷᄑ ᅩᄅ ᅦᄉ ᅳᄐ ᅳᄂ ᅳ ᆫ ᄀ ᅡ ᆼᄋ ᅮᄅ ᅣ ᆼᄋ ᅦ ᄀ ᅪ ᆫ ᄀ ᅨ ᄋ ᅥ

ᆹᄋ ᅵ ᄅ ᅩᄇ ᅥᄉ ᅳᄐ ᅳᄒ ᅡ ᆫ ᄋ ᅨᄎ ᅳ ᆨᄉ ᅥ ᆼᄂ ᅳ ᆼᄋ ᅳ ᆯ ᄇ ᅩᄋ ᅧ ᆻᄃ ᅡ. ᄉ ᅵᄀ ᅡ ᆫᄒ ᅢᄉ ᅡ ᆼᄃ ᅩᄀ ᅡ ᄂ ᅩ ᇁᄋ ᅳ ᆯ ᄄ ᅢᄂ ᅳ ᆫ ᄀ ᅩ ᆼ ᄀ ᅡ ᆫᄅ ᅢ ᆫᄃ ᅥ ᆷᄑ ᅩᄅ ᅦᄉ ᅳᄐ ᅳᄀ ᅡ ᄋ ᅨᄎ ᅳ ᆨᄉ ᅥ ᆼᄂ ᅳ ᆼ ᄋ ᅵ ᄋ ᅮᄉ ᅮ ᄒ

ᅡᄋ ᅧ ᆻᄋ ᅳᄆ ᅧ, ᄂ ᅡ ᆽᄋ ᅳ ᆯ ᄄ ᅢᄂ ᅳ ᆫ ᄌ ᅥ ᆼᄀ ᅲᄏ ᅳᄅ ᅵᄀ ᅵ ᆼᄋ ᅵ ᄋ ᅨᄎ ᅳ ᆨᄉ ᅥ ᆼᄂ ᅳ ᆼ ᄋ ᅵ ᄋ ᅮᄉ ᅮᄒ ᅡᄋ ᅧ ᆻᄃ ᅡ.

ᅮᄋ ᅭᄋ ᅭ ᆼ ᄋ ᅥ: ᄀ ᅩ ᆼ ᄀ ᅡ ᆫᄅ ᅢ ᆫᄃ ᅥ ᆷᄑ ᅩᄅ ᅦᄉ ᅳᄐ ᅳ, ᄋ ᅵ ᆯᄇ ᅡ ᆫᄒ ᅪᄀ ᅡᄇ ᅥ ᆸᄆ ᅩᄒ ᅧ ᆼ, ᄏ ᅳᄅ ᅵᄀ ᅵ ᆼ.

1. 서론 ᄎ

ᅬ근기후변화로 인한 집중호우와 같은기상재해가 증가하고 있다. 특히 여름철 집중호우로 인한 재 ᄒ

ᅢ는많은 인명 피해와 경제적 손실을발생시킨다. 정확한 강우 데이터는강우로 인한 피해를경감시키 ᄀ

ᅵ 위한 수문학적 연구의 기초 자료이다 (Park과 Kim, 2017). 기상청은전국 10대의 단일편파기상레이 ᄃ

ᅥ와 642 대의 우량계를활용한 강우를정량적으로 추정하여 수자원 관리 및 방재에 이용하고 있다.

ᅵ상에 설치된 강우 관측소는 정확한 강우량을 제공하지만 강우 관측소가 설치되지 않은지역에 대 ᄒ

ᅡᆫ 강우의 공간적인 분포를정확하게 제공하지 않는다. 강우는짧은시간 단위에서 공간적 연속성은매 ᄋ

ᅮ 낮으므로 지상 강우만을이용하여 강우의 공간적인 분포특성을파악하는데 어려움이 있다 (Kim 등, 2014). 반면 강우 레이더는넓은영역에 대하여 강우관측을하므로 높은시공간 해상도로 강우에 대한 저

ᆼ보를 제공할 수 있으며, 가까운 인접지역의 상대적 강우량을정확하게 추정 가능하므로 강우의 공간 ᄌ

ᆨ 변동에 대한 정보를파악할 수 있다 (Kim 등, 2007). 하지만 기상레이더의 강우 강도는고정된 Z-R 과

ᆫ계식으로 추정되므로 집중호우 현상을과소 또는과대 추정하는 문제점을않고 있다 (Kim 등, 2013).

ᅡᆼ우 관측소와 강우 레이더의 한계를 극복하기 위해 지상 강우와 레이더를 합성한 연구가 진행되고 있 ᄃ

ᅡ.

ᅵ상 강우만을이용한 연구로 Park과 Jang (2008)은 강우의 공간적 분포도 작성을위해 다변량 크 ᄅ

ᅵ깅의 적용가능성을검토하였으며, Kim 등 (2010)은역거리제곱법과 크리깅 기법을이용하여 강우의

ᄋ ᅵ ᄂ ᅩ ᆫᄆ ᅮ ᆫᄋ ᅳ ᆫ 2016 ᄒ ᅡ ᆨᄂ ᅧ ᆫᄃ ᅩ ᄃ ᅢᄀ ᅮᄃ ᅢᄒ ᅡ ᆨᄀ ᅭ ᄒ ᅡ ᆨᄉ ᅮ ᆯᄋ ᅧ ᆫᄀ ᅮᄇ ᅵᄌ ᅵᄋ ᅯ ᆫ ᄋ ᅦ ᄋ ᅴᄒ ᅡ ᆫ ᄂ ᅩ ᆫᄆ ᅮ ᆫᄋ ᅵ ᆷ.

1

(38453) ᄀ ᅧ ᆼᄉ ᅡ ᆼᄇ ᅮ ᆨ ᄃ ᅩ ᄀ ᅧ ᆼᄉ ᅡ ᆫᄉ ᅵ ᄌ ᅵ ᆫᄅ ᅣ ᆼᄋ ᅳ ᆸ ᄃ ᅢᄀ ᅮᄃ ᅢᄅ ᅩ 201, ᄃ ᅢᄀ ᅮᄃ ᅢᄒ ᅡ ᆨᄀ ᅭ ᄋ ᅵ ᆯᄇ ᅡ ᆫᄃ ᅢᄒ ᅡ ᆨᄋ ᅯ ᆫ ᄐ ᅩ ᆼ ᄀ ᅨᄒ ᅡ ᆨᄀ ᅪ, ᄉ ᅥ ᆨᄉ ᅡᄀ ᅪᄌ ᅥ ᆼ.

2

ᄀ ᅭᄉ ᅵ ᆫᄌ ᅥᄌ ᅡ: (38453) ᄀ ᅧ ᆼᄉ ᅡ ᆼᄇ ᅮ ᆨ ᄃ ᅩ ᄀ ᅧ ᆼᄉ ᅡ ᆫᄉ ᅵ ᄌ ᅵ ᆫᄅ ᅣ ᆼᄋ ᅳ ᆸ ᄃ ᅢᄀ ᅮᄃ ᅢᄅ ᅩ 201, ᄃ ᅢᄀ ᅮᄃ ᅢᄒ ᅡ ᆨᄀ ᅭ ᄉ ᅮᄅ ᅵᄇ ᅵ ᆨᄃ ᅦᄋ ᅵᄐ ᅥᄒ ᅡ ᆨᄇ ᅮ, ᄌ ᅩᄀ ᅭᄉ ᅮ. E-mail:

[email protected]

(2)

ᄀ ᅩ

ᆼ간분포를산출하였다. 레이더와 지상 강우를합성한 연구로 Kim 등 (2013)은 공동크리깅 방법으로 ᄅ

ᅦ이더 강우강도의 오차분포를생성하여 레이더 강우강도를보정하였다. Yoon 등 (2015)은정규크리깅 ᄀ

ᅪ 조건부 합성기법을이용하여 서울지역의 정량적 실황 강우장을산정하였다. Jang 등 (2015)은정규 ᄏ

ᅳ리깅과 공동크리깅 방법과 함께 KED (kriging with external drift) 기법을적용하여 강우장을추정 ᄒ

ᅡ였다. Shin 등 (2017)은계층적 베이지안 모형을이용하여 통계적 강우 조정 모형을제시하였다.

ᅵ상자료의 공간분포를추정하기 위해 공간통계모형인 역거리가중법, 일반화가법모형, 공간선형모형 ᄃ

ᆼ이 활용되고 있다 (Yoon, 2017; Im과 Yoon, 2018). 본연구는 서울특별시의 정량적 강우량 추정을 ᄋ

ᅱ해 관악산 강우 레이더 자료와 고해상도 지상 강우 자료를 이용한 공간통계모형의 정량적 강우 추정 서

ᆼ능을비교하고자 한다. 고려된 공간통계모형은역거리가중법, 일반화가법모형, 크리깅과 기계학습모 혀

ᆼ인 공간랜덤포레스트 (spatial random forest)를고려하였다. 고해상도 지상 강우 자료는 SK 플래닛 ᄋ

ᅦ서 서울지역에서관측한 190개소의 10분단위 강우량을사용하였다.

보

ᆫ 논문은다음과 같이 구성되어 있다. 2절에서는 공간통계모형인 역거리가중법, 일반화가법모형, 크 ᄅ

ᅵ깅, 공간랜덤포레스트에 대해 설명하고 3절에서는 연구에서 사용된 자료에 대해 설명한다. 4절에서 느

ᆫ 공간통계모형의 예측성능을비교하였으며, 5절에서는예측사례를선정하여 추정된강우분포를살펴 ᄇ

ᅩ았다. 마지막으로 6절에서는결론 및 향후 연구방향을제시한다.

2. 연구방법론

2.1. 역거리가중법 ᄋ

ᅧᆨ거리가중법 (inverse distance weight; IDW)은거리에 따른주변관측값들의 가중평균으로 보간하 느

ᆫ방법이다 (Shepard, 1968).

Zp=

n

X

i=1

ZiWi/

n

X

i=1

Wi, W = 1/dki, (2.1)

ᅧ기서 Zp는 예측값, Zi는관측값, n은관측지점의 수, di는관측지점과 예측지점 사이의 거리, Wi는 ᄀ

ᅥ리에 따른가중치로 k가 증가할수록가까운관측지점이큰영향을 준다. 일반적으로 k는 2를사용한 ᄃ

ᅡ.

2.2. 일반화가법모형 이

ᆯ반화가법모형 (generalized additive model; GAM)은 일반화선형모형 (generalized linear model)의 화

ᆨ장으로 평활함수 (smooth function)를 사용하여 비선형 관계를 설명한다 (Hastie와 Tibshirani, 1986).

Y = f0+

p

X

j=1

fj(xj) + ϵ, ϵ ∼ N (0, σ2), (2.2)

ᅧ기서 fj는평활함수로서 cubic smoothing spline, local regression, thin-plate smoothing spline등을 ᄋ

ᅵ용하여 추정하며, 평활모수는 일반적으로 일반화 교차 타당성 방법 (generalized cross validation)을 ᄐ

ᆼ해 결정된다. 본연구에서는 cubic smoothing spline 함수가 사용하였고, 지상강우만을고려한 모형 (GAM1)과 지상강우와 레이더를고려한 모형 (GAM2)을구분하여 예측성능을비교하였다.

(3)

2.3. 크리깅 ᄏ

ᅳ리깅 (kriging)은보간하고자 하는점 주위의 측정값에 가중치를부여하여 미관측지점의 값을보간 ᄒ

ᅡ는모델로 공간구조는반베리오그램 (semivariogram)을 통해 계산된다. 반베리오그램은 공간적 자기 ᄉ

ᅡᆼ관성을나타내는척도인 베리오그램 (variogram)의 반에 해당하는값으로 분리거리 h만큼떨어진 자 ᄅ

ᅭ의 개수가 n일 때,

γ(h) = 1 2n

n

X

i=1

[z(xi) − z(xi+ h)]2 (2.3) ᄅ

ᅩ 계산된다. 공간보간을위해서는예측지점에 대한 베리오그램이 필요하므로 경험적 베리오그램을함 ᄉ

ᅮ화한 이론적 베리오그램이 필요하다. 이론적 베리오그램은 구형모델 (spherical model), 지수모델 (exponential model),가우시안모델 (gaussian model) 등이 가장 많이 사용된다 (Cho와 Jeong, 2007, Kim 등, 2011).

보

ᆫ연구에서는이론적 베리오그램으로 지수모델을사용하였으며 추정식이 편향되지 않으면서 오차분 ᄉ

ᅡᆫ을최소로 하는정규크리깅 (ordinary kriging; OK)과 공간적으로 변화하거나 특정한 경향을반영하 ᄋ

ᅧ 가중치를계산하는 일반크리깅 (universal kriging; UK)을 고려하였다. 즉, OK는지상강우장이고 UK는지상강우와 레이더의 합성장이다.

2.4. 공간랜덤포레스트 ᄅ

ᅢᆫ덤포레스트는 Breiman (2001)에 의해 제안된 것으로 의사결정나무의 심화된 기법이다. 배깅 (bagging)을 통해 중복을허용한 임의추출로 원데이터와 동일한 크기의 데이터를여러 개 구성하고 이 르

ᆯ기반으로 각각의 의사결정나무를구성한다. 이후 무작위로 선택된 변수로 만들어진 여러 의사결정나 ᄆ

ᅮ 모형을 통한관측치를평균으로 결합하여 최종으로 예측한다.

ᅢᆫ덤 포레스트는매개 변수를 추정하는 동안 샘플링 위치와 일반적인 샘플링 패턴이 무시되므로 공 ᄀ

ᅡᆫ 예측에 대한 비공간적 접근법이다. 이는 목표변수의 공간자기상관이 높거나 점 패턴이 명백히 표집 ᄑ

ᅧᆫ향을 보일 때 최적이 아닌 예측과 체계적으로 과대예측 또는 과소예측으로 이어질 수 있다. 이러한 무

ᆫ제를 해결하기 위해 관측치 간의 지리적 근접성 및 공간적관계를설명하는 공변량 XG를고려한다 (Hengl 등, 2018).

XG= (dp1, dp2, · · · dpN), ᄋ

ᅧ기서 dpi는관측지점 pi로부터 예측 지점까지의 버퍼 거리 (buffer distance)이고, N은 총 training ᄉ

ᅮ이다. 버퍼 거리는유클리디안 (Euclidean) 거리, DEM (dIgital elevation model)을이용하여 계산 되

ᆫ다. 본연구는유클리디안 거리를 통해 계산된버퍼 거리를이용하였다. Figure 2.1은 공간랜덤포레 ᄉ

ᅳ트의 프로세스를나타낸 것이다.

보

ᆫ연구에서는지상강우만 이용한 공간랜덤포레스트 (sRF1)와 지상강우와 레이더를이용한 공간랜덤 ᄑ

ᅩ레스트 (sRF2)를고려하였다.

2.5. 교차검증 ᄀ

ᅭ차검증 (cross validation)은예측된 자료만을이용하여 본래의 자료값을다시 예측하여 예측에 사 ᄋ

ᆼ된 방법의 타당성을 검증하는방법이다. 본 연구에서는 각 모형 성능 비교를 위해 K-겹 교차검증법 (K-folds cross validation)을적용하였다. K-겹 교차검증은 동일한 크기의 그룹을 K개로 분할하여 하 ᄂ

ᅡ의 그룹을검증데이터로 나머지 그룹은학습데이터로 사용하여 검증하고 이와 같은과정을 K번 반복 ᄒ

ᅡᆫ다. 일반적으로 K=10으로 두고 수행한다.

(4)

Figure 2.1 Spatial random forest process (Hengl et al., 2018)

보

ᆫ 연구에서는 10-겹 교차검증을 50번 수행하였으며, 검증지표로서 평균제곱근오차 (root mean square error; RMSE), 평균절대오차 (mean absolute error: MAE), 상대편차 (relative bias; rBIAS), ᄉ

ᅡᆼ관계수 (correlation coefficient; CC)를계산하였다.

RM SE = v u u t 1 n

n

X

i=1

(ˆyi− yi)2, M AE = 1 n

n

X

i=1

|yi− ˆyi|, rBIAS =

N

X

i=1

yi− ˆyi

yi

,

CC = nPN

i=1yiyˆi−PN i=1yiPN

i=1yˆi

q nPN

i=1y2i− (PN i=1yi)2

q nPN

i=1yˆi2−PN i=1yˆi

2,

(2.4)

ᅧ기서 yi와 ˆyi는 각각 모델 예측값과 관측값 평균의 차이, 관측값과 관측값 평균의 차이를 나타내며 n은데이터 개수를의미한다. RMSE, MAE는값이 작을수록예측성능이 우수하며, rBIAS는 0에 가까 ᄋ

ᅮᆯ수록예측결과가 편향되지 않았다고 할 수 있다. CC는 1에 가까울수록상관관계가 높음을의미한다.

3. 연구자료 보

ᆫ연구는정량적 강우 추정을위해 서울지역을설치된우량계 190개소에서 10분단위로관측된강우 ᄌ

ᅡ료를이용하였다. 강우 레이더는광덕산 레이더관측소에관측된고도 1.5km의 자료로 공간해상도는 250m이다. Figure 3.1의 (a)는 관악산 레이더와 레이더의 관측반경이며, (b)는 강우 관측소의 공간적 ᄇ

ᅮᆫ포이다. 사례기간은서울지역의 비가 내린 2013년 7월 2일, 4일, 12 ∼ 15일, 22 ∼ 23일이다. 10분 다

ᆫ위 시간 해상도를기준으로 총 사건은 1,152건이며 그 중 비온 사건은 840건 (73%)이다. 본연구에 ᄉ

ᅥ는 공간통계모형의 모델링을위해 5개소 이상에서 비가관측된596건 (51.7%)을 분석하였다.

ᅡᆼ우가관측된강우량 비율에 따라 강우량의 기술통계량을계산하면 Table 3.1이다. 약 33.8%가 5 ∼ 40개소에서관측된사건이며, 다음으로 160 ∼ 190개소 (25.5%), 41 ∼ 80개소 (16.1%), 120 ∼ 160개소 (13.4%), 41 ∼ 80 (16.1%) 순이다. 많은관측지점에서 강우가관측될수록강우량이 많았으며, 관측지 ᄌ

ᅥᆷ 수가 줄어들수록관측된강우량이 적었다.

(5)

(a) Gwangdeoksan radar (b) Rain gauges Figure 3.1 The spatial distribution of stations.

Table 3.1 Rainfall according to the ratio of stations

observed sites N (%) mean sd max

5 ∼ 40 202 (33.8%) 0.049 0.096 0.809 41 ∼ 80 96 (16.1%) 0.170 0.184 1.431 81 ∼ 120 66 (11.1%) 0.434 0.578 2.995 121 ∼ 159 80 (13.4%) 0.735 0.786 4.081 160 ∼ 190 152 (25.5%) 2.024 1.319 5.622 total 596 (100%) 0.707 1.101 5.622

4. 분석결과

4.1. 전체 사건에 대한 공간통계모형 예측성능 저

ᆼ량적 강우 추정을위해 사용된모형은지상 강우관측자료만 이용한 역거리 가중법 (IDW), 일반화 ᄀ

ᅡ법모형 (GAM1), 정규크리깅 (OK), 공간랜덤포레스트 모형 (sRF1)과 지상 강우관측자료와 레이더 ᄌ

ᅡ료를합성한 일반화가법모형 (GAM2), 일반크리깅 (UK), 공간랜덤포레스트 모형 (sRF2)이다.

ᄀ ᅩ

ᆼ간통계모형의 예측성능을 평가하기 위해 10겹-교차검증을 50번 반복하여 RMSE, MAE, rBIAS, CC를계산하였다. 전체 사건에 대한 예측성능은 Table 4.1이다. RMSE와 MAE 기준으로 공간랜덤포 ᄅ

ᅦ스트가 다른모형에 비해 낮았으며, 다음으로 OK, UK, IDW, GAM 순이다. rBIAS는 GAM, OK, UK, IDW, sRF1, sRF2 순이다, CC는 IDW가 가장 높았으며, 다음으로 OK, UK, sRF2, sRF1, GAM1, GAM2 순이었다. 크리깅과 공간랜덤포레스트의 레이더가 고려된모형과 고려되지 않은모형의 성능의 ᄏ

ᅳᆫ차이가 나지 않으므로 레이더에 대한 효과는거의 없는것으로 보인다.

Table 4.1 Predcition performance for all events (mean (sd))

RMSE MAE rBIAS CC

IDW 0.490 (0.597) 0.293 (0.390) -0.032 (0.103) 0.621 (0.246)

GAM1 0.504 (0.616) 0.294 (0.378) 0.000 (0.085) 0.573 (0.248)

GAM2 0.523 (0.664) 0.294 (0.378) 0.012 (0.493) 0.570 (0.256)

OK 0.457 (0.731) 0.245 (0.314) 0.015 (0.135) 0.620 (0.271)

UK 0.457 (0.567) 0.251 (0.326) 0.019 (0.140) 0.613 (0.267)

sRF1 0.453 (0.535) 0.225 (0.298) -0.315 (0.296) 0.602 (0.278)

sRF2 0.453 (0.534) 0.225 (0.298) -0.315 (0.296) 0.602 (0.277)

(6)

ᄀ ᅡ

ᆨ 사건을살펴본결과 RMSE 기준으로 OK (16.8%)로 가장 많은사건에서 예측성능이 우수하였으 ᄆ

ᅧ, 다음으로 IDW (9.5%), UK (8.9%), GAM1 (5.6%), sRF1 (5.2%), sRF2 (3.6%), GAM2 (2.2%) 순 ᄋ

ᅵ다. MAE 기준으로는 sRF1 (21.2%), sRF2 (20.3%), OK (6.4%), UK (2.4%), GAM1 (0.7%), IDW (0.5%), GAM2 (0.2%) 순이다. 예측성능은강우의 패턴에 따라 다를수 있다. 10분단위의 사건의 일 펴

ᆼ균 예측성능은 Figure 4.1이다. RMSE 기준으로 2일, 12 ∼ 14일, 22일, 23일은다른 모형에 비해 OK가 가장 낮은값을보였다. 4일은 RF1와 RF2가 가장 낮은값이며, 15일은 RF2가 다른모형에 비 ᄒ

ᅢ 낮은값을보이며, RF1, OK가 유사한 결과를보였다. CC 기준으로 4일, 14일, 15일은 IDW가 다른 ᄆ

ᅩ형에 비해 높았으며, 2일, 12일, 22일, 23일은 OK가 13일은 RF2가 높았다.

Figure 4.1 Prediction performance by day.

ᅡᆼ우가관측된우량계의 비율에 따른 공간통계모형의 예측성능은 Table 4.2와 Table 4.3이다. 5 ∼ 40개소에서 강우가 관측되었을 경우 IDW가 예측성능이 우수하며, 41 ∼ 80개소는 UK의 예측성능이 ᄋ

ᅮ수하였다. 그 외에 81개소 이상인 강우가관측된 전역성 강우에는 OK의 예측성능이 우수하였다. 즉, ᄀ

ᆨ지성 강우일 때는 IDW가 예측성능이 우수하며, 전역성 강우일 때는 OK가 예측성능이 우수하다.

5 ∼ 40개소의 경우 OK를제외한 모형에서 공간랜덤포레스트가 예측성능이 우수하였으며, 41개소 이 ᄉ

ᅡᆼ의 경우에도 크리깅을 제외한 모형에서 공간랜덤포레스트의 예측성능이 우수하였다. 따라서 Table 4.1에서 크리깅보다 공간랜덤포레스트의 예측성능이 우수한 이유는강우량과 무관하게 공간랜덤포레스 ᄐ

ᅳ가 일정수준의 예측성능을보이기 때문이다.

4.2. 시간해상도에 따른 공간통계모형 예측성능 ᄉ

ᅵ간해상도가 낮아질수록 강우의 관측 기간이 늘어나면서 강우의 지역적 성격이 반영된 강우패턴을 화

ᆨ인할 수 있다. 따라서 시간해상도를 10분, 1시간, 6시간, 24시간으로 낮추었을때 모형평가 결과를살 ᄑ

ᅧ보았다 (Table 4.4). 시간해상도가 10분과 1시간일 때 상대적으로 공간랜덤포레스트의 RMSE 값이

(7)

Table 4.2 RMSE according to the number of stations (mean (sd))

observed sites IDW GAM1 GAM2 OK UK sRF1 sRF2

5 ∼ 40 0.148 0.165 0.233 0.211 0.181 0.151 0.150

(0.223) (0.260) (0.536) (0.924) (0.359) (0.207) (0.206)

41 ∼ 80 0.294 0.311 0.309 0.275 0.273 0.287 0.286

(0.270) (0.275) (0.265) (0.251) (0.247) (0.244) (0.243)

81 ∼ 120 0.461 0.462 0.461 0.408 0.424 0.439 0.438

(0.539) (0.523) (0.524) (0.466) (0.483) (0.493) (0.492)

121 ∼ 159 0.628 0.677 0.673 0.533 0.577 0.561 0.561

(0.623) (0.708) (0.702) (0.509) (0.615) (0.526) (0.526)

160 ∼ 190 1.009 1.005 1.005 0.880 0.892 0.911 0.910

(0.708) (0.730) (0.734) (0.646) (0.662) (0.653) (0.652)

total 0.490 0.504 0.523 0.457 0.457 0.453 0.453

(0.597) (0.616) (0.664) (0.731) (0.567) (0.535) (0.534)

Table 4.3 CC according to the number of stations (mean (sd))

observed sites IDW GAM1 GAM2 OK UK sRF1 sRF2

5 ∼ 40 0.462 0.308 0.368 0.419 0.411 0.385 0.389

(0.254) (0.237) (0.251) (0.269) (0.261) (0.282) (0.282)

41 ∼ 80 0.621 0.572 0.576 0.626 0.625 0.606 0.607

(0.219) (0.190) (0.188) (0.229) (0.221) (0.225) (0.225)

81 ∼ 120 0.627 0.638 0.639 0.690 0.675 0.668 0.669

(0.201) (0.189) (0.191) (0.214) (0.211) (0.218) (0.217)

121 ∼ 159 0.690 0.649 0.650 0.715 0.705 0.703 0.703

(0.231) (0.213) (0.215) (0.130) (0.131) (0.123) (0.123)

160 ∼ 190 0.775 0.762 0.763 0.803 0.799 0.795 0.796

(0.128) (0.124) (0.125) (0.130) (0.131) (0.123) (0.123)

total 0.621 0.573 0.570 0.620 0.613 0.602 0.604

(0.246) (0.248) (0.256) (0.271) (0.267) (0.278) (0.277)

ᄂ ᅡ

ᆽ으며, 6시간과 24시간일 때 크리깅이 공간랜덤포레스트보다 낮았다. 공간해상도가 높을 때는 CC를 ᄀ

ᅵ준으로 10분은 IDW, 1시간은 OK, 6시간은 RF2, 24시간은 OK가 다른모형에 비해 높은상관관계 르

ᆯ보인다.

Table 4.4 RMSE and CC according to time resolution (mean (sd))

RMSE CC

10m 1h 6h 24h 10m 1h 6h 24h

IDW 0.490 1.295 4.406 10.804 0.621 0.684 0.729 0.670

(0.597) (1.850) (4.871) (7.678) (0.246) (0.226) (0.182) (0.305)

GAM1 0.504 1.188 3.627 9.842 0.573 0.653 0.731 0.720

(0.616) (1.649) (4.408) (7.180) (0.248) (0.244) (0.175) (0.245)

GAM2 0.523 1.195 3.626 9.843 0.570 0.651 0.731 0.720

(0.664) (1.642) (4.403) (7.219) (0.256) (0.248) (0.176) (0.249)

OK 0.457 1.281 3.461 9.607 0.620 0.694 0.755 0.690

(0.731) (2.214) (4.562) (7.467) (0.271) (0.246) (0.203) (0.340)

UK 0.457 1.277 3.581 9.793 0.613 0.688 0.748 0.684

(0.567) (2.118) (4.690) (7.398) (0.267) (0.245) (0.198) (0.333)

sRF1 0.453 1.124 3.630 9.994 0.602 0.677 0.759 0.708

(0.353) (1.570) (4.673) (7.664) (0.278) (0.255) (0.171) (0.281)

sRF2 0.453 1.122 3.623 9.975 0.604 0.679 0.760 0.709

(0.534) (1.566) (4.669) (7.631) (0.277) (0.256) (0.171) (0.280)

(8)

5. 공간통계모형의 강우 예측 사례 ᄀ

ᆼ간통계모형으로 추정된강우의 공간적인 분포를알아보기 위해 사례일을선정하여 살펴보았다. 선 저

ᆼ된사건은비가 많이 온사건 (2013년 7월 23일 12:40)과 비가 적게 온사건 (2013년 7월 12일)이다.

ᅵ가 많이 온사건은 총 680.2mm의 강우가 내렸으며, 187개소에서관측이 되었으며, 비가 적게 온사건 ᄋ

ᆫ 총 6.7mm의 강우가 내렸으며 17개소에서관측이 되었다.

ᅵ가 많이 온사건에 대한 공간통계모형의 예측성능은 Table 5.1이다. RMSE와 CC 기준으로 OK가 ᄃ

ᅡ른 모형에 비해 예측성능이 우수하였으며, 다음으로 UK, sRF1, sRF2, IDW, GAM1, GAM2 순 ᄋ

ᅵ다. 비가 많이 온 사건에 대한 추정된 강우분포도는 Figure 5.1이다. 위의 그림들은 각각 지상 강 ᄋ

ᅮ와 레이더를 나타낸 것이다. 나머지 그림들은 추정된 강우분포도로 왼쪽은 지상 강우 자료를 이용 ᄒ

ᅡᆫ 결과이며, 오른쪽은 지상 강우 관측 자료와 레이더 자료를 합성한 결과이다. IDW을 이용하여 추 저

ᆼ된강우분포도는관측소를 중심으로 강우가 분포되어 있으며, 공간적으로 평활화되는경향을보인다.

GAM과 크리깅을이용하여 추정된강우분포도 평활화되어 있으며, 강우패턴이 유사하게 나타났다. 그 ᄅ

ᅥ나 sRF는다른모형에 비해 평활화된 경향이 감소하였으며, 강우패턴이 비균질적이다. 이는 sRF는 ᄀ

ᅥ리에 따라 버퍼 거리가 계산되어 레이어별로 다른가중치를가지지만, 다른모형은거리에 따른가중 ᄎ

ᅵ를관측소별로 동일하게 적용하기 때문이다.

Table 5.1 Result of cross validation for high intensity rainfall event

IDW GAM1 GAM2 OK UK sRF1 sRF2

RMSE 1.059 1.070 1.079 0.877 0.887 0.973 0.973 CC 0.889 0.873 0.871 0.915 0.913 0.895 0.895

ᅵ가 적게 온 사건에 대한 공간통계모형의 예측성능은 Table 5.2이다. RMSE와 CC 기준으로 IDW가 다른모형에 비해 예측성능이 우수하였으며, 다음으로 sRF1, sRF2, GAM1, OK, UK, GAM2 ᄉ

ᅮᆫ이다. 비가 많이 온 사건에 대한 추정된 강우분포도는 Figure 5.2이다. Figure 5.1과 마찬가지로 IDW는강우가관측된지점으로부터 평활화되는 특성을보인다. GAM은위로부터 아래로 평활화되는 ᄐ

ᅳᆨ성을보인다. OK는 GAM1과 패턴이 비슷하게 나타났으나 레이더가 반영된UK는패턴이 다르게 나 ᄐ

ᅡ났다. sRF는레이더가 미치는영향이 적은것으로 보인다.

Table 5.2 Result of cross validation for low intensity rainfall event

IDW GAM1 GAM2 OK UK sRF1 sRF2

RMSE 0.097 0.111 0.131 0.111 0.121 0.107 0.109

CC 0.795 0.701 0.577 0.696 0.622 0.725 0.709

(9)

IDW

GAM

Kriging

sRF

Figure 5.1 Spatial interpolation map for high intensity rainfall event

(10)

IDW

GAM

Kriging

sRF

Figure 5.2 Spatial interpolation map for low intensity rainfall event

(11)

6. 결론 보

ᆫ연구는정량적 강우 추정을위해 공간통계모형인 역거리가중법, 일반화가법모형, 크리깅, 공간랜덤 ᄑ

ᅩ레스트의 예측성능을비교하였다. 레이더가 모형에 영향을미치는지 알아보기 위해 레이더 지상 강우 ᄌ

ᅡ료만 이용한 모형과 지상 강우관측자료와 레이더자료를합성한 모형을고려하였다. 공간통계모형의 ᄋ

ᅨ측성능을평가하기 위해 10-겹 교차검증을 50번 반복수행하여 RMSE, MAE, rBIAS, CC를계산하 ᄋ

ᅧᆻ다.

ᅥᆫ체 사건에 모형 예측성능은 공간랜덤포레스트가 예측성능이 우수하였다. 이를 일자별로 살펴보았 으

ᆯ때 정규크리깅이 우수하였으며, 다음으로 공간랜덤포레스트였다. 강우가관측된기상관측소 비율에 ᄄ

ᅡ른 모형예측성능을살펴본 결과 국지성 강우일 때 역거리가중법이 예측성능이 우수하였으나 전역성 ᄀ

ᅡᆼ우일 때는정규크리깅이었다. 전체 결과에서 공간랜덤포레스트가 예측성능이 우수하게 나온이유는 ᄀ

ᅡᆼ우량의 따른 예측성능의 차이가 적기 때문이다. 시간해상도를 다르게 하여 예측성능을 평가한 결과 ᄉ

ᅵ간해상도가 높을때는 공간랜덤포레스트가 예측성능이 우수하였으며, 시간해상도가 낮을수록정규크 ᄅ

ᅵ깅이 예측성능이 우수하였다. 비가 많이 온 사건과 적게 온 사건에 대한 예측사례를 공간통계모형 ᄋ

ᅳ로 추정된강우의 공간분포를살펴보았다. 역거리가중법, 일반화가법모형, 정규크리깅은평활화되는 겨

ᆼ향을보였으나 공간랜덤포레스트는평활화 경향이 감소하였다. 따라서 공간랜덤포레스트가 현실적인 ᄀ

ᅡᆼ우의 공간분포를나타내는것으로 보인다.

보

ᆫ연구는한정된강우사상을이용하였으므로 더 많은강우사상에 적용하여 모형에 대한 검증이 필요 ᄒ

ᅡ다. 향후 강우의 패턴을 군집화하여 모형의 예측성능을평가한다면 강우가 발생하였을 때 적절한 합 서

ᆼ장을제공할 수 있을것이다. 또한 고도 및 해안선과 같은지형적 특성과 바람에 의한 이류효과 등을 ᄀ

ᅩ려한다면 보다 정확한 강우 추정이 가능할 것으로 생각된다.

References

Breiman, L. (2001). Random forests. Machine learning, 45, 5-32.

Cho, H. L. and Jeong, J. C. (2007). Mapping of environmental data using spatial interpolation methods.

Journal of The Korea Society for Geospatial Information Science, 273-279.

Hastie, T. and Tibshirani, R. (1986). Generalized additive models. Statistical Science, 1, 297-318.

Hengl, T., Nussbaum, M., Wright, M. N. and Heuvelink, G. B. (2018). Random forest as a generic framework for predictive modeling of spatial and spatio-temporal variables. PeerJ Preprints.

Im, J. and Yoon, S. (2018). Production of agrometeorological information in onion fields using geostatistical models. Journal of Environmental Science International , 27, 509-518.

Jang, H., Kang, N., Noh, H., Lee, D. R., Choi, C. and Kim, H. S. (2015). Applicability of spatial interpo- lation methods for the estimation of rainfall field. Journal of Wetlands Research, 17, 370-379 Kim, B. S., Hong, J. B., Kim, H. S. and Yoon, S. Y. (2007). Combining radar and rain gauge rainfall

estimates for flood forecasting using conditional merging method. Journal of the Korean Society of Civil Engineers, 27, 255-265.

Kim, B. S., Kim, H. S. and Yang, D. M. (2010). Comparison of spatial distributions of rainfall derived from rain gages and a radar. Journal of Wetlands Research, 12, 63-73.

Kim, J. P., Lee, W.-S., Cho, H. and Kim, G. (2014). Estimation of high resolution daily precipitation using a modified PRISM model. Journal of the Korean Society of Civil Engineers, 34, 1139-1150.

Kim, K.-H., Kim, M.-S., Lee, G. W., Kang, D.-H. and Kwon, B.-H. (2013). The adjustment of radar pre- cipitation estimation based on the kriging method. The Journal of the Korean Earth Science Society, 34, 13-27.

Kim, Y. W., Hong, S. Y. and Jang, M. W. (2011). Comparison between spatial interpolation methods of temperature data for garlic cultivation. Journal of the Korean Society of Agricultural Engineers, 53, 1-7.

Park, N.-W. and Jang, D.-H. (2008). Mapping of temperature and rainfall using DEM and multivariate

kriging. Journal of Korean Geographical Society, 43, 1002-1015.

(12)

Park, Y. and Kim, Y. M. (2017). Bayesian analysis of adjustment function for wind-induced loss of precip- itation. Journal of the Korean Data & Information Science Society, 28, 483-492.

Shepard, D. (1968). A Two-dimensional interpolation function for irregularly spaced data. Proceedings of the 1968 23rd ACM National Conference, 517-524.

Shin, T. S., Lee, G. and Kim. Y. (2017). A spatiotemporal adjustment of precipitation using radar data and AWS data. Journal of the Korean Data & Information Science Society, 28, 39-47.

Yoon, S. (2017). Generating High resolution of daily mean temperature using statistical models. Journal of the Korean Data & Information Science Society, 27, 1215-1224.

Yoon, S.-S., Lee, B. and Choi, Y. (2015). Quantitative precipitation estimation using high density rain

gauge network in seoul area. Atmosphere, 25, 283-294.

(13)

2019, 30

(

1)

,

77–89

Comparison of quantitative precipitation estimate using geostatistical models

Jieun Im

1

· Sanghoo Yoon

2

1Department of Statistics, Daegu University

2Division of Mathematics and Big Data Science, Daegu University

Received 3 December 2018, revised 2 January 2019, accepted 2 January 2019

Abstract

Precipitation is necessary data for hydrological studies to reduce the damage caused by meteorological disasters such as heavy rainfall. There are being conducted studies of combining gauge data and radar data to improve quantitative precipitation estimate.

The advantage of radar is monitoring the rainfall phenomenon over a large area and can estimate the rainfall at the non-measurement sites. This study considered geostatistical models for quantitative precipitation estimate. The models used are inverse distance weight, generalized additive model, kriging, and spatial random forest. To evaluate the prediction performance, 10-folds cross-validation was repeated 50 times and root mean square error, mean absolute error, relative bias is calculated. As a result, inverse distance weight performs best when rainfall was low and spatial range was local. In the opposite situation, ordinary kriging performs best. A spatial random forest was regarded as robust predictors regardless of rainfall intensity. Spatial random forest performs well when time resolution is high. however ordinary kriging performs best for low time resolution.

Keywords: Generalized addictive model, kriging, spatial random forest.

This research was supported by the Daegu University Research Grant, 2016.

1

Master’s course, Department of Statistics, Daegu University, Gyeongbuk 68453, Korea.

2

Corresponding author: Assistant professor, Division of Mathematics and Big Data Science, Daegu

University, Gyeongbuk 68453, Korea. E-mail: [email protected]

수치

Figure 2.1 Spatial random forest process (Hengl et al., 2018)
Table 4.1 Predcition performance for all events (mean (sd))
Figure 4.1 Prediction performance by day.
Table 4.3 CC according to the number of stations (mean (sd))
+4

참조

관련 문서