Development and validation of a deep neural network for predicting SPI of Nakdong river basin<sup>†</sup>

(1)

2019, 30

(

6)

,

1277–1287

낙동강 유역의 SPI 예측을 위한 심층신경망 개발 및 검증

^†

ᄎ

ᅬ영태¹·이경은²· 김광섭³

12경북대학교 통계학과 ·³경북대학교 토목공학과

ᄌ ᅥ

ᆸᄉ ᅮ 2019ᄂ ᅧ ᆫ 10ᄋ ᅯ ᆯ 31ᄋ ᅵ ᆯ, ᄉ ᅮᄌ ᅥ ᆼ 2019ᄂ ᅧ ᆫ 11ᄋ ᅯ ᆯ 15ᄋ ᅵ ᆯ, ᄀ ᅦᄌ ᅢ ᄒ ᅪ ᆨᄌ ᅥ ᆼ 2019ᄂ ᅧ ᆫ 11ᄋ ᅯ ᆯ 15ᄋ ᅵ ᆯ

요 약

ᄇ

ᅩ ᆫ ᄋ ᅧ ᆫᄀ ᅮᄋ ᅦᄉ ᅥ, ᄂ ᅡ ᆨᄃ ᅩ ᆼ ᄀ ᅡ ᆼ ᄋ ᅲᄋ ᅧ ᆨᄋ ᅴ SPI6ᄅ ᅳ ᆯ ᄋ ᅨᄎ ᅳ ᆨ ᄒ ᅡᄀ ᅵ ᄋ ᅱᄒ ᅢ ᄉ ᅵ ᆫᄀ ᅧ ᆼᄆ ᅡ ᆼ ᄆ ᅩᄒ ᅧ ᆼ ᄌ ᅮ ᆼ ᄒ ᅡᄂ ᅡᄋ ᅵ ᆫ ᄃ ᅡᄎ ᅳ ᆼ ᄑ ᅥᄉ ᅦ ᆸᄐ ᅳᄅ ᅩ ᆫ (MLP;

multilayer perceptron)ᄋ ᅳ ᆯ ᄌ ᅥ ᆨᄋ ᅭ ᆼᄒ ᅢ ᆻᄃ ᅡ. ᄋ ᅯ ᆯᄇ ᅧ ᆯ ᄑ ᅭᄌ ᅮ ᆫ ᄀ ᅡ ᆼᄉ ᅮᄌ ᅵᄉ ᅮ, ᄀ ᅵᄋ ᅩ ᆫ, ᄀ ᅵᄋ ᅩ ᆫ ᄑ ᅧ ᆼᄂ ᅧ ᆫᄀ ᅡ ᆹ, ᄀ ᅡ ᆼᄉ ᅮᄅ ᅣ ᆼ, ᄀ ᅡ ᆼᄉ ᅮ ᄑ ᅧ ᆼᄂ ᅧ ᆫ ᄀ ᅡ ᆹ, ᄀ

ᅡ ᆼᄉ ᅮᄋ ᅵ ᆯᄉ ᅮ, ᄀ ᅳᄅ ᅵᄀ ᅩ ᄋ ᅧᄅ ᅥᄀ ᅡᄌ ᅵ ᄉ ᅦᄀ ᅨᄀ ᅵᄒ ᅮᄌ ᅵᄉ ᅮᄅ ᅳ ᆯ ᄉ ᅥ ᆯᄆ ᅧ ᆼ ᄇ ᅧ ᆫᄉ ᅮᄅ ᅩ ᄉ ᅡᄋ ᅭ ᆼᄒ ᅢ ᆻᄋ ᅳᄆ ᅧ, ᄎ ᅬᄌ ᅥ ᆨᄋ ᅴ ᄆ ᅩᄒ ᅧ ᆼᄋ ᅳ ᆯ ᄎ ᅡ ᆽᄀ ᅵ ᄋ ᅱᄒ ᅢ ᄃ ᅮ ᄀ ᅡ ᄌ

ᅵᄋ ᅴ ᄒ ᅪ ᆯᄉ ᅥ ᆼᄒ ᅡ ᆷᄉ ᅮ, ᄂ ᅦ ᄀ ᅡᄌ ᅵᄋ ᅴ ᄋ ᅳ ᆫᄂ ᅵ ᆨᄎ ᅳ ᆼᄇ ᅧ ᆯ ᄂ ᅲᄅ ᅥ ᆫ ᄉ ᅮ, ᄃ ᅡᄉ ᅥ ᆺ ᄀ ᅡᄌ ᅵ ᄌ ᅮ ᆼ ᄃ ᅩᄐ ᅡ ᆯᄅ ᅡ ᆨ ᄇ ᅵᄋ ᅲ ᆯ (dropout rate), ᄃ ᅡᄉ ᅥ ᆺ ᄀ ᅡᄌ ᅵ ᄋ ᅳ ᆫ ᄂ ᅵ

ᆨᄎ ᅳ ᆼ ᄉ ᅮ, ᄃ ᅮ ᄀ ᅡᄌ ᅵ ᄉ ᅩ ᆫᄉ ᅵ ᆯ ᄒ ᅡ ᆷᄉ ᅮᄅ ᅳ ᆯ ᄀ ᅩᄅ ᅧᄒ ᅡᄋ ᅧ ᆻᄃ ᅡ. ᄆ ᅩᄒ ᅧ ᆼ ᄑ ᅧ ᆼᄀ ᅡ ᄀ ᅵᄌ ᅮ ᆫ ᄋ ᅳᄅ ᅩ ᄀ ᅥ ᆷᄌ ᅳ ᆼᄑ ᅧ ᆼᄀ ᅲ ᆫ ᄌ ᅦᄀ ᅩ ᆸ ᄋ ᅩᄎ ᅡ (validation mean square error)ᄅ ᅳ ᆯ ᄋ ᅵᄋ ᅭ ᆼ ᄒ ᅡᄋ ᅧ ᄀ ᅡᄌ ᅡ ᆼ ᄌ ᅩ ᇂᄋ ᅳ ᆫ ᄆ ᅩᄒ ᅧ ᆼᄋ ᅳ ᆯ ᄎ ᅡ ᆽᄀ ᅩᄌ ᅡ ᄒ ᅡᄋ ᅧ ᆻᄃ ᅡ. SPI6ᄅ ᅳ ᆯ ᄋ ᅨᄎ ᅳ ᆨ ᄒ ᅡ ᆷᄋ ᅦ ᄋ ᅵ ᆻᄋ ᅥᄉ ᅥ, L

1

ᄌ ᅥ ᆼᄀ ᅲᄒ ᅪᄅ ᅳ ᆯ ᄌ

ᅥ

ᆨᄋ ᅭ ᆼ ᄒ ᅡ ᆫ ᄆ ᅩᄒ ᅧ ᆼᄋ ᅵ ᄌ ᅥ ᆨᄋ ᅭ ᆼ ᄒ ᅡᄌ ᅵ ᄋ ᅡ ᆭᄋ ᅳ ᆫ ᄆ ᅩᄒ ᅧ ᆼᄇ ᅩᄃ ᅡ ᄀ ᅥ ᆷᄌ ᅳ ᆼᄑ ᅧ ᆼᄀ ᅲ ᆫ ᄌ ᅦᄀ ᅩ ᆸ ᄋ ᅩᄎ ᅡ (validation mean square error)ᄀ ᅡ ᄒ ᅡ ᆼᄉ ᅡ ᆼ ᄃ

ᅥ ᄂ ᅡ ᆽᄋ ᅡ ᆻᄋ ᅳᄆ ᅧ, ᄃ ᅢᄇ ᅮᄇ ᅮ ᆫ ᄋ ᅴ ᄌ ᅵᄋ ᅧ ᆨᄋ ᅦᄉ ᅥ ᄋ ᅳ ᆫᄂ ᅵ ᆨᄎ ᅳ ᆼ ᄉ ᅮᄀ ᅡ ᄌ ᅥ ᆨᄋ ᅳ ᆯ ᄉ ᅮᄅ ᅩ ᆨ ᄀ ᅥ ᆷᄌ ᅳ ᆼᄑ ᅧ ᆼᄀ ᅲ ᆫ ᄌ ᅦᄀ ᅩ ᆸ ᄋ ᅩᄎ ᅡ (validation mean square error)ᄀ ᅡ ᄃ ᅥ ᄂ ᅡ ᆽᄋ ᅳ ᆫ ᄀ ᅧ ᆼᄒ ᅣ ᆼᄋ ᅳ ᆯ ᄇ ᅩᄋ ᅧ ᆻᄃ ᅡ.

ᄌ

ᅮᄋ ᅭᄋ ᅭ ᆼ ᄋ ᅥ: ᄀ ᅥ ᆷᄌ ᅳ ᆼᄑ ᅧ ᆼᄀ ᅲ ᆫ ᄌ ᅦᄀ ᅩ ᆸ ᄋ ᅩᄎ ᅡ, ᄃ ᅡᄎ ᅳ ᆼ ᄑ ᅥᄉ ᅦ ᆸᄐ ᅳᄅ ᅩ ᆫ, ᄉ ᅵ ᆫᄀ ᅧ ᆼᄆ ᅡ ᆼ ᄆ ᅩᄒ ᅧ ᆼ, ᄋ ᅳ ᆫᄂ ᅵ ᆨᄎ ᅳ ᆼ ᄉ ᅮ, ᄉ ᅩ ᆫᄉ ᅵ ᆯ ᄒ ᅡ ᆷᄉ ᅮ, L

1

ᄌ ᅥ ᆼᄀ ᅲᄒ ᅪ, SPI6.

1. 서론 ᄀ

ᅡ뭄은 일종의 자연재해로, 수 개월 혹은수 년에 걸쳐 물 공급이 부족한 상황을 일컫는다. 가뭄의 영 ᄒ

ᅣᆼ을 받은지역에서는 생태계와 농업에 막대한 피해가 있을수 있고, 더 나아가서 지역 경제에 피해를 ᄁ

ᅵ칠 수 있다. 실제 미국에서 가뭄으로 인한 피해 비용추정치가 매년 6-80억 달러에 이르고, 유럽에서 느

ᆫ 53억 유로에 이르는것으로 추산된다. 중국에서는 가뭄이 가장 피해가 많은자연재해이며, 한국 또 ᄒ

ᅡᆫ 지리적으로 여름에 극단적으로 비가 많고, 봄, 가을에는 극단적으로 비가 적어서 가뭄에 더 민감한 겨

ᆼ향이 있다. 따라서 가뭄의 피해를 줄이기 위한 여러가지 방법들이 모색되고 있는데, 가뭄의 정확한 예 ᄎ

ᅳ

ᆨ은효과적인 가뭄모니터링 시스템과 효율적인완화 전략 개발에 중요한 요소이다. 가뭄예측은가뭄 ᄋ

ᅳ로 인한 피해에 더 빠르고 정확하게 대응할 수 있게 해주며, 자원을효과적으로 할당할 수 있게 도와 ᄌ

ᅮ기 때문에 가뭄비용을 줄이는데 중요한 역할을수행한다. 기상, 수자원, 농업, 사회분야에서 상대적 ᄋ

ᅳ로 간단한 지수부터 매우 복잡한 지수 등여러 형태의 가뭄지수가 개발되어왔으나 계산과정과 사용성 ᄋ

ᅦ 있어서 간단하면서도 물리적 설득력을가지는지수가 요구되고 있다. 이러한 필요를 충족시키는 대 ᄑ

ᅭ적 가뭄지수로서 강수량만을 입력자료로 활용하여 평년값에 비하여 당월 누적강수량의 확률적 위치 르

ᆯ나타내고 단기, 중기, 장기 가뭄의 심도를유연하게 나타낼 수 있는 SPI (standardized precipitation

†

ᄇ ᅩ ᆫ ᄋ ᅧ ᆫᄀ ᅮᄂ ᅳ ᆫ ᄒ ᅪ ᆫᄀ ᅧ ᆼᄇ ᅮ/ᄒ ᅡ ᆫᄀ ᅮ ᆨᄒ ᅪ ᆫᄀ ᅧ ᆼᄉ ᅡ ᆫᄋ ᅥ ᆸᄀ ᅵᄉ ᅮ ᆯᄋ ᅯ ᆫ ᄋ ᅴ ᄌ ᅵᄋ ᅯ ᆫ ᄋ ᅳᄅ ᅩ ᄉ ᅮᄒ ᅢ ᆼᄃ ᅬᄋ ᅥ ᆻᄋ ᅳ ᆷ (ᄀ ᅪᄌ ᅦᄇ ᅥ ᆫᄒ ᅩ 83067).

1

(41566) ᄃ ᅢᄀ ᅮᄉ ᅵ ᄇ ᅮ ᆨ ᄀ ᅮ ᄉ ᅡ ᆫᄀ ᅧ ᆨᄃ ᅩ ᆼ ᄃ ᅢᄒ ᅡ ᆨᄅ ᅩ 80, ᄀ ᅧ ᆼᄇ ᅮ ᆨ ᄃ ᅢᄒ ᅡ ᆨᄀ ᅭ ᄐ ᅩ ᆼ ᄀ ᅨᄒ ᅡ ᆨᄀ ᅪ, ᄇ ᅡ ᆨᄉ ᅡᄀ ᅪᄌ ᅥ ᆼ.

2

(41566) ᄃ ᅢᄀ ᅮᄉ ᅵ ᄇ ᅮ ᆨ ᄀ ᅮ ᄉ ᅡ ᆫᄀ ᅧ ᆨᄃ ᅩ ᆼ ᄃ ᅢᄒ ᅡ ᆨᄅ ᅩ 80, ᄀ ᅧ ᆼᄇ ᅮ ᆨ ᄃ ᅢᄒ ᅡ ᆨᄀ ᅭ ᄐ ᅩ ᆼ ᄀ ᅨᄒ ᅡ ᆨᄀ ᅪ, ᄇ ᅮᄀ ᅭᄉ ᅮ.

3

ᄀ ᅭᄉ ᅵ ᆫᄌ ᅥᄌ ᅡ: (41566) ᄃ ᅢᄀ ᅮᄉ ᅵ ᄇ ᅮ ᆨ ᄀ ᅮ ᄉ ᅡ ᆫᄀ ᅧ ᆨᄃ ᅩ ᆼ ᄃ ᅢᄒ ᅡ ᆨᄅ ᅩ 80, ᄀ ᅧ ᆼᄇ ᅮ ᆨ ᄃ ᅢᄒ ᅡ ᆨᄀ ᅭ ᄐ ᅩᄆ ᅩ ᆨᄀ ᅩ ᆼ ᄒ ᅡ ᆨᄀ ᅪ, ᄀ ᅭᄉ ᅮ.

E-mail: [email protected]

(2)

Index)가 개발되었다 (McKee 등, 1993). SPI지수 개발 이후, 이를적용한 가뭄 분석과 예측연구가 전 ᄉ

ᅦ계적으로 많이 이루어지고 있다 (Ali 등, 2019; Bonaccorso 등, 2015; Wu 등, 2007).

ᄇ

ᅩᆫ 연구에서는 가뭄지수 중 하나인 SPI6를 예측하는 심층신경망 모형 개발에 그 목적을 둔다. 예측 ᄇ

ᅧᆫ수로는 23개의 세계기후지수 (Table 3.1 참고)를사용하였으며, 추가적으로 월별 표준강수지수, 기온, ᄀ

ᅵ온 평년값, 강수량, 강수 평년값, 강수일수 또한 사용하였다. 제 2절에서는 인공 신경망의 한 종류인 ᄃ

ᅡ층퍼셉트론에 대한 내용을, 제 3절에서는 본연구에서 사용한 자료와 모형 적용방법에관한 정리, 그 ᄅ

ᅵ고 그 결과들을서술하고 있으며, 제 4절은결론으로, 전체적인 내용을정리하고 있다.

2. 심층신경망 모형 보

ᆫ 연구에서는 인공 신경망의 한 종류인 다층 퍼셉트론 (multilayer perceptron; MLP)을사용하였 ᄃ

ᅡ. 다층퍼셉트론은 입력층 (input layer)과 출력층 (output layer)사이에 하나 이상의 은닉층 (hidden layer)을 가지는 구조로, 단층 퍼셉트론과 다르게 배타적 논리합 (exclusive or; XOR) 함수를 학습할 ᄉ

ᅮ 있는 등 더 좋은 성능을 낸다는 사실이 알려져 있다 (Minsky and Papert, 1988). 은닉층이 하나 ᄋ

ᅵᆫ 다층 퍼셉트론을 바닐라 신경망 (vanilla neural networks)이라고 부르기도 한다. 은닉층과 출력층 ᄋ

ᅳ

ᆫ여러 개의 인공뉴런 (artificial neuron)이라고 하는간단한 연산기능을갖는처리기로 이루어져 있는 ᄃ

ᅦ, 이 인공뉴런의 자세한 기능은다음과 같다. 단순히 입력된신호 x = (x1, x2, . . . , xn)를연결가중치 w = (w0, w1, w2, . . . , wn)와 내적한 다음,그 결과에 비선형 함수 f를취하는것이다. 즉, 출력 y의 값 ᄋ

ᅳ

ᆫ다음과 같은 식 2.1에 의해 계산된다.

y = f w0+

n

X

i=1

wi· xi

!

, (2.1)

ᄋ

ᅵ 때 동일한 입력 x를 가했을때의 출력은 w에 따라 다른값이된다. 따라서 정보는 바로 연결 가중 ᄎ

ᅵ 벡터 w에 저장된다고 볼수 있다. 또한, f 는활성함수 (activation function)라고 하며, 일반적으로 ᄇ

ᅵ선형 함수를사용한다. 만일 다층퍼셉트론의활성함수가 모두 선형이라면, 선형대수에 의해서 어떤 ᄃ

ᅡ층퍼셉트론도 2층의 입력-출력 모형 (two-layer input-output model)으로 축약될수 있으므로, 선형 ᄒ

ᅡᆷ수를 사용할 경우, 선형회귀분석과 같은 결과를 얻게 된다. 대중적인 활성함수로는 렐루 (Rectified linear unit; ReLU),시그모이드 함수 (sigmoid function), 하이퍼볼릭 탄젠트 함수 (hyperbolic tangent function)와 맥스아웃 (maxout)이 있으며, 이들 중몇 가지의 자세한 내용은다음과 같다.

• 렐루 (rectified linear unit; ReLU)

f (x) = max(0, x), (2.2)

• 시그모이드 함수 (sigmoid function)

f (x) = 1

1 + e^−x, (2.3)

• 하이퍼볼릭 탄젠트 함수 (hyperbolic tangent function)

f (x) = e^x− e^−x

e^x+ e^−x, (2.4)

• 맥스아웃 (maxout)

f (x1, x2, . . . , xk) = max

j∈J xj, J = {1, 2, . . . , k}, (2.5)

(3)

• 아크탄젠트 (arctangent function)

f (x) = tan⁻¹(x), (2.6)

• 리키 렐루 (leaky rectified linear unit; leaky ReLU)

f (x) = max(0.01x, x). (2.7) 보

ᆫ연구에서는이 중성능은다른활성함수에 비해 크게 뒤쳐지지 않으나 학습 속도가 비교적 빠르다 ᄀ

ᅩ 알려진 두 가지 활성함수인 렐루와 맥스아웃을사용하였다 (Nair와 Hinton, 2010; Goodfellow 등, 2013).

ᄒ

ᅡᆨ습 (learning)이란, 이러한 인공뉴런의 연결가중치를주어진 손실함수 (loss function)에 대해 최적 ᄒ

ᅪ하는과정이다. 다음은 딥러닝에서 흔히 사용하는최적화 방법이다.

• SGD (stochastic gradient descent)

• NAG (Nesterov-accelerated gradient; Yurii Nesterov., 1983)

• Adagrad (adaptive gradient algorithm; John Duchi, 2011)

• Adadelta (adaptive learning rate method; Matthew D. Zeiler., 2012.)

• Adam (adaptive moment estimation; Kingma and Ba, 2014)

• Nadam (Nesterov-accelerated adaptive moment estimation; Timothy Dozat., 2016) 보

ᆫ연구에서는 이들 중하나인 Adam을사용하였다. 이 방법은 그래디언트 (gradient)가 커져도 이동 ᄏ

ᅳ기 (stepsize)에는한계가 있어, 어떤 손실함수를사용한다 하더라도 안정적으로 최적화가 가능하다는 ᄌ

ᅡᆼ점이 있다.

ᄄ

ᅩ한 손실함수는 평균제곱오차 (mean square error; MSE)와 L1 정규화를 사용한 평균제곱오차 (mean square error with L1 regularization)를사용하였다. L1 정규화를 이용하면 인공뉴런의 연결 ᄀ

ᅡ중치 중 일부를 0 혹은 0에 매우 가까운값으로 만들어주게 되므로, 입력된신호 중 일부를고려하지 ᄋ

ᅡ

ᆭ게 되는, 변수선택의 역할을하게된다. 두 평균제곱오차의 수식은다음과 같다.

• 평균제곱오차

L(ˆy) =1

n||y − ˆy||²₂, (2.8)

• L1정규화를사용한 평균제곱오차

L(ˆy) = 1

n||y − ˆy||²₂+ λ||w||1. (2.9) ᄋ

ᅵ 때, n은관측치 갯수이고, || · ||^p는 Lp-노름 (norm)이다.

보

ᆫ연구에서는각 지역의 현재 시점에 대한 SPI6를 종속변수로, 월별 표준강수지수, 기온,기온평년 ᄀ

ᅡ

ᆹ, 강수량, 강수 평년값, 강수일수, 그리고 여러 가지의 세계기후지수를설명변수로 두었다. 이를 다 ᄎ

ᅳ

ᆼ퍼셉트론을이용하여 분석하였으며,활성함수로는 렐루와 맥스아웃,두 가지를, 은닉층별 뉴런수로는 10, 30, 50과 100, 네 가지를, 중도탈락 비율 (dropout rate)로는 0%, 10%, 30%, 50%, 80%,다섯 가지 르

ᆯ, 은닉층수로는 1, 2, 3, 4, 5다섯가지를, 손실함수로는평균제곱오차와 L1 정규화를사용한 평균제 고

ᆸ오차를각각 적용하여 이들 중최적의 모형을 찾고자 하였다. 세부적인 사항은 3절에서 다루도록 하 게

ᆻ다.

(4)

3. 모형 적용 ᄀ

ᅢ발된심층신경망 가뭄예측모형의 적용성을검증하기 위하여 유역 연강수량이 5대강 유역에서 가 ᄌ

ᅡᆼ 작으며 가뭄피해의 발생빈도가 높은낙동강 유역을대상 지역으로 선정하였다. 낙동강 유역에 위치 ᄒ

ᅡᆫ 기상청에서 운영하는 20개 종관기상관측지점에서관측된1974년에서 2018년 강수량 자료를사용하 ᄋ

ᅧ SPI6를산정하였다. 낙동강 유역의 기후지수 자료가 존재하는 24개 지역 중,관측기간이 비교적 짧 ᄋ

ᅳᆫ 4개 지역 (안동, 상주, 마산, 봉화)을제외한 나머지 20개 지역 (울진, 포항, 대구, 울산, 부산, 통영, ᄌ

ᅵᆫ주, 태백, 영주, 문경, 영덕, 의성, 구미, 영천, 거창, 합천, 밀양, 산청, 거제, 남해)에 대해서 분석을 시

ᆯ시하였다.

Figure 3.1은 20개 지역을우리나라 지도상에 표시한 것이다. 1974년 1월부터 2017년 6월까지 522개 ᄋ

ᅯ

ᆯ간의 월별 표준강수지수, 기온,기온평년값, 강수량, 강수 평년값, 강수일수, 그리고 여러가지 세계기 ᄒ

ᅮ지수를사용했으며, Table 3.1은 본연구에 사용한 총 23가지 지수의 세부사항이다. 또한 모형을 평 ᄀ

ᅡ하기 위해 522개월을시간 순으로 105, 105, 104, 104, 104 개월으로 5등분하여 다중교차타당성 방법 으

ᆯ사용하였다.

Figure 3.1 The map for the 20 region. To evaluate the model, we used the Validation Mean Square error as an evaluation standard. in Nakdong River Basin.

보

ᆫ연구에서는각 지역의 현재 시점에 대한 SPI6를 종속변수로 두고, 각 지역별로 월별 표준강수지수, ᄀ

ᅵ온, 기온평년값, 강수량, 강수 평년값, 강수일수, 그리고 여러 가지의 세계기후지수와 같은각 변수들 ᄋ

ᅴ 1개월 전부터 12개월 전까지의관측값을설명변수로 두었다. 이를다층퍼셉트론을이용하여 분석하 ᄋ

ᅧᆻ으며, 활성함수로는 렐루와 맥스아웃, 두 가지를, 은닉 층 별 뉴런수로는 10, 30, 50와 100, 네 가지 르

ᆯ, 중도탈락 비율 (dropout rate)로는 0%, 10%, 30%, 50%, 80%, 다섯 가지를적용한 후 최적 모형을 ᄉ

ᅥᆫ택하고자 하였다. 특히 은닉층수로는 1, 2, 3, 4, 5,다섯 가지를적용하여, 최적의 은닉층수를찾고 ᄌ

ᅡ 하였으며, 손실함수로는평균제곱오차와 L¹ 정규화를사용한 평균제곱오차를각각 적용하여, L¹ 정 ᄀ

ᅲ화 적용전과 후의 결과를비교하고, 최적의 모형을찾고자 하였다.

Table 3.2는 20개 지역 중 지역 인구가 많은대표 5개 지역에 대해 각 지역별 400가지 모형 중검증 펴

ᆼ균제곱오차 (validation mean square error)가 가장 작은모형을선택하여 나타낸 표이다. 이 표에 나 ᄐ

ᅡ난 대표지역 외 15개 지역도 모두 고려했을때, L¹ 정규화를적용한 모형이 항상 최적의 모형으로 선

(5)

Table 3.1 23 World climate indices

World climate index Description

PNA Pacific North American Index

WP Western Pacific Index

NAO North Atlantic Oscillation SOI Southern Oscillation Index NINO3 Eastern Tropical Pacific SST

BEST Bivariate ENSO Timeseries

TNA Tropical Northern Atlantic Index TSA Tropical Southern Atlantic Index

WHWP Western Hemisphere warm pool

ONI Oceanic Nino Index

MEI Multivariate ENSO Index

NINO12 Extreme Eastern Tropical Pacific SST NINO4 Central Tropical Pacific SST NINO34 East Central Tropical Pacific SST PDO Pacific Decadal Oscillation

NP North Pacific pattern

TNI Trans-Nino Index

AO Antarctic Oscillation

AMO Atlantic multidecadal Oscillation

AMM Atlantic Meridional Mode

QBO Quasi-Biennial Oscillation

SOLAR Solar Flux

GMLOT Global Mean Land/Ocean Temperature Index

Table 3.2 MLP having the lowest validation MSE in each representative region.

Region Busan Daegu Ulsan Pohang Gumi

Activation function Maxout Maxout Maxout Maxout ReLU

# of neuron in a layer 100 100 100 100 100

Dropout rate 0.5 0.5 0.5 0.5 0.3

# of hidden layers 1 1 1 1 4

L₁regularization Applied Applied Applied Applied Applied

MSE 0.2575 0.2573 0.1011 0.2085 0.3938

태

ᆨ됨을알 수 있다.

Figure 3.2은 부산지역의 훈련자료 (training data)와 검증자료 (validation data)에 대한 학습반복 ᄉ

ᅮ (epochs)에 따른제곱근평균제곱오차 (root mean square error)에 대한 추적 그림 (trace plot)이다.

ᄉ

ᅡᆼ단은 L1 정규화를적용하지 않은경우이고, 하단은 L1 정규화를적용한 경우이며, 실선은 훈련자료 (training data), 점선은 검증자료 (validation data)의 평균을각각 나타내었다. 이 때, 활성함수로는 매

ᆨ스아웃, 은닉층별 뉴런 수는 100개, 중도탈락비율은 0.5, 은닉층수는 1로 고정하였다. 이 그림에 따 ᄅ

ᅳ면, L1 정규화를적용하지 않은경우, 중도탈락을적용했음에도 불구하고 학습수가 늘어남에 따라 과 ᄌ

ᅥᆨ합 (overfitting)이 일어나고 있으나, L1 정규화를적용한 경우 과적합도 일어나지 않고 검증집합의 최 ᄌ

ᅥᆨ 제곱근평균제곱오차도 L¹정규화를적용하지 않은경우보다 더 낮게 나옴을알 수 있다.

Figure 3.3은지역별로 은닉층수와 L1 정규화 적용유무를고정하고활성함수, 은닉층별 뉴런 수, 중 ᄃ

ᅩ탈락비율의 여러 조합 중최적 모형의 제곱근평균제곱오차 선그림이다. 여기서 지속 (persistant)은 ᄋ

ᅵ전 달의 SPI6 값이 다음달에 계속이어진다고 가정 했을때의 값이며, 제곱근평균제곱오차가 이 값보 ᄃ

ᅡ 크면 추론이 아무런 의미가 없으므로 최저 기준으로 사용할 수 있는값이다. 여기서 제시된제곱근평 규

ᆫ제곱오차는 검증자료의 제곱근평균제곱오차이다. 이 선그림을보면 대다수의 지역에서 L1 정규화를

(6)

NONEL1

0 25 50 75 100

0.2 0.3 0.4 0.5 0.6 0.7

epochs

RMSE

train

TRAINING VALIDATION

Figure 3.2 RMSE according to epochs for training data and validation data in Busan

0.3 0.4 0.5 0.6 0.7

Persistent H1 H2 H3 H4 H5 H1+L1 H2+L1 H3+L1 H4+L1 H5+L1 Models

RMSE

Busan Daegu

Geochang Geoje

Gumi Hapcheon

Jinju Miryang

Mungyeong Namhae

Persistent H1 H2 H3 H4 H5 H1+L1 H2+L1 H3+L1 H4+L1 H5+L1 Models

Pohang Sancheong

Taebaek Tongyeong

Uiseong Uljin

Ulsan Yeongcheon

Yeongdeok Yeongju

Figure 3.3 The line plot of optimal RMSE according to the number of hidden layers and L₁regularization. The number following H means the number of hidden layers, and L1 means L1regularization on the ”Models” axis.

(7)

0.4 0.6 0.8 1.0

Persistent H1 H2 H3 H4 H5 H1+L1 H2+L1 H3+L1 H4+L1 H5+L1

Models

RMSE

Figure 3.4 The box plot of optimal RMSE according to the number of hidden layers and L1regularization. The number following H means the number of hidden layers, and L1 means L₁regularization on the ”Models” axis.

ᄌ ᅥ

ᆨ용시키고 은닉층수가 1개인 모형의 제곱근평균제곱오차가 가장 낮음을 볼수 있다. 또한, L1 정규화 ᄅ

ᅳᆯ적용시킨 모형의 제곱근평균제곱오차가 적용시키지 않은모형보다 낮으며, 은닉층수가 적을수록더 ᄂ

ᅡ

ᆽ음은경향이 있음을알 수 있다.

Figure 3.4는 은닉층수와 L1 정규화 적용유무를고정하고활성함수, 은닉층별 뉴런 수, 중도탈락비 ᄋ

ᅲᆯ의 여러 조합 중최적 모형의 제곱근평균제곱오차에 대한 상자그림이다. 여기서도 마찬가지로 은닉층 ᄉ

ᅮ가 많은모형보다 적은모형이, L¹정규화를적용시키지 않은모형보다 적용시킨 모형이 더 낮은제곱 ᄀ

ᅳᆫ평균제곱오차를산출하는경향이 있음을시각적으로 알 수 있다.

Table 3.3은지역별 최적 모형을모형별로 정리한 표이다. 선택된 최종 모형들은모두 L1 정규화가 ᄌ

ᅥ

ᆨ용됨을알 수 있고, 많은지역에서 은닉층 1개인 모형이 선택되었음을알 수 있다.

(8)

Table 3.3 Regions and the number of regions by optimal model Model

Regions # of regions

# of hidden layers L1regularization

Busan, Daegu, Mungyeong, Namhae,

1 Applied Pohang, Sancheong, Taebaek, Uiseong, 12

Uljin, Ulsan, Yeongcheon, Yeongju

2 Applied Geochang, Geoje, Hapcheon, Miryang 4

3 Applied Tongyeong, Yeongdeok 2

4 Applied Gumi 1

5 Applied Jinju 1

4. 결론

Figure 4.1 The maps based on regional forecasts. From top, April, May, and June 2017. Three maps on the left are drawn based on actual observed values, and three on the right are drawn based on predicted values.

Month Observed Predicted

April

May

June

(9)

ᄀ

ᅡ뭄은서서히 퍼지면서도 시공간적으로큰부정적 영향을미치는자연재해로 현황 파악 및 예측의 정 화

ᆨ도를 높여야 하는요구가 높다. 본연구에서는여러 가뭄지수 중다양한 시간스케일의 가뭄현상을나 ᄐ

ᅡ낼 수 있으며 강수량이란 하나의 변수로 가뭄의 심도를제시하는 SPI에 대한 예측모형을구성하였다.

ᄀ

ᅡ뭄예측모형 구성에 있어 가뭄현상의 비선형적 변화특성을 반영하기 위하여 심층신경망기법을적용하 ᄋ

ᅧᆻ다. 개발된예측모형은 가뭄피해 발생빈도가 우리나라 5대강 유역 중에서 가장 높은 낙동강 유역의 ᄀ

ᅡ뭄예측을 통하여 적용성을검증하였다.

ᄄ

ᅡ라서 본연구에서는 1974년부터 522개월간 낙동강 유역의 20개 지역 (울진, 포항, 대구, 울산, 부 ᄉ

ᅡᆫ, 통영, 진주, 태백, 영주, 문경, 영덕, 의성, 구미, 영천, 거창, 합천, 밀양, 산청, 거제, 남해)의 자료 르

ᆯ이용하여 SPI6 값의 예측을수행하였다. SPI6의 예측을위해 지역의 기후자료는 물론세계 기후자 ᄅ

ᅭ를함께 사용하여 예측력을한층 높이고자 하였다. 이를위한 모형으로는 인공 신경망의 한 종류인 다 ᄎ

ᅳ

ᆼ퍼셉트론 (multilayer perceptron; MLP)을사용하였으며, 활성함수, 은닉층별 뉴런 수, 중도탈락 비 유

ᆯ, 은닉층수, L1 정규화 적용유무를고려하여 지역당 400가지 모형 중최적의 모형을찾고자 하였다.

ᄌ

ᅵ역별 최적의 모형으로 예측한 2017년 4-6월 예측값을바탕으로 지도를그리면 Table 4.1 와 같다. 왼 ᄍ

ᅩ

ᆨ그림 3개는 실제관측된값을기반으로 그린 그림이고, 오른쪽그림 3개는예측한 값을기반으로 그 ᄅ

ᅵᆫ 그림이다. 지역별 SPI6를예측함에 있어서, L1 정규화를적용한 모형이 적용하지 않은모형보다 검 ᄌ

ᅳᆼ평균제곱오차 (validation mean square error)가 항상 더 낮았으며, 대부분의 지역에서 은닉층수가 ᄌ

ᅥ

ᆨ을수록검증평균제곱오차 (validation mean square error)가 더 낮은경향을보였다.

이

ᆯ반적으로 심층 신경망 모형은자료가 많이 축적될수록예측력이 높아지게 되므로, 보다 더 오랜 기 ᄀ

ᅡᆫ의 자료를수집하여 분석하게된다면 검증평균제곱오차가 더 낮은모형을찾을수 있을것으로 기대된 ᄃ

ᅡ. 또한 이러한 모형을낙동강 유역의 자료 뿐만 아니라 다른지역의 자료에 마찬가지로 적용할 수 있 ᄋ

ᅳ므로, 전국모든지역에서 SPI6를예측하는데 유용하게 사용될 것이라 기대된다.

References

Ali, M., Deo, R., Maraseni, T. and Downs, N. (2019). Improving spi-derived drought forecasts incorpo- rating synoptic-scale climate indices in multi-phase multivariate empirical mode decomposition model hybridized with simulated annealing and kernel ridge regression algorithms. Journal Of Hydrology, 576, 164-184.

Bonaccorso, B., Cancelliere, A. and Rossi, G. (2015). Probabilistic forecasting of drought class transitions in Sicily (Italy) using Standardized Precipitation Index and North Atlantic Oscillation Index. Journal Of Hydrology, 526, 136-150.

Duchi, J., Hazan, E. and Singer, Y. (2011). Adaptive subgradient methods for online learning and stochastic optimization. The Journal Of Machine Learning Research, 12, 2121-2159.

Goodfellow, I., Warde-Farley, D., Mirza, M., Courville, A. and Bengio, Y. (2013). Maxout networks.

Proceedings of the 30th International Conference on Machine Learning, PMLR, 28:1319-1327 Kingma, D. P. and Ba, J. (2014). Adam: A method for stochastic optimization. CoRR, abs/1412.6980.

Matthew D. Zeiler. (2012). Adadelta: An adaptive learning rate method. arXiv preprint arXiv:1212.5701.

Mckee, T. B., Doesken, N.J. and Kleist, J. (1993) The relationship of drought frequency and duration to time scales. Proceedings of 8th Conference on Applied Climatology, Anaheim, 179-184.

Minsky, M., and Papert, S. (1988). Perceptions. An introduction to computational geometry, The MIT Press: Cambridge.

Nair, V. and Hinton, G. (2010). Rectified linear units improve restricted boltzmann machines. Proceedings of ICML. 27. 807-814.

The H2O.ai team (2017). R interface for h2o, CRAN.

Dozat, T. (2016). Incorporating nesterov momentum into adam. ICLR Workshop, 1, 2013-2016.

Wickham. H., L. (2016). Ggplot2: Elegant graphics for data analysis, New York, NY: Springer-Verlag.

Wu, H., Svoboda, M., Hayes, M., Wilhite, D. and Wen, F. (2007). Appropriate application of the stan-

dardized precipitation index in arid locations and dry seasons. International Journal Of Climatology,

27, 65-79.

(10)

Nesterov, Y. (1983). A method for unconstrained convex minimization problem with the rate of convergence

o(1/k

²

). Doklady ANSSSR (translated as Soviet.Math.Docl.), 269, 543-547.

(11)

2019, 30

(

6)

,

1277–1287

Development and validation of a deep neural network for predicting SPI of Nakdong river basin

^†

Youngtae Choi¹· Kyeong Eun Lee²· Gwangseob Kim³

12Department of Statistics, Kyungpook National University

3Department of Civil Engineering, Kyungpook National University

Received 31 October 2019, revised 15 November 2019, accepted 15 November 2019

Abstract

In this study, we applied a kind of deep neural network, a multilayer perceptron (MLP), to predict SPI6 of Nakdong River Basin. The monthly standard precipitation indices, temperature, temperature normal value, precipitation, normal precipitation, precipitation date, and various global climate indexes are used as explanatory variables.

To find the optimal model, we consider two active functions, four types of the neurons per a hidden layer, five types of dropout rates, five types of the number of hidden layers, and two loss functions. We use the validation mean square error for the evaluation.

The validation mean square error was always lower in the model with (L1normalization than in the model without the normalization. In most areas, the smaller the number of hidden layers, the lower the validation mean square error.

Keywords: Deep neural network, L1 regularization, Mean square error, Multilayer perceptron, Neural network, SPI6, Validation dataset.

†

This work was supported by Korea Environmet Industry & Technology Institute (KEITI) through Advanced Water Management Research Program, funded by Korea Ministry of Environment (Grant.

83067).

1

Ph.D. student, Department of Statistics, Kyungpook National University, 80 Daehak-ro, Buk-gu, Daegu 41566, Korea.

2

Associate professor, Department of Statistics, Kyungpook National University, 80 Daehak-ro, Buk-gu, Daegu 41566, Korea.

3

Development and validation of a deep neural network for predicting SPI of Nakdong river basin<sup>†</sup>

2019, 30

6)

1277–1287

낙동강 유역의 SPI 예측을 위한 심층신경망 개발 및 검증

ᄌ ᅥ

ᆸᄉ ᅮ 2019ᄂ ᅧ ᆫ 10ᄋ ᅯ ᆯ 31ᄋ ᅵ ᆯ, ᄉ ᅮᄌ ᅥ ᆼ 2019ᄂ ᅧ ᆫ 11ᄋ ᅯ ᆯ 15ᄋ ᅵ ᆯ, ᄀ ᅦᄌ ᅢ ᄒ ᅪ ᆨᄌ ᅥ ᆼ 2019ᄂ ᅧ ᆫ 11ᄋ ᅯ ᆯ 15ᄋ ᅵ ᆯ

ᄇ

ᄌ ᅥ ᆼᄀ ᅲᄒ ᅪᄅ ᅳ ᆯ ᄌ

ᅥ

ᆨᄋ ᅭ ᆼ ᄒ ᅡ ᆫ ᄆ ᅩᄒ ᅧ ᆼᄋ ᅵ ᄌ ᅥ ᆨᄋ ᅭ ᆼ ᄒ ᅡᄌ ᅵ ᄋ ᅡ ᆭᄋ ᅳ ᆫ ᄆ ᅩᄒ ᅧ ᆼᄇ ᅩᄃ ᅡ ᄀ ᅥ ᆷᄌ ᅳ ᆼᄑ ᅧ ᆼᄀ ᅲ ᆫ ᄌ ᅦᄀ ᅩ ᆸ ᄋ ᅩᄎ ᅡ (validation mean square error)ᄀ ᅡ ᄒ ᅡ ᆼᄉ ᅡ ᆼ ᄃ

ᄌ

ᄌ ᅥ ᆼᄀ ᅲᄒ ᅪ, SPI6.

ᄇ ᅩ ᆫ ᄋ ᅧ ᆫᄀ ᅮᄂ ᅳ ᆫ ᄒ ᅪ ᆫᄀ ᅧ ᆼᄇ ᅮ/ᄒ ᅡ ᆫᄀ ᅮ ᆨᄒ ᅪ ᆫᄀ ᅧ ᆼᄉ ᅡ ᆫᄋ ᅥ ᆸᄀ ᅵᄉ ᅮ ᆯᄋ ᅯ ᆫ ᄋ ᅴ ᄌ ᅵᄋ ᅯ ᆫ ᄋ ᅳᄅ ᅩ ᄉ ᅮᄒ ᅢ ᆼᄃ ᅬᄋ ᅥ ᆻᄋ ᅳ ᆷ (ᄀ ᅪᄌ ᅦᄇ ᅥ ᆫᄒ ᅩ 83067).

(41566) ᄃ ᅢᄀ ᅮᄉ ᅵ ᄇ ᅮ ᆨ ᄀ ᅮ ᄉ ᅡ ᆫᄀ ᅧ ᆨᄃ ᅩ ᆼ ᄃ ᅢᄒ ᅡ ᆨᄅ ᅩ 80, ᄀ ᅧ ᆼᄇ ᅮ ᆨ ᄃ ᅢᄒ ᅡ ᆨᄀ ᅭ ᄐ ᅩ ᆼ ᄀ ᅨᄒ ᅡ ᆨᄀ ᅪ, ᄇ ᅡ ᆨᄉ ᅡᄀ ᅪᄌ ᅥ ᆼ.

(41566) ᄃ ᅢᄀ ᅮᄉ ᅵ ᄇ ᅮ ᆨ ᄀ ᅮ ᄉ ᅡ ᆫᄀ ᅧ ᆨᄃ ᅩ ᆼ ᄃ ᅢᄒ ᅡ ᆨᄅ ᅩ 80, ᄀ ᅧ ᆼᄇ ᅮ ᆨ ᄃ ᅢᄒ ᅡ ᆨᄀ ᅭ ᄐ ᅩ ᆼ ᄀ ᅨᄒ ᅡ ᆨᄀ ᅪ, ᄇ ᅮᄀ ᅭᄉ ᅮ.

ᄀ ᅭᄉ ᅵ ᆫᄌ ᅥᄌ ᅡ: (41566) ᄃ ᅢᄀ ᅮᄉ ᅵ ᄇ ᅮ ᆨ ᄀ ᅮ ᄉ ᅡ ᆫᄀ ᅧ ᆨᄃ ᅩ ᆼ ᄃ ᅢᄒ ᅡ ᆨᄅ ᅩ 80, ᄀ ᅧ ᆼᄇ ᅮ ᆨ ᄃ ᅢᄒ ᅡ ᆨᄀ ᅭ ᄐ ᅩᄆ ᅩ ᆨᄀ ᅩ ᆼ ᄒ ᅡ ᆨᄀ ᅪ, ᄀ ᅭᄉ ᅮ.

E-mail: [email protected]

epochs

RMSE

train

Bonaccorso, B., Cancelliere, A. and Rossi, G. (2015). Probabilistic forecasting of drought class transitions in Sicily (Italy) using Standardized Precipitation Index and North Atlantic Oscillation Index. Journal Of Hydrology, 526, 136-150.

Duchi, J., Hazan, E. and Singer, Y. (2011). Adaptive subgradient methods for online learning and stochastic optimization. The Journal Of Machine Learning Research, 12, 2121-2159.

Goodfellow, I., Warde-Farley, D., Mirza, M., Courville, A. and Bengio, Y. (2013). Maxout networks.

Proceedings of the 30th International Conference on Machine Learning, PMLR, 28:1319-1327 Kingma, D. P. and Ba, J. (2014). Adam: A method for stochastic optimization. CoRR, abs/1412.6980.

Matthew D. Zeiler. (2012). Adadelta: An adaptive learning rate method. arXiv preprint arXiv:1212.5701.

Mckee, T. B., Doesken, N.J. and Kleist, J. (1993) The relationship of drought frequency and duration to time scales. Proceedings of 8th Conference on Applied Climatology, Anaheim, 179-184.

Minsky, M., and Papert, S. (1988). Perceptions. An introduction to computational geometry, The MIT Press: Cambridge.

Nair, V. and Hinton, G. (2010). Rectified linear units improve restricted boltzmann machines. Proceedings of ICML. 27. 807-814.

The H2O.ai team (2017). R interface for h2o, CRAN.

Dozat, T. (2016). Incorporating nesterov momentum into adam. ICLR Workshop, 1, 2013-2016.

Wickham. H., L. (2016). Ggplot2: Elegant graphics for data analysis, New York, NY: Springer-Verlag.

Wu, H., Svoboda, M., Hayes, M., Wilhite, D. and Wen, F. (2007). Appropriate application of the stan-

dardized precipitation index in arid locations and dry seasons. International Journal Of Climatology,

27, 65-79.

Nesterov, Y. (1983). A method for unconstrained convex minimization problem with the rate of convergence

o(1/k

). Doklady ANSSSR (translated as Soviet.Math.Docl.), 269, 543-547.

2019, 30

6)

1277–1287

Development and validation of a deep neural network for predicting SPI of Nakdong river basin

This work was supported by Korea Environmet Industry & Technology Institute (KEITI) through Advanced Water Management Research Program, funded by Korea Ministry of Environment (Grant.

83067).

Ph.D. student, Department of Statistics, Kyungpook National University, 80 Daehak-ro, Buk-gu, Daegu 41566, Korea.

Associate professor, Department of Statistics, Kyungpook National University, 80 Daehak-ro, Buk-gu, Daegu 41566, Korea.

Corresponding author: Professor, Department of Civil Engineering, Kyungpook National University,

80 Daehak-ro, Buk-gu, Daegu 41566, Korea. E-mail: [email protected]