2020, 31
(2)
,243–254
공간보간법을 이용한 정량적 강우 추정 비교분석
†
기
ᆷ희준
1
·안숙희2
·지준범3
· 윤상후4
14대구대학교 수리빅데이터학부 · 23한국외국어대학교 대기환경연구센터
ᄌ ᅥ
ᆸᄉ ᅮ 2019ᄂ ᅧ ᆫ 12ᄋ ᅯ ᆯ 16ᄋ ᅵ ᆯ, ᄉ ᅮᄌ ᅥ ᆼ 2020ᄂ ᅧ ᆫ 1ᄋ ᅯ ᆯ 17ᄋ ᅵ ᆯ, ᄀ ᅦᄌ ᅢ ᄒ ᅪ ᆨᄌ ᅥ ᆼ 2020ᄂ ᅧ ᆫ 1ᄋ ᅯ ᆯ 21ᄋ ᅵ ᆯ
요 약
ᄌ ᅵ
ᆸᄌ ᅮ ᆼ ᄒ ᅩᄋ ᅮᄋ ᅪ ᄀ ᅡ ᇀᄋ ᅳ ᆫ ᄀ ᅵᄉ ᅡ ᆼᄌ ᅢᄒ ᅢᄋ ᅴ ᄑ ᅵᄒ ᅢᄅ ᅳ ᆯ ᄒ ᅭᄋ ᅲ ᆯᄌ ᅥ ᆨᄋ ᅳᄅ ᅩ ᄃ ᅢᄎ ᅦᄒ ᅡᄀ ᅵ ᄋ ᅱᄒ ᅢᄉ ᅥ ᆫ ᄀ ᅡ ᆼᄋ ᅮᄋ ᅴ ᄌ ᅥ ᆼᄅ ᅣ ᆼᄌ ᅥ ᆨ ᄎ ᅮᄌ ᅥ ᆼᄋ ᅵ ᄑ ᅵ ᆯᄋ ᅭᄒ ᅡᄃ ᅡ.
ᄀ
ᅵᄉ ᅡ ᆼᄎ ᅥ ᆼᄋ ᅳ ᆫ ᄌ ᅡᄃ ᅩ ᆼ ᄀ ᅵᄉ ᅡ ᆼ ᄀ ᅪ ᆫᄎ ᅳ ᆨ ᄌ ᅡ ᆼᄇ ᅵᄋ ᅪ ᄀ ᅡ ᆼᄋ ᅮ ᄅ ᅦᄋ ᅵᄃ ᅥᄅ ᅳ ᆯ ᄋ ᅵᄋ ᅭ ᆼ ᄒ ᅡᄋ ᅧ ᄀ ᅩᄒ ᅢᄉ ᅡ ᆼᄃ ᅩ ᄌ ᅥ ᆼᄅ ᅣ ᆼᄌ ᅥ ᆨ ᄀ ᅡ ᆼᄋ ᅮ ᄎ ᅮᄌ ᅥ ᆼᄋ ᅳ ᆯ ᄋ ᅱᄒ ᅡ ᆫ ᄌ ᅡᄅ ᅭᄅ ᅳ ᆯ ᄉ ᅮ ᄌ ᅵ
ᆸᄒ ᅡᄀ ᅩ ᄋ ᅵ ᆻᄃ ᅡ. ᄇ ᅩ ᆫ ᄋ ᅧ ᆫᄀ ᅮᄂ ᅳ ᆫ ᄉ ᅥᄋ ᅮ ᆯ ᄌ ᅵᄋ ᅧ ᆨᄋ ᅴ ᄀ ᅩᄒ ᅢᄉ ᅡ ᆼᄃ ᅩ ᄀ ᅡ ᆼᄋ ᅮᄅ ᅣ ᆼᄋ ᅳ ᆯ ᄋ ᅧᄅ ᅥ ᄀ ᅩ ᆼ ᄀ ᅡ ᆫᄇ ᅩᄀ ᅡ ᆫᄇ ᅥ ᆸᄋ ᅳᄅ ᅩ ᄎ ᅮᄌ ᅥ ᆼᄒ ᅡᄀ ᅩ ᄎ ᅮᄌ ᅥ ᆼᄀ ᅧ ᆯᄀ ᅪᄅ ᅳ ᆯ ᄇ ᅵ ᄀ
ᅭᄒ ᅡᄀ ᅩᄌ ᅡ ᄒ ᅡ ᆫᄃ ᅡ. ᄀ ᅩ ᆼ ᄀ ᅡ ᆫᄇ ᅩᄀ ᅡ ᆫᄇ ᅡ ᆼᄇ ᅥ ᆸᄋ ᅳᄅ ᅩ ᄀ ᅧ ᆯᄌ ᅥ ᆼᄅ ᅩ ᆫᄌ ᅥ ᆨᄋ ᅵ ᆫ ᄋ ᅧ ᆨᄀ ᅥᄅ ᅵᄀ ᅡᄌ ᅮ ᆼᄇ ᅥ ᆸᄀ ᅪ k- ᄀ ᅳ ᆫᄌ ᅥ ᆸ ᄋ ᅵᄋ ᅮ ᆺ ᄋ ᅡ ᆯᄀ ᅩᄅ ᅵᄌ ᅳ ᆷ ᄋ ᅵ ᄀ ᅩᄅ ᅧᄃ ᅬᄋ ᅥ ᆻᄀ ᅩ, ᄒ ᅪ
ᆨᄅ ᅲ ᆯᄅ ᅩ ᆫᄌ ᅥ ᆨᄋ ᅵ ᆫ ᄋ ᅵ ᆯᄇ ᅡ ᆫᄒ ᅪᄀ ᅡᄇ ᅥ ᆸᄆ ᅩᄒ ᅧ ᆼᄀ ᅪ ᄏ ᅳᄅ ᅵᄀ ᅵ ᆼᄀ ᅵᄇ ᅥ ᆸᄋ ᅵ ᄉ ᅡᄋ ᅭ ᆼ ᄃ ᅬᄋ ᅥ ᆻᄃ ᅡ. ᄏ ᅳᄅ ᅵᄀ ᅵ ᆼᄀ ᅵᄇ ᅥ ᆸᄋ ᅳ ᆫ ᄌ ᅵᄉ ᅡ ᆼ ᄀ ᅡ ᆼᄋ ᅮ ᄌ ᅡᄅ ᅭᄆ ᅡ ᆫ ᄋ ᅵᄋ ᅭ ᆼ ᄒ ᅡ ᆫ ᄌ ᅥ ᆼ ᄀ
ᅲᄏ ᅳᄅ ᅵᄀ ᅵ ᆼᄀ ᅪ ᄌ ᅵᄉ ᅡ ᆼ ᄀ ᅡ ᆼᄋ ᅮ ᄌ ᅡᄅ ᅭᄋ ᅦ ᄅ ᅦᄋ ᅵᄃ ᅥ ᄌ ᅡᄅ ᅭᄀ ᅡ ᄒ ᅡ ᆷᄁ ᅦ ᄀ ᅩᄅ ᅧ ᄃ ᅬ ᆫ ᄋ ᅵ ᆯᄇ ᅡ ᆫᄏ ᅳᄅ ᅵᄀ ᅵ ᆼ ᄀ ᅳᄅ ᅵᄀ ᅩ ᄒ ᅬᄀ ᅱᄏ ᅳᄅ ᅵᄀ ᅵ ᆼᄋ ᅵ ᄀ ᅩᄅ ᅧᄃ ᅬᄋ ᅥ ᆻ ᄃ
ᅡ. ᄋ ᅨᄎ ᅳ ᆨᄉ ᅥ ᆼᄂ ᅳ ᆼᄋ ᅳ ᆯ ᄑ ᅧ ᆼᄀ ᅡᄒ ᅡᄀ ᅵ ᄋ ᅱᄒ ᅢ ᄅ ᅵᄇ ᅳ-ᄋ ᅯ ᆫ-ᄋ ᅡᄋ ᅮ ᆺ ᄀ ᅭᄎ ᅡᄀ ᅥ ᆷᄌ ᅳ ᆼ ᄋ ᅵ ᄉ ᅮᄒ ᅢ ᆼᄃ ᅬᄋ ᅥ ᆻᄋ ᅳᄆ ᅧ ᄑ ᅧ ᆼᄀ ᅲ ᆫ ᄌ ᅦᄀ ᅩ ᆸ ᄋ ᅩᄎ ᅡ, ᄑ ᅧ ᆼᄀ ᅲ ᆫᄌ ᅥ ᆯᄃ ᅢᄋ ᅩᄎ ᅡᄅ ᅩ ᄋ
ᅨᄎ ᅳ ᆨᄉ ᅥ ᆼᄂ ᅳ ᆼᄋ ᅳ ᆯ ᄇ ᅵᄀ ᅭᄒ ᅡᄋ ᅧ ᆻᄃ ᅡ. ᄋ ᅧ ᆫᄀ ᅮᄌ ᅡᄅ ᅭᄂ ᅳ ᆫ 2016ᄂ ᅧ ᆫᄇ ᅮᄐ ᅥ 2018ᄂ ᅧ ᆫᄁ ᅡᄌ ᅵ ᄋ ᅧᄅ ᅳ ᆷᄎ ᅥ ᆯ (6ᄋ ᅯ ᆯ, 7ᄋ ᅯ ᆯ, 8ᄋ ᅯ ᆯ) ᄀ ᅪ ᆫᄎ ᅳ ᆨᄃ ᅬ ᆫ 10ᄇ ᅮ ᆫ ᄃ ᅡ ᆫ ᄋ
ᅱ ᄌ ᅵᄉ ᅡ ᆼᄀ ᅡ ᆼᄋ ᅮ ᄀ ᅪ ᆫᄎ ᅳ ᆨ ᄌ ᅡᄅ ᅭᄋ ᅪ ᄀ ᅡ ᆼᄋ ᅮ ᄅ ᅦᄋ ᅵᄃ ᅥ ᄌ ᅡᄅ ᅭᄋ ᅵᄃ ᅡ. ᄇ ᅮ ᆫᄉ ᅥ ᆨᄀ ᅧ ᆯᄀ ᅪ ᄋ ᅧ ᆨᄀ ᅥᄅ ᅵᄀ ᅡᄌ ᅮ ᆼᄇ ᅥ ᆸᄋ ᅵ ᄉ ᅥᄋ ᅮ ᆯ ᄌ ᅵᄋ ᅧ ᆨᄋ ᅴ ᄀ ᅩ ᆼ ᄀ ᅡ ᆫᄌ ᅥ ᆨᄋ ᅵ ᆫ ᄀ ᅡ ᆼᄋ ᅮ ᄐ
ᅳ ᆨᄉ ᅥ ᆼᄋ ᅳ ᆯ ᄌ ᅡ ᆯ ᄇ ᅡ ᆫᄋ ᅧ ᆼᄒ ᅡᄋ ᅧ ᆻᄋ ᅳᄂ ᅡ, ᄀ ᅡ ᆼᄋ ᅮ ᄑ ᅢᄐ ᅥ ᆫᄋ ᅦ ᄄ ᅡᄅ ᅡ ᄎ ᅬᄌ ᅥ ᆨ ᄀ ᅩ ᆼ ᄀ ᅡ ᆫᄇ ᅩᄀ ᅡ ᆫᄇ ᅥ ᆸᄋ ᅵ ᄉ ᅡ ᆼᄋ ᅵᄒ ᅢ ᆻᄃ ᅡ. ᄀ ᅡ ᆼᄋ ᅮ ᄅ ᅦᄋ ᅵᄃ ᅥ ᄌ ᅡᄅ ᅭᄂ ᅳ ᆫ ᄀ ᅡ ᆼᄋ ᅮᄀ ᅡ ᄉ
ᅩᄌ ᅵᄋ ᅧ ᆨ ᄄ ᅩᄂ ᅳ ᆫ ᄌ ᅥ ᆫᄌ ᅵᄋ ᅧ ᆨᄋ ᅦᄉ ᅥ ᄇ ᅡ ᆯᄉ ᅢ ᆼ ᄉ ᅵ ᄃ ᅩᄋ ᅮ ᆷ ᄋ ᅵ ᄃ ᅬᄋ ᅥ ᆻᄃ ᅡ.
ᄌ
ᅮᄋ ᅭᄋ ᅭ ᆼ ᄋ ᅥ: ᄋ ᅧ ᆨᄀ ᅥᄅ ᅵᄀ ᅡᄌ ᅮ ᆼᄇ ᅥ ᆸ, ᄋ ᅵ ᆯᄇ ᅡ ᆫᄒ ᅪᄀ ᅡᄇ ᅥ ᆸᄆ ᅩᄒ ᅧ ᆼ, ᄏ ᅳᄅ ᅵᄀ ᅵ ᆼᄀ ᅵᄇ ᅥ ᆸ, k- ᄀ ᅳ ᆫᄌ ᅥ ᆸ ᄋ ᅵᄋ ᅮ ᆺ ᄋ ᅡ ᆯᄀ ᅩᄅ ᅵᄌ ᅳ ᆷ.
1. 서론 ᄀ
ᅵ후변화로 인한 집중호우는재산 및 인명피해를유발한다. 한반도는장마철인 여름에 집중호우가 발 새
ᆼ하고 있다. 집중호우의 피해를 줄이기 위해 기상청은강우관측소 외에 강우 레이더를이용한 구름탐 ᄌ
ᅵ를 통해 정량적 강우를추정하고 있다. 강우 레이더는비를생성하는데 필요한 입자들의 반사도가 정 ᄅ
ᅣᆼ적으로 계측되어 고해상도의 정량적 강우 추정에 효과적이다.
ᄀ
ᅩ해상도 정량적 강우 추정은강우로 인해 발생하는피해를감소시키기 위한 수문학 연구의 기초 자료 ᄋ
ᅵ다 (Park 등, 2017). 지상의 강우관측소는 특정 위치에 내리는강우량을 측정한다. 하지만 강우 관 ᄎ
ᅳ
ᆨ소가 설치되어 있지 않은지점의 강우량을관측할 수 없다. 강우 자료는 공간적 상관성을지니고 있으 ᄆ
ᅳ로 단순한 통계적 내삽기법은강우의 공간적인 분포특성을 충분히 반영하지 못한다 (Kim 등, 2014).
ᄀ
ᅡᆼ우 레이더는 1km이상의 높은 공간 해상도의 격자 형태로 강우를 추정하므로 강우 관측소보다 높은 ᄀ
ᅩ
ᆼ간 밀도의 강우 정보를제공한다 (Kim 등, 2007). 하지만 강우 레이더는강우 강도와 반사도의 분포
†
ᄋ ᅵ ᄋ ᅧ ᆫᄀ ᅮᄂ ᅳ ᆫ ᄀ ᅵᄉ ᅡ ᆼᄎ ᅥ ᆼ ᄆ ᅵᄅ ᅢᄋ ᅲᄆ ᅡ ᆼ ᄆ ᅵ ᆫᄀ ᅡ ᆫᄀ ᅵᄉ ᅡ ᆼᄉ ᅥᄇ ᅵᄉ ᅳ ᄉ ᅥ ᆼᄌ ᅡ ᆼᄀ ᅵᄉ ᅮ ᆯ ᄀ ᅢᄇ ᅡ ᆯ ᄉ ᅡᄋ ᅥ ᆸ(KMI2018-08210)ᄋ ᅴ ᄌ ᅵᄋ ᅯ ᆫ ᄋ ᅳᄅ ᅩ ᄉ
ᅮᄒ ᅢ ᆼᄃ ᅬᄋ ᅥ ᆻᄉ ᅳ ᆸ ᄂ ᅵᄃ ᅡ.
1
(38453) ᄀ ᅧ ᆼᄉ ᅡ ᆼᄇ ᅮ ᆨ ᄃ ᅩ ᄀ ᅧ ᆼᄉ ᅡ ᆫᄉ ᅵ ᄌ ᅵ ᆫᄅ ᅣ ᆼᄋ ᅳ ᆸ ᄃ ᅢᄀ ᅮᄃ ᅢᄅ ᅩ 201, ᄃ ᅢᄀ ᅮᄃ ᅢᄒ ᅡ ᆨᄀ ᅭ ᄀ ᅪᄒ ᅡ ᆨᄉ ᅢ ᆼᄆ ᅧ ᆼᄋ ᅲ ᆼ ᄒ ᅡ ᆸᄃ ᅢᄒ ᅡ ᆨ ᄉ ᅮᄅ ᅵᄇ ᅵ ᆨᄃ ᅦᄋ ᅵᄐ ᅥᄒ ᅡ ᆨᄇ ᅮ, ᄒ ᅡ ᆨᄇ ᅮᄀ ᅪᄌ ᅥ ᆼ.
2
(17035) ᄀ ᅧ ᆼᄀ ᅵᄃ ᅩ ᄋ ᅭ ᆼᄋ ᅵ ᆫᄉ ᅵ ᄎ ᅥᄋ ᅵ ᆫᄀ ᅮ ᄆ ᅩᄒ ᅧ ᆫᄆ ᅧ ᆫ ᄋ ᅬᄃ ᅢᄅ ᅩ 81, ᄒ ᅡ ᆫᄀ ᅮ ᆨ ᄋ ᅬᄀ ᅮ ᆨ ᄋ ᅥᄃ ᅢᄒ ᅡ ᆨᄀ ᅭ ᄃ ᅢᄀ ᅵ ᄒ ᅪ ᆫᄀ ᅧ ᆼᄋ ᅧ ᆫᄀ ᅮᄉ ᅦ ᆫᄐ ᅥ ᄎ ᅢ ᆨᄋ ᅵ ᆷᄋ ᅧ ᆫᄀ ᅮᄋ ᅯ ᆫ.
3
(17035) ᄀ ᅧ ᆼᄀ ᅵᄃ ᅩ ᄋ ᅭ ᆼᄋ ᅵ ᆫᄉ ᅵ ᄎ ᅥᄋ ᅵ ᆫᄀ ᅮ ᄆ ᅩᄒ ᅧ ᆫᄆ ᅧ ᆫ ᄋ ᅬᄃ ᅢᄅ ᅩ 81, ᄒ ᅡ ᆫᄀ ᅮ ᆨ ᄋ ᅬᄀ ᅮ ᆨ ᄋ ᅥᄃ ᅢᄒ ᅡ ᆨᄀ ᅭ ᄃ ᅢᄀ ᅵ ᄒ ᅪ ᆫᄀ ᅧ ᆼᄋ ᅧ ᆫᄀ ᅮᄉ ᅦ ᆫᄐ ᅥ ᄋ ᅧ ᆫᄀ ᅮᄀ ᅭᄉ ᅮ.
4
ᄀ ᅭᄉ ᅵ ᆫᄌ ᅥᄌ ᅡ: (38453) ᄀ ᅧ ᆼᄉ ᅡ ᆼᄇ ᅮ ᆨ ᄃ ᅩ ᄀ ᅧ ᆼᄉ ᅡ ᆫᄉ ᅵ ᄌ ᅵ ᆫᄅ ᅣ ᆼᄋ ᅳ ᆸ ᄃ ᅢᄀ ᅮᄃ ᅢᄅ ᅩ 201, ᄃ ᅢᄀ ᅮᄃ ᅢᄒ ᅡ ᆨᄀ ᅭ ᄉ ᅮᄅ ᅵᄇ ᅵ ᆨᄃ ᅦᄋ ᅵᄐ ᅥᄒ ᅡ ᆨᄇ ᅮ, ᄌ ᅩᄀ ᅭᄉ ᅮ.
E-mail: [email protected]
ᄅ
ᅩ 강우량을추정하므로 실제관측된강우와 다를수 있다. 그럼에도 불구하고 강우 레이더는고해상도 ᄋ
ᅴ 상대적 강우량을정확하게 추정할 수 있어 (Hoblit과 David, 2005) 강우의 공간적 변동정보를알 수 이
ᆻ다.
ᄀ
ᅩ해상도 정량적 강우 추정은 지상의 강우관측소와 공간의 강우 레이더를합성하여 생성된다. 선행 ᄋ
ᅧᆫ구에서는수문학적 모형 또는 통계적 공간보간법으로 고해상도 강우장을생성하였다. 지상 강우만을 ᄋ
ᅵ용한 연구로 Cho와 Jeong (2006)은 크리깅 기법이 비교적 정확성이 높다고 분석하였으며, Kim 등 (2010)은크리깅 기법과 역거리제곱법을이용하여 강우의 공간분포를산출하였다. 레이더와 지상 강우 르
ᆯ합성한 연구로 Yoon 등 (2015)은조건부 합성기법과 정규크리깅을 사용하여 서울지역 정량적 실황 ᄀ
ᅡᆼ우장을산정하였고 Jang 등 (2015)은 크리깅 기법인 일반크리깅, 공동크리깅 등을 적용하여 고해상 ᄃ
ᅩ 강우장을추정·비교하였다. 이 외에도 강우 추정모형으로 베이지안 공간선형모형과 일반화가법모형 ᄋ
ᅵ 있다 (Im과 Yoon, 2018).
보
ᆫ연구에서는서울지역의 정량적 강우 추정을위해 기상자료개방 포털의 서울지역 지상 강우관측자 ᄅ
ᅭ와 전국 레이더 합성장 자료를수립하였다. 수집된자료의 연구 기간은 2016년부터 2018년까지이고 지
ᆸ중호우가 발생하는여름철 (6월, 7월, 8월)만 수집하였다. 시간 해상도는 10분단위로 가공하여 다양 ᄒ
ᅡᆫ 공간보간법으로 예측성능을비교하였다. 성능평가를위해 리브-원-아웃교차검증이 수행되었으며 편 ᄎ
ᅡ, 평균제곱오차, 평균절대오차가 평가 기준으로 사용되었다.
ᄇ
ᅩᆫ 논문의 구성은 다음과 같다. 2장에서는 공간보간법인 역거리가중법 (Inverse distance weight method, IDW), k근접 이웃알고리즘 (k-nearest neighbor, k-NN), 일반화가법모형 (General additive model, GAM),크리깅 (Kriging)에 대해 설명하고, 3장에서는 본연구에서 사용된자료에 대해 설명한 ᄃ
ᅡ. 4장에서는 공간보간법에 따른연구결과를제시하고, 마지막으로 5장에서는결론과 향후 연구 방향 ᄋ
ᅳᆯ제시한다.
2. 연구방법론 보
ᆫ 연구는고해상도 정량적 강우 추정을지상 강우관측자료와 강우 레이더를다양한 공간보간법으 ᄅ
ᅩ 합성하고 그 성능을비교하고자 한다. 고려된 공간보간법으로는결정론적 모형인 IDW과 k-NN, 지 ᄀ
ᅮ통계모형인 GAM과 크리깅이 고려되었다.
2.1. 역거리가중법 (Inverse distance weight method, IDW)
IDW는가까운거리의관측소에 상대적 많은가중치를주어 보간 지점에 대한 강수량을결정하는방 버
ᆸ (Park과 Kim, 2013)으로 거리에 따른주변 값들에 가중치를산정하여관심 지점의 값을가중평균을 ᄐ
ᅩ
ᆼ해 보간한다 (Shepard, 1968).
yp=
n
X
i=1
yiwi/
n
X
i=1
wi, w = 1/dki, (2.1)
ᄋ
ᅧ기서 yp는예측값, yi는관측값, di은관측지점에서 예측지점까지의 거리, n은보간에 사용되는관측 ᄌ
ᅵ점의 전체 개수이며 wi는보간할 지점의 값을결정할 때 사용한 보간에 사용할 알려진관측지점의 거 ᄅ
ᅵ에 대한 가중치이다. wi는 k가 커질수록 가까운관측지점이 많은 영향을 준다. k는 교차검증을 통 ᄒ
ᅢ 최적의 k를 찾을 수 있으나 이벤트마다 추정되는 k가 상이할 수 있어 본연구에서는 R프로그램의
“Spatstat”패키지의 idw함수의 기본값인 2를사용하였다 (Baddeley와 Turner, 2004).
2.2. k 근접 이웃 알고리즘 (K-nearest neighbor algorithm, k-NN)
k-NN은새로운 개체들의 목푯값을예측하기 위하여 과거의 유사한 데이터를 이용해서 그 값을예측 ᄒ
ᅡ는 것이다 (Kim과 Hong, 2012). k-NN 알고리즘을수행하기 위해서 속성의 가중치를계산, 속성값 ᄀ
ᅡᆫ의 유사도를계산 등의 계산 방법들을 필요로 한다. 우선 X와 Y 를각 k개의 구성된데이터라 하고, xi와 yi는 각각 X와 Y 의 i번째 속성값으로 하자. 또한 T 를 목적 속성이라고 가정하고 △T(X, Y )를 T에 대한 X와 Y 의 유사도라고 하면, ΩT(X, Y )는다음과 같이 정의된다.
ΩT(X, Y ) =
k
X
j=1
wT(j)ST(xi, yi), (2.2)
ᄋ
ᅧ기서 wT(j)는 i번째 속성의 가중치이며, ST(xi, yi)는 속성값 xi, yi간의 유사도이다. 위의 식 으
ᆯ 보면 k-NN 알고리즘의 유사도 계산은 각 속성의 가중치 계산 (wT(j))과 속성값의 유사도 계산 (ST(xi, yi))의 두 단계로 구분된다. 이와 같은 계산식을기반으로 새로운데이터에 대하여 과거 데이 ᄐ
ᅥ에서 유사도가 가장 높은 데이터들을 목적 값으로 이용한다. 속성값의 형태에 따라 유사도는 달라 지
ᆯ 수 있다. 본 연구는 지상 강우만 고려한 모형 (k-NN1)과 지상 강우와 강우 레이더를 고려한 모형 (k-NN2)으로 예측성능을비교하였다.
2.3. 일반화가법모형 (General additive model, GAM)
GAM은 일반화선형모형 (Generalized linear model)을확장한 것으로 평활함수를이용하여 비선형 과
ᆫ계를설명한다 (Im과 Yoon, 2019).
Y = f0+
p
X
j=1
fj(xj) + ϵ, ϵ ∼ N (0, σ2), (2.3)
ᄋ
ᅧ기서 fj는평활 함수 (Smooth function)이며 thin-plate smoothing spline, local regression, cubic smoothing spline 등을이용하여 추정한다. 평활모수 (Smoothing)는대게 일반화 교차 타당성 방법으 ᄅ
ᅩ 결정된다. 본연구는지상 강우만 고려한 모형 (GAM1)과 지상 강우와 강우 레이더를고려한 모형 (GAM2)으로 예측성능을비교하였다.
2.4. 크리깅 (Kriging) ᄏ
ᅳ리깅은자료의 경향을고려하여 측정값들간에 통계적관계인 자기 상관을포함한 통계적 모델에근 ᄀ
ᅥ한다. 크리깅은 IDW와 동일하게 보간하고자 하는점 주위에 있는 측정값에 가중치를부여하지만, 거 ᄅ
ᅵ에근거하여 알고리즘을사용하는 IDW와는다르게 크리깅의 가중치는데이터 공간 구조를파악하기 ᄋ
ᅱ해서 반베리오그램 (Semi variogram)에서 계산한다 (Lee, 2010).
ᄇ
ᅮᆫ리 거리가 h인 두 점 간의 베리오그램 2γ(h)는 거리에 따른 자료 값의 공분산으로 2γ(h) = V AR[y(h + h) − y(h)]과 같이 표현되며, 이러한 자료 점의 쌍이 n개 존재할 경우 반베리오그램 γ(h)는 ᄃ
ᅡ음과 같이 계산된다.
γ(h) = 1 2n
n
X
i=1
[y(xi) − y(xi+ h)]2. (2.4)