• 검색 결과가 없습니다.

Design of rain gauge network using entropy and Gini impurity: A case study of Gangwon Province

N/A
N/A
Protected

Academic year: 2021

Share "Design of rain gauge network using entropy and Gini impurity: A case study of Gangwon Province"

Copied!
9
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

2020, 31

(

4)

,

569–577

엔트로피와 지니 불순도를 이용한 강우 관측망 설계:

강원도 지역을 중심으로

ᄀ ᅯ

ᆫ태용

1

· 윤상후

2

1대구대학교 일반대학원통계학과 ·2대구대학교 수리빅데이터학부

ᄌ ᅥ

ᆸᄉ ᅮ 2020ᄂ ᅧ ᆫ 5ᄋ ᅯ ᆯ 13ᄋ ᅵ ᆯ, ᄉ ᅮᄌ ᅥ ᆼ 2020ᄂ ᅧ ᆫ 5ᄋ ᅯ ᆯ 27ᄋ ᅵ ᆯ, ᄀ ᅦᄌ ᅢ ᄒ ᅪ ᆨᄌ ᅥ ᆼ 2020ᄂ ᅧ ᆫ 5ᄋ ᅯ ᆯ 29ᄋ ᅵ ᆯ

요 약

ᄒ ᅡ

ᆫᄇ ᅡ ᆫᄃ ᅩᄂ ᅳ ᆫ ᄌ ᅵ ᆸᄌ ᅮ ᆼ ᄒ ᅩᄋ ᅮ, ᄒ ᅩ ᆼ ᄉ ᅮᄋ ᅪ ᄀ ᅡ ᇀᄋ ᅳ ᆫ ᄀ ᅡ ᆼᄋ ᅮᄋ ᅪ ᄀ ᅪ ᆫᄅ ᅧ ᆫᄃ ᅬ ᆫ ᄌ ᅡᄋ ᅧ ᆫᄌ ᅢᄒ ᅢᄅ ᅩ ᄋ ᅵ ᆫᄒ ᅢ ᄉ ᅡᄒ ᅬ ᄆ ᅵ ᆾ ᄀ ᅧ ᆼᄌ ᅦᄌ ᅥ ᆨ ᄑ ᅵᄒ ᅢᄅ ᅳ ᆯ ᄋ ᅵ ᆸᄂ ᅳ ᆫ ᄃ ᅡ.

ᅮᄌ ᅡᄋ ᅯ ᆫ ᄋ ᅦ ᄋ ᅧ ᆫᄀ ᅪ ᆫᄃ ᅬ ᆫ ᄌ ᅡᄋ ᅧ ᆫᄌ ᅢᄒ ᅢᄅ ᅳ ᆯ ᄒ ᅭᄋ ᅲ ᆯᄌ ᅥ ᆨᄋ ᅳᄅ ᅩ ᄆ ᅩᄂ ᅵᄐ ᅥᄅ ᅵ ᆼᄒ ᅡᄀ ᅵ ᄋ ᅱᄒ ᅢᄉ ᅥ ᆫ ᄀ ᅡ ᆼᄋ ᅮᄋ ᅴ ᄐ ᅳ ᆨᄉ ᅥ ᆼᄋ ᅳ ᆯ ᄑ ᅡᄋ ᅡ ᆨᄒ ᅡ ᆯ ᄉ ᅮ ᄋ ᅵ ᆻᄂ ᅳ ᆫ ᄀ ᅡ ᆼᄋ ᅮ ᄀ ᅪ ᆫ ᄎ

ᆨ ᄆ ᅡ ᆼ ᄉ ᅥ ᆯᄀ ᅨᄀ ᅡ ᄑ ᅵ ᆯᄋ ᅭᄒ ᅡᄃ ᅡ. ᄀ ᅡ ᆼᄋ ᅯ ᆫ ᄃ ᅩᄂ ᅳ ᆫ ᄐ ᅢᄇ ᅢ ᆨᄉ ᅡ ᆫᄆ ᅢ ᆨᄋ ᅳ ᆯ ᄑ ᅩᄒ ᅡ ᆷᄒ ᅡ ᆫ ᄒ ᅢᄇ ᅡ ᆯᄀ ᅩᄃ ᅩᄀ ᅡ ᄂ ᅩ ᇁᄋ ᅳ ᆫ ᄉ ᅡ ᆫᄌ ᅵᄌ ᅵᄋ ᅧ ᆨᄋ ᅳᄅ ᅩ ᄃ ᅢ ᆷᄋ ᅵ ᄆ ᅡ ᆭᄀ ᅩ, ᄎ ᅮ ᆨ ᄉ ᅡ ᆫ ᄋ ᅥ

ᆸᄀ ᅪ ᄀ ᅩᄅ ᅢ ᆼᄌ ᅵ ᄇ ᅢᄎ ᅮᄋ ᅪ ᄀ ᅡ ᇀᄋ ᅳ ᆫ 1ᄎ ᅡ ᄉ ᅡ ᆫᄋ ᅥ ᆸᄋ ᅵ ᄇ ᅡ ᆯᄃ ᅡ ᆯᄒ ᅢ ᆻᄃ ᅡ. ᄀ ᅡ ᆼᄋ ᅯ ᆫ ᄃ ᅩᄋ ᅴ ᄌ ᅡᄋ ᅧ ᆫᄌ ᅢᄒ ᅢᄂ ᅳ ᆫ ᄉ ᅡ ᆫᄌ ᅵᄌ ᅵᄋ ᅧ ᆨᄋ ᅳ ᆯ ᄌ ᅮ ᆼᄉ ᅵ ᆷᄋ ᅳᄅ ᅩ ᄇ ᅡ ᆯᄉ ᅢ ᆼᄒ ᅡᄆ ᅳ ᄅ

ᅩ ᄑ ᅵᄒ ᅢᄅ ᅳ ᆯ ᄌ ᅮ ᆯ ᄋ ᅵᄀ ᅵ ᄋ ᅱᄒ ᅢᄉ ᅥ ᆫ ᄀ ᅡ ᆼᄋ ᅮ ᄀ ᅪ ᆫᄎ ᅳ ᆨ ᄆ ᅡ ᆼ ᄉ ᅥ ᆯᄀ ᅨᄀ ᅡ ᄑ ᅵ ᆯᄋ ᅭᄒ ᅡᄃ ᅡ. ᄌ ᅥ ᆼᄇ ᅩᄋ ᅵᄅ ᅩ ᆫᄋ ᅳ ᆫ ᄀ ᅡ ᆼᄋ ᅮ ᄀ ᅪ ᆫᄎ ᅳ ᆨ ᄆ ᅡ ᆼᄋ ᅴ ᄉ ᅥ ᆯᄀ ᅨ ᄆ ᅵ ᆾ ᄇ ᅮ ᆯᄒ ᅪ ᆨ ᄉ ᅵ ᆯᄉ ᅥ ᆼ ᄋ

ᅳ ᆯ ᄑ ᅧ ᆼᄀ ᅡᄒ ᅡᄂ ᅳ ᆫ ᄃ ᅦ ᄂ ᅥ ᆯᄅ ᅵ ᄉ ᅡᄋ ᅭ ᆼ ᄃ ᅬᄋ ᅥ ᄋ ᅪ ᆻ ᄃ ᅡ. ᄇ ᅩ ᆫ ᄋ ᅧ ᆫᄀ ᅮᄋ ᅦᄉ ᅥᄂ ᅳ ᆫ ᄌ ᅥ ᆼᄇ ᅩᄋ ᅵᄅ ᅩ ᆫ ᄌ ᅮ ᆼ ᄋ ᅦ ᆫᄐ ᅳᄅ ᅩᄑ ᅵᄋ ᅪ ᄌ ᅵᄂ ᅵ ᄇ ᅮ ᆯᄉ ᅮ ᆫ ᄃ ᅩᄅ ᅳ ᆯ ᄐ ᅩ ᆼ ᄒ ᅢ ᄀ ᅡ ᆼᄋ ᅯ ᆫ ᄃ

ᅩᄋ ᅴ ᄀ ᅡ ᆼᄋ ᅮ ᄀ ᅪ ᆫᄎ ᅳ ᆨ ᄆ ᅡ ᆼᄋ ᅳ ᆯ ᄉ ᅥ ᆯᄀ ᅨᄒ ᅡᄀ ᅩᄌ ᅡ ᄒ ᅡ ᆫᄃ ᅡ. ᄌ ᅥ ᆼᄇ ᅩᄋ ᅵᄅ ᅩ ᆫᄋ ᅳ ᆯ ᄐ ᅩ ᆼ ᄒ ᅢ ᄉ ᅥ ᆫᄌ ᅥ ᆼᄃ ᅬ ᆫ ᄀ ᅡ ᆼᄋ ᅮ ᄀ ᅪ ᆫᄎ ᅳ ᆨ ᄆ ᅡ ᆼᄋ ᅳᄅ ᅩ ᄉ ᅥ ᆫᄌ ᅥ ᆼᄃ ᅬᄌ ᅵ ᄋ ᅡ ᆭᄋ ᅳ ᆫ ᄀ ᅡ ᆼᄋ ᅮ ᄀ ᅪ

ᆫᄎ ᅳ ᆨ ᄉ ᅩᄋ ᅴ ᄀ ᅡ ᆼᄋ ᅮᄅ ᅣ ᆼᄋ ᅳ ᆯ ᄋ ᅨᄎ ᅳ ᆨ ᄒ ᅡᄋ ᅧ ᆻᄃ ᅡ. ᄋ ᅵᄅ ᅳ ᆯ ᄐ ᅩ ᆼ ᄒ ᅢ ᄀ ᅨᄉ ᅡ ᆫᄃ ᅬᄂ ᅳ ᆫ ᄑ ᅧ ᆼᄀ ᅲ ᆫ ᄌ ᅦᄀ ᅩ ᆸᄀ ᅳ ᆫ ᄋ ᅩᄎ ᅡᄅ ᅳ ᆯ ᄋ ᅵᄋ ᅭ ᆼ ᄒ ᅡᄋ ᅧ ᄉ ᅥ ᆫᄌ ᅥ ᆼᄃ ᅬ ᆫ ᄀ ᅡ ᆼᄋ ᅮ ᄀ ᅪ ᆫᄎ ᅳ ᆨ ᄆ ᅡ ᆼ ᄋ

ᅳ ᆯ ᄌ ᅥ ᆼᄅ ᅣ ᆼᄌ ᅥ ᆨᄋ ᅳᄅ ᅩ ᄑ ᅧ ᆼᄀ ᅡᄒ ᅡᄋ ᅧ ᆻᄃ ᅡ. ᄎ ᅮᄀ ᅡᄅ ᅩ ᄆ ᅩᄃ ᅳ ᆫ ᄀ ᅡ ᆼᄋ ᅮ ᄀ ᅪ ᆫᄎ ᅳ ᆨ ᄆ ᅡ ᆼ ᄌ ᅩᄒ ᅡ ᆸᄃ ᅳ ᆯ ᄋ ᅴ ᄑ ᅧ ᆼᄀ ᅲ ᆫ ᄌ ᅦᄀ ᅩ ᆸᄀ ᅳ ᆫ ᄋ ᅩᄎ ᅡᄅ ᅳ ᆯ ᄐ ᅩ ᆼ ᄒ ᅢ ᄋ ᅦ ᆫᄐ ᅳᄅ ᅩᄑ ᅵᄋ ᅪ ᄌ ᅵ ᄂ

ᅵ ᄇ ᅮ ᆯᄉ ᅮ ᆫ ᄃ ᅩᄅ ᅩ ᄉ ᅥ ᆫᄌ ᅥ ᆼᄃ ᅬ ᆫ ᄀ ᅡ ᆼᄋ ᅮ ᄀ ᅪ ᆫᄎ ᅳ ᆨ ᄆ ᅡ ᆼᄋ ᅴ ᄉ ᅥ ᆼᄂ ᅳ ᆼᄋ ᅳ ᆯ ᄑ ᅧ ᆼᄀ ᅡᄒ ᅡᄋ ᅧ ᆻᄃ ᅡ. ᄋ ᅧ ᆫᄀ ᅮᄀ ᅧ ᆯᄀ ᅪ ᄌ ᅩᄀ ᅥ ᆫᄇ ᅮ ᄒ ᅪ ᆨᄅ ᅲ ᆯᄇ ᅮ ᆫ ᄑ ᅩᄅ ᅳ ᆯ ᄋ ᅵᄋ ᅭ ᆼ ᄒ ᅡ ᆫ ᄀ ᅡ ᆼᄋ ᅮ ᄀ ᅪ ᆫ ᄎ

ᆨ ᄆ ᅡ ᆼᄋ ᅵ ᄀ ᅧ ᆯᄒ ᅡ ᆸᄒ ᅪ ᆨᄅ ᅲ ᆯᄇ ᅮ ᆫ ᄑ ᅩᄋ ᅦ ᄇ ᅵᄒ ᅢ ᄋ ᅮᄉ ᅮᄒ ᅡᄋ ᅧ ᆻᄃ ᅡ. ᄌ ᅥ ᆼᄇ ᅩᄋ ᅵᄅ ᅩ ᆫ ᄌ ᅮ ᆼ ᄋ ᅦ ᆫᄐ ᅳᄅ ᅩᄑ ᅵᄀ ᅡ ᄌ ᅵᄂ ᅵ ᄇ ᅮ ᆯᄉ ᅮ ᆫ ᄃ ᅩᄋ ᅦ ᄇ ᅵᄒ ᅢ ᄀ ᅡ ᆼᄋ ᅮ ᄀ ᅪ ᆫᄎ ᅳ ᆨ ᄆ ᅡ ᆼ ᄉ ᅥ

ᆯᄀ ᅨᄋ ᅦ ᄌ ᅥ ᆨᄌ ᅥ ᆯᄒ ᅡᄋ ᅧ ᆻᄃ ᅡ. ᄀ ᅨᄌ ᅥ ᆯᄇ ᅧ ᆯᄅ ᅩ ᄇ ᅩᄆ ᅧ ᆫ ᄌ ᅥ ᆼᄇ ᅩᄋ ᅵᄅ ᅩ ᆫᄋ ᅳ ᆫ ᄀ ᅡ ᆼᄋ ᅮᄅ ᅣ ᆼᄋ ᅵ ᄆ ᅡ ᆭᄋ ᅳ ᆫ ᄋ ᅧᄅ ᅳ ᆷᄎ ᅥ ᆯᄋ ᅦ ᄌ ᅥ ᆨᄌ ᅥ ᆯᄒ ᅡᄀ ᅩ ᄀ ᅡ ᆼᄋ ᅮᄅ ᅣ ᆼᄋ ᅵ ᄌ ᅥ ᆨᄋ ᅳ ᆫ ᄀ ᅧᄋ ᅮ ᆯ ᄎ ᅥ

ᆯᄋ ᅳ ᆫ ᄌ ᅥ ᆨᄌ ᅥ ᆯᄒ ᅡᄌ ᅵ ᄋ ᅡ ᆭᄋ ᅡ ᆻᄃ ᅡ.

ᅮᄋ ᅭᄋ ᅭ ᆼ ᄋ ᅥ: ᄀ ᅡ ᆼᄋ ᅮ ᄀ ᅪ ᆫᄎ ᅳ ᆨ ᄆ ᅡ ᆼ, ᄋ ᅦ ᆫᄐ ᅳᄅ ᅩᄑ ᅵ, ᄌ ᅵᄂ ᅵ ᄇ ᅮ ᆯᄉ ᅮ ᆫ ᄃ ᅩ, ᄑ ᅧ ᆼᄀ ᅲ ᆫ ᄌ ᅦᄀ ᅩ ᆸᄀ ᅳ ᆫ ᄋ ᅩᄎ ᅡ.

1. 서론 ᄀ

ᅵ후변화에 따른기상 이변으로 자연재해 피해사례가 늘어나고 있다. 한반도는 집중호우, 홍수, 댐의 ᄇ

ᅥᆷ람 위기 등강우와관련된자연재해의 비중이 다른자연재해에 비해 높다 (Lee 등, 2017). 특히, 강원 ᄃ

ᅩ 지역은해발고도가 높은산지지역으로 농산업을위한 댐이 많고 축산업과 고랭지 농산업이 발달하였 ᄃ

ᅡ. Lee와 Lee (2008)에 따르면 강원도는 산지지역을 중심으로 자연재해가 발생하고 있다. 강우와 관 ᄅ

ᅧᆫ된자연재해에 효율적으로 대응하기 위해선 강우의관측이 중요하다.

ᅡᆼ우의 효율적인관측을위해선 강우의 시공간적 분포의 특성을고려한 강우관측망 설계가 필요하다.

ᅡᆼ우관측소가 많을수록강우의 공간적 분포를자세히 파악할 수 있다. 하지만 많은관측소를 운영할수 ᄅ

ᆨ 높은비용이 발생하게된다. 적절한 강우 관측소를배치하여 운영한다면 비용을최소화하면서도 강 ᄋ

ᅮ의 공간적 분포를파악할 수 있다.

1

(38453) ᄀ ᅧ ᆼᄉ ᅡ ᆼᄇ ᅮ ᆨ ᄃ ᅩ ᄀ ᅧ ᆼᄉ ᅡ ᆫᄉ ᅵ ᄌ ᅵ ᆫᄅ ᅣ ᆼᄋ ᅳ ᆸ ᄃ ᅢᄀ ᅮᄃ ᅢᄅ ᅩ 201, ᄃ ᅢᄀ ᅮᄃ ᅢᄒ ᅡ ᆨᄀ ᅭ ᄋ ᅵ ᆯᄇ ᅡ ᆫᄃ ᅢᄒ ᅡ ᆨᄋ ᅯ ᆫ ᄐ ᅩ ᆼ ᄀ ᅨᄒ ᅡ ᆨᄀ ᅪ, ᄇ ᅡ ᆨᄉ ᅡᄉ ᅮᄅ ᅭ.

2

ᄀ ᅭᄉ ᅵ ᆫᄌ ᅥᄌ ᅡ: (38453) ᄀ ᅧ ᆼᄉ ᅡ ᆼᄇ ᅮ ᆨ ᄃ ᅩ ᄀ ᅧ ᆼᄉ ᅡ ᆫᄉ ᅵ ᄌ ᅵ ᆫᄅ ᅣ ᆼᄋ ᅳ ᆸ ᄃ ᅢᄀ ᅮᄃ ᅢᄅ ᅩ 201, ᄃ ᅢᄀ ᅮᄃ ᅢᄒ ᅡ ᆨᄀ ᅭ ᄉ ᅮᄅ ᅵᄇ ᅵ ᆨᄃ ᅦᄋ ᅵᄐ ᅥᄒ ᅡ ᆨᄇ ᅮ, ᄌ ᅩᄀ ᅭᄉ ᅮ. E-mail:

[email protected]

(2)

ᅥᆫ행연구를보면 정보 이론을 이용하여 강우관측망을설계하고 평가하였다. 정보 이론 중 엔트로피 ᄅ

ᅳᆯ 이용한 최대정보량으로 관측소를 평가하는사례가 많았다. 본 연구에서는 정보이론 중 엔트로피와 ᄌ

ᅵ니 불순도를이용하여 강우관측망을선정하고 모든조합의 결과와 비교하여 엔트로피와 지니 불순도 ᄅ

ᅩ 강우관측망을설계했을때의 특징을살펴보고자 한다. 또한 계절별 강우특성에 따라 강우관측망 설 ᄀ

ᅨ가 변하는지확인하였다.

보

ᆫ 논문의 구성은 다음과 같다. 2절에서는강우 관측망 설계에 사용되는 엔트로피와 지니 불순도를 서

ᆯ명한다. 또한 강우관측망 평가에 사용하는 공간보간법인 정규크리깅을다룬다. 3절과 4절에서는 엔 ᄐ

ᅳ로피와 지니 불순도를기반으로 강원도 지역의 10개 종관기상관측장비에 대하여 강우관측망을설계 ᄒ

ᅡ고 이를평가한다. 마지막으로 5장에서는연구의 결론 및 한계점을제시한다.

2. 연구방법론 보

ᆫ 연구에서는 정보이론 중 엔트로피와 지니 불순도를 이용하여 강우 관측망을 설계하는방법을 다 루

ᆫ다. 강우관측자료의확률분포로부터 조건 엔트로피와 결합 엔트로피, 조건 지니 불순도와 결합 지 ᄂ

ᅵ 불순도가 계산되고 이를 통해 강우관측망이 선정된다. 선정된강우관측망 평가를 위해 선정된 강 ᄋ

ᅮ 관측소의 강우량으로 선정되지 않은강우 관측소의 강우량을 정규크리깅으로 공간보간하여 평균제 고

ᆸ근오차 (root mean square error, RMSE)를 계산하였다. 연구를위해 사용된컴퓨터의 운영체제는 Window10이고, cpu는 i5-7500, Ram은 32GB이다. 자료처리를 위해 사용된 프로그램은 R이고 버전 ᄋ

ᅳᆫ 3.5.2이다.

2.1. 연구의 구성도 에

ᆫ트로피와 지니 불순도를계산하여 강우관측망을설계하는방법을 Figure 2.1에서 나타내었다. 강 ᄋ

ᅮ 관측 자료의 경험적 확률분포로부터 조건 엔트로피 (방법 A)와 결합 엔트로피 (방법 B), 조건 지 ᄂ

ᅵ 불순도 (방법 C)와 결합 지니 불순도 (방법 D)를구한다. 엔트로피와 지니 불순도는정보이론을이 ᄋ

ᆼ한 불확실성의 지표로 수치가 높을수록 예측하기 어려운 중요한 지점이다. 엔트로피와 지니 불순도 ᄀ

ᅡ 높은조합의 강우관측망으로 선정한 후 선정되지 않은강우관측소의 강우량을 공간보간하여 선정 되

ᆫ강우관측망을평가하였다. 추가로 가능한 모든강우관측망 조합의 RMSE와 선정된강우관측망의 RMSE를비교하였다.

(3)

Figure 2.1 The flowchart of research

2.2. 엔트로피 에

ᆫ트로피는무작위성의 정도를자료가 지니는확률분포로부터 정량적으로 평가하는방법이다 (Shan- non, 1948). 엔트로피는사용목적에 따라 한계 엔트로피, 조건 엔트로피, 결합엔트로피로 정보의 불확 시

ᆯ성을정량화 한다. Shannon (1948)이 제안한 한계 엔트로피는이산확률변수X가 갖는 불확실성의 양 ᄋ

ᅵ며 다음과 같다.

H(X) = −

N

X

n=1

p(xn) log p(xn), (2.1) ᄋ

ᅧ기서 p(xn)은 xn의 경험적확률이고, H(X)는한계 엔트로피 X가 내재하고 있는 불확실성을의미한 ᄃ

ᅡ. n은 X의 계급구간의 수를의미한다.

ᄃ ᅮ

ᆯ이상의 임의의확률변수 X와 Y 가 있다면 조건부확률과 결합확률을 통해 조건엔트로피와 결합 에

ᆫ트로피가 계산된다. 변수 Y 가 주어졌을때, 변수 X의 엔트로피는조건엔트로피 H(X|Y )로 식은아 ᄅ

ᅢ와 같다.

H(X|Y ) = −

N

X

n=1 M

X

m=1

p(xn, ym) log p(xn|ym), (2.2) ᄋ

ᅧ기서 X와 Y 의 N, M은계급구간의 수, p(xn, ym)은결합확률, p(xn|ym)은조건부확률이다. 결합 에

ᆫ트로피 H(X, Y )는확률변수 X와 Y 의 결합확률로부터 계산되며 다음과 같다.

H(X, Y ) = −

N

X

n=1 M

X

m=1

p(xn, ym) log p(xn, ym), (2.3)

에

ᆫ트로피가큰강우관측소는 강우량관측이 불확실한 강우관측소이므로 중요한 강우관측지점이라 ᄀ

ᅩ 할 수 있다.

2.3. 지니불순도 ᄌ

ᅵ니 불순도는 집합에 이질적인 것이 얼마나 섞여 있는지를 측정하는 지표로서 분류모델에서 영역 으

ᆯ 나누는 기준의 하나이다. 정보 이론적 측면에서는 가중치가 고려된 엔트로피로 해당한다. 0에서 1의 값을 가지며 값이 클수록 다른 정보와 이질적임을 의미한다. 지니 불순도는 다음과 같이 계산된 ᄃ

ᅡ (Breiman, 1996; Rokach와 Maimon, 2005).

(4)

G(X|Y ) =

N

X

n=1 M

X

m=1

p(xn, ym)(1 − p(xn, ym))/

M

X

m=1

p(ym)(1 − p(ym)), (2.5) ᄋ

ᅧ기서 X와 Y 의 N, M은 자료의 수, p(xn, ym)은 결합 확률이다. 결합불순도 G(X, Y )는확률변수 X와 Y 의 결합확률로부터 계산되며 다음과 같다.

G(X, Y ) = −

N

X

n=1 M

X

m=1

p(xn, ym)(1 − p(xn, ym)). (2.6)

2.4. 정규크리깅 ᄏ

ᅳ리깅은 Krige (1951)에 의해 개발되었으며, 이를 Matheron (1963)이 수학적으로 정립한 것으로 ᄆ

ᅵ관측지점의 값을이미 알고 있는주위의 값들을가중치 조합으로 예측하는기법이다. 크리깅은 일정 ᄒ

ᅡᆫ 거리에 있는자료의 유사성을나타내는 공간적 자기상관성의 척도인 베리오그램을이용한다. 베리오 ᄀ

ᅳ램은다음 식과 같으며 일정거리 만큼떨어진 두 자료간의 차이를제곱하여 기댓값을구하는것이다.

2γ(h) = E[(z(x) − z(x + h))2], (2.7) ᄋ

ᅧ기서 z(x)는 x의 위치에서관측값이며, z(x + h)는 x에서 h만큼떨어진 위치의 값이다.

저

ᆼ규크리깅은이미 값을알고 있는 n개의 자료값 zi을이용하여 z0지점의 미지값을예측한다. 본연 ᄀ

ᅮ에서는 gstat패키지의 krige 함수를이용하여 정규크리깅을수행하였다 (Pebesma, 2004).

3. 연구자료 ᄀ

ᅡᆼ원도는태백산맥을 중심으로 영동과 영서로 분리되어 있다. 영동지역은여름철 태풍의 피해가 발생 ᄒ

ᅡ고 겨울철 강수현상이 불규칙하여 가뭄의 피해를겪는다. 영서지역은 총강수량이 기후변화로 인해 증 ᄀ

ᅡ하는추세이며 여름철에는 집중호우의 피해가 발생하고 겨울철은강수량이 매우 작다. 강원도는고랭 ᄌ

ᅵ배추와 감자와 같은 고랭지 농산물의 주요 재배지이다. 산지지역이 많아 많은댐이 설치되어 있으므 ᄅ

ᅩ 유역의 강우특성을파악하기 위해 효율적인 강우관측망 설계가 필요하다.

ᅵ상청에서 강원도지역에 설치한 종관기상관측장비 (automated synoptic observing system, ASOS) 느

ᆫ 10개소로 Figure 3.1에서 나타내고 있다. 연구자료는 기상자료 개방포털 사이트 (https://data.

kma.go.kr)에서 수집한 1989년부터 2018년까지 관측된 일 단위 강우량이다. 연 평균 총 강우량의 ᄇ

ᅥᆷ위는 1166.3에서 1454.6mm이고, 일 최대 강우량은 태풍 루사의 영향으로 영동지역인 강릉에서 870.5mm발생하였다 (Table 3.1).

(5)

Figure 3.1 Location of rain gauge station in Gangwon (ASOS)

Table 3.1 Summary of ASOS

No. Locations Period Lon. Lat. Max.Prec. Annual Prec.

1 Sokcho 128.56 38.25 295.5 1412.3

2 Cheorwon 127.30 38.15 384.3 1381.1

3 Chuncheon 127.74 37.90 308.5 1368.5

4 Gangneung 1989 128.89 37.75 870.5 1454.6

5 Donghae ∼ 129.12 37.51 319.5 1235.1

6 Wonju 2018 127.95 37.34 305.0 1340.8

7 Youngwol 128.46 37.18 226.0 1166.3

8 Inje 128.17 38.06 252.0 1222.4

9 Hongcheon 127.88 37.68 276.0 1383.1

10 Taebaek 128.99 37.17 338.5 1327.3

4. 연구결과 에

ᆫ트로피 계산을 위해 연속형인 강우자료를 이산공간으로 변환하였다. 계급구간의 수를 100, 200, 300, 400으로 변화를주어 엔트로피를비교한 결과, 계급구간이 증가함에 따라 엔트로피의 정보량은 증 ᄀ

ᅡ하지만 강우 관측소 수에 따른 최대정보량의 패턴은 Lim과 Yoon (2017)의 연구와 같이 동일하였 ᄃ

ᅡ. 이에 연구는계급구간을 200으로 고정하여 수행하였다. 정보이론으로 강우관측망을선정한 결과 느

ᆫ Table 4.1에서 나타내고 있다.

ᅮ선 강원도지역의 한계 엔트로피와 지니 불순도로 첫 번째 강우 관측소를 선정하였다. 속초에 설 ᄎ

ᅵ된 강우 관측소의 엔트로피가 1.988로 가장 높았다. 지니 불순도가 가장 높은 강우 관측소는 태백 (0.852)이다. 엔트로피로 선정된강우관측소는 속초이고 지니 불순도로 선정된 강우 관측소는태백이 ᄃ

ᅡ.

ᅮ 개 이상의 강우관측소의 조합은 조건 엔트로피와 결합 엔트로피, 조건 지니 불순도와 결합 지니 ᄇ

ᅮᆯ순도로 결정하였다. 조건 엔트로피와 조건 지니 불순도 (방법 A, C)는 순차적으로 강우관측소를결 저

ᆼ하므로 결합 엔트로피와 결합 지니 불순도에 비해 상대적으로 계산 시간이 짧다. 결합 엔트로피와 결 ᄒ

ᅡᆸ 지니 불순도 (방법 B, D)는모든조합의 엔트로피와 지니 불순도를계산하여 그 중에 최댓값의 조합

(6)

RMSE를기준으로 비교하였을때 선정된강우관측소가 2개에서 5개 일 때 조건엔트로피로 선정된강 ᄋ

ᅮ관측망이 좋은결과를보였다. 강우관측소의 수가 1개일 때 선정된강우관측소는 불확실성이 제일 노

ᇁ은 중요한 강우관측소이다. 이때의 RMSE는전체 조합의 RMSE에서 중앙값과 유사하게 나타났다.

ᅡᆼ우관측소가 6개 이상이면 지니 불순도를 통한 강우관측망 선정이 엔트로피보다 좋았다. 결합엔트로 ᄑ

ᅵ로 선정된강우관측망은전반적으로 저조한 예측성능을보였다. 조건엔트로피를이용한 강우관측망 ᄉ

ᅥᆫ정이 9개의 강우관측소 일 때를제외하면 우수한 강우관측망이였다.

Table 4.1 Result of select optimal rain gauge network of method

Num. cases Conditional

Rank Method A Conditional

Rank Method C

entropy gini impurity

1 10 1.988 7 1 0.852 3 10

2 9 1.528 14 1,(6) 0.990 42 10,(4)

3 8 0.895 72 1,6,(10) 0.995 114 10,4,(1)

4 7 0.578 39 1,6,10,(2) 0.996 179 10,4,1,(6)

5 6 0.349 56 1,6,10,2,(5) 0.995 63 10,4,1,6,(2)

6 5 0.278 32 1,6,10,2,5,(8) 0.994 6 10,4,1,6,2,(3)

7 4 0.190 56 1,6,10,2,5,8,(7) 0.994 35 10,4,1,6,2,3,(8)

8 3 0.134 25 1,6,10,2,5,8,7,(9) 0.993 27 10,4,1,6,2,3,8,(9)

9 2 0.089 10 1,6,10,2,5,8,7,9,(3) 0.992 7 10,4,1,6,2,3,8,9,(5)

10 1 0.058 1,6,10,2,5,8,7,9,3,(4) 0.990 10,4,1,6,2,3,8,9,5,(7)

Computing time : 0.65s Computing time : 9.89s

Num. cases Joint

Rank Method B Joint

Rank Method D

entropy gini impurity

1 10 1.988 7 1 0.852 3 10

2 45 0.762 40 3,8 0.843 42 4,10

3 120 1.949 116 3,8,9 0.839 114 1,4,10

4 210 3.316 207 3,6,8,9 0.836 179 1,4,6,10

5 252 4.747 252 2,3,6,8,9 0.832 63 1,2,4,6,10

6 210 6.121 210 2,3,6,7,8,9 0.827 6 1,2,3,4,6,10

7 120 7.569 120 2,3,6,7,8,9,10 0.822 35 1,2,3,4,6,8,10

8 45 9.088 45 1,2,3,6,7,8,9,10 0.816 27 1,2,3,4,6,8,9,10

9 10 10.493 10 1,2,3,5,6,7,8,9,10 0.809 7 1,2,3,4,5,6,8,9,10

10 1 11.757 1,2,3,4,5,6,7,8,9,10 0.801 1,2,3,4,5,6,7,8,9,10

Computing time : 5.58s Computing time : 53.38s

(7)

ᅡᆼ우관측소의 수가 6일 때 엔트로피와 지니 불순도로 선정된강우관측소의 순위는상대적으로 좋은 ᄑ

ᅧᆫ이나 그 외에는 선정된강우관측망의 순위가 좋지 않다. 강원도의 강우는 약 80%가 여름철에 발생 ᄒ

ᅡ므로 계절별로 구분하여 강우관측 조합을 선정한 후 RMSE를기준으로 순위를 재평가하면 Figure 4.2로 나타낼 수 있다. 계절별로 조건엔트로피와 지니 불순도로 선정된강우관측망의 성능을확인하였 으

ᆯ때 조건엔트로피가 지니 불순도에 비해 우수하였다.

Figure 4.1 The performance of rain gauge networks among possible combination by season

5. 결론 보

ᆫ연구는정보이론을이용한관측망 선정에관한 연구로 엔트로피와 지니 불순도를 통해 강우관측망 으

ᆯ선정하였다. 선정된강우관측망으로 선정되지 않은강우관측망을 공간보간하여 RMSE를계산하였 ᄀ

ᅩ, 전체 조합의 RMSE와 비교하여 설계된강우관측망을평가하였다. 결합엔트로피는모든경우를고 ᄅ

ᅧ하기 때문에 조건엔트로피에 비해 계산 시간이 비교적 오래 걸리며 조건엔트로피에 비하여 성능이 저 ᄌ

ᅩ하였다. 계절을구분하지 않고 강우관측망을선정할 경우 정보이론기반의 강우관측망이 다른강우 과

ᆫ측망에 비해 좋지 못했다. 이는강원도 강우의 약 80%가 여름철에 발생하고 겨울철에는가뭄이 일어 ᄂ

ᆯ 정도의 기상상태를 보이기 때문이다. 따라서 선행연구와 달리 계절별로 구분하여 강우관측망을 설 ᄀ

ᅨ할 필요가 있다.

보

ᆫ연구의 한계점 및 향후 연구방향을다음과 같다. 첫째, 정보이론을기반으로 한 강우관측망 설계 느

ᆫ관측자료의 경험적확률분포만 이용하므로 강우관측소간 공간적 분포가 고려되지 못하는단점이 있 ᄃ

ᅡ. 강우 관측자료 간 상관성이 존재할 경우 조건 엔트로피가 작아지므로 공간성이 반영될 수 있지만, ᄀ

ᆼ간적 거리가 직접적으로활용되지는 못한다. 따라서 관측소 간 공간적 거리와 경험적 확률분포를 모 ᄃ

ᅮ 고려한 연구가 수행되면 좋겠다. 둘째, 본연구의 강우관측망 평가는강우관측소가 설치된위치만 펴

ᆼ가되었다. 강우 레이더 관측자료는 강우 관측소가 없는지점의 강우량도 추정되므로 강우레이더와 ᄀ

ᅡᆼ우관측자료가 모두 고려된강우관측망 설계 연구가 추가로 요구된다.

(8)

Kawachi, T., Maruyama, T. and Singh, V. P. (2001). Rainfall entropy for delineation of water resources zones in Japan. Journal of Hydrology, 246, 36-44.

Krige, D. G. (1951). A statistical approach to some basic mine valuation problems on the Witwatersrand.

Journal of the Southern African Institute of Mining and Metallurgy, 52, 119-139.

Li, C., Singh, V. P. and Mishra, A. K. (2012). Entropy theory-based criterion for hydrometric network evaluation and design: maximum information minimum redundancy. Water Resources Research, 48.

Lim, J. and Yoon, S. (2017). Method for evaluating optimal air monitoring sites for SO2 in Ulsan. Journal of Environmental Science International , 26, 1073-1080.

Lee, M., Hong, J. H. and Kim, K. Y. (2017). Estimating damage costs from natural disasters in Korea.

Natural Hazards Review , 18, 04017016.

Lee, S. H., and Lee, K. M. (2008). The distribution of natural disaster in mountainous region of Gangwon- do. Journal of the Korean Geographical Society, 43, 843-857.

Mishra, A. K. and Coulibaly, P. (2010). Hydrometric network evaluation for Canadian watersheds. Journal of Hydrology, 380, 420-437.

Matheron, G. (1963). Principles of geostatistics. Economic Geology, 58, 1246-1266.

Mogheir, Y., Singh, V. P. and de Lima, J. L. M. P. (2006). Spatial assessment and redesign of a groundwater quality monitoring network using entropy theory, Gaza strip, Palestine. Hydrogeology Journal , 14, 700- 712.

Pebesma, E. J. (2004). Multivariable geostatistics in S: the gstat package. Computers & Geosciences, 30, 683-691.

Rokach, L., and Maimon, O. (2005). Top-down induction of decision trees classifiers-a survey. IEEE Trans- actions on Systems, Man, and Cybernetics, Part C (Applications and Reviews), 35, 476-487.

Shannon, C. E. (1948). A mathematical theory of communication. Bell System Technical Journal , 27,

379-423.

(9)

2020, 31

(

4)

,

569–577

Design of rain gauge network using entropy and Gini impurity: A case study of Gangwon Province

Taeyong Kwon

1

· Sanghoo Yoon

2

1Department of Statistics, Daegu University

2Division of Mathematics and Big Data Science, Daegu University

Received 13 May 2020, revised 27 May 2020, accepted 29 May 2020

Abstract

The Korean Peninsula suffers social and economic damage from natural disasters related to rainfall, such as torrential rains and floods. In order to monitor natural disasters associated with water resources, it is necessary to design a rain gauge network.

Gangwon Province is a mountainous area including the Taebaek Mountains, with many dams, and primary industries such as livestock and highland cabbages. A rain gauge network design is necessary to reduce damage because natural disasters in Gangwon Province occur mainly in mountainous areas. Information theory has been widely used to assess the design and uncertainty of rain gauge networks. In this study, we want to design a rain gauge network in Gwangwon through entropy and Gini impurity. The rain gauge network was quantitatively evaluated with the root mean square error obtained by predicting the rain gauge network. In addition, the rank of rain gauge network was assessed by all combinations of rain gauge network. A rain gauge network using conditional entropy was suggested between spring and autumn because the rain gauge network was negatively affected by low precipitation during the winter season.

Keywords: Entropy, Gini impurity, rain gauge network, root mean square error.

1

Ph. D. candidate, Department of Statistics, Daegu University, Gyeongbuk 38453, Korea.

2

Corresponding author: Assistant professor, Division of Mathematics and Big Data Science, Daegu

University, Gyeongbuk 38453, Korea. E-mail: [email protected]

수치

Figure 2.1 The flowchart of research 2.2. 엔트로피 에 ᆫᄐ ᅳᄅ ᅩᄑ ᅵ는 ᄆ ᅮ자 ᆨᄋ ᅱ서 ᆼᄋ ᅴ 저 ᆼᄃ ᅩ를 ᄌ ᅡᄅ ᅭᄀ ᅡ ᄌ ᅵᄂ ᅵ는 화 ᆨ류 ᆯ분 ᄑ ᅩᄅ ᅩᄇ ᅮᄐ ᅥ 저 ᆼ랴 ᆼ저 ᆨᄋ ᅳᄅ ᅩ 펴 ᆼᄀ ᅡᄒ ᅡ는 바 ᆼ버 ᆸᄋ ᅵᄃ ᅡ  (Shan-non, 1948)
Table 3.1 Summary of ASOS
Table 4.1 Result of select optimal rain gauge network of method
Figure 4.1 The performance of rain gauge networks among possible combination by season

참조

관련 문서

Pentad geopotential height at the 200 hPa for pre heavy rain phase (left), heavy rain phase (middle) and their difference of heavy rain phase minus pre heavy (right).. Units

Design is applied to create better convenience and beneficial values through a variety of design methodology in relevant industry, and new service

The purpose of this study is to use Lucia jig, leaf gauge, and cotton roll among the anterior deprogramming devices being used to induce the centric

– In order to investigate the interaction between neurons in the network, patterning the small number of neurons is necessary.. – The electrical connectivity

The purpose of this study is to establish and design the characteristics of summer resorts according to the design manual, develop cultural products using

Design consulting service focusing on design development is dominant in Korean design industry. There has been design consulting service supported by

Fifth, It is necessary to establish an information network related to Taekwondo tourism information. Until now, the reason why Taekwondo does not receive

The seven steps can be organized in order of selecting local cultural resources of Fujian Province, selecting local design prototypes for character