A study on goodness-of-fit test for extreme value distribution<sup>†</sup>

(1)

2019, 30

(

3)

,

539–549

극단값분포에 대한 적합도 검정에 관한 연구 ^†

ᄎ ᅬ병진

¹

1경기대학교 경제학부 응용통계전공

ᄌ ᅥ

ᆸᄉ ᅮ 2019ᄂ ᅧ ᆫ 4ᄋ ᅯ ᆯ 5ᄋ ᅵ ᆯ, ᄉ ᅮᄌ ᅥ ᆼ 2019ᄂ ᅧ ᆫ 4ᄋ ᅯ ᆯ 30ᄋ ᅵ ᆯ, ᄀ ᅦᄌ ᅢ ᄒ ᅪ ᆨᄌ ᅥ ᆼ 2019ᄂ ᅧ ᆫ 5ᄋ ᅯ ᆯ 13ᄋ ᅵ ᆯ

요 약

ᄀ ᅳ

ᆨ ᄃ ᅡ ᆫᄀ ᅡ ᆹᄇ ᅮ ᆫ ᄑ ᅩᄂ ᅳ ᆫ ᄉ ᅮᄆ ᅧ ᆼᄀ ᅥ ᆷᄌ ᅥ ᆼᄀ ᅪ ᄉ ᅮᄆ ᅮ ᆫ ᄒ ᅡ ᆨ ᄃ ᅳ ᆼ ᄋ ᅴ ᄃ ᅡᄋ ᅣ ᆼᄒ ᅡ ᆫ ᄋ ᅧ ᆼᄋ ᅧ ᆨᄋ ᅦᄉ ᅥ ᄃ ᅦᄋ ᅵᄐ ᅥ ᄇ ᅮ ᆫᄉ ᅥ ᆨᄋ ᅳ ᆯ ᄋ ᅱᄒ ᅡ ᆫ ᄒ ᅪ ᆨᄅ ᅲ ᆯ ᄆ ᅩᄒ ᅧ ᆼᄋ ᅳᄅ ᅩ ᄀ ᅪ ᆼᄇ ᅥ ᆷᄋ ᅱ ᄒ

ᅡᄀ ᅦ ᄉ ᅵᄋ ᅭ ᆼ ᄃ ᅬᄀ ᅩ ᄋ ᅵ ᆻᄃ ᅡ. ᄀ ᅳ ᆨ ᄃ ᅡ ᆫᄀ ᅡ ᆹᄇ ᅮ ᆫ ᄑ ᅩᄀ ᅡ ᄋ ᅵᄃ ᅳ ᆯ ᄋ ᅧ ᆼᄋ ᅧ ᆨᄋ ᅦᄉ ᅥ ᄋ ᅵᄅ ᅩ ᆫᄌ ᅥ ᆨ ᄄ ᅩᄂ ᅳ ᆫ ᄋ ᅳ ᆼᄋ ᅭ ᆼᄌ ᅥ ᆨᄋ ᅵ ᆫ ᄆ ᅧ ᆫᄋ ᅦᄉ ᅥ ᄆ ᅢᄅ ᅧ ᆨᄌ ᅥ ᆨᄋ ᅵ ᆫ ᄆ ᅩᄒ ᅧ ᆼᄋ ᅵᄅ ᅡᄀ ᅩ ᄒ

ᅡᄃ ᅥᄅ ᅡᄃ ᅩ ᄇ ᅮ ᆫᄉ ᅥ ᆨᄆ ᅩᄒ ᅧ ᆼᄋ ᅳᄅ ᅩ ᄃ ᅦᄋ ᅵᄐ ᅥᄋ ᅦ ᄌ ᅥ ᆨᄒ ᅡ ᆸᄒ ᅡ ᆫᄌ ᅵᄅ ᅳ ᆯ ᄀ ᅥ ᆷᄌ ᅳ ᆼ ᄒ ᅢ ᄇ ᅩ ᆯ ᄑ ᅵ ᆯᄋ ᅭᄀ ᅡ ᄋ ᅵ ᆻᄃ ᅡ. ᄇ ᅩ ᆫ ᄂ ᅩ ᆫᄆ ᅮ ᆫ ᄋ ᅦᄉ ᅥᄂ ᅳ ᆫ ᄆ ᅩᄉ ᅮᄃ ᅳ ᆯ ᄋ ᅵ ᄆ ᅵᄌ ᅵᄋ ᅵ ᆫ ᄀ ᅳ

ᆨ ᄃ ᅡ ᆫᄀ ᅡ ᆹᄇ ᅮ ᆫ ᄑ ᅩᄋ ᅦ ᄃ ᅢᄒ ᅡ ᆫ ᄌ ᅥ ᆨᄒ ᅡ ᆸᄃ ᅩ ᄀ ᅥ ᆷᄌ ᅥ ᆼᄋ ᅳ ᆯ ᄋ ᅱᄒ ᅢ ᄋ ᅢ ᆫᄃ ᅥᄉ ᅳ ᆫ-ᄃ ᅡ ᆯᄅ ᅵ ᆼ (Anderson-Darling)ᄀ ᅪ ᄏ ᅳᄅ ᅢᄆ ᅥ-ᄆ ᅵᄌ ᅦᄉ ᅳ (Cramer- von Mises) ᄀ ᅥ ᆷᄌ ᅥ ᆼᄋ ᅴ ᄉ ᅡᄋ ᅭ ᆼᄋ ᅳ ᆯ ᄂ ᅩ ᆫ ᄋ ᅴᄒ ᅡ ᆫᄃ ᅡ. ᄀ ᅥ ᆷᄌ ᅥ ᆼᄋ ᅦ ᄉ ᅡᄋ ᅭ ᆼ ᄒ ᅡ ᆯ ᄀ ᅥ ᆷᄌ ᅥ ᆼᄐ ᅩ ᆼ ᄀ ᅨᄅ ᅣ ᆼᄋ ᅳ ᆫ ᄀ ᅳ ᆨ ᄃ ᅡ ᆫᄀ ᅡ ᆹᄇ ᅮ ᆫ ᄑ ᅩᄋ ᅪ ᄀ ᅪ ᆫᄅ ᅧ ᆫᄃ ᅬ ᆫ ᄆ ᅩᄉ ᅮᄅ ᅳ ᆯ ᄑ ᅩᄒ ᅡ ᆷ ᄒ

ᅡᄀ ᅦ ᄃ ᅬᄀ ᅩ ᄋ ᅵᄀ ᅥ ᆺᄋ ᅳ ᆯ ᄑ ᅧ ᆫᄋ ᅴ-ᄉ ᅮᄌ ᅥ ᆼ ᄎ ᅬᄃ ᅢᄀ ᅡᄂ ᅳ ᆼ ᄃ ᅩᄎ ᅮᄌ ᅥ ᆼᄅ ᅣ ᆼᄀ ᅪ ᄎ ᅬᄃ ᅢᄋ ᅦ ᆫᄐ ᅳᄅ ᅩᄑ ᅵᄎ ᅮᄌ ᅥ ᆼᄅ ᅣ ᆼ ᄃ ᅳ ᆼ ᄋ ᅳᄅ ᅩ ᄃ ᅢᄎ ᅦᄒ ᅡ ᆫ ᄉ ᅮᄌ ᅥ ᆼᄃ ᅬ ᆫ ᄀ ᅥ ᆷᄌ ᅥ ᆼᄐ ᅩ ᆼ ᄀ ᅨ ᄅ

ᅣ ᆼᄃ ᅳ ᆯᄋ ᅳ ᆯ ᄌ ᅦᄉ ᅵᄒ ᅡ ᆫᄃ ᅡ. ᄀ ᅥ ᆷᄌ ᅥ ᆼᄋ ᅴ ᄉ ᅮᄒ ᅢ ᆼᄋ ᅳ ᆯ ᄋ ᅱᄒ ᅢ ᄑ ᅵ ᆯᄋ ᅭᄒ ᅡ ᆫ ᄀ ᅵᄀ ᅡ ᆨᄀ ᅡ ᆹᄋ ᅳ ᆫ ᄆ ᅩᄋ ᅴᄉ ᅵ ᆯᄒ ᅥ ᆷᄋ ᅳ ᆯ ᄐ ᅩ ᆼ ᄒ ᅢ ᄎ ᅮᄌ ᅥ ᆼᄒ ᅡᄋ ᅧ ᄑ ᅭᄋ ᅴ ᄒ ᅧ ᆼᄐ ᅢᄅ ᅩ ᄌ ᅦᄀ ᅩ ᆼ ᄒ ᅡ

ᆫᄃ ᅡ. ᄄ ᅩᄒ ᅡ ᆫ ᄀ ᅥ ᆷᄌ ᅥ ᆼᄅ ᅧ ᆨ ᄇ ᅵᄀ ᅭᄅ ᅳ ᆯ ᄋ ᅱᄒ ᅢ ᄆ ᅩᄋ ᅴᄉ ᅵ ᆯᄒ ᅥ ᆷᄋ ᅳ ᆯ ᄉ ᅵ ᆯᄉ ᅵᄒ ᅡᄀ ᅩ ᄀ ᅳ ᄀ ᅧ ᆯᄀ ᅪᄅ ᅳ ᆯ ᄌ ᅦᄉ ᅵᄒ ᅡ ᆫᄃ ᅡ.

ᄌ

ᅮᄋ ᅭᄋ ᅭ ᆼ ᄋ ᅥ: ᄀ ᅥ ᆷᄌ ᅥ ᆼᄅ ᅧ ᆨ, ᄀ ᅥ ᆷᄌ ᅥ ᆼᄐ ᅩ ᆼ ᄀ ᅨᄅ ᅣ ᆼ, ᄀ ᅳ ᆨ ᄃ ᅡ ᆫᄀ ᅡ ᆹᄇ ᅮ ᆫ ᄑ ᅩ, ᄀ ᅵᄀ ᅡ ᆨᄀ ᅡ ᆹ, ᄌ ᅥ ᆨᄒ ᅡ ᆸᄃ ᅩ, EDF ᄀ ᅥ ᆷᄌ ᅥ ᆼ.

1. 서론 ᄋ

ᅳ

ᆼ용에서 관심의 대상이 되는 현상들의 규명을 위해서 연구자들은 데이터를 수집하고 통계적 분석 으

ᆯ 사용해서 얻은 결과로부터 유의미한 결론을도출하는과학적 연구과정을 수행하게 된다. 대부분의 ᄋ

ᅵ용 가능한 분석방법들은 데이터의 정규성 가정 하에서 개발된 것들로 수집된 데이터의 적용에 무리 ᄀ

ᅡ 있는 경우가 발생한다. 한 예로 어떤 지역에서 여름철 특정 달에 매일 각 시간대별로 관측한 기온 X1, . . . , X24로부터 가장 높은기온 M = max (X1, . . . , X24)를기록하는과정을 일정한 기간 동안 지속 ᄒ

ᅢ서 데이터를얻었다면 이 데이터는정규분포를하지 않을가능성이 높을것이다. 이런 경우 데이터의 화

ᆨ률모형으로 정규분포가 아닌 다른 분포의 사용을고려해 볼 필요가 있다.

저

ᆼ규분포의 대안으로 선택할 수 있는 분포들 중에서 위치와 척도를 나타내는두 개의 모수 µ와 σ를 ᄀ

ᅡ지는제1종극단값분포 (이하극단값분포) EV (µ, σ)는 굼벨 (Gumbel)분포로도 잘 알려져 있으며 특 ᄒ

ᅵ 앞 예의 최대 기온과 같은극단값의 통계적인 모델링을위한 확률분포로 수명검정, 수자원관리 및 ᄉ

ᅮ문학 등의 다양한 영역에서 폭넓게 사용되어지고 있다. 이들 분야에서극단값분포의 유용성은 Hersh- field와 Kohler (1960), Lambert와 Duan (1994), Ryu 등 (2016), Stol (1971), Yang과 Yoon (2017)을 ᄇ

ᅩ기 바라며 응용의 포괄적인 검토는 Johnson 등 (1995)을참조하기 바란다.

그

ᆨ단값분포는 동일한 분포함수를가지는 n개의 독립적인확률변수들의 최대값에 대한극한분포로 이 로

ᆫ적인 유도를할 수 있으며 분포함수의 형태는아래와 같다.

†

ᄋ ᅵ ᄂ ᅩ ᆫᄆ ᅮ ᆫᄋ ᅳ ᆫ 2016ᄒ ᅡ ᆨᄂ ᅧ ᆫᄃ ᅩ ᄀ ᅧ ᆼᄀ ᅵᄃ ᅢᄒ ᅡ ᆨᄀ ᅭ ᄋ ᅧ ᆫᄀ ᅮᄂ ᅧ ᆫ ᄉ ᅮᄒ ᅨᄅ ᅩ ᄋ ᅧ ᆫᄀ ᅮᄃ ᅬᄋ ᅥ ᆻᄋ ᅳ ᆷ.

1

(16227) ᄀ ᅧ ᆼᄀ ᅵᄃ ᅩ ᄉ ᅮᄋ ᅯ ᆫ ᄉ ᅵ ᄋ ᅧ ᆼᄐ ᅩ ᆼ ᄀ ᅮ ᄀ ᅪ ᆼ ᄀ ᅭᄉ ᅡ ᆫᄅ ᅩ 154-42, ᄀ ᅧ ᆼᄀ ᅵᄃ ᅢᄒ ᅡ ᆨᄀ ᅭ ᄀ ᅧ ᆼᄌ ᅦᄒ ᅡ ᆨᄇ ᅮ ᄋ ᅳ ᆼᄋ ᅭ ᆼᄐ ᅩ ᆼ ᄀ ᅨᄌ ᅥ ᆫᄀ ᅩ ᆼ, ᄀ ᅭᄉ ᅮ.

E-mail: [email protected]

(2)

F (x|θ) = exp (

−exp

−x − µ σ

)

, − ∞ < x < ∞, − ∞ < µ < ∞, σ > 0, (1.1)

ᄋ

ᅧ기서 θ = (µ, σ)는모수벡터이다. 또한 분포함수로부터확률밀도함수를구해보면 다음과 같다.

f (x|θ) = 1 σexp

−x − µ σ

exp

(

−exp

−x − µ σ

)

. (1.2)

그

ᆨ단값분포가 연구자의 관점에서 이론적 또는 응용적인 면에서 매력적인 확률모형이라고 하더라도 부

ᆫ석할 데이터에 적합한 확률모형인지를 검증해 볼 필요가 있다. 이것은 데이터 분석의 가장 기초적 ᄋ

ᅵᆫ 단계이고 극단값분포에 대한 데이터 적합을 통해 모형 타당성을 확인해 보려는여러 시도가 있었다 (Vogel, 1986; Fill과 Stedinger, 1995; Wang, 1998). 그러나 제안된방법들은 분포에관련된모수들을 ᄎ

ᅮ정했을때 발생하는 복잡성 때문에광범위한 합의를얻지 못했다. 한편 Stephens (1977)은경험적 분 ᄑ

ᅩ함수를활용하는 EDF (empirical distribution function) 검정으로 앤더슨-달링 (Anderson-Darling) 거

ᆷ정 (이하 AD 검정)과 크래머-미제스 (Cramer-von Mises) 검정 (이하 CM 검정)을소개했다. 제안 ᄒ

ᅡᆫ 검정에서는극단값분포에관련된모수들이 알려져 있지 않은경우 검정통계량의 계산을위해 각 모수 ᄋ

ᅦ 대한 최대가능도추정량 (MLE)를 사용한다. 그러나 Choi (2015)에서 보듯이 최대가능도법으로 얻 ᄋ

ᅳ

ᆫ모수의 추정량이 다른추정법을 통해 구한 것들보다 항상 좋은성능을보이지는않는다. 그러므로 미 ᄌ

ᅵ의 모수를최대가능도추정량으로 대체한 검정통계량을이용하는검정이 항상 좋은검정결과를제공해 ᄌ

ᅮ지는않을것으로 판단되며 최대가능도추정량 대신에 다른추정량의 사용을고려해 볼 필요가 있을것 ᄋ

ᅵ다.

보

ᆫ 논문에서는모수가 미지인 극단값분포에 대한 적합도 검정으로 AD 검정과 CM 검정을고려하고 ᄆ

ᅩ수에 대한 추정량을 Fiorentino와 Gabriele (1984)의 편의-수정 최대가능도추정량 (bias-corrected maximum likelihood estimator), Jowitt (1979)에서 소개된최대엔트로피추정량 (maximum entropy estimator), Greenwood 등 (1979)이 제안한 확률가중적률추정량 (probability weighted moments estimator), Rasmussen과 Gautam (2003)의 일반화된 확률가중적률추정량 (generalized probability weighted moments estimator)으로 대체하여 구축한 검정통계량을제시한다. 그리고 이 검정통계량을 ᄉ

ᅡ용한 검정이 Stephen (1977)이 제안한 검정에 비해 어느 정도의 검정력 이득이 있는지를모의실험을 ᄐ

ᅩ

ᆼ해 비교해 보고자 한다. 2절에서는기존의 검정통계량과의 비교에 사용할 검정통계량들을소개하고 3절에서는모의실험을 통해 얻은검정력의 분석결과를제시한다. 4절에서는간략한 결론으로 마무리한 ᄃ

ᅡ.

2. 극단값분포에 대한 적합도 검정 ᄏ

ᅳ기 n의 표본 X1, . . . , Xn 이 누적분포함수 F (x|θ)를가지는 분포에서 추출되었을때 표본이 특정 부

ᅩ θ는 분포에관련된모수들로 구성된벡터이다.

ᄌ

ᅥᆨ합도 검정 중에서 일반적으로 많이 사용하는 대표적인 것은 EDF 검정으로 경험적 분포함수 Fn(x)와 가설로 설정한 분포함수 F0(x|θ)의 불일치 정도를 재는 측도를 고려하여 다음과 같이 정 ᄋ

ᅴ되는검정통계량을이용한다.

(3)

Q = n Z ∞

−∞

{Fn(x) − F0(x|θ)}²ψ (x) dF0(x|θ) , (2.1)

ᄋ

ᅧ기서 ψ (x)는 {Fn(x) − F0(x|θ)}² 에 적절한 가중을 부여하는 함수이다. AD 검정은 가중함수를 ψ (x) = [F0(x|θ) {1 − F0(x|θ)}]⁻¹로 하는 검정통계량 (통상적으로 A²으로 표기)를, CM 검정은 ψ (x) = 1로 하는 검정통계량 (통상적으로 W²으로 표기)를 사용한다. AD 검정과 CM 검정은 다른 EDF 검정에 비해 비교적 높은검정력을 가지는것으로 알려져 있고 이들 검정에 대한 자세한 논의는 D’Agostino와 Stephens (1986)을참고하기 바란다.

AD 검정과 CM 검정의 수행을위해서는표본으로부터 각각의 검정통계량 A²과 W²을계산해야 한 ᄃ

ᅡ. 이들검정통계량의 계산은확률적분변환(probability integral transformation)을이용하면 어렵지 ᄋ

ᅡ

ᆭ게 할 수 있으며 그 방법은 다음과 같다. 표본 X1, . . . , Xn을 크기순으로 나열하여 정리한 X(1) <

X(2)< · · · < X(n)에 대해 Zⁱ= F0 X(i)|θ, i = 1, . . . , n을계산한다. θ가 알려져 있지 않다면 θ를추 저

ᆼ량 ˆθ로 대체하여 Zi= F0

X(i)|ˆθ

ᄅ

ᅩ 구한다. 변환된Zi들을바탕으로 검정통계량 A²과 W²은각각 ᄋ

ᅡ래의 식으로 계산하게된다 (D’Agostino와 Stephens, 1986).

A²= −n −1 n

n

X

i=1

(2i − 1) [log Zi+ log {1 − Zn+1−i}] , (2.2)

W²=

n

X

i=1

Zi−(2i − 1) 2n

2

+ 1

12n. (2.3)

ᄋ

ᅵ제 표본이 모수 µ와 σ가 알려지지 않은 극단값분포에서 온 것인지를 알아보기 위한 적합도 검정 으

ᆯ고려하기로 한다. 극단값분포의 누적분포함수는 식 (1.1)과 같고 이것을 F (x|µ, σ)로 표기하기로 한 ᄃ

ᅡ. 검정할 영가설의 분포함수는 F0(x|θ) = F (x|µ, σ)이므로 각 가설은다음과 같이 H0 : F (x|θ) = F (x|µ, σ)와 H¹ : F (x|θ) ̸= F (x|µ, σ)로 설정이 되고 검정방법으로 AD 검정과 CM 검정을이용하 ᄀ

ᅵ로 한다. 검정에 사용할 검정통계량 A²과 W²의 계산을하려면 Zi들의 계산이 요구되므로극단값분 ᄑ

ᅩ에관련된모수 µ와 σ의 추정량이 필요하다. 최대가능도추정량을사용하는것이 보편적이지만 Choi (2015)의 모의실험결과에서 보듯이 최대가능도추정량이 일관성 있게 가장 뛰어난 성능을 가지진 않는 ᄃ

ᅡ. 따라서 최대가능도추정량 대신에 다른 추정량을 사용하는 것이 더 나은 검정력을 제공해줄 수도 이

ᆻ을 것이다. 검정통계량의 구축을 위해 모수의 추정량으로 Fiorentino와 Gabriele (1984)의 편의-수 저

ᆼ 최대가능도추정량 (CMLE), Jowitt (1979)의 최대엔트로피추정량 (MEE), Greenwood 등 (1979)의 화

ᆨ률가중적률추정량 (PWME)와 Rasmussen과 Gautam (2003)의 일반화된 확률가중적률추정량 (GP- WME)를 이용하기로 하고 이 추정량들을 이용하여 구한 Zi들로부터 얻은 검정통계량을 아래와 같이 ᄑ

ᅭ기하기로 한다.

Test statistic

MLE CMLE MEE PWME GPWME

AD test A

²_{M L}

A

ᄃ

ᅡ. 그런데 검정통계량의 계산에 필요한 모수들을 추정하여 사용한 경우에는 표집분포의 이론적인 도 ᄎ

ᅮᆯ이 어렵게 되므로 다음의 모의실험을 수행하여 기각값을 추정하기로 한다. 표본크기 10에서 200까 ᄌ

ᅵ 10씩 증가하면서극단값분포 EV (0, 1)로부터 표본을생성한 다음이것을사용하여 모수들의 추정값 으

ᆯ구했다. 계산된추정값을 이용해서 변환된 Zi값들을얻어서 각 검정통계량을 계산했다. 이런 과정 으

ᆯ 500000번 반복을해서 얻은각 검정통계량의 계산값들로부터 산출한 100 (1 − α) 백분위수를유의수 ᄌ

ᅮᆫ α에 해당하는 기각값으로 결정했다. Table 2.1은표본크기에 따른 검정통계량들의 기각값 (유의수 주

ᆫ 5%)이다.

ᄆ

ᅩ의실험을 통해 추정한 Table 2.1의 기각값을검정에서 이용했을때 유의수준 5%를 잘 유지하는지 ᄋ

ᅦ 대한 검토를 통해 기각값의 정확도를평가해 볼 필요가 있다. 만일 검정에서 영가설의 기각비율이 유 ᄋ

ᅴ수준 5%보다 과소 또는과대하게관측된다면 추정한 기각값을 신뢰할 수가 없게된다. Table 2.2는 EV (0, 0.5)와 EV (0, 2)부터 추출한 크기 n = 10, 20, 30, 50, 100인 10000개의 표본을 바탕으로 Table 2.1에 주어진 각 검정통계량에 대한 기각값을사용하여 추정한 기각비율이다. 유의수준이 5%일 때 계 ᄉ

ᅡᆫ된 10000개의 검정통계량값으로부터 추정한 기각비율의 95%는대략 4.56%와 5.44% 사이에 있게된 ᄃ

ᅡ. Table 2.2의 값들은이 범위를벗어나고 있지 않으므로 Table 2.1의 기각값을검정에 이용하는데 있 ᄋ

ᅥ 문제가 없음을알 수 있다.

Table 2.2 Estimated rejection rates of the modified AD and CM tests (α = 0.05) EV (0, 0.5)

, A

²_{P W}

, A

²_{GP W}

for α = 0.05 (D1 : EV2(0,1,2.5), D2 : EV2(0,1,3.5), D3 : G(0.9,1.2), D4 : G(1.2,0.9), D5 : LN(0,0.5), D6 : LN(0,0.75), D7 : N(0,1), D8 : L(0,0.5), D9

: L(0,1.5), D10 : W(5,1), D11 : W(5,5))

3. 검정력 비교

2절에서 소개한 검정통계량들 중에서 어떤 검정통계량을 사용하는 것이 검정력 이득에 유리한지 르

ᆯ 알아보고자 모의실험을 통해 검정력 평가를 해 보기로 한다. 대립분포로는 제2종 극단값분포 EV 2 (µ, σ, α), 감마분포 G (α, β), 로그정규분포 LN µ, σ², 표준정규분포 N (0, 1), 로지스틱분포 L (µ, σ),와이블분포 W (α, β)를선택했다. 이 분포들은극단값분포에 대한 대안으로 응용에서 많이활 ᄋ

ᅭ

ᆼ되는 확률모형들이고 (Reiss와 Thomas, 2001), 제2종극단값분포는 특히 프레셰 (Frechet) 분포로 너

ᆯ리 알려져 있으며 아래와 같은 분포함수를가진다.

F (x|µ, σ, α) = exp

−

−x − µ σ

^−α

, x > µ, σ > 0, α > 0, (3.1)

ᄋ

ᅧ기서 α는형상모수 (shape parameter)이다. 검정력의 추정을위해서 선택한 6개의 대립분포 각각으 ᄅ

ᅩ부터 크기 n = 10, 20, 30, 50인 표본을추출하여 각 검정통계량을계산했다. 검정통계량들의 계산값 ᄋ

ᅵ Table 2.1에서 찾은해당 기각값보다 크면 영가설을기각하게 되고 이 표본은극단값분포를따르지 ᄋ

ᅡ

ᆭ는것으로 기록했다. 이런 과정을 10000번을반복했고극단값분포를따르지 않는표본들의 상대빈도 르

ᆯ구하는방식으로 검정력을추정했다.

20 0.451 0.437 0.462 0.428 0.418

30 0.611 0.596 0.632 0.608 0.602

50 0.814 0.805 0.839 0.827 0.826

EV2(0,1,3.5) 10 0.175 0.163 0.163 0.134 0.112

20 0.287 0.275 0.295 0.268 0.250

30 0.389 0.378 0.417 0.402 0.379

50 0.575 0.562 0.614 0.603 0.587

G(0.9,1.2) 10 0.227 0.196 0.192 0.129 0.138

20 0.440 0.403 0.406 0.318 0.383

30 0.640 0.600 0.606 0.506 0.605

50 0.891 0.871 0.872 0.803 0.884

G(1.2,0.9) 10 0.148 0.125 0.122 0.082 0.085

20 0.260 0.229 0.235 0.171 0.214

30 0.407 0.365 0.373 0.291 0.367

50 0.650 0.615 0.617 0.523 0.632

LN(0,0.5) 10 0.157 0.143 0.143 0.107 0.100

20 0.264 0.244 0.263 0.223 0.226

30 0.360 0.339 0.373 0.335 0.347

50 0.573 0.547 0.593 0.557 0.586

LN(0,0.75) 10 0.250 0.230 0.229 0.175 0.166

20 0.457 0.431 0.454 0.400 0.417

30 0.630 0.604 0.633 0.586 0.617

50 0.846 0.832 0.857 0.823 0.856

N(0,1) 10 0.100 0.116 0.120 0.156 0.155

20 0.221 0.251 0.256 0.295 0.269

30 0.345 0.372 0.387 0.417 0.371

50 0.553 0.579 0.606 0.626 0.572

L(0,0.5) 10 0.216 0.249 0.245 0.278 0.273

20 0.473 0.510 0.492 0.496 0.467

30 0.648 0.679 0.654 0.634 0.606

50 0.868 0.881 0.863 0.828 0.818

L(0,1.5) 10 0.211 0.244 0.241 0.277 0.272

20 0.468 0.505 0.489 0.493 0.462

30 0.650 0.680 0.657 0.635 0.604

50 0.862 0.875 0.861 0.830 0.817

W(5,1) 10 0.140 0.166 0.174 0.220 0.154

20 0.331 0.365 0.386 0.437 0.321

30 0.501 0.534 0.559 0.601 0.493

50 0.770 0.789 0.817 0.841 0.781

W(5,5) 10 0.137 0.164 0.169 0.218 0.148

20 0.332 0.370 0.386 0.439 0.320

30 0.501 0.535 0.562 0.612 0.493

50 0.768 0.788 0.817 0.841 0.781

Average power 0.451 0.452 0.463 0.447 0.435

(Standard deviation) (0.231) (0.232) (0.234) (0.233) (0.235)

거

ᆷ정통계량들의 평균검정력을구해보면 n = 10, 20일 때 A²M E와 A²CM L이 A²M L, A²_{P W}, A²_{GP W}보다 ᄃ

ᅥ 높게 나타나고 n = 30, 50일 때 A²M E와 A²M L이 A²CM L, A²_{P W}, A²_{GP W}에 비해 더 좋게 나타난다. 모 드

20 0.451 0.437 0.462 0.428 0.418

30 0.611 0.596 0.632 0.608 0.602

50 0.814 0.805 0.839 0.827 0.826

EV2(0,1,3.5) 10 0.175 0.163 0.163 0.134 0.112

20 0.287 0.275 0.295 0.268 0.250

30 0.389 0.378 0.417 0.402 0.379

50 0.575 0.562 0.614 0.603 0.587

G(0.9,1.2) 10 0.227 0.196 0.192 0.129 0.138

20 0.440 0.403 0.406 0.318 0.383

30 0.640 0.600 0.606 0.506 0.605

50 0.891 0.871 0.872 0.803 0.884

G(1.2,0.9) 10 0.148 0.125 0.122 0.082 0.085

20 0.260 0.229 0.235 0.171 0.214

30 0.407 0.365 0.373 0.291 0.367

50 0.650 0.615 0.617 0.523 0.632

LN(0,0.5) 10 0.157 0.143 0.143 0.107 0.100

20 0.264 0.244 0.263 0.223 0.226

30 0.360 0.339 0.373 0.335 0.347

50 0.573 0.547 0.593 0.557 0.586

LN(0,0.75) 10 0.250 0.230 0.229 0.175 0.166

20 0.457 0.431 0.454 0.400 0.417

30 0.630 0.604 0.633 0.586 0.617

50 0.846 0.832 0.857 0.823 0.856

N(0,1) 10 0.100 0.116 0.120 0.156 0.155

20 0.221 0.251 0.256 0.295 0.269

30 0.345 0.372 0.387 0.417 0.371

50 0.553 0.579 0.606 0.626 0.572

L(0,0.5) 10 0.216 0.249 0.245 0.278 0.273

20 0.473 0.510 0.492 0.496 0.467

30 0.648 0.679 0.654 0.634 0.606

50 0.868 0.881 0.863 0.828 0.818

L(0,1.5) 10 0.211 0.244 0.241 0.277 0.272

20 0.468 0.505 0.489 0.493 0.462

30 0.650 0.680 0.657 0.635 0.604

50 0.862 0.875 0.861 0.830 0.817

W(5,1) 10 0.140 0.166 0.174 0.220 0.154

20 0.331 0.365 0.386 0.437 0.321

30 0.501 0.534 0.559 0.601 0.493

50 0.770 0.789 0.817 0.841 0.781

W(5,5) 10 0.137 0.164 0.169 0.218 0.148

20 0.332 0.370 0.386 0.439 0.320

30 0.501 0.535 0.562 0.612 0.493

50 0.768 0.788 0.817 0.841 0.781

Average power 0.407 0.406 0.441 0.402 0.412

(Standard deviation) (0.219) (0.223) (0.227) (0.207) (0.223)

ᄌ

ᅵ는반면 n = 30, 50일 때는 A²_{M L}의 검정력이 더 높음을알 수 있다. 또한 제시된표로부터 추가적으 ᄅ

ᅩ 이끌어낸 결과는아래와 같다.

1) A²M L의 검정력은감마분포에서 가장 높게 나타난다. 그러나 A²M L은정규분포에서 가장 낮은검정 ᄅ

ᅧ

ᆨ을보이고 이런 현상은 A²_{GP W}을제외한 와이블분포에서의 결과에서도확인할 수 있다. 또한 A²_{M L}은

(8)

ᄌ

ᅦ2종극단값분포와 로그정규분포에서 대체적으로 A²M E 다음으로 높은검정력을가지게 되지만 로지스 티

ᆨ분포에서 A²GP W을제외한 나머지 검정통계량들보다 낮은검정력을가진다.

2) A²_{CM L}은 로지스틱분포에서 가장 좋은 성능을 보이고 제2종 극단값분포와 (n = 30, 50인 경우) 저

ᆼ규분포에서 대체적으로 가장 낮은 성능을 가진다. 또한 감마분포, 로그정규분포와 와이블분포에서 A²_{CM L}의 검정력은 3번째로 높게 나타난다.

3) A²_{M E}는모든대립분포들에서 1번째 또는 2번째로 높은검정력을가지는걸로 나타나서 가장 강력 ᄒ

ᅡᆫ 검정통계량임을알 수 있다.

4) A²_{P W}의 검정력은 표준정규분포와 와이블분포에서 가장 높게 나타나지만 나머지 대립분포들에서 A²_{GP W}를제외한 다른검정통계들보다 전반적으로 낮게관측이된다. A²GP W의 경우 표준정규분포에서 A²_{P W} 다음의 높은검정력을보이지만 다른대립분포들에서 거의 최하위의 검정력 순위를가진다.

Table 3.2는모의실험에 의해 추정된유의수준 5%에 대한 W_{M L}² , WCM L² , WM E² , WP W² , WGP W² 의 거

ᆷ정력이고 Figure 3.2는 표의 검정력을 그린 플롯이다. 표에 제시된 검정통계량들의 평균 검정력을 ᄇ

ᅩ면 W_{CM L}² 와 WGP W² 가 다른 검정통계량들에 비해 전반적으로 높은 성능을 가지는 반면 W_{CM L}² 과 WP W² 가 낮은성능을가지는것으로 나타난다. 검정통계량들의 평균 검정력을표본크기별로 구해보면 n = 10, 20일 때 WM E² 와 WCM L² 이 다른검정통계량들보다 더 높은검정력을가지고 n = 30, 50일 때 W_{M E}² 과 WGP W² 이 나머지 검정통계량들보다 더 높은검정력을보인다. 또한 제시된표로부터 추가적으 ᄅ

ᅩ 이끌어낸 결과는아래와 같다.

1) 전반적으로 WM E² 은제2종극단값분포, 표준정규분포와 와이블분포에서 가장 높은검정력을보이 ᄆ

ᅧ 나머지 대립분포들에서도 2번째로 높은검정력을가진다.

2) W_{GP W}² 의 검정력은감마분포와 로그정규분포에서 가장 높게 나타나는반면에 표준정규분포와 로 ᄌ

ᅵ스틱분포에서 가장 낮게관측된다.

3) WCM L² 은표준정규분포에서 가장 좋은성능을보이지만 제2종극단값분포와 로그정규분포에서 다 ᄅ

ᅳ

ᆫ검정통계량들에 비해 좋은성능을가지진 않는다.

4) W_{M L}² 은와이블분포에서 WGP W² 을제외한 다른검정통계량들보다 낮은검정력이관측되지만 감마 부

ᆫ포와 로지스틱분포에서 3번째로 높은검정력을보인다.

5) W_{P W}² 의 검정력은 제2종극단값분포와 와이블분포에서 WM E² 다음으로 높게 나타난 반면에 감마 부

ᆫ포에서 다른 검정통계량들의 검정력을 능가하진 않는다. 또한 W_{P W}² 은 로지스틱분포에서 WGP W² 보 ᄃ

ᅡ 좋은성능을보이지만 WM L² , W_{CM L}² , W_{M E}² 에 비해 좋은성능을발휘하지는않는다.

4. 결론

Stephens (1977)은 모수들이 알려져 있지 않은 극단값분포에 대한 적합도 검정통계량으로 AD와 CM 검정통계량을소개했고 검정통계량의 계산을위해 필요한 모수들의 추정량으로 MLE를사용했다.

ᄀ

ᅳ러나 Choi (2015)의 연구에서 보듯이 MLE가 항상 좋은결과를제공하지는않는다. 본 논문에서는 ᄆ

ᅩ수들의 추정량으로 CMLE, MEE, PWE, GPWE로 대체하여 구축한 수정된 AD 검정통계량과 CM 거

ᆷ정통계량을제시하고 이들검정통계량을사용하는검정의 성능을모의실험을 통해 조사했다.

거

ᆷ정력 분석결과에서 A²M E와 A²CM L을사용하는 AD 검정이 전반적으로 우수한 성능을가지는것으 ᄅ

ᅩ 나타났다. CM 검정에서는 W_{M E}² 와 WGP W² 을 사용하는 것이 다른 검정통계량을 이용하는 것보다 ᄋ

ᅲ리함을 볼수 있었다. 그리고 각 검정에서 가장 강력한 검정통계량은 A²_{M E}과 WM E² 임을 알 수 있었 ᄃ

ᅡ. CMLE를이용한 경우 A²CM L은 A²_{M E} 다음으로 가장 좋은성능을보인 반면에 WCM L² 은 W_{P W}² 다 ᄋ

ᅳ

ᆷ으로 가장 낮은 성능을가짐을확인할 수 있었다. MLE를이용한 A²_{M L}과 WM L² 각각은 대체적으로 ᄌ

ᅮᆼ간 순위의 성능을가짐을 알 수 있었다. 따라서 응용에서극단값분포에 대한 적합도 검정통계량으로

: L(0,1.5), D10 : W(5,1), D11 : W(5,5))

A²_{M E}과 WM E² 을사용할 것을추천한다.

References

Choi, B. (2015). Estimation for scale parameter of type-I extreme value distribution. Journal of the Korean Data & Information Society, 26, 535-545.

D’Agostino, R. B. and Stephens, M. A. (1986). Goodness-of-fit techniques, Marcel Dekker Inc, New York.

Fill, H. D. and Stedinger, J. R. (1995). L-moment and probability plot correlation coefficient goodness-of- fit tests for the Gumbel distribution and impact of autocorrelation. Water Resources Research, 31, 225-229.

Fiorentino, M. and Gabriele, S. (1984). A correction for the bias of maximum likelihood estimators of Gumbel parameters. Journal of Hydrology, 73, 39-49.

Greenwood, J. A., Landwehr, J. M., Matalas, N. N. and Wallis, J. R. (1979). Probability weighted mo- ments: Definition and relation to parameters of several distributions expressible in inverse form. Water Resources Research, 15, 1049-1054.

Hershfield, M. A. and Kohler, M. A. (1960). An empirical appraisal of the Gumbel extreme-value procedure.

Journal of Geophysical Research, 65, 1737-1746.

Johnson, N. L., Kotz, S. and Balakrishnan, N. (1995). Continuous Univariate Distributions, Volume 2, Second Edition, Wiley, New York.

Jowitt, P. W. (1979). The extreme value type 1 distribution and the principle of maximum entropy. Journal of Hydrology, 42, 23-38.

Lambert, J. and Duan, L. (1994). Evaluating risk of extreme events for univariate-loss functions. Journal of Water Resources Planning and Management, 120, 382-399.

Rasmussen, P. F. and Gautam, N. (2003). Alternative PWM-estimators of the Gumbel distribution. Jour-

nal of Hydrology, 280, 265-271.

(10)

Reiss, R. D. and Thomas, M. (2001). Statistical Analysis of Extreme Values, Birkh¨ auser, Basel.

Ryu, S., Eom, E., Kwon, T. and Yoon, S. (2016). The estimation of CO concentration in Daegu-Gyeongbuk area using GEV distribution. Journal of the Korean Data & Information Society, 27, 1001-1012.

Stephens, M. A. (1977). Goodness-of-fit for the extreme value distribution. Biometrika, 64, 583-588.

Stol, P. T. (1971). On the decomposition of the extreme value distribution of daily rainfall depths and the derivation of probabilities of compound events. Journal of Hydrology, 14, 181-196.

Vogel, R. M. (1986). The probability plot correlation coefficient test for the normal, lognormal, and Gumbel distributional hypotheses. Water Resources Research, 22, 587-590.

Wang, Q. J. (1998). Approximate goodness-of-fit tests of fitted generalized extreme value distributions using LH moments. Water Resources Research, 34, 3497-3502.

Yang, M. and Yoon, S. (2017). Evaluation of the impact of typhoon on daily maximum precipitation.

Journal of the Korean Data & Information Society, 28, 1415-1425.

(11)

2019, 30

(

3)

,

539–549

A study on goodness-of-fit test for extreme value distribution ^†

Byungjin Choi

¹

1Major in Applied Statistics, Kyonggi University

Received 5 April 2019, revised 30 April 2019, accepted 13 May 2019

Abstract

The extreme value distribution is extensively used as a probability model for data analysis in various fields including life testing and hydrology. Although the use of the extreme value distribution is theoretically or practically justified in such fields, it is necessary to ascertain the appropriateness of the distribution prior to data analysis. In this paper, we discuss the use of the modified Anderson-Darling and Cramer-von Mises tests of fit for the extreme value distribution with unknown parameters. Since the test statistics to be used include the parameters involved in the extreme value distribution, we present the modified test statistics by replacing the unknown parameters with the estimators obtained by the maximum likelihood method for reducing bias and the maximum entropy method, etc. The critical values of the proposed tests using the modified test statistics are estimated by Monte-Carlo simulations and provided in a tabular form. We also carry out Monte-Carlo simulations for performance comparison in terms of power and present the obtained results.

Keywords: Critical value, EDF test, extreme value distribution, goodness-of-fit, test power, test statistic.

†

This work was supported by Kyonggi University Research Grant 2016.

1

A study on goodness-of-fit test for extreme value distribution<sup>†</sup>

2019, 30

3)

539–549

극단값분포에 대한 적합도 검정에 관한 연구 †

1

ᄌ ᅥ

ᆸᄉ ᅮ 2019ᄂ ᅧ ᆫ 4ᄋ ᅯ ᆯ 5ᄋ ᅵ ᆯ, ᄉ ᅮᄌ ᅥ ᆼ 2019ᄂ ᅧ ᆫ 4ᄋ ᅯ ᆯ 30ᄋ ᅵ ᆯ, ᄀ ᅦᄌ ᅢ ᄒ ᅪ ᆨᄌ ᅥ ᆼ 2019ᄂ ᅧ ᆫ 5ᄋ ᅯ ᆯ 13ᄋ ᅵ ᆯ

ᄀ ᅳ

ᆫᄃ ᅡ. ᄄ ᅩᄒ ᅡ ᆫ ᄀ ᅥ ᆷᄌ ᅥ ᆼᄅ ᅧ ᆨ ᄇ ᅵᄀ ᅭᄅ ᅳ ᆯ ᄋ ᅱᄒ ᅢ ᄆ ᅩᄋ ᅴᄉ ᅵ ᆯᄒ ᅥ ᆷᄋ ᅳ ᆯ ᄉ ᅵ ᆯᄉ ᅵᄒ ᅡᄀ ᅩ ᄀ ᅳ ᄀ ᅧ ᆯᄀ ᅪᄅ ᅳ ᆯ ᄌ ᅦᄉ ᅵᄒ ᅡ ᆫᄃ ᅡ.

ᄌ

ᅮᄋ ᅭᄋ ᅭ ᆼ ᄋ ᅥ: ᄀ ᅥ ᆷᄌ ᅥ ᆼᄅ ᅧ ᆨ, ᄀ ᅥ ᆷᄌ ᅥ ᆼᄐ ᅩ ᆼ ᄀ ᅨᄅ ᅣ ᆼ, ᄀ ᅳ ᆨ ᄃ ᅡ ᆫᄀ ᅡ ᆹᄇ ᅮ ᆫ ᄑ ᅩ, ᄀ ᅵᄀ ᅡ ᆨᄀ ᅡ ᆹ, ᄌ ᅥ ᆨᄒ ᅡ ᆸᄃ ᅩ, EDF ᄀ ᅥ ᆷᄌ ᅥ ᆼ.

ᄋ ᅵ ᄂ ᅩ ᆫᄆ ᅮ ᆫᄋ ᅳ ᆫ 2016ᄒ ᅡ ᆨᄂ ᅧ ᆫᄃ ᅩ ᄀ ᅧ ᆼᄀ ᅵᄃ ᅢᄒ ᅡ ᆨᄀ ᅭ ᄋ ᅧ ᆫᄀ ᅮᄂ ᅧ ᆫ ᄉ ᅮᄒ ᅨᄅ ᅩ ᄋ ᅧ ᆫᄀ ᅮᄃ ᅬᄋ ᅥ ᆻᄋ ᅳ ᆷ.

(16227) ᄀ ᅧ ᆼᄀ ᅵᄃ ᅩ ᄉ ᅮᄋ ᅯ ᆫ ᄉ ᅵ ᄋ ᅧ ᆼᄐ ᅩ ᆼ ᄀ ᅮ ᄀ ᅪ ᆼ ᄀ ᅭᄉ ᅡ ᆫᄅ ᅩ 154-42, ᄀ ᅧ ᆼᄀ ᅵᄃ ᅢᄒ ᅡ ᆨᄀ ᅭ ᄀ ᅧ ᆼᄌ ᅦᄒ ᅡ ᆨᄇ ᅮ ᄋ ᅳ ᆼᄋ ᅭ ᆼᄐ ᅩ ᆼ ᄀ ᅨᄌ ᅥ ᆫᄀ ᅩ ᆼ, ᄀ ᅭᄉ ᅮ.

E-mail: [email protected]

Test statistic

MLE CMLE MEE PWME GPWME

AD test A

A

A

A

A

CM test W

W

W

W

W

Table 2.1 Estimated critical values of the modified AD and CM tests (α = 0.05) n A

A

A

A

A

W

W

W

W

W

Table 2.2 Estimated rejection rates of the modified AD and CM tests (α = 0.05) EV (0, 0.5)

n A

A

A

A

A

W

W

W

W

W

EV (0, 2)

n A

A

A

A

A

W

W

W

W

W

10 0.051 0.050 0.052 0.053 0.051 0.052 0.051 0.052 0.052 0.051

20 0.050 0.050 0.050 0.049 0.049 0.052 0.050 0.050 0.050 0.051

30 0.049 0.050 0.051 0.051 0.052 0.051 0.050 0.053 0.050 0.051

50 0.050 0.049 0.050 0.050 0.051 0.049 0.050 0.049 0.050 0.050

100 0.051 0.050 0.050 0.050 0.050 0.051 0.050 0.050 0.050 0.051

Figure 3.1 Estimated powers of A

, A

, A

, A

, A

for α = 0.05 (D1 : EV2(0,1,2.5), D2 : EV2(0,1,3.5), D3 : G(0.9,1.2), D4 : G(1.2,0.9), D5 : LN(0,0.5), D6 : LN(0,0.75), D7 : N(0,1), D8 : L(0,0.5), D9

: L(0,1.5), D10 : W(5,1), D11 : W(5,5))

Table 3.1 Estimated powers of A

, A

, A

, A

, A

(α = 0.05) Distribution n A

A

A

A

극단값분포에 대한 적합도 검정에 관한 연구 ^†

¹