2019, 30
(3)
,539–549
극단값분포에 대한 적합도 검정에 관한 연구 †
ᄎ ᅬ병진
1
1경기대학교 경제학부 응용통계전공
ᄌ ᅥ
ᆸᄉ ᅮ 2019ᄂ ᅧ ᆫ 4ᄋ ᅯ ᆯ 5ᄋ ᅵ ᆯ, ᄉ ᅮᄌ ᅥ ᆼ 2019ᄂ ᅧ ᆫ 4ᄋ ᅯ ᆯ 30ᄋ ᅵ ᆯ, ᄀ ᅦᄌ ᅢ ᄒ ᅪ ᆨᄌ ᅥ ᆼ 2019ᄂ ᅧ ᆫ 5ᄋ ᅯ ᆯ 13ᄋ ᅵ ᆯ
요 약
ᄀ ᅳ
ᆨ ᄃ ᅡ ᆫᄀ ᅡ ᆹᄇ ᅮ ᆫ ᄑ ᅩᄂ ᅳ ᆫ ᄉ ᅮᄆ ᅧ ᆼᄀ ᅥ ᆷᄌ ᅥ ᆼᄀ ᅪ ᄉ ᅮᄆ ᅮ ᆫ ᄒ ᅡ ᆨ ᄃ ᅳ ᆼ ᄋ ᅴ ᄃ ᅡᄋ ᅣ ᆼᄒ ᅡ ᆫ ᄋ ᅧ ᆼᄋ ᅧ ᆨᄋ ᅦᄉ ᅥ ᄃ ᅦᄋ ᅵᄐ ᅥ ᄇ ᅮ ᆫᄉ ᅥ ᆨᄋ ᅳ ᆯ ᄋ ᅱᄒ ᅡ ᆫ ᄒ ᅪ ᆨᄅ ᅲ ᆯ ᄆ ᅩᄒ ᅧ ᆼᄋ ᅳᄅ ᅩ ᄀ ᅪ ᆼᄇ ᅥ ᆷᄋ ᅱ ᄒ
ᅡᄀ ᅦ ᄉ ᅵᄋ ᅭ ᆼ ᄃ ᅬᄀ ᅩ ᄋ ᅵ ᆻᄃ ᅡ. ᄀ ᅳ ᆨ ᄃ ᅡ ᆫᄀ ᅡ ᆹᄇ ᅮ ᆫ ᄑ ᅩᄀ ᅡ ᄋ ᅵᄃ ᅳ ᆯ ᄋ ᅧ ᆼᄋ ᅧ ᆨᄋ ᅦᄉ ᅥ ᄋ ᅵᄅ ᅩ ᆫᄌ ᅥ ᆨ ᄄ ᅩᄂ ᅳ ᆫ ᄋ ᅳ ᆼᄋ ᅭ ᆼᄌ ᅥ ᆨᄋ ᅵ ᆫ ᄆ ᅧ ᆫᄋ ᅦᄉ ᅥ ᄆ ᅢᄅ ᅧ ᆨᄌ ᅥ ᆨᄋ ᅵ ᆫ ᄆ ᅩᄒ ᅧ ᆼᄋ ᅵᄅ ᅡᄀ ᅩ ᄒ
ᅡᄃ ᅥᄅ ᅡᄃ ᅩ ᄇ ᅮ ᆫᄉ ᅥ ᆨᄆ ᅩᄒ ᅧ ᆼᄋ ᅳᄅ ᅩ ᄃ ᅦᄋ ᅵᄐ ᅥᄋ ᅦ ᄌ ᅥ ᆨᄒ ᅡ ᆸᄒ ᅡ ᆫᄌ ᅵᄅ ᅳ ᆯ ᄀ ᅥ ᆷᄌ ᅳ ᆼ ᄒ ᅢ ᄇ ᅩ ᆯ ᄑ ᅵ ᆯᄋ ᅭᄀ ᅡ ᄋ ᅵ ᆻᄃ ᅡ. ᄇ ᅩ ᆫ ᄂ ᅩ ᆫᄆ ᅮ ᆫ ᄋ ᅦᄉ ᅥᄂ ᅳ ᆫ ᄆ ᅩᄉ ᅮᄃ ᅳ ᆯ ᄋ ᅵ ᄆ ᅵᄌ ᅵᄋ ᅵ ᆫ ᄀ ᅳ
ᆨ ᄃ ᅡ ᆫᄀ ᅡ ᆹᄇ ᅮ ᆫ ᄑ ᅩᄋ ᅦ ᄃ ᅢᄒ ᅡ ᆫ ᄌ ᅥ ᆨᄒ ᅡ ᆸᄃ ᅩ ᄀ ᅥ ᆷᄌ ᅥ ᆼᄋ ᅳ ᆯ ᄋ ᅱᄒ ᅢ ᄋ ᅢ ᆫᄃ ᅥᄉ ᅳ ᆫ-ᄃ ᅡ ᆯᄅ ᅵ ᆼ (Anderson-Darling)ᄀ ᅪ ᄏ ᅳᄅ ᅢᄆ ᅥ-ᄆ ᅵᄌ ᅦᄉ ᅳ (Cramer- von Mises) ᄀ ᅥ ᆷᄌ ᅥ ᆼᄋ ᅴ ᄉ ᅡᄋ ᅭ ᆼᄋ ᅳ ᆯ ᄂ ᅩ ᆫ ᄋ ᅴᄒ ᅡ ᆫᄃ ᅡ. ᄀ ᅥ ᆷᄌ ᅥ ᆼᄋ ᅦ ᄉ ᅡᄋ ᅭ ᆼ ᄒ ᅡ ᆯ ᄀ ᅥ ᆷᄌ ᅥ ᆼᄐ ᅩ ᆼ ᄀ ᅨᄅ ᅣ ᆼᄋ ᅳ ᆫ ᄀ ᅳ ᆨ ᄃ ᅡ ᆫᄀ ᅡ ᆹᄇ ᅮ ᆫ ᄑ ᅩᄋ ᅪ ᄀ ᅪ ᆫᄅ ᅧ ᆫᄃ ᅬ ᆫ ᄆ ᅩᄉ ᅮᄅ ᅳ ᆯ ᄑ ᅩᄒ ᅡ ᆷ ᄒ
ᅡᄀ ᅦ ᄃ ᅬᄀ ᅩ ᄋ ᅵᄀ ᅥ ᆺᄋ ᅳ ᆯ ᄑ ᅧ ᆫᄋ ᅴ-ᄉ ᅮᄌ ᅥ ᆼ ᄎ ᅬᄃ ᅢᄀ ᅡᄂ ᅳ ᆼ ᄃ ᅩᄎ ᅮᄌ ᅥ ᆼᄅ ᅣ ᆼᄀ ᅪ ᄎ ᅬᄃ ᅢᄋ ᅦ ᆫᄐ ᅳᄅ ᅩᄑ ᅵᄎ ᅮᄌ ᅥ ᆼᄅ ᅣ ᆼ ᄃ ᅳ ᆼ ᄋ ᅳᄅ ᅩ ᄃ ᅢᄎ ᅦᄒ ᅡ ᆫ ᄉ ᅮᄌ ᅥ ᆼᄃ ᅬ ᆫ ᄀ ᅥ ᆷᄌ ᅥ ᆼᄐ ᅩ ᆼ ᄀ ᅨ ᄅ
ᅣ ᆼᄃ ᅳ ᆯᄋ ᅳ ᆯ ᄌ ᅦᄉ ᅵᄒ ᅡ ᆫᄃ ᅡ. ᄀ ᅥ ᆷᄌ ᅥ ᆼᄋ ᅴ ᄉ ᅮᄒ ᅢ ᆼᄋ ᅳ ᆯ ᄋ ᅱᄒ ᅢ ᄑ ᅵ ᆯᄋ ᅭᄒ ᅡ ᆫ ᄀ ᅵᄀ ᅡ ᆨᄀ ᅡ ᆹᄋ ᅳ ᆫ ᄆ ᅩᄋ ᅴᄉ ᅵ ᆯᄒ ᅥ ᆷᄋ ᅳ ᆯ ᄐ ᅩ ᆼ ᄒ ᅢ ᄎ ᅮᄌ ᅥ ᆼᄒ ᅡᄋ ᅧ ᄑ ᅭᄋ ᅴ ᄒ ᅧ ᆼᄐ ᅢᄅ ᅩ ᄌ ᅦᄀ ᅩ ᆼ ᄒ ᅡ
ᆫᄃ ᅡ. ᄄ ᅩᄒ ᅡ ᆫ ᄀ ᅥ ᆷᄌ ᅥ ᆼᄅ ᅧ ᆨ ᄇ ᅵᄀ ᅭᄅ ᅳ ᆯ ᄋ ᅱᄒ ᅢ ᄆ ᅩᄋ ᅴᄉ ᅵ ᆯᄒ ᅥ ᆷᄋ ᅳ ᆯ ᄉ ᅵ ᆯᄉ ᅵᄒ ᅡᄀ ᅩ ᄀ ᅳ ᄀ ᅧ ᆯᄀ ᅪᄅ ᅳ ᆯ ᄌ ᅦᄉ ᅵᄒ ᅡ ᆫᄃ ᅡ.
ᄌ
ᅮᄋ ᅭᄋ ᅭ ᆼ ᄋ ᅥ: ᄀ ᅥ ᆷᄌ ᅥ ᆼᄅ ᅧ ᆨ, ᄀ ᅥ ᆷᄌ ᅥ ᆼᄐ ᅩ ᆼ ᄀ ᅨᄅ ᅣ ᆼ, ᄀ ᅳ ᆨ ᄃ ᅡ ᆫᄀ ᅡ ᆹᄇ ᅮ ᆫ ᄑ ᅩ, ᄀ ᅵᄀ ᅡ ᆨᄀ ᅡ ᆹ, ᄌ ᅥ ᆨᄒ ᅡ ᆸᄃ ᅩ, EDF ᄀ ᅥ ᆷᄌ ᅥ ᆼ.
1. 서론 ᄋ
ᅳ
ᆼ용에서 관심의 대상이 되는 현상들의 규명을 위해서 연구자들은 데이터를 수집하고 통계적 분석 으
ᆯ 사용해서 얻은 결과로부터 유의미한 결론을도출하는과학적 연구과정을 수행하게 된다. 대부분의 ᄋ
ᅵ용 가능한 분석방법들은 데이터의 정규성 가정 하에서 개발된 것들로 수집된 데이터의 적용에 무리 ᄀ
ᅡ 있는 경우가 발생한다. 한 예로 어떤 지역에서 여름철 특정 달에 매일 각 시간대별로 관측한 기온 X1, . . . , X24로부터 가장 높은기온 M = max (X1, . . . , X24)를기록하는과정을 일정한 기간 동안 지속 ᄒ
ᅢ서 데이터를얻었다면 이 데이터는정규분포를하지 않을가능성이 높을것이다. 이런 경우 데이터의 화
ᆨ률모형으로 정규분포가 아닌 다른 분포의 사용을고려해 볼 필요가 있다.
저
ᆼ규분포의 대안으로 선택할 수 있는 분포들 중에서 위치와 척도를 나타내는두 개의 모수 µ와 σ를 ᄀ
ᅡ지는제1종극단값분포 (이하극단값분포) EV (µ, σ)는 굼벨 (Gumbel)분포로도 잘 알려져 있으며 특 ᄒ
ᅵ 앞 예의 최대 기온과 같은극단값의 통계적인 모델링을위한 확률분포로 수명검정, 수자원관리 및 ᄉ
ᅮ문학 등의 다양한 영역에서 폭넓게 사용되어지고 있다. 이들 분야에서극단값분포의 유용성은 Hersh- field와 Kohler (1960), Lambert와 Duan (1994), Ryu 등 (2016), Stol (1971), Yang과 Yoon (2017)을 ᄇ
ᅩ기 바라며 응용의 포괄적인 검토는 Johnson 등 (1995)을참조하기 바란다.
그
ᆨ단값분포는 동일한 분포함수를가지는 n개의 독립적인확률변수들의 최대값에 대한극한분포로 이 로
ᆫ적인 유도를할 수 있으며 분포함수의 형태는아래와 같다.
†
ᄋ ᅵ ᄂ ᅩ ᆫᄆ ᅮ ᆫᄋ ᅳ ᆫ 2016ᄒ ᅡ ᆨᄂ ᅧ ᆫᄃ ᅩ ᄀ ᅧ ᆼᄀ ᅵᄃ ᅢᄒ ᅡ ᆨᄀ ᅭ ᄋ ᅧ ᆫᄀ ᅮᄂ ᅧ ᆫ ᄉ ᅮᄒ ᅨᄅ ᅩ ᄋ ᅧ ᆫᄀ ᅮᄃ ᅬᄋ ᅥ ᆻᄋ ᅳ ᆷ.
1
(16227) ᄀ ᅧ ᆼᄀ ᅵᄃ ᅩ ᄉ ᅮᄋ ᅯ ᆫ ᄉ ᅵ ᄋ ᅧ ᆼᄐ ᅩ ᆼ ᄀ ᅮ ᄀ ᅪ ᆼ ᄀ ᅭᄉ ᅡ ᆫᄅ ᅩ 154-42, ᄀ ᅧ ᆼᄀ ᅵᄃ ᅢᄒ ᅡ ᆨᄀ ᅭ ᄀ ᅧ ᆼᄌ ᅦᄒ ᅡ ᆨᄇ ᅮ ᄋ ᅳ ᆼᄋ ᅭ ᆼᄐ ᅩ ᆼ ᄀ ᅨᄌ ᅥ ᆫᄀ ᅩ ᆼ, ᄀ ᅭᄉ ᅮ.
E-mail: [email protected]
F (x|θ) = exp (
−exp
−x − µ σ
)
, − ∞ < x < ∞, − ∞ < µ < ∞, σ > 0, (1.1)
ᄋ
ᅧ기서 θ = (µ, σ)는모수벡터이다. 또한 분포함수로부터확률밀도함수를구해보면 다음과 같다.
f (x|θ) = 1 σexp
−x − µ σ
exp
(
−exp
−x − µ σ
)
. (1.2)
그
ᆨ단값분포가 연구자의 관점에서 이론적 또는 응용적인 면에서 매력적인 확률모형이라고 하더라도 부
ᆫ석할 데이터에 적합한 확률모형인지를 검증해 볼 필요가 있다. 이것은 데이터 분석의 가장 기초적 ᄋ
ᅵᆫ 단계이고 극단값분포에 대한 데이터 적합을 통해 모형 타당성을 확인해 보려는여러 시도가 있었다 (Vogel, 1986; Fill과 Stedinger, 1995; Wang, 1998). 그러나 제안된방법들은 분포에관련된모수들을 ᄎ
ᅮ정했을때 발생하는 복잡성 때문에광범위한 합의를얻지 못했다. 한편 Stephens (1977)은경험적 분 ᄑ
ᅩ함수를활용하는 EDF (empirical distribution function) 검정으로 앤더슨-달링 (Anderson-Darling) 거
ᆷ정 (이하 AD 검정)과 크래머-미제스 (Cramer-von Mises) 검정 (이하 CM 검정)을소개했다. 제안 ᄒ
ᅡᆫ 검정에서는극단값분포에관련된모수들이 알려져 있지 않은경우 검정통계량의 계산을위해 각 모수 ᄋ
ᅦ 대한 최대가능도추정량 (MLE)를 사용한다. 그러나 Choi (2015)에서 보듯이 최대가능도법으로 얻 ᄋ
ᅳ
ᆫ모수의 추정량이 다른추정법을 통해 구한 것들보다 항상 좋은성능을보이지는않는다. 그러므로 미 ᄌ
ᅵ의 모수를최대가능도추정량으로 대체한 검정통계량을이용하는검정이 항상 좋은검정결과를제공해 ᄌ
ᅮ지는않을것으로 판단되며 최대가능도추정량 대신에 다른추정량의 사용을고려해 볼 필요가 있을것 ᄋ
ᅵ다.
보
ᆫ 논문에서는모수가 미지인 극단값분포에 대한 적합도 검정으로 AD 검정과 CM 검정을고려하고 ᄆ
ᅩ수에 대한 추정량을 Fiorentino와 Gabriele (1984)의 편의-수정 최대가능도추정량 (bias-corrected maximum likelihood estimator), Jowitt (1979)에서 소개된최대엔트로피추정량 (maximum entropy estimator), Greenwood 등 (1979)이 제안한 확률가중적률추정량 (probability weighted moments estimator), Rasmussen과 Gautam (2003)의 일반화된 확률가중적률추정량 (generalized probability weighted moments estimator)으로 대체하여 구축한 검정통계량을제시한다. 그리고 이 검정통계량을 ᄉ
ᅡ용한 검정이 Stephen (1977)이 제안한 검정에 비해 어느 정도의 검정력 이득이 있는지를모의실험을 ᄐ
ᅩ
ᆼ해 비교해 보고자 한다. 2절에서는기존의 검정통계량과의 비교에 사용할 검정통계량들을소개하고 3절에서는모의실험을 통해 얻은검정력의 분석결과를제시한다. 4절에서는간략한 결론으로 마무리한 ᄃ
ᅡ.
2. 극단값분포에 대한 적합도 검정 ᄏ
ᅳ기 n의 표본 X1, . . . , Xn 이 누적분포함수 F (x|θ)를가지는 분포에서 추출되었을때 표본이 특정 부
ᆫ포를 따르는지에 대한 적합도 검정은 영가설과 대립가설이 각각 H0 : F (x|θ) = F0(x|θ)와 H1 : F (x|θ) ̸= F0(x|θ)로 설정되는가설검정의 문제이다. 여기서 F0(x|θ)는 특정분포의 누적분포함수이 ᄀ
ᅩ θ는 분포에관련된모수들로 구성된벡터이다.
ᄌ
ᅥᆨ합도 검정 중에서 일반적으로 많이 사용하는 대표적인 것은 EDF 검정으로 경험적 분포함수 Fn(x)와 가설로 설정한 분포함수 F0(x|θ)의 불일치 정도를 재는 측도를 고려하여 다음과 같이 정 ᄋ
ᅴ되는검정통계량을이용한다.
Q = n Z ∞
−∞
{Fn(x) − F0(x|θ)}2ψ (x) dF0(x|θ) , (2.1)
ᄋ
ᅧ기서 ψ (x)는 {Fn(x) − F0(x|θ)}2 에 적절한 가중을 부여하는 함수이다. AD 검정은 가중함수를 ψ (x) = [F0(x|θ) {1 − F0(x|θ)}]−1로 하는 검정통계량 (통상적으로 A2으로 표기)를, CM 검정은 ψ (x) = 1로 하는 검정통계량 (통상적으로 W2으로 표기)를 사용한다. AD 검정과 CM 검정은 다른 EDF 검정에 비해 비교적 높은검정력을 가지는것으로 알려져 있고 이들 검정에 대한 자세한 논의는 D’Agostino와 Stephens (1986)을참고하기 바란다.
AD 검정과 CM 검정의 수행을위해서는표본으로부터 각각의 검정통계량 A2과 W2을계산해야 한 ᄃ
ᅡ. 이들검정통계량의 계산은확률적분변환(probability integral transformation)을이용하면 어렵지 ᄋ
ᅡ
ᆭ게 할 수 있으며 그 방법은 다음과 같다. 표본 X1, . . . , Xn을 크기순으로 나열하여 정리한 X(1) <
X(2)< · · · < X(n)에 대해 Zi= F0 X(i)|θ, i = 1, . . . , n을계산한다. θ가 알려져 있지 않다면 θ를추 저
ᆼ량 ˆθ로 대체하여 Zi= F0
X(i)|ˆθ
ᄅ
ᅩ 구한다. 변환된Zi들을바탕으로 검정통계량 A2과 W2은각각 ᄋ
ᅡ래의 식으로 계산하게된다 (D’Agostino와 Stephens, 1986).
A2= −n −1 n
n
X
i=1
(2i − 1) [log Zi+ log {1 − Zn+1−i}] , (2.2)
W2=
n
X
i=1
Zi−(2i − 1) 2n
2
+ 1
12n. (2.3)
ᄋ
ᅵ제 표본이 모수 µ와 σ가 알려지지 않은 극단값분포에서 온 것인지를 알아보기 위한 적합도 검정 으
ᆯ고려하기로 한다. 극단값분포의 누적분포함수는 식 (1.1)과 같고 이것을 F (x|µ, σ)로 표기하기로 한 ᄃ
ᅡ. 검정할 영가설의 분포함수는 F0(x|θ) = F (x|µ, σ)이므로 각 가설은다음과 같이 H0 : F (x|θ) = F (x|µ, σ)와 H1 : F (x|θ) ̸= F (x|µ, σ)로 설정이 되고 검정방법으로 AD 검정과 CM 검정을이용하 ᄀ
ᅵ로 한다. 검정에 사용할 검정통계량 A2과 W2의 계산을하려면 Zi들의 계산이 요구되므로극단값분 ᄑ
ᅩ에관련된모수 µ와 σ의 추정량이 필요하다. 최대가능도추정량을사용하는것이 보편적이지만 Choi (2015)의 모의실험결과에서 보듯이 최대가능도추정량이 일관성 있게 가장 뛰어난 성능을 가지진 않는 ᄃ
ᅡ. 따라서 최대가능도추정량 대신에 다른 추정량을 사용하는 것이 더 나은 검정력을 제공해줄 수도 이
ᆻ을 것이다. 검정통계량의 구축을 위해 모수의 추정량으로 Fiorentino와 Gabriele (1984)의 편의-수 저
ᆼ 최대가능도추정량 (CMLE), Jowitt (1979)의 최대엔트로피추정량 (MEE), Greenwood 등 (1979)의 화
ᆨ률가중적률추정량 (PWME)와 Rasmussen과 Gautam (2003)의 일반화된 확률가중적률추정량 (GP- WME)를 이용하기로 하고 이 추정량들을 이용하여 구한 Zi들로부터 얻은 검정통계량을 아래와 같이 ᄑ
ᅭ기하기로 한다.
Test statistic
MLE CMLE MEE PWME GPWME
AD test A
2M LA
2CM LA
2M EA
2P WA
2GP WCM test W
M L2W
CM L2W
M E2W
P W2W
GP W2ᄋ
ᅱ의 열거된검정통계량을이용하여 유의수준 α인 검정을수행하려면 영가설의 기각 여부를결정하 ᄀ
ᅵ 위한 기각값이 필요하다. 이 값은 영가설이 사실일 때 검정통계량의 표집분포로부터 결정하게 된
Table 2.1 Estimated critical values of the modified AD and CM tests (α = 0.05) n A
2M LA
2CM LA
2M EA
2P WA
2GP WW
M L2W
CM L2W
M E2W
P W2W
GP W210 0.725 0.671 0.761 0.789 0.915 0.120 0.115 0.134 0.128 0.142 20 0.742 0.714 0.783 0.813 0.869 0.122 0.119 0.137 0.131 0.142 30 0.747 0.729 0.790 0.819 0.856 0.123 0.121 0.137 0.132 0.143 40 0.747 0.734 0.792 0.816 0.843 0.123 0.122 0.138 0.132 0.142 50 0.750 0.740 0.794 0.820 0.839 0.123 0.122 0.138 0.133 0.142 60 0.752 0.745 0.798 0.819 0.835 0.123 0.122 0.139 0.133 0.142 80 0.753 0.747 0.798 0.824 0.832 0.123 0.123 0.139 0.133 0.142 100 0.754 0.749 0.798 0.822 0.826 0.123 0.123 0.139 0.133 0.141 150 0.756 0.752 0.801 0.823 0.820 0.124 0.123 0.139 0.134 0.141 200 0.756 0.752 0.801 0.824 0.819 0.124 0.124 0.139 0.134 0.141
ᄃ
ᅡ. 그런데 검정통계량의 계산에 필요한 모수들을 추정하여 사용한 경우에는 표집분포의 이론적인 도 ᄎ
ᅮᆯ이 어렵게 되므로 다음의 모의실험을 수행하여 기각값을 추정하기로 한다. 표본크기 10에서 200까 ᄌ
ᅵ 10씩 증가하면서극단값분포 EV (0, 1)로부터 표본을생성한 다음이것을사용하여 모수들의 추정값 으
ᆯ구했다. 계산된추정값을 이용해서 변환된 Zi값들을얻어서 각 검정통계량을 계산했다. 이런 과정 으
ᆯ 500000번 반복을해서 얻은각 검정통계량의 계산값들로부터 산출한 100 (1 − α) 백분위수를유의수 ᄌ
ᅮᆫ α에 해당하는 기각값으로 결정했다. Table 2.1은표본크기에 따른 검정통계량들의 기각값 (유의수 주
ᆫ 5%)이다.
ᄆ
ᅩ의실험을 통해 추정한 Table 2.1의 기각값을검정에서 이용했을때 유의수준 5%를 잘 유지하는지 ᄋ
ᅦ 대한 검토를 통해 기각값의 정확도를평가해 볼 필요가 있다. 만일 검정에서 영가설의 기각비율이 유 ᄋ
ᅴ수준 5%보다 과소 또는과대하게관측된다면 추정한 기각값을 신뢰할 수가 없게된다. Table 2.2는 EV (0, 0.5)와 EV (0, 2)부터 추출한 크기 n = 10, 20, 30, 50, 100인 10000개의 표본을 바탕으로 Table 2.1에 주어진 각 검정통계량에 대한 기각값을사용하여 추정한 기각비율이다. 유의수준이 5%일 때 계 ᄉ
ᅡᆫ된 10000개의 검정통계량값으로부터 추정한 기각비율의 95%는대략 4.56%와 5.44% 사이에 있게된 ᄃ
ᅡ. Table 2.2의 값들은이 범위를벗어나고 있지 않으므로 Table 2.1의 기각값을검정에 이용하는데 있 ᄋ
ᅥ 문제가 없음을알 수 있다.
Table 2.2 Estimated rejection rates of the modified AD and CM tests (α = 0.05) EV (0, 0.5)
n A
2M LA
2CM LA
2M EA
2P WA
2GP WW
M L2W
CM L2W
M E2W
P W2W
GP W210 0.049 0.049 0.049 0.049 0.049 0.050 0.049 0.048 0.047 0.048 20 0.048 0.049 0.051 0.048 0.050 0.048 0.048 0.049 0.049 0.050 30 0.050 0.050 0.051 0.051 0.049 0.051 0.051 0.052 0.051 0.050 50 0.050 0.051 0.050 0.050 0.051 0.051 0.051 0.052 0.052 0.052 100 0.049 0.049 0.051 0.051 0.050 0.051 0.050 0.051 0.050 0.051
EV (0, 2)
n A
2M LA
2CM LA
2M EA
2P WA
2GP WW
M L2W
CM L2W
M E2W
P W2W
GP W210 0.051 0.050 0.052 0.053 0.051 0.052 0.051 0.052 0.052 0.051
20 0.050 0.050 0.050 0.049 0.049 0.052 0.050 0.050 0.050 0.051
30 0.049 0.050 0.051 0.051 0.052 0.051 0.050 0.053 0.050 0.051
50 0.050 0.049 0.050 0.050 0.051 0.049 0.050 0.049 0.050 0.050
100 0.051 0.050 0.050 0.050 0.050 0.051 0.050 0.050 0.050 0.051
Figure 3.1 Estimated powers of A
2M L, A
2CM L, A
2M E, A
2P W, A
2GP Wfor α = 0.05 (D1 : EV2(0,1,2.5), D2 : EV2(0,1,3.5), D3 : G(0.9,1.2), D4 : G(1.2,0.9), D5 : LN(0,0.5), D6 : LN(0,0.75), D7 : N(0,1), D8 : L(0,0.5), D9
: L(0,1.5), D10 : W(5,1), D11 : W(5,5))
3. 검정력 비교
2절에서 소개한 검정통계량들 중에서 어떤 검정통계량을 사용하는 것이 검정력 이득에 유리한지 르
ᆯ 알아보고자 모의실험을 통해 검정력 평가를 해 보기로 한다. 대립분포로는 제2종 극단값분포 EV 2 (µ, σ, α), 감마분포 G (α, β), 로그정규분포 LN µ, σ2, 표준정규분포 N (0, 1), 로지스틱분포 L (µ, σ),와이블분포 W (α, β)를선택했다. 이 분포들은극단값분포에 대한 대안으로 응용에서 많이활 ᄋ
ᅭ
ᆼ되는 확률모형들이고 (Reiss와 Thomas, 2001), 제2종극단값분포는 특히 프레셰 (Frechet) 분포로 너
ᆯ리 알려져 있으며 아래와 같은 분포함수를가진다.
F (x|µ, σ, α) = exp
−
−x − µ σ
−α
, x > µ, σ > 0, α > 0, (3.1)
ᄋ
ᅧ기서 α는형상모수 (shape parameter)이다. 검정력의 추정을위해서 선택한 6개의 대립분포 각각으 ᄅ
ᅩ부터 크기 n = 10, 20, 30, 50인 표본을추출하여 각 검정통계량을계산했다. 검정통계량들의 계산값 ᄋ
ᅵ Table 2.1에서 찾은해당 기각값보다 크면 영가설을기각하게 되고 이 표본은극단값분포를따르지 ᄋ
ᅡ
ᆭ는것으로 기록했다. 이런 과정을 10000번을반복했고극단값분포를따르지 않는표본들의 상대빈도 르
ᆯ구하는방식으로 검정력을추정했다.
Table 3.1은모의실험에 의해 추정된유의수준 5%에 대한 A2M L, A2CM L, A2M E, A2P W, A2GP W의 검 저
ᆼ력이고 Figure 3.1은표의 검정력을그린 플롯이다. 표에 제시된 검정통계량들의 평균검정력을보면 A2M E가 가장 높은 성능을가지는반면 A2GP W가 가장 낮은성능을가지는것으로 나타낸다. A2CM L과 A2M L 각각은 2번째와 3번째로 높은 검정력을 보이지만 두 검정력의 차이는 거의 없다. 표본크기별로
Table 3.1 Estimated powers of A
2M L, A
2CM L, A
2M E, A
2P W, A
2GP W(α = 0.05) Distribution n A
2M LA
2CM LA
2M EA
2P WA
2GP WEV2(0,1,2.5) 10 0.255 0.243 0.241 0.200 0.182
20 0.451 0.437 0.462 0.428 0.418
30 0.611 0.596 0.632 0.608 0.602
50 0.814 0.805 0.839 0.827 0.826
EV2(0,1,3.5) 10 0.175 0.163 0.163 0.134 0.112
20 0.287 0.275 0.295 0.268 0.250
30 0.389 0.378 0.417 0.402 0.379
50 0.575 0.562 0.614 0.603 0.587
G(0.9,1.2) 10 0.227 0.196 0.192 0.129 0.138
20 0.440 0.403 0.406 0.318 0.383
30 0.640 0.600 0.606 0.506 0.605
50 0.891 0.871 0.872 0.803 0.884
G(1.2,0.9) 10 0.148 0.125 0.122 0.082 0.085
20 0.260 0.229 0.235 0.171 0.214
30 0.407 0.365 0.373 0.291 0.367
50 0.650 0.615 0.617 0.523 0.632
LN(0,0.5) 10 0.157 0.143 0.143 0.107 0.100
20 0.264 0.244 0.263 0.223 0.226
30 0.360 0.339 0.373 0.335 0.347
50 0.573 0.547 0.593 0.557 0.586
LN(0,0.75) 10 0.250 0.230 0.229 0.175 0.166
20 0.457 0.431 0.454 0.400 0.417
30 0.630 0.604 0.633 0.586 0.617
50 0.846 0.832 0.857 0.823 0.856
N(0,1) 10 0.100 0.116 0.120 0.156 0.155
20 0.221 0.251 0.256 0.295 0.269
30 0.345 0.372 0.387 0.417 0.371
50 0.553 0.579 0.606 0.626 0.572
L(0,0.5) 10 0.216 0.249 0.245 0.278 0.273
20 0.473 0.510 0.492 0.496 0.467
30 0.648 0.679 0.654 0.634 0.606
50 0.868 0.881 0.863 0.828 0.818
L(0,1.5) 10 0.211 0.244 0.241 0.277 0.272
20 0.468 0.505 0.489 0.493 0.462
30 0.650 0.680 0.657 0.635 0.604
50 0.862 0.875 0.861 0.830 0.817
W(5,1) 10 0.140 0.166 0.174 0.220 0.154
20 0.331 0.365 0.386 0.437 0.321
30 0.501 0.534 0.559 0.601 0.493
50 0.770 0.789 0.817 0.841 0.781
W(5,5) 10 0.137 0.164 0.169 0.218 0.148
20 0.332 0.370 0.386 0.439 0.320
30 0.501 0.535 0.562 0.612 0.493
50 0.768 0.788 0.817 0.841 0.781
Average power 0.451 0.452 0.463 0.447 0.435
(Standard deviation) (0.231) (0.232) (0.234) (0.233) (0.235)
거
ᆷ정통계량들의 평균검정력을구해보면 n = 10, 20일 때 A2M E와 A2CM L이 A2M L, A2P W, A2GP W보다 ᄃ
ᅥ 높게 나타나고 n = 30, 50일 때 A2M E와 A2M L이 A2CM L, A2P W, A2GP W에 비해 더 좋게 나타난다. 모 드
ᆫ대립분포와 표본크기에서 가장 우수한 성능을보이는것은 A2M E이고 그 다음으로 좋은성능을가지 느
ᆫ것은 A2CM L과 A2M L이다. A2CM L과 A2M L의 경우 n = 10, 20일 때는 A2CM L이 더 높은검정력을가
Table 3.2 Estimated powers of W
M L2, W
CM L2, W
M E2, W
P W2, W
GP W2(α = 0.05) Distribution n W
M L2W
CM L2W
M E2W
P W2W
GP W2EV2(0,1,2.5) 10 0.255 0.243 0.241 0.200 0.182
20 0.451 0.437 0.462 0.428 0.418
30 0.611 0.596 0.632 0.608 0.602
50 0.814 0.805 0.839 0.827 0.826
EV2(0,1,3.5) 10 0.175 0.163 0.163 0.134 0.112
20 0.287 0.275 0.295 0.268 0.250
30 0.389 0.378 0.417 0.402 0.379
50 0.575 0.562 0.614 0.603 0.587
G(0.9,1.2) 10 0.227 0.196 0.192 0.129 0.138
20 0.440 0.403 0.406 0.318 0.383
30 0.640 0.600 0.606 0.506 0.605
50 0.891 0.871 0.872 0.803 0.884
G(1.2,0.9) 10 0.148 0.125 0.122 0.082 0.085
20 0.260 0.229 0.235 0.171 0.214
30 0.407 0.365 0.373 0.291 0.367
50 0.650 0.615 0.617 0.523 0.632
LN(0,0.5) 10 0.157 0.143 0.143 0.107 0.100
20 0.264 0.244 0.263 0.223 0.226
30 0.360 0.339 0.373 0.335 0.347
50 0.573 0.547 0.593 0.557 0.586
LN(0,0.75) 10 0.250 0.230 0.229 0.175 0.166
20 0.457 0.431 0.454 0.400 0.417
30 0.630 0.604 0.633 0.586 0.617
50 0.846 0.832 0.857 0.823 0.856
N(0,1) 10 0.100 0.116 0.120 0.156 0.155
20 0.221 0.251 0.256 0.295 0.269
30 0.345 0.372 0.387 0.417 0.371
50 0.553 0.579 0.606 0.626 0.572
L(0,0.5) 10 0.216 0.249 0.245 0.278 0.273
20 0.473 0.510 0.492 0.496 0.467
30 0.648 0.679 0.654 0.634 0.606
50 0.868 0.881 0.863 0.828 0.818
L(0,1.5) 10 0.211 0.244 0.241 0.277 0.272
20 0.468 0.505 0.489 0.493 0.462
30 0.650 0.680 0.657 0.635 0.604
50 0.862 0.875 0.861 0.830 0.817
W(5,1) 10 0.140 0.166 0.174 0.220 0.154
20 0.331 0.365 0.386 0.437 0.321
30 0.501 0.534 0.559 0.601 0.493
50 0.770 0.789 0.817 0.841 0.781
W(5,5) 10 0.137 0.164 0.169 0.218 0.148
20 0.332 0.370 0.386 0.439 0.320
30 0.501 0.535 0.562 0.612 0.493
50 0.768 0.788 0.817 0.841 0.781
Average power 0.407 0.406 0.441 0.402 0.412
(Standard deviation) (0.219) (0.223) (0.227) (0.207) (0.223)
ᄌ
ᅵ는반면 n = 30, 50일 때는 A2M L의 검정력이 더 높음을알 수 있다. 또한 제시된표로부터 추가적으 ᄅ
ᅩ 이끌어낸 결과는아래와 같다.
1) A2M L의 검정력은감마분포에서 가장 높게 나타난다. 그러나 A2M L은정규분포에서 가장 낮은검정 ᄅ
ᅧ
ᆨ을보이고 이런 현상은 A2GP W을제외한 와이블분포에서의 결과에서도확인할 수 있다. 또한 A2M L은
ᄌ
ᅦ2종극단값분포와 로그정규분포에서 대체적으로 A2M E 다음으로 높은검정력을가지게 되지만 로지스 티
ᆨ분포에서 A2GP W을제외한 나머지 검정통계량들보다 낮은검정력을가진다.
2) A2CM L은 로지스틱분포에서 가장 좋은 성능을 보이고 제2종 극단값분포와 (n = 30, 50인 경우) 저
ᆼ규분포에서 대체적으로 가장 낮은 성능을 가진다. 또한 감마분포, 로그정규분포와 와이블분포에서 A2CM L의 검정력은 3번째로 높게 나타난다.
3) A2M E는모든대립분포들에서 1번째 또는 2번째로 높은검정력을가지는걸로 나타나서 가장 강력 ᄒ
ᅡᆫ 검정통계량임을알 수 있다.
4) A2P W의 검정력은 표준정규분포와 와이블분포에서 가장 높게 나타나지만 나머지 대립분포들에서 A2GP W를제외한 다른검정통계들보다 전반적으로 낮게관측이된다. A2GP W의 경우 표준정규분포에서 A2P W 다음의 높은검정력을보이지만 다른대립분포들에서 거의 최하위의 검정력 순위를가진다.
Table 3.2는모의실험에 의해 추정된유의수준 5%에 대한 WM L2 , WCM L2 , WM E2 , WP W2 , WGP W2 의 거
ᆷ정력이고 Figure 3.2는 표의 검정력을 그린 플롯이다. 표에 제시된 검정통계량들의 평균 검정력을 ᄇ
ᅩ면 WCM L2 와 WGP W2 가 다른 검정통계량들에 비해 전반적으로 높은 성능을 가지는 반면 WCM L2 과 WP W2 가 낮은성능을가지는것으로 나타난다. 검정통계량들의 평균 검정력을표본크기별로 구해보면 n = 10, 20일 때 WM E2 와 WCM L2 이 다른검정통계량들보다 더 높은검정력을가지고 n = 30, 50일 때 WM E2 과 WGP W2 이 나머지 검정통계량들보다 더 높은검정력을보인다. 또한 제시된표로부터 추가적으 ᄅ
ᅩ 이끌어낸 결과는아래와 같다.
1) 전반적으로 WM E2 은제2종극단값분포, 표준정규분포와 와이블분포에서 가장 높은검정력을보이 ᄆ
ᅧ 나머지 대립분포들에서도 2번째로 높은검정력을가진다.
2) WGP W2 의 검정력은감마분포와 로그정규분포에서 가장 높게 나타나는반면에 표준정규분포와 로 ᄌ
ᅵ스틱분포에서 가장 낮게관측된다.
3) WCM L2 은표준정규분포에서 가장 좋은성능을보이지만 제2종극단값분포와 로그정규분포에서 다 ᄅ
ᅳ
ᆫ검정통계량들에 비해 좋은성능을가지진 않는다.
4) WM L2 은와이블분포에서 WGP W2 을제외한 다른검정통계량들보다 낮은검정력이관측되지만 감마 부
ᆫ포와 로지스틱분포에서 3번째로 높은검정력을보인다.
5) WP W2 의 검정력은 제2종극단값분포와 와이블분포에서 WM E2 다음으로 높게 나타난 반면에 감마 부
ᆫ포에서 다른 검정통계량들의 검정력을 능가하진 않는다. 또한 WP W2 은 로지스틱분포에서 WGP W2 보 ᄃ
ᅡ 좋은성능을보이지만 WM L2 , WCM L2 , WM E2 에 비해 좋은성능을발휘하지는않는다.
4. 결론
Stephens (1977)은 모수들이 알려져 있지 않은 극단값분포에 대한 적합도 검정통계량으로 AD와 CM 검정통계량을소개했고 검정통계량의 계산을위해 필요한 모수들의 추정량으로 MLE를사용했다.
ᄀ
ᅳ러나 Choi (2015)의 연구에서 보듯이 MLE가 항상 좋은결과를제공하지는않는다. 본 논문에서는 ᄆ
ᅩ수들의 추정량으로 CMLE, MEE, PWE, GPWE로 대체하여 구축한 수정된 AD 검정통계량과 CM 거
ᆷ정통계량을제시하고 이들검정통계량을사용하는검정의 성능을모의실험을 통해 조사했다.
거
ᆷ정력 분석결과에서 A2M E와 A2CM L을사용하는 AD 검정이 전반적으로 우수한 성능을가지는것으 ᄅ
ᅩ 나타났다. CM 검정에서는 WM E2 와 WGP W2 을 사용하는 것이 다른 검정통계량을 이용하는 것보다 ᄋ
ᅲ리함을 볼수 있었다. 그리고 각 검정에서 가장 강력한 검정통계량은 A2M E과 WM E2 임을 알 수 있었 ᄃ
ᅡ. CMLE를이용한 경우 A2CM L은 A2M E 다음으로 가장 좋은성능을보인 반면에 WCM L2 은 WP W2 다 ᄋ
ᅳ
ᆷ으로 가장 낮은 성능을가짐을확인할 수 있었다. MLE를이용한 A2M L과 WM L2 각각은 대체적으로 ᄌ
ᅮᆼ간 순위의 성능을가짐을 알 수 있었다. 따라서 응용에서극단값분포에 대한 적합도 검정통계량으로
Figure 3.2 Estimated powers of W
M L2, W
CM L2, W
M E2, W
P W2, W
GP W2for α = 0.05 (D1 : EV2(0,1,2.5), D2 : EV2(0,1,3.5), D3 : G(0.9,1.2), D4 : G(1.2,0.9), D5 : LN(0,0.5), D6 : LN(0,0.75), D7 : N(0,1), D8 : L(0,0.5), D9
: L(0,1.5), D10 : W(5,1), D11 : W(5,5))
A2M E과 WM E2 을사용할 것을추천한다.
References
Choi, B. (2015). Estimation for scale parameter of type-I extreme value distribution. Journal of the Korean Data & Information Society, 26, 535-545.
D’Agostino, R. B. and Stephens, M. A. (1986). Goodness-of-fit techniques, Marcel Dekker Inc, New York.
Fill, H. D. and Stedinger, J. R. (1995). L-moment and probability plot correlation coefficient goodness-of- fit tests for the Gumbel distribution and impact of autocorrelation. Water Resources Research, 31, 225-229.
Fiorentino, M. and Gabriele, S. (1984). A correction for the bias of maximum likelihood estimators of Gumbel parameters. Journal of Hydrology, 73, 39-49.
Greenwood, J. A., Landwehr, J. M., Matalas, N. N. and Wallis, J. R. (1979). Probability weighted mo- ments: Definition and relation to parameters of several distributions expressible in inverse form. Water Resources Research, 15, 1049-1054.
Hershfield, M. A. and Kohler, M. A. (1960). An empirical appraisal of the Gumbel extreme-value procedure.
Journal of Geophysical Research, 65, 1737-1746.
Johnson, N. L., Kotz, S. and Balakrishnan, N. (1995). Continuous Univariate Distributions, Volume 2, Second Edition, Wiley, New York.
Jowitt, P. W. (1979). The extreme value type 1 distribution and the principle of maximum entropy. Journal of Hydrology, 42, 23-38.
Lambert, J. and Duan, L. (1994). Evaluating risk of extreme events for univariate-loss functions. Journal of Water Resources Planning and Management, 120, 382-399.
Rasmussen, P. F. and Gautam, N. (2003). Alternative PWM-estimators of the Gumbel distribution. Jour-
nal of Hydrology, 280, 265-271.
Reiss, R. D. and Thomas, M. (2001). Statistical Analysis of Extreme Values, Birkh¨ auser, Basel.
Ryu, S., Eom, E., Kwon, T. and Yoon, S. (2016). The estimation of CO concentration in Daegu-Gyeongbuk area using GEV distribution. Journal of the Korean Data & Information Society, 27, 1001-1012.
Stephens, M. A. (1977). Goodness-of-fit for the extreme value distribution. Biometrika, 64, 583-588.
Stol, P. T. (1971). On the decomposition of the extreme value distribution of daily rainfall depths and the derivation of probabilities of compound events. Journal of Hydrology, 14, 181-196.
Vogel, R. M. (1986). The probability plot correlation coefficient test for the normal, lognormal, and Gumbel distributional hypotheses. Water Resources Research, 22, 587-590.
Wang, Q. J. (1998). Approximate goodness-of-fit tests of fitted generalized extreme value distributions using LH moments. Water Resources Research, 34, 3497-3502.
Yang, M. and Yoon, S. (2017). Evaluation of the impact of typhoon on daily maximum precipitation.
Journal of the Korean Data & Information Society, 28, 1415-1425.
2019, 30
(3)
,539–549
A study on goodness-of-fit test for extreme value distribution †
Byungjin Choi
1
1Major in Applied Statistics, Kyonggi University
Received 5 April 2019, revised 30 April 2019, accepted 13 May 2019
Abstract
The extreme value distribution is extensively used as a probability model for data analysis in various fields including life testing and hydrology. Although the use of the extreme value distribution is theoretically or practically justified in such fields, it is necessary to ascertain the appropriateness of the distribution prior to data analysis. In this paper, we discuss the use of the modified Anderson-Darling and Cramer-von Mises tests of fit for the extreme value distribution with unknown parameters. Since the test statistics to be used include the parameters involved in the extreme value distribution, we present the modified test statistics by replacing the unknown parameters with the estimators obtained by the maximum likelihood method for reducing bias and the maximum entropy method, etc. The critical values of the proposed tests using the modified test statistics are estimated by Monte-Carlo simulations and provided in a tabular form. We also carry out Monte-Carlo simulations for performance comparison in terms of power and present the obtained results.
Keywords: Critical value, EDF test, extreme value distribution, goodness-of-fit, test power, test statistic.
†
This work was supported by Kyonggi University Research Grant 2016.
1