비모수적 추론-2
3. 크루스칼-왈리스 검정(Kruskal-Wallis test) k개의 그룹이 있고 각 그룹에 n i개씩 총 N(=
∑
ki= 1n i)개의 관측치가 있다고 하 자. 각 그룹의 중앙값이 모두 같은지(즉, k개 모집단의 분포가 모두 동일한지) 검정 하고자 한다. 각 그룹에서 모집단의 중앙값을 M1,M 2,⋯,M k라고 할 때 귀무가설 과 대립가설은 다음과 같이 된다.
H 0: M 1= ⋯ =Mk vs. H 1: Mi들이 모두 같지는 않다.
모든 그룹의 데이터를 통틀어 작은 값부터 오름차순으로 순위를 매기자(여기서도 동점이 생기면 평균 순위를 부여한다). 각 그룹별로 이들 순위의 합 R 1,R 2,⋯,R k를 계산한다. 모든 그룹의 분포가 전부 동일하다면(즉, 귀무가설이 맞다면) 각 그룹별로 이들 순위합의 평균이 비슷할 것이고 그렇지 않다면 차이가 날 것이다. 각 그룹에서의 순위평균을 R i= R i
n i (i= 1,⋯,k)라고 하자. 귀무가설이 맞다고 했을 때 순위평균은 R= N+1
2 이 된다. 검정통계량은 각 순위평균과 귀무 가설 하에서의 순위평균의 차이를 생각한 것으로 다음과 같다.
H = 12
N(N+1)
∑
ki= 1n i( R i- (N+1) 2 ) 2
= 12
N(N+1)
∑
ki= 1
R2i
n i -3(N+1)
이제 계산된 검정통계량 H가 충분히 클 때 귀무가설을 기각하게 된다. 즉, 유의
수준 α로 했을 때 H≥h α(k;n 1,⋯,n k)이면 귀무가설을 기각하게 된다. 여기서 h α(k;n 1,⋯,n k)는 P[H≥h α(k;n 1,⋯,n k)]=α를 만족하는 상수이다. 그룹별 표 본수가 적은 경우에는 크루스칼-왈리스 검정통계량의 확률분포표를 이용하여 구할 수 있다. H가 해당되는 표본수에서의 임계치보다 크면, 제시된 α수준으로 귀무가 설을 기각한다. 표본수가 크면, 귀무가설 하에서 검정통계량 H가 근사적으로 자유 도가 k-1인 카이제곱 분포를 따른다는 것을 이용하여
H≥ χ2α(k-1)
일 때 귀무가설을 기각한다. 여기서 χ2α(k-1)는 자유도가 k-1인 카이제곱분포에 서의 상위 α의 확률에 해당하는 임계치이다.
여기서도 동점이 있을 경우에는 평균 순위를 이용하여 계산하고, 검정통계량 H를
H'= H
1-
∑
kj= 1(t3j-t j)/(N3-N)
로 수정한다. 여기서 t j는 j번째 동점인 그룹의 크기이며, k는 동점그룹의 수이다.
엑셀을 이용한 크루스칼-왈리스 검정
4. 스피어만의 순위상관계수(Spearman's rank correlation coefficient)
n개의 관찰치 쌍 (xi,y i), (i= 1,⋯,n)이 있다고 하자. 첫 번째 관측치 중에서 xi의 순위를 매긴 것을 R i라고 하고, 두 번째 관측 치에서 y i의 순위를 매긴 것 을 S i라고 하자. 스피어만의 상관계수는
r s=
∑
ni= 1(R i- R)(S i- S)
∑
ni= 1(R i- R) 2
∑
ni= 1(S i- S) 2
로 정의된다. 여기서 R= S= (n+1)/2가 되므로, 이 식은 다음과 같이 계산하기 쉬운 식으로 표현할 수 있다.
r s=1- 6
n(n 2-1)
∑
ni= 1(R i-S i) 2
스피어만의 상관계수도 피어슨의 상관계수와 같이 -1≤r s≤1의 값을 가지며, 이 값이 1에 가까우면 양의 상관이 있음을, -1에 가까우면 음의 상관이 있음을 의미 하고, 0에 가까우면 상관이 없음을 나타낸다.
두 변수 간에 관련이 있다고 할 수 있는지 독립성 검정을 행할 수 있다. 모집단 에서의 상관계수를 ρ라고 할 때 이에 대한 가설의 형태와 기각역은 다음과 같다.
H 0:ρ = 0 vs. H 1:ρ > 0일 때, r s>r( α,n)이면 귀무가설 기각
H 0:ρ = 0 vs. H 1:ρ < 0일 때, r s←r(α,n)이면 귀무가설 기각
H 0:ρ = 0 vs. H 1:ρ≠0일 때, r s≥r(α/2,n) 또는 r s←r(α/2,n)이면 귀무가설기각
여기서 r(α,n)은 P[r s≥r(α,n)] =α를 만족하는 값이다.
귀무가설 하에서 r s의 평균과 분산은 각각
평균= 0 , 분산 = 1 n-1 이 된다. 만약 표본의 크기가 크면 다음과 같은 통계량
Z r s= r s-0
1/(n-1) =r s n-1
이 귀무가설 하에서 근사적으로 표준정규분포를 따른다는 사실을 이용하여 검정을 수행한다. 이때에도 동점이 있을 경우에는 평균 순위를 이용하여 계산하면 된다.
엑셀을 이용한 순위상관계수