• 검색 결과가 없습니다.

비모수적 추론-2

N/A
N/A
Protected

Academic year: 2022

Share "비모수적 추론-2"

Copied!
6
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

비모수적 추론-2

3. 크루스칼-왈리스 검정(Kruskal-Wallis test) k개의 그룹이 있고 각 그룹에 n i개씩 총 N(=

k

i= 1n i)개의 관측치가 있다고 하 자. 각 그룹의 중앙값이 모두 같은지(즉, k개 모집단의 분포가 모두 동일한지) 검정 하고자 한다. 각 그룹에서 모집단의 중앙값을 M1,M 2,⋯,M k라고 할 때 귀무가설 과 대립가설은 다음과 같이 된다.

H 0: M 1= ⋯ =Mk vs. H 1: Mi들이 모두 같지는 않다.

(2)

모든 그룹의 데이터를 통틀어 작은 값부터 오름차순으로 순위를 매기자(여기서도 동점이 생기면 평균 순위를 부여한다). 각 그룹별로 이들 순위의 합 R 1,R 2,⋯,R k를 계산한다. 모든 그룹의 분포가 전부 동일하다면(즉, 귀무가설이 맞다면) 각 그룹별로 이들 순위합의 평균이 비슷할 것이고 그렇지 않다면 차이가 날 것이다. 각 그룹에서의 순위평균을 R i= R i

n i (i= 1,⋯,k)라고 하자. 귀무가설이 맞다고 했을 때 순위평균은 R= N+1

2 이 된다. 검정통계량은 각 순위평균과 귀무 가설 하에서의 순위평균의 차이를 생각한 것으로 다음과 같다.

H = 12

N(N+1)

k

i= 1n i( R i- (N+1) 2 ) 2

= 12

N(N+1)

k

i= 1

R2i

n i -3(N+1)

이제 계산된 검정통계량 H가 충분히 클 때 귀무가설을 기각하게 된다. 즉, 유의

(3)

수준 α로 했을 때 H≥h α(k;n 1,⋯,n k)이면 귀무가설을 기각하게 된다. 여기서 h α(k;n 1,⋯,n k)는 P[H≥h α(k;n 1,⋯,n k)]=α를 만족하는 상수이다. 그룹별 표 본수가 적은 경우에는 크루스칼-왈리스 검정통계량의 확률분포표를 이용하여 구할 수 있다. H가 해당되는 표본수에서의 임계치보다 크면, 제시된 α수준으로 귀무가 설을 기각한다. 표본수가 크면, 귀무가설 하에서 검정통계량 H가 근사적으로 자유 도가 k-1인 카이제곱 분포를 따른다는 것을 이용하여

H≥ χ2α(k-1)

일 때 귀무가설을 기각한다. 여기서 χ2α(k-1)는 자유도가 k-1인 카이제곱분포에 서의 상위 α의 확률에 해당하는 임계치이다.

여기서도 동점이 있을 경우에는 평균 순위를 이용하여 계산하고, 검정통계량 H를

H'= H

1-

k

j= 1(t3j-t j)/(N3-N)

(4)

로 수정한다. 여기서 t j는 j번째 동점인 그룹의 크기이며, k는 동점그룹의 수이다.

엑셀을 이용한 크루스칼-왈리스 검정

4. 스피어만의 순위상관계수(Spearman's rank correlation coefficient)

n개의 관찰치 쌍 (xi,y i), (i= 1,⋯,n)이 있다고 하자. 첫 번째 관측치 중에서 xi의 순위를 매긴 것을 R i라고 하고, 두 번째 관측 치에서 y i의 순위를 매긴 것 을 S i라고 하자. 스피어만의 상관계수는

r s=

n

i= 1(R i- R)(S i- S)

n

i= 1(R i- R) 2

n

i= 1(S i- S) 2

로 정의된다. 여기서 R= S= (n+1)/2가 되므로, 이 식은 다음과 같이 계산하기 쉬운 식으로 표현할 수 있다.

(5)

r s=1- 6

n(n 2-1)

n

i= 1(R i-S i) 2

스피어만의 상관계수도 피어슨의 상관계수와 같이 -1≤r s≤1의 값을 가지며, 이 값이 1에 가까우면 양의 상관이 있음을, -1에 가까우면 음의 상관이 있음을 의미 하고, 0에 가까우면 상관이 없음을 나타낸다.

두 변수 간에 관련이 있다고 할 수 있는지 독립성 검정을 행할 수 있다. 모집단 에서의 상관계수를 ρ라고 할 때 이에 대한 가설의 형태와 기각역은 다음과 같다.

 H 0:ρ = 0 vs. H 1:ρ > 0일 때, r s>r( α,n)이면 귀무가설 기각

 H 0:ρ = 0 vs. H 1:ρ < 0일 때, r s←r(α,n)이면 귀무가설 기각

 H 0:ρ = 0 vs. H 1:ρ≠0일 때, r s≥r(α/2,n) 또는 r s←r(α/2,n)이면 귀무가설기각

여기서 r(α,n)은 P[r s≥r(α,n)] =α를 만족하는 값이다.

귀무가설 하에서 r s의 평균과 분산은 각각

(6)

평균= 0 , 분산 = 1 n-1 이 된다. 만약 표본의 크기가 크면 다음과 같은 통계량

Z r s= r s-0

1/(n-1) =r s n-1

이 귀무가설 하에서 근사적으로 표준정규분포를 따른다는 사실을 이용하여 검정을 수행한다. 이때에도 동점이 있을 경우에는 평균 순위를 이용하여 계산하면 된다.

엑셀을 이용한 순위상관계수

참조

관련 문서

신앙은 말씀의 토대 위에서 살아계신 하나님과 살아있는 교제 가운데 사는 것이고 그 하나님의 인도를 따라 우리의 모든 삶으로 따라가 는 것이고

즉 연구팀은 아르기닌 메틸화가 일어난 정상 AML1의 전사 조절과 급성 백혈 병 발생과 연관성이 있는 AML1-ETO의 전사 조절이 차이가 있음을 확인한 것이다(참조

Ø 만일 하나의 변수를 살펴본다면 하나의 변수로부터 자료의 분포를 적절하게 요약하기 위해 중심척도와 산포척도를 필요로 한다.. Ø 만일 중위수와 평균이 가상적으로 동일하다면,

 제휴에 참여하는 파트너 기업간 전략, 조직 및 문화적 차이가 적은 기업이 유리.  지역, 시장 및 사업의 중복이 없을수록

(구체적으로 어느 집단의 평균이 다른 것인지 판단하기 위한 것이 다음에 설명할 사후 검정이다.) 두 통계량의 p-값에 차이가 있다면, Welch 검정법이 더 강력하다고

판매대리인은 모든 지역에서 판매, 제조업자의 시장지배력이 약한 곳에서만 활동 4.. 판매대리인은 신용을 제공, 제조업자

poor good excellent rancid delicious cheap average generous.

이리하여 신라사회의 이단자인 해도인