가설검정

(1)

제11장 모집단평균에 대한 가설검정

(2)

가설검정

 통계적 가설(statistical hypothesis)

 모집단 모수에 대한 주장이나 예상

 단순히 가설(hypothesis)

 통계적 가설검정(statistical hypothesis testing)

 가설이 옳은지 옳지 않은지 여부를 검토하는 통계적 방법

 단순히 가설검정(hypothesis testing)

(3)

가설검정의 기초(1)

 가설의 설정



모수에 대하여 서로 상반되는 두가지 가설설정



귀무가설(null hypothesis: H

₀

)

 모수에 대하여 잘 알려진 과거의 인식이나 일반적인 표준치에 근거하여 세워진 가설



대립가설(alternative hypothesis: H

₁

)

 귀무가설이 주장하는 바와 모수에 대한 표본의 정보 가 서로 일치한다고 보기가 논리적이지 못할 때 대신 받아들이게 되는 또 하나의 가설



표본을 통하여 입증하고 하는 주장을 대립가설로 하 고 상반되는 가설을 귀무가설로 하는 것이 일반적이 다.

0 )

( 1

)

( H

₀

 H

₁

 P H

₀

 H

₁



P

(4)

가설검정의 기초(2)

 가설의 유형

 단측검정(우측검정: upper-tailed test)

 단측검정(좌측검정: lower-tailed test)

 양측검정(two-tailed test)

I I

H H





 :

:

1 0

I I

H H





 :

:

1 0

I I

H H





 :

:

1 0

(5)

가설검정의 두 가지 오류

 가설검정에서는 표본에서 추출된 불완전한 정보를 기초로 하여 두 가지 중 하나의 결론을 선택하기 때문에 항상 잘못된 결론을 내릴 가능성이 있다.

 가설검정의 오류

 제1종 오류(TypeⅠerror)

 H₀ 이 옳은데도 불구하고 H₁로 잘못 결론 내리는 오류

 제1종 오류의 확률은 α로 나타내며 α위험(α risk)라고 한다.

 제2종 오류(TypeⅡerror)

 H₁ 이 옳은데도 불구하고 H₀로 잘못 결론 내리는 오류

 제2종 오류의 확률은 β로 나타내며 β위험(β risk)라고 한다.

 임계치(critical value): A

 H₀을 선택할 것인지 H₁을 선택할 것인지를 가늠하는 기준점

 채택역(acceptance region)

 H₀을 채택하게끔 하는 의 범위

 기각역(rejection region)

 H₁을 채택하게끔 하는 의 범위 X

X

(6)

오류의 통제

 제1종 오류, α위험을 줄이기 위해 임계치를 조정하면 제2종 오 류, β위험이 상대적으로 커지기 때문에 두 가지 위험을 적적히 통제하는 것이 필요하다.

 두 가지 오류를 동시에 통제하기 위해서는 표본의 크기를 적절 히 선택하여야 함

 표본크기가 이미 고정되어 있거나 표본이 이미 선택되어 있는 경우에는 두 가지 위험 중 하나만을 통제할 수 있으며 나머지 위험은 그대로 받아 들일 수 밖에 없다.

 일반적으로 α위험과 β위험 중 α위험을 더 중요하게 생각하여 α 위험만을 통제하는데, 그 이유는 α위험이 중요하게끔 가설을 세우기 때문

 유의수준(level of significance)

 통제하고자 하는 α위험의 크기

 일반적으로 0.01, 0.05, 0.10이 실무에서 많이 이용됨

 이 값을 작게 할 수록 H₀을 기각하는데 있어서 보다 신중하고 보수 적이다.

(7)

가설검정의 절차-표본이 큰 경우(1)

 가설검정은 신뢰구간과 마찬가지로 표본이 큰 경우에는, 모집단의 분 포에는 상관없이 중심극한 정리에 근거하여 Z분포를 사용하고, 표본이 작은 경우에는 모집단이 정규분포와 유사한 분포라는 전제하에서 t분 포를 사용한다.

 일반적으로 통계패키지의 경우 t분포의 자유도가 큰 경우 Z분포에 근접하 기 때문에 t분포만을 사용한다.

 가설검정의 절차

1. 귀무가설과 대립가설을 세운다.

2. 유의수준, 즉 α위험의 크기를 결정한다.

3. 귀무가설이 맞다는 가정하에서 의 분포를 그려 유의수준을 만족하는 임 계치를 계산한다. 이때 단측검정의 경우에는 귀무가설이 지지하는 μ의 값 이 여러 가지가 있게 되는데, 이 중에서 가장 극단적인 μ의 값을 기준으로 하여 임계치를 계산하도록 한다. 이 임계치를 기준으로 귀무가설의 채택역 과 기각역이 결정된다.

4. 표본을 추출하여 여기에서 계산된 통계량 의 값이 임계치를 기준으로 귀 무가설을 지지하는 영역, 즉 채택역에 속하면 귀무가설을 채택하고, 반대 로 통계량이 대립가설을 지지하는 영역, 즉 기각역에 속하면 귀무가설을 기각하고 대립가설을 채택한다.

) ( X X

(8)

가설검정의 절차-표본이 큰 경우(2)



우측단측검정

 검정절차

 α위험과 β위험을 동시에 통제하기 위한 표본크기의 결정



좌측단측검정



양측검정

2

)

2

1 ( )

(

) ( )

1 (

) ( )

1 (

 







 

 









 





 



 







 





























I II

II I

z n z

z n z n

z n A

z

A

(9)

가설검정의 절차-표본이 작은 경우



표본크기 n이 작을 때에는 중심극한정리를 적용할 수 없 지만 모집단이 정규분포이거나 정규분포에서 크게 벗어 나지 않으면 t분포를 이용하여 검정할 수 있다.



일반적으로 통계패키지의 경우 t분포의 자유도가 큰 경우 Z분포에 근접하기 때문에 t분포만을 사용한다.

) 1 ) (

(

)

(   

n X t

s

X 

(10)

표준검정통계량을 이용한 가설검정

 표준검정통계량을 이용한 방법은 앞의 방법과 내용상 동일하나 단지 표본으로부터 계산되는 와 임계치 등을 서로 비교할 때 표분정규확률변수 Z를 기준으로 한다는 것만이 다르다.

채택 을 만약

같다 다음과 결정규칙은

따라서

나타낸다 로

하고 이라고 표준검정통계량

을

채택 을 만약

나누면 로

빼고 을

양변에서 결정규칙

채택 을 만약

), 1 (

. ) .

(

), 1 ) (

(

), 1 ) (

(

) ( , ), ( ) 1 (

), ( ) 1 (

850 :

1

*

0

*

* 1

0 1 0 1

0

H z

z

H z

z X z s X

H X z

s X

H X z

s X

X s H X s z

X

H X s z

X

H H

I I I

I I

I

I I





 





















 



 

























X

(11)

P값을 이용한 검정

 미리 정해 놓은 α값에 따라 결론이 달라질 수 있 기 때문에 가설검정을 하는 사람이 가설검정의 맨 마지막 단계에서 값을 스스로 결정하여 결론 을 내릴 수 있게 하는 방법이 P값(P-value)에 의한 가설검정이다.

 P값(P-value)



가설검정에서 P값이란 귀무가설이 맞다는 가정, 즉 μ=μ

_I

일 때의 의 표본분포에서 표본에 의한 관찰된 값보다 이론적으로 가 더 극단에 위치할 확률을 의 미한다.