제11장 모집단평균에 대한 가설검정
가설검정
통계적 가설(statistical hypothesis)
모집단 모수에 대한 주장이나 예상
단순히 가설(hypothesis)
통계적 가설검정(statistical hypothesis testing)
가설이 옳은지 옳지 않은지 여부를 검토하는 통계적 방법
단순히 가설검정(hypothesis testing)
가설검정의 기초(1)
가설의 설정
모수에 대하여 서로 상반되는 두가지 가설설정
귀무가설(null hypothesis: H
0)
모수에 대하여 잘 알려진 과거의 인식이나 일반적인 표준치에 근거하여 세워진 가설
대립가설(alternative hypothesis: H
1)
귀무가설이 주장하는 바와 모수에 대한 표본의 정보 가 서로 일치한다고 보기가 논리적이지 못할 때 대신 받아들이게 되는 또 하나의 가설
표본을 통하여 입증하고 하는 주장을 대립가설로 하 고 상반되는 가설을 귀무가설로 하는 것이 일반적이 다.
0 )
( 1
)
( H
0 H
1 P H
0 H
1
P
가설검정의 기초(2)
가설의 유형
단측검정(우측검정: upper-tailed test)
단측검정(좌측검정: lower-tailed test)
양측검정(two-tailed test)
I I
H H
:
:
1 0
I I
H H
:
:
1 0
I I
H H
:
:
1 0
가설검정의 두 가지 오류
가설검정에서는 표본에서 추출된 불완전한 정보를 기초로 하여 두 가지 중 하나의 결론을 선택하기 때문에 항상 잘못된 결론을 내릴 가능성이 있다.
가설검정의 오류
제1종 오류(TypeⅠerror)
H0 이 옳은데도 불구하고 H1로 잘못 결론 내리는 오류
제1종 오류의 확률은 α로 나타내며 α위험(α risk)라고 한다.
제2종 오류(TypeⅡerror)
H1 이 옳은데도 불구하고 H0로 잘못 결론 내리는 오류
제2종 오류의 확률은 β로 나타내며 β위험(β risk)라고 한다.
임계치(critical value): A
H0을 선택할 것인지 H1을 선택할 것인지를 가늠하는 기준점
채택역(acceptance region)
H0을 채택하게끔 하는 의 범위
기각역(rejection region)
H1을 채택하게끔 하는 의 범위 X
X
오류의 통제
제1종 오류, α위험을 줄이기 위해 임계치를 조정하면 제2종 오 류, β위험이 상대적으로 커지기 때문에 두 가지 위험을 적적히 통제하는 것이 필요하다.
두 가지 오류를 동시에 통제하기 위해서는 표본의 크기를 적절 히 선택하여야 함
표본크기가 이미 고정되어 있거나 표본이 이미 선택되어 있는 경우에는 두 가지 위험 중 하나만을 통제할 수 있으며 나머지 위험은 그대로 받아 들일 수 밖에 없다.
일반적으로 α위험과 β위험 중 α위험을 더 중요하게 생각하여 α 위험만을 통제하는데, 그 이유는 α위험이 중요하게끔 가설을 세우기 때문
유의수준(level of significance)
통제하고자 하는 α위험의 크기
일반적으로 0.01, 0.05, 0.10이 실무에서 많이 이용됨
이 값을 작게 할 수록 H0을 기각하는데 있어서 보다 신중하고 보수 적이다.
가설검정의 절차-표본이 큰 경우(1)
가설검정은 신뢰구간과 마찬가지로 표본이 큰 경우에는, 모집단의 분 포에는 상관없이 중심극한 정리에 근거하여 Z분포를 사용하고, 표본이 작은 경우에는 모집단이 정규분포와 유사한 분포라는 전제하에서 t분 포를 사용한다.
일반적으로 통계패키지의 경우 t분포의 자유도가 큰 경우 Z분포에 근접하 기 때문에 t분포만을 사용한다.
가설검정의 절차
1. 귀무가설과 대립가설을 세운다.
2. 유의수준, 즉 α위험의 크기를 결정한다.
3. 귀무가설이 맞다는 가정하에서 의 분포를 그려 유의수준을 만족하는 임 계치를 계산한다. 이때 단측검정의 경우에는 귀무가설이 지지하는 μ의 값 이 여러 가지가 있게 되는데, 이 중에서 가장 극단적인 μ의 값을 기준으로 하여 임계치를 계산하도록 한다. 이 임계치를 기준으로 귀무가설의 채택역 과 기각역이 결정된다.
4. 표본을 추출하여 여기에서 계산된 통계량 의 값이 임계치를 기준으로 귀 무가설을 지지하는 영역, 즉 채택역에 속하면 귀무가설을 채택하고, 반대 로 통계량이 대립가설을 지지하는 영역, 즉 기각역에 속하면 귀무가설을 기각하고 대립가설을 채택한다.
) ( X X
가설검정의 절차-표본이 큰 경우(2)
우측단측검정
검정절차
α위험과 β위험을 동시에 통제하기 위한 표본크기의 결정
좌측단측검정
양측검정
2
)
21 ( )
(
) ( )
1 (
) ( )
1 (
I II
II I
II I
z n z
z n z n
z n A
z
A
가설검정의 절차-표본이 작은 경우
표본크기 n이 작을 때에는 중심극한정리를 적용할 수 없 지만 모집단이 정규분포이거나 정규분포에서 크게 벗어 나지 않으면 t분포를 이용하여 검정할 수 있다.
일반적으로 통계패키지의 경우 t분포의 자유도가 큰 경우 Z분포에 근접하기 때문에 t분포만을 사용한다.
) 1 ) (
(
)
(
n X t
s
X
표준검정통계량을 이용한 가설검정
표준검정통계량을 이용한 방법은 앞의 방법과 내용상 동일하나 단지 표본으로부터 계산되는 와 임계치 등을 서로 비교할 때 표분정규확률변수 Z를 기준으로 한다는 것만이 다르다.
채택 을 만약
채택 을 만약
같다 다음과 결정규칙은
따라서
나타낸다 로
하고 이라고 표준검정통계량
을
채택 을 만약
채택 을 만약
나누면 로
빼고 을
양변에서 결정규칙
채택 을 만약
채택 을 만약
), 1 (
), 1 (
. ) .
(
), 1 ) (
(
), 1 ) (
(
) ( , ), ( ) 1 (
), ( ) 1 (
850 :
850 :
1
*
0
*
* 1
0 1 0 1
0
H z
z
H z
z X z s X
H X z
s X
H X z
s X
X s H X s z
X
H X s z
X
H H
I I I
I I
I
I I
X
P값을 이용한 검정
미리 정해 놓은 α값에 따라 결론이 달라질 수 있 기 때문에 가설검정을 하는 사람이 가설검정의 맨 마지막 단계에서 값을 스스로 결정하여 결론 을 내릴 수 있게 하는 방법이 P값(P-value)에 의한 가설검정이다.
P값(P-value)
가설검정에서 P값이란 귀무가설이 맞다는 가정, 즉 μ=μ
I일 때의 의 표본분포에서 표본에 의한 관찰된 값보다 이론적으로 가 더 극단에 위치할 확률을 의 미한다.
P값을 이용한 통계규칙
P값이 α값보다 작으면 H
1을 채택하고, P값이 α값보 다 같거나 크면 H
0을 채택한다.
컴퓨터를 이용한 사례
X
X
<참고>
검정력곡선(power curve)
검정력(power): P(H
1:μ)
μ값이 달라짐에 따라 H
1을 결론 내릴 확률을 나타낸 곡선
검사특성곡선(operating characteristic curve)
μ값이 달라짐에 따라 H
0을 결론 내릴 확률을 나타낸 곡선
오류곡선(error curve)
) : (
1 ) : (
1 ) : (
) : (
1 0
1 0