가설검정 2
모평균의 검정
교재 pp.200~212
오늘 배울
내용은
모평균의 검정
모집단의 평균이 ?? 이다
가설은
H
0:
모집단의 평균이 ?? 이다
H
1:
모집단의 평균이 ?? 가 아니다
H
0:
모집단의 평균이 ?? 이다
H
1:
모집단의 평균이 ?? 보다 크다
H
0:
모집단의 평균이 ?? 이다
H
1:
모집단의 평균이 ?? 보다 작다양측검 정
단측검 정
단측검 정
1. 모집단의 표준편차 를 아는 경우 모집단의 분산 을 아는 경우
2. 모집단의 표준편차 를 모르는 경우 모집단의 분산 을 모르는 경우
´� −�
� / √ � � (0,1)
� = ´ ∑ �
�� � (� , �
2� )
� −� ´
� / √ � �(�− 1)
모표준편차를 알 때
모표준편차를 모를 때 모평균의점추정량은
표본평균
예제 5.2 p.201
J 대학 경영학부 학생들의 평균 IQ 를 조사하는 데
표본평균 =115, 표본수 =25
편차 (σ) 는 10 이라고 알려져 있다
일반인들의 IQ 는 110 인데 이 집단은 일반인 들에 비해서 높다고 이야기 할 수 있나 ?
H
0:
모집단의 평균이 110 이다H
1:
모집단의 평균이 110 보다 크다 가설단측검정
잠깐 idea 를
Random 으로 25 개를 뽑아 평균을 구해보니
표본집단의 평균은 115
원래 모집단의 평균은 110
모집단의 표준편차는 10
120, 130, 100, 110, 105, 95, 85, 120,
110, 125, …
?, ?, ?, ….
모수
Parameter
가설검정의
절차는 ?
출발점은 어디인가 ? 기존의 사실 ( 귀무가설 ) 을 중시
귀무가설에서 많이 벗어나야 대립가설이 맞다고 판단
판단기준이 되는 값은 ?
모평균의 점추정값인 표본평균으로 판단
표본평균의 값이 귀무가설이 사실일 때 나올 수 있는 범위 (?) 를 그려보고
관측된 표본평균 값이 여기서 많이 벗어난다고 판단 되면 대립가설이 맞는 것으로 결정
귀무가설이 맞다면
표본평균의 분포는 다음과 같이 생겼다
�
0: �=110
표본평균이 115 이상 나올 가능성이 있음
� � ´ ( �, � �
2) = N ( 110, 10 252 )
10
√ 25
H
0115
´�
110
귀무가설이 맞다면
가능성은 있지만 그래도 너무 벗어난다면
110
10
√ 25
H
0115
�
0: �=110
대립가설이 맞다라고 판단
´�
H
1 판단이 얼마정도 틀릴것을 각오하는가 ?
유의수준 ( 일반적으로 5%, 1%, 10%)
유의수준에 따라 기각역 유도
H0 이 맞아도 표본평균이 기각역 값이상 나올 확률
110
2
H
0´�
어느정도 벗어나야 ?
5%
H
1H
0기각역
1
�
0 1 2 3
−3 −2 −1
1.645
0.05 N(0.1)
1
�
0 1 2 3
−3 −2 −1
2.326
0.01 N(0.1)
1
�
0 1 2 3
−3 −2 −1 1.96
0.025 N(0.1)
�
0 1 2 3
−3 −2 −1 0
0.05 t(8)
유의수준
표준화 하면 표준정규분포에서 상위 5% 가 되는 값이 1.645
110
2
H
0�−110
2 =1.645
´�
예제의 기각역을 구하는 법
5%
기각역 =
1
�
0 1 2 3
−3 −2 −1 1.645
0.05 N(0.1)
참고 : k 를
엑셀에 의하여 구하면 NORM.
INV
110
2
´�
5%
�
기각역이 113.29 이므로 115 는 기각역에 속함
그러므로 귀무가설 기각
모평균이 110 보다 크다고 판단한다
(
110
2
H
0´�
기각역에 의한 검정
(
5%
H
1H
0113.29 115
기각 (
유의수준이 1% 일 때 기각역을 계산
관측값 115 는 기각역 114.65 보다 큼
그러므로 귀무가설 기각
(
110
2
H
0´�
기각역에 의한 검정
(
1%
H
1H
0113.29 115
114.65
�−110
2 =2.326
1
�
0 1 2 3
−3 −2 −1 2.326
0.01 N(0.1)
Q1
이때
여러분의 선택은 ?
귀무가설 기각 (
귀무가설 기각 (
당연히 귀무가설 기각 ( 이라 씀
유의수준은 ?
틀릴 확률
유의수준 5% 로 판정하는 것보다 유의수준 1% 로 판정하는 것이 더 신뢰감을 줌
Q2
만약 이면
여러분의 선택은 ?
귀무가설 기각 (
귀무가설 채택 (
이때는 귀무가설 기각하기 위해 사용 ?
110
2
H
0´�
H
1H
0113.29 114
114.65
1%
어떤 통계 패키지에서도 가설 기각 , 채택 등의 결과를 출력하지 않는 다 ?
같은 결과로도 유의수준에 따라 기각할 수도 채택할 수도 있기 때문임
절대적인 유의수준의 값은 없음
그래서 각 유의수준에 따른 기각역 또는 p- 값만 제시함
p- 값 = Pr( 결과 | H0 이 사실 ) = Pr( 결과 이상 | H0 이 사실 ) ( 정확한 표
현 )
p- 값을 이용하면 기각역을 구하지 않고도 결론을 내릴 수 있음
그래서 대부분의 통계분석도구들은 p- 값만 출력함
p- 값 < 이면 H0 기각 ( 유의수준 )
앞의 예제의 p- 값에 의한 검정
표본평균이 115 가 나옴 ( 결과 )
표본평균이 115 이상 나올 확률을 구 함
P- 값과 유의수준을 비교
P- 값이 작으면 귀무가설 기각
110
10
√ 25
H
0115
´�
p- 값
114.65
P- 값 < 0.01=1%
귀무가설 기각 (
p- 값 =1-0.99379=0.006
P- 값 =0.006 < 0.01=1%
귀무가설 기각 (
참고 :p- 값을
엑셀에 의하여 구하면 NOR- M.DIST
110
2
115
´�
p- 값
p- 값 =1-0.99379=0.00 6
참고 :p- 값을 구하는 좋은 습관
0
1
115 −110
2 =2.5
z
p- 값 idea:
표준정규분포는 -3 에서 3 까지의 범위
표준화 값이 -2, 2 를 벗어나면
귀무가설 분포에서 멀어진다라고 판단
1 2 3
−3 −2 −1
예제 5.3 p.204
어떤 치료법의 치료기간 조사
표본평균 =14, 표본수 =16
편차 (σ) 는 2.3 이라고 알려져 있다
일반 치료법의 치료기간은 15 일 인데 이 치료법 은 치료기간이 단축되었다고 이야기 할 수 있
나 ?
H0: 모집단의 평균이 15 이다
H1: 모집단의 평균이 15 보다 작다
가설 단측검정
H
1귀무가설이 맞다면
표본평균의 분포는 다음과 같이 생겼다
15
2.3
√ 16
H
0�
0: �=15
귀무가설하에서
표본평균이 14 이하 나올 가능성이 있음
� � ´ ( �, � �
2) = N ( 15, 2.3 162 )
´�
14
기각역에 의한
검정
관측값과 기각역을 비교
이번에는 기각역이 왼쪽
H
1기각역
15
2.3
4
14
´�
H
0기각역에 의한
검정
유의수준은 5% 로 가정
기각역의 왼쪽 확률이 5%
´�
15
2.3
4
H
1H
0기각역
5%
=k
0.946
1
�
0 1 2 3
−3 −2 −1 1.645
0.05 N(0.1)
엑셀에 의하여 구하면
´�
15
2.3 4
H
1H
014.054
5%
14
표본평균 14 일이 기각역에 들어가므
로
귀무가설 기각 (
P- 값에 의한
검정
p- 값 = 표본평균이 14 일보다 작을 확률
14 일을 표준화해주면
표준정규분포에서 -1.74 보다 작을 확률
15
2.3
√ 16
H
0´�
14 0
1
H
0z -1.74
P- 값에 의한
검정
p- 값 = 표본평균이 14 일보다 작을 확 률
15
2.3
√ 16
H
0´�
14
P- 값 =0.041 <
0.05=5%
귀무가설 기각 (
P- 값에 의한
검정
p- 값 = 표준정규분포에서 -1.74 보다 작을 확률
0
1
H
0z -1.74
P- 값 =0.041 <
0.05=5%
귀무가설 기각 (
1. 모집단의 표준편차 를 아는 경우 모집단의 분산 을 아는 경우
2. 모집단의 표준편차 를 모르는 경우 모집단의 분산 을 모르는 경우
Z- 검정
t- 검정
´� −�
� / √ � � (0,1)
� = ´ ∑ �
�� � (� , �
2� )
� −� ´
� / √ � �(�− 1)
모표준편차를 알 때
모표준편차를 모를 때 모평균의점추정량은
표본평균
예제 5.4 p.209
전구의 수명시간을 조사하는데
표본평균 =1970, 표본수 =9
편차 (σ) 는 모르고 표본표준편차 (s) 는 70 으로 계산
일반 전구의 수명은 1950 시간인데 이 집단의 전구 수명은 일반 전구들에 비해서 높다고 이야기 할 수 있 나 ?
H
0:
모집단의 평균이 1950 이다H
1:
모집단의 평균이 1950 보다 크다 가설단측검정
단측검정이므로 기각역이 한 쪽
1950
�
√
9
H
0´�
5%
H
1H
0기각역 =k
기각역에 의한
검정
�
0 1 2 3
−3 −2 −1 1.86
0.05 t(8)
86 . 9 1
/
701950
k
4 . 1993
9 86 70 . 1 1950
k
관측값 1970 이 기각역 1993.4 보 다 작으므로 귀무가설 채택 (
1950
�
√
9
H
0´�
5%
H
1H
0기각역 = 1993.4
기각역에 의한
검정
�
0 1 2 3
−3 −2 −1 1.86
0.05 t(8)
1970
86 . 9 1
/
701950
k
참고 > 엑셀에 의하면
�
0 1 2 3
−3 −2 −1 1.86
0.05 t(8)
표본평균이 1970 이상일 확률은 0.208
이는 Excel 에서 계산 가능
p- 값이 유의수준보다 크므로 귀무가설 채택
p- 값에 의한 검정
1950
�
√
9
H
0´�
1970
�
0 1 2 3
−3 −2 −1 0.857
0.208 t(8)
1970 − 1950
70/
√
9 =0.857
참고 > 엑셀에 의하면
�
�
0 1 2 3
−3 −2 −1 0.857
t(8)
예제 5.5 p.211
학생들의 평균신장을 조사
표본평균 =170, 표본수 =10
편차 (σ) 는 모르고 표본표준편차 (s) 는 5.02 으로 계산
일반인의 평균이 172 인데 이 집단의 평균신장은 일반인들과 다르다고 이야기 할 수 있나 ?
H0: 모집단의 평균이 172 이다
H1: 모집단의 평균이 172 가 아니다 ( 크거나 작다 )
가설
양측검정
양측검정이므로 기각역이 양 쪽
172
�
√
10
H
0´�
0.025
H
1기각역 =k
기각역에 의한
검정
H
0H
1기각역
0.025
�
0 1 2 3
−3 −2 −1 2.262
0.025 t(9)
−2.262
262 . 10 2
/ 02 .
5k 172
59 . 175
10 02 . 2625 . 2 172
k
관측값 170 이 기각역에 속하지 않으므로 귀무가설 채택
172
�
√
10
H
0´�
0.025
H
1H
0기각역 = 175.59
기각역에 의한
검정
�
0 1 2 3
−3 −2 −1 2.262
0.025 t(9)
H
1기각역 = 168.41
0.025
170
−2.262
262 . 10 2
/ 02 .
5k 172
양측검정이므로 p- 값도 2 배
170 보다 작을확률 =174 보다 클확률
172
�
√
10
H
0´�
P- 값에 의한
검정
�
0 1 2 3
−3 −2 −1 1.26
?
t(9)
170 174
174 −172
5.02/
√
10 =1.26
−1.26
p- 값 =0.239
p- 값이 유의수준보다 크므로
귀무가설 채택
172
�
√
10
H
0´�
P- 값에 의한
검정
�
0 1 2 3
−3 −2 −1 1.26
?
t(9)
170 174
−1.26