두집단 평균차이의 검정
- 두집단의 평균비교
교재 pp.213~228
1. 두집단의 평균비교 : z- 검정 ( 모집단의 분산을 알 때 )
2. 두집단의 평균비교 : t- 검정 ( 두 집단의 분산이 같을 때 ) 3. 두집단의 평균비교 : t- 검정 ( 두 집단의 분산이 다를 때 ) 4. 대응표본의 평균비교 : t- 검정 ( 쌍체비교 )
목차
오늘 배울
내용은
• 두 평균차이의 검정
• 두집단의 평균이 같다 ?
• 가설은
• H0: 두집단의 평균이 같다
• H1: 두집단의 평균이 다르다
• H0: 두집단의 평균이 같다
• H1: 한쪽의 평균이 다른쪽보다 크다
양측검 정
단측검 정
ide a
• Random 으로 각 집단에서 표본을 뽑아 ( 각 n1, n2 개 ) 평균을 구했다
• 두 집단의 모평균이 같다면 두 표본집단의 평균은 ?
•
� 1 , � 2 ,…, � �
1
X 집단 모평균 :
Y 집단
모평균 :
� 1 , � 2 ,…, � �
2
�
1= �
2?
´�
� ´
�2
√�2
´�
� 2
�1
√�1
´�
� 1
이론
표본평균의분 포: ´� �(
�, ��2)
√
��112+ ��222� − ´´ �
� 1−�2
예제 5.6 p.214
• 두가지 교육방식으로 학생들을 교육 (A, B type)
• 시험성적을 조사 ( 각 9 명씩 )
• A 표본평균 =260, B 표본평균 =280
• 편차 (σ) 는 25 라고 알려져 있다
• 두 집단의 평균이 다르다고 할 수 있는지를 양측 검정하시오
• H0: 두 집단의 평균이 같다
• H1: 두 집단의 평균이 다르다
가설
양측검정
H
1H
1귀무가설이 맞다면
• 귀무가설하에서 표본평균의 차이분포는 다음과 같다
• 귀무가설이 맞더라도 평균차이가 20 이상 나올 수 있다
• 그러나 양쪽으로 많이 벗어나면 귀무가설 기각
� − ´´ �
0
-20
H
0√
2592+ 2592
2 2 2 1
2
, 1
0
~ N n n
Y
X
기각역에 의한 검정
• 기각역에 따라 기각 또는 채택
•
•
H
1H
0H
1기각역
√
2592+2592� − ´´ �
0
기각역
1
�
0 1 2 3
−3 −2 −1 1.96
0.025
N(0.1)
0.025
0.025
기각역에 의한 검정
H
1H
0H
1기각역 =k 11.785
� − ´´ �
0
기각역
0.025
0.025
-23.1 23.1
-20
• 기각역이 ±23.1 이므로 평균차 -20 은 기각역에 속하지 않음
• 그러므로 귀무가설 채택
96 . 785 1
.
11k 0
0986 .
23
785 .
11 96
. 1 0
k
P- 값에 의한 검정
• 통계량값 -20 이하 나올 확률을 구함
• 양측검정이므로 20 이상일 확률도 포함
• P- 값과 유의수준을 비교
• 유의수준보다 크므로 귀무가설 채택
11.785
� − ´´ �
0
-20 20
• 통계량값 20 을 표준화하면 (20-0)/11.785=1.70
• 표준정규분포에서 1.7 까지 의 확률은 0.9554
• ?=0.0446
• 그러므로 p- 값은 0.0892
?
엑셀로 다시 풀어보는
• 데이터 입력
예제 5.6
p.214
결과
• 표준화값이 -1.697
• 양측검정의 유의확률이 0.089
• 그러므로 유의수준 5% 로는 귀무가설 채택
1. 두집단의 평균비교 : z- 검정 ( 모집단의 분산을 알 때 )
2. 두집단의 평균비교 : t- 검정 ( 두 집단의 분산이 같을 때 )
3. 두집단의 평균비교 : t- 검정 ( 두 집단의 분산이 다를 때 ) 4. 대응표본의 평균비교 : t- 검정 ( 쌍체비교 )
목차
예제 5.7 p.219
• 두가지 교육방식으로 학생들을 교육 (A, B type)
• 시험성적을 조사 ( 각 9 명씩 )
• A 표본평균 =260, B 표본평균 =280
• 모표준편차 (σ) 는 모른다
• 두 집단의 평균이 다르다고 할 수 있는지를 양측 검정하시오
앞의 문제와 같은 문제
단 모분산 ( 모표준편차 ) 만 모를 뿐
• H0: 두 집단의 평균이 같다
• H1: 두 집단의 평균이 다르다
가설
양측검정NOTE • 정규변수를 표준화할 때
• 분산을 알면 표준정규분포
• 분산을 모르면 t- 분포
표준화
표준화
� �− �´ ¿2 Σ¿¿
�12=¿
� �− ´� ¿2 Σ¿¿
�22=¿
자유도가 얼마 ?
?
) 1 , 0 (
~
2 2 2 1
2 1
N n
n
Y X
) ,
0 (
~
2 2 2 1
2 1
n N n
Y
X
) (
~
2 2 2 1
2 1
t nS n
S
Y X
문제의 시작
• 분산을 모른다고 그냥 S1, S2 로 추정한 값을 넣으면 ф( 자유도 ) 값의 계산이 난해• 일단은 두 집단의 분산이 같다고 가정
표준화
표준화
� � − �´ ¿2
¿
� �− �´ ¿2+ Σ ¿ Σ ¿
�������2 =¿
공동표본분산
) 2 (
1 ~
1 1 2
2 1
t n n
n S n
Y X
P
) ,
0 (
~
2 2 2 1
2 1
n N n
Y
X
~ ( )2 2 2 1
2 1
t n
S n
S
Y X
1 )) ( 1
, 0 (
~
2 1
2
n N n
Y
X
그래서
• 분산을 모를 때 두집단의 평균차이 검정은
• t- 검정인데
• 자유도때문에
• 두 가지 경우로 나누어 생각한다
• 분산이 같을 때 ( 등분산 等分散 )
• 분산이 다를 때 ( 이분산 異分散 )
다시
예제 5.7 p.219
• 두가지 교육방식으로 학생들을 교육 (A, B type)
• 시험성적을 조사 ( 각 9 명씩 )
• A 표본평균 =260, B 표본평균 =280
• 등분산을 가정하고
• 두집단의 평균이 다르다고 할 수 있는지를 양측 검정하시오
� � − �´ ¿2
¿
� � − �´ ¿2+ Σ ¿ Σ ¿
� ������2 =¿
2 2
1 25.34
S S22 27.82
375 .
2 707 ) 1 (
) 1 (
2 1
2 2 2
2 1
2 1
n n
S n
S SP n
기각역에 의한 검정
• 표본평균차이를 표준화해주면 t 분포
• -20 을 표준화하면
• t(0.025, 16)=2.12
• 귀무가설 채택
•
?≈
√
707.375� − ´� ´
0
-20 20
� 0 1 2 3
−3 −2 −1 2.12
0.025 t(16)
-1.59
H1 H0
H1
기각역 기각역
엑셀로 다시 풀어보는
• 데이터 입력은 예제 5.6 과 동일
예제 5.7
p.214
• 공동분산이 707.375
• 자유도는 16
• 표준화값은 -1.59
• 양측검정의 유의확률이 0.13
• 그러므로 유의수준 5% 로 귀무 가설 채택
결과
당연히
나올 질문
• 등분산을 가정하고 문제를 풀었는데 분산이 같다는 건 어떻게 아나요 ?
• 분산이 같은지를 먼저 검정합니다
• 엑셀의 분석도구에서
F 검정 : 분산에 대한 두집단• F 검정에서 귀무가설은 ?
• 귀무가설은 ‘같다’ , ‘ 차이없다’ , ‘ 효과없다’ , ‘0 이다’
• 즉 , 분산이 같다
• F 검정 : 분산에 대한 두집단에서 p- 값을 구하고
• p- 값이 작다면 이분산
• p- 값이 크다면 등분산
1. 두집단의 평균비교 : z- 검정 ( 모집단의 분산을 알 때 ) 2. 두집단의 평균비교 : t- 검정 ( 두 집단의 분산이 같을 때 )
3. 두집단의 평균비교 : t- 검정 ( 두 집단의 분산이 다를 때 )
4. 대응표본의 평균비교 : t- 검정 ( 쌍체비교 )
목차
예제 5.8 p.221
• 남녀 학생들을 100m 기록 ( 각 9 명씩 )
• A 표본평균 =13.2, B 표본평균 =14.85
• 편차 (σ) 는 모른다 ( 이분산 의심 )
• 두집단의 평균이 다르다고 할 수 있는지를 양 측검정하시오
• 먼저 등분산인지 이분산인지를 판단하기위하 여 예제 5.9 풀이
• 이분산으로 가정되므로 (p=0.00077)
• t- 검정 : 이분산 가정 두집단
엑셀로 ( 만 ) 풀어보자
• 데이터 입력
• 1 단계 > 두집단의 분산이 같은지를 검정
• 데이터 분석도구 => F- 검정
• 유의확률이 0.00077 이므 로 귀무가설 기각
• 귀무가설 ( 분산이 같다 ) 이 기각되었으므로 이분산
• 2 단계 > 두 집단의 평균이 같은지를 검정
• 데이터 분석도구 =>
• t- 검정 : 이분산가정 두집단
• 유의확률이 0.05147
• 유의수준 5% 로
• 귀무가설 채택
요약 : 두집단의 평균차이 검 정
• 귀무가설 : 두 집단의 모평균이 같다
분산을 안다
F- 검정
• 검정통계량 : 두 집단의 표본평균의 차이
Z- 검정
분산을 모
른다 등분산 이분산
t- 검정
t- 검정
) 1 , 0 (
~
2 2 2 1
2 1
N n
n
Y X
) ,
0 (
~
2 2 2 1
2 1
n N n
Y
X
) (
~
2 2 2 1
2 1
t n
S n
S
Y X
) 2 (
1 ~
1 1 2
2 1
t n n
n S n
Y X
P
1. 두집단의 평균비교 : z- 검정 ( 모집단의 분산을 알 때 ) 2. 두집단의 평균비교 : t- 검정 ( 두 집단의 분산이 같을 때 ) 3. 두집단의 평균비교 : t- 검정 ( 두 집단의 분산이 다를 때 ) 4. 대응표본의 평균비교 : t- 검정 ( 쌍체비교 )
목차
오늘 배울 내용
하나 더
• 두 평균차이의 검정
• 그런데 앞 절과는 달리 두 집단이 서로 독립이 아니다
• 쌍체비교
• 대응표본 검정 (paired sample test)
• 예 >
• 광고를 보기 전과 후의 인지도 차이
• t- 검정 : 쌍체비교
• 광고를 본 그룹과 컨트롤 그룹의 평균차이
• t- 검정 : ? 분산 가정 두집단
구별방법 : 한 개체에서 두 값을 얻었으면 쌍체비교
예제 5.10 p.228
• 다이어트 전과 후의 체중 조사
• 5 명을 전후로 측정
• 다이어트 전 평균 =66.4
• 다이어트 후 평균 =63.6
• 편차 (σ) 는 모른다
• 다이어트 후의 평균이 줄었다고 할 수 있는 지를 단측검정하시오
• H0: 전과 후의 평균이 같다
• H1: 전의 평균이 후의 평균보다 크다
가설
단측검정ide a
• 두집단이 독립은 아니지만
• D1, D2,…,Dn 은 서로 독립
• 검정의 판단기준은 ?
X 집단 X
1X
2X
3: X
nY 집단 Y
1Y
2Y
3: Y
n- -
- : -
= D
1= D
2= D
3:
= D
n즉 , 이값이 크면 X 집단 의 평균이 크다는 의미가 된다 . ( 한 ) 모집단의 평
균검정과 동일 들의 평균
D
엑셀에 의한 풀이
• 데이터 입력
• 데이터분석도구 => 쌍체비교
결과
• P- 값이 0.09
• 유의수준 5% 보다 크므로 귀무가설 채 택
• 즉 평균이 같다고밖 에 말할 수 없다
수고하셨습니다
이제 기말고사 준비할 때가 왔습니다