10장
평균에 대한 비교 (comparisons involving means) Part A
두 모집단 평균 차이에 대한 추론: 과 가 알려져 있는 경우
두 모집단 평균 차이에 대한 추론: 짝 표본의 경우
1
2 두 모집단 평균 차이에 대한 추론: 과 가 알려져 있지 않은 경우
1
2두 모집단 평균 차이에 대한 추론 : 알려져 있는 경우
에 대한 신뢰구간 추정
에 대한 가설검정
1 - 2
1 - 2
1과
2가
두 모집단 평균 차이에 대한 추론
1 - 2은 두 모집단의 평균의 차이 이다.
= 표본1의 평균, = 표본2의 평균
x1
x1 xx22
두 모집단 1, 2 의 평균의 차이에 대한 점추정치는:
x x
11 x x
22 을 모집단 1의 모집단 평균으로, 를 모집단 2의 모집단 평균으로 한다.
2
1
평균값의 차이( )에 대한 추론을 하기 위해, 모집단 1로부터 개, 모집단 2로부터 개의 표본을 무작위로 선정한다
1 - 2
n1 n2
기대값
의 표본분포
x
1 x
2x
1 x
2E x( 1 x2) 1 2 E x( 1 x2) 1 2
표준편차 (표준오차; standard error))
x x
n n
1 2
1 2
1
2 2
2
x x
n n
1 2
1 2
1
2 2
2
여기서: 1 = 모집단 1의 표준편차
2 = 모집단 2의 표준편차 n1 = 모집단 1의 표본규모 n2 = 모집단 2의 표본규모
신뢰구간 추정
1-
2의 신뢰구간 추정 :
1와
2가 알려져 있는 경우
2 2
1 2
1 2 / 2
1 2
x x z
n n
12
221 2 / 2
1 2
x x z
n n
여기서: 1 - 는 신뢰계수
예: Par사
1-
2신뢰구간 추정 :
1과
2가 알려져 있는 경우
기계장치를 이용한 드라이빙거리 시험에서, Par사 골프공 표본을 경쟁사인 Rap 사의 골프공 표본과
비교하였다. 표본통계량이 다음 슬라이더에 나와 있다.
Par사는 골프 용품 제조업체로써 훨씬 멀리 나가는 새로운 골프공을 개발하였다.
예: Par사
1-
2의 신뢰구간 추정 :
1과
2가 알려져 있는 경우
표본규모 표본평균
표본 #1 Par사
표본 #2 Rap사 120 개 80 개
275 yards 258 yards
이전 시험을 기초로 할 때 , 두 모집단의 표준편차는
1 = 15 yards 와 2 = 20 yards 로 알려져 있다.
1-
2신뢰구간 추정 :
1과
2가 알려져 있는 경우
예: Par사
두 골프공의 드라이빙거리 평균 차이에 대해 95%의 신뢰구간을 추정 해 보자.
두 모집단 평균의 차이에 대한 추정
m1 – 2 = 두 평균거리의 차이
x1 - x2 = m1 – 2 의 점추정치 모집단 1
Par사 골프공
1 = Par사 골프공의 평균 거리
모집단2 Rap사 골프공
2 = Rap사 골프공의
평균거리
R ap사 골프공의 단순무작위 표본수:n2
x2 = Rap사 공의 표본평균거리 Par사 골프공의 단순무작위
표본수: n1
x1 = Par사 공의 표본평균거리
1-
2의 점추정치
1 2 의 점추정치= xx11 xx22
여기서:
1 = Par사 골프공의 모집단의 평균거리
2 = Rap사 골프공의 모집단의 평균거리
= 275 258
= 17 yards
x x z
n n
1 2 2 1
2
1
2 2
2
2 2
17 1 96 15 120
20
80
/ . ( ) ( )
x x z
n n
1 2 2 1
2
1
2 2
2
2 2
17 1 96 15 120
20
80
/ . ( ) ( )
1-
2의 구간 추정 :
1과
2가 알려진 경우
Par사 골프공과 Rap사 골프공의 평균드라이빙거리 차이는 11.86 에서 22.14 yards 이다는 것을 95%
신뢰한다.
17 + 5.14 또는 11.86 yards에서 22.14 yards
1
2에 대한 가설 검정 :
1과
2가 알려진 경우
가설
1 2 0
2 2
1 2
1 2
( x x ) D z
n n
1 2 0
2 2
1 2
1 2
( x x ) D z
n n
1
2 0a
:
Ha
:
1
2 D0H D
0
:
1 2 0H0
:
1
2 D0H D
0
:
1 2 0H0
:
1
2 D0H D
1
2 0a
:
Ha
:
1
2 D0H D
0
:
1 2 0H0
:
1
2 D0H D
1
2 0a
:
Ha
:
1
2 D0H D
왼쪽 검정 오른쪽 검정 양측 검정
검정통계량(test statistics)
예: Par사
1
2에 대한 가설 검정 :
1과
2가 알려진 경우
유의수준 = .01에서, 이 회사의 골프공의 평균 드라이빙 거리가 Rap사 골프공의 평균
드라이빙 거리보다 더 멀다고 결론지을 수 있는가 ?
H0: 1 - 2 < 0 Ha: 1 - 2 > 0 여기서:
1 = Par사 골프공의모집단의 평균거리
2 = Rap사 골프공의 모집단의 평균거리 1. 가설 수립
p –값 과 임계값을 이용한 방법
1
2에 대한 가설 검정 :
1과
2가 알려진 경우
2. 유의수준 설정 = .01
3. 검정통계량 계산
1
2에 대한 가설 검정 :
1과
2가 알려진 경우
p –값 과 임계값을 이용한 방법
1 2 0
2 2
1 2
1 2
(x x ) D z
n n
1 2 0
2 2
1 2
1 2
(x x ) D z
n n
p –값 접근법 4. p–값 계산
z = 6.49에 대하여, p –값 < .0001.
1
2에 대한 가설 검정 :
1과
2가 알려진 경우
5. 귀무가설( H0)을 기각할지를 결정 p–값 < = .01, H0를 기각
.01 의 유의수준에서, 표본자료는 Par사 골프공이 Rap사 골프공보다 평균 드라이빙거리가 더 멀다는 것을 보여준다.
1
2에 대한 가설 검정 :
1과
2가 알려진 경우
5. 귀무가설( H0)을 기각할 것인지 결정 z = 6.49 > 2.33, H0을 기각
임계값 접근법
= .01에서, z.01 = 2.33 4. 임계값과 기각법칙 결정
z > 2.33이면, H 0을 기각
표본자료는 Par사 골프공이 Rap사 골프공보다 평균 드라이빙거리가 더 멀다는 것을 보여준다.
두 모집단 평균의 차이에 대한 추론 :
1과
2가 알려지지 않은 경우
1 – 2 의 신뢰구간 추정
1 – 2의 가설 검정
1-
2의 신뢰구간 추정 :
1과
2가 알려지지 않은 경우
1 과 2 을 모르고 있을 때 :
•
z/2 를 t/2로 대체•
표본의 표준편차 s1 과 s2 을 σ1과 σ2의 추정치로 이용2 2
1 2
1 2 / 2
1 2
s s x x t
n n
12
221 2 / 2
1 2
s s x x t
n n
t/2 에 대한 자유도:
1-
2에 대한 신뢰구간 추정 :
1과
2가 알려지지 않은 경우
신뢰구간 추정치
2 2 2
1 2
1 2
2 2
2 2
1 2
1 1 2 2
1 1
1 1
s s
n n
df
s s
n n n n
2 2 2
1 2
1 2
2 2
2 2
1 2
1 1 2 2
1 1
1 1
s s
n n
df
s s
n n n n
예 : Specific Motors
두 모집단 평균의 차이 :
1과
2가 알려지지 않은 경우
D etroit의 Specific Motors는 M car라는 새로운 자동차를 개발 하였다.
연비 (miles-per-gallon: mpg) 비교를 위해 M car 24대와 J cars 28대(일본산) 로 실험을 하였다. 표본통계량은 다음 슬라이더에 제공되어 있다.
두 모집단 평균의 차이 :
1과
2가 알려지지 않은 경우
예 : Specific Motors
표본규모 표본평균
표본표준편차 표본#1
M Cars
표본 #2 J Cars 24 대 28 대 29.8 mpg 27.3 mpg 2.56 mpg 1.81 mpg
두 모집단 평균의 차이 :
1과
2가 알려지지 않은 경우
두 자동차 연비의 모집단 평균의 차이에 대하여 90%의 신뢰구간을 추정해 보자.
예 : Specific Motors
1 2 의 점추정치 = xx11 xx22
1
2의 점추정치
여기서:
1 = M car의 평균연비(mpg)
2 = J car 의 평균연비(m pg)
= 29.8 - 27.3
= 2.5 mpg
1
2의 구간 추정
1과
2가 알려지지 않은 경우
t/2 의 자유도:
2 2 2
2 2
2 2
(2.56) (1.81)
24 28
24.07 24 1 (2.56) 1 (1.81)
24 1 24 28 1 28
df
2 2 2
2 2
2 2
(2.56) (1.81)
24 28
24.07 24 1 (2.56) 1 (1.81)
24 1 24 28 1 28
df
/2 = .05 이고, df = 24, t/2 = 1.711
1
2의 구간추정 :
1과
2가 알려지지 않은 경우
2 2 2 2
1 2
1 2 / 2
1 2
(2.56) (1.81)
29.8 27.3 1.711
24 28
s s
x x t
n n
12 22 2 2
1 2 / 2
1 2
(2.56) (1.81)
29.8 27.3 1.711
24 28
s s
x x t
n n
M cars 와 J cars의 평균 연비 차이가 1.431 에서 3.569 mpg 이다는 것을 90% 신뢰한다.
2.5 + 1.069 또는 1.431에서 3.569 mpg
μ
1
2에 대한 가설검정 :
1과
2가 알려지지 않은 경우
가설
1 2 0
2 2
1 2
1 2
( x x ) D t
s s
n n
1 2 0
2 2
1 2
1 2
( x x ) D t
s s
n n
1
2 0a
:
Ha
:
1
2 D0H D
0
:
1 2 0H0
:
1
2 D0H D
0
:
1 2 0H0
:
1
2 D0H D
1
2 0a
:
Ha
:
1
2 D0H D
0
:
1 2 0H0
:
1
2 D0H D
1
2 0a
:
Ha
:
1
2 D0H D
왼쪽 검정 오른쪽 검정 양측 검정
검정통계량
예: Specific Motors
1
2에 대한 가설 검정 :
1과
2가 알려지지 않은 경우
0.05 의 유의수준에서, M cars의 연비 (m pg) 가 J cars의 연비 (m pg)보다 크다고 결론을 내릴 수 있는가?
H0: 1 - 2 < 0 Ha: 1 - 2 > 0 여기서:
1 = M cars 모집단의 평균 mpg
2 = J cars 모집단의 평균 mpg 1. 가설 수립
p –값과 임계값을 이용한 방법
1
2에 대한 가설 검정 :
1과
2가 알려지지 않은 경우
2. 유의수준 설정 3. 검정통계량 계산
= .05
p –값과 임계값 접근 방법
1
2에 대한 가설 검정 :
1과
2가 알려지지 않은 경우
1 2 0
2 2 2 2
1 2
1 2
( ) (29.8 27.3) 0
4.003 (2.56) (1.81)
24 28
x x D
t
s s
n n
1 2 0
2 2 2 2
1 2
1 2
( ) (29.8 27.3) 0
4.003 (2.56) (1.81)
24 28
x x D
t
s s
n n
1
2에 대한 가설 검정 :
1과
2가 알려지지 않은 경우
p –값 접근법 4. p –값 계산
t 에 대한 자유도:
2 2 2
2 2
2 2
(2.56) (1.81)
24 28
24.07 24 1 (2.56) 1 (1.81)
24 1 24 28 1 28
df
2 2 2
2 2
2 2
(2.56) (1.81)
24 28
24.07 24 1 (2.56) 1 (1.81)
24 1 24 28 1 28
df
t = 4.003 > t.005 = 2.797 에서, p–값 < .005.
5. H0을 기각할지 결정
M cars의 연비 (mpg) 가 J cars의 연비 (mpg) 보다 우수하다는 것을 적어도 95% 신뢰한다.
p –값 접근법
p–값 < = .05, H0을 기각한다.
1
2에 대한 가설 검정
1과
2가 알려지지 않은 경우
4. 임계값과 기각법칙 결정
임계값 접근법
1
2에 대한 가설 검정 :
1과
2가 알려지지 않은 경우
= .05 와 df = 24에서, t.05 = 1.711 t > 1.711일 경우, H 0 기각 5. H0을 기각할지 결정
4.003 > 1.711에서, H0을 기각한다.
M cars의 연비 (mpg) 가 J cars의 연비 (mpg) 보다 우수하다는 것을 적어도 95% 신뢰한다.
짝 표본 방법에서는 추출된 각 표본항목이 한 쌍의 자료값을 가지고 있다.
독립표본 설계에 비하여 낮은 표본오차를 보인다. 이것은 짝표본 설계에서는 표본항목들 사이의 변동이 제거되어
낮은 표본오차(sam pling error)를 보일 수 있기 때문이다.
두 모집단 평균의 차이에 대한 추론 :
짝 표본 (matched samples)의 경우
예 : Express D eliveries
두 모집단 평균의 차이에 대한 추론 : 짝 표본의 경우
Chicago에 있는 한 회사는 미국 전지점에 급히 배송해야 할 서류를 가지고 있다. 이 회사는 UPX (United Parcel Express) 와 INTEX(International Express)라는
두 택배 회사 중 하나를 선택하여 서류를 배송해야 한다.
예 : Express Deliveries
두 모집단 평균 차이에 대한 추론 : 짝 표본의 경우
두 택배사의 배송시간 검정을 위해, 이 회사는 전국 지점들
중 무작위로 선정해서 두 개의 서류 중 하나는 UPX 로 다른 하나는 INTEX로 보냈다. 다음 슬라이더에 있는 데이터로
두 택배회사의 평균배송시간에 차이가 있다고 할 수 있는가? 유의수준은 .05로 한다.
32 30 19 16 15 18 14 10 7 16
25 24 15 15 13 15 15 8 9 11
UPX INTEX 배송시간차이 지점
Seattle
Los Angeles Boston
Cleveland New York Houston Atlanta St. Louis Milwaukee Denver
배송시간 (시간)
7 6 4 1 2 3 -1 2 -2 5
두 모집단 평균 차이에 대한 추론 :
짝 표본의 경우
H0: d = 0 Ha: d
d = 모집단 지점에 대한 두 배송서비스 시간 차이의 평균
1. 가설 수립
두 모집단 평균의 차이에 대한 추론 : 짝 표본의 경우
p –값과 임계값 접근법
2. 유의수준 설정 = .05
두 모집단 평균의 차이에 대한 추론 : 짝 표본의 경우
p –값과 임계값 접근법
3. 검정통계량 계산
d d
n
i ( ... )
7 6 5 .
10 2 7
d d
n
i ( ... )
7 6 5 .
10 2 7
s d d
d ni
( ) .
.
2
1
76 1
9 2 9
s d d
d ni
( ) .
.
2
1
76 1
9 2 9 2.7 0 2.94 2.9 10
d d
t d
s n
2.7 0 2.94 2.9 10
d d
t d
s n
5. H0을 기각할지를 결정
두 택배회사의 평균 배송시간에 차이가 있다는 것을 적어도 95% 신뢰한다.
4. p –값 계산
t = 2.94 와 df = 9에서, p–값은 .02 와 .01사이에
있다. (이것은 양측 검정이므로 우측검정 때의 면적 0.01과 0.005를 각각 두 배로 하였다)
p–값 < = .05에서, H0을 기각한다.
두 모집단 평균의 차이에 대한 추론 : 짝 표본의 경우
p –값 접근법
4. 임계값과 기각법칙 결정
두 모집단 평균의 차이에 대한 검정 : 짝 표본의 경우
임계값 접근법
= .05 과 df = 9에서, t.025 = 2.262.
t > 2.262경우, H 0 기각 5. H0을 기각할지를 결정
t = 2.94 > 2.262에서, H0을 기각한다.
두 택배회사의 평균 배송시간에 차이가 있다는 것을 적어도 95% 신뢰한다.