평균에 대한 비교 (comparisons involving means) Part A

(1)

10장

평균에 대한 비교 (comparisons involving means) Part A

 두 모집단 평균 차이에 대한 추론: 과 가 알려져 있는 경우

 두 모집단 평균 차이에 대한 추론: 짝 표본의 경우



₁



₂

 두 모집단 평균 차이에 대한 추론: 과 가 알려져 있지 않은 경우



₁



₂

(2)

두 모집단 평균 차이에 대한 추론 : 알려져 있는 경우

 에 대한 신뢰구간 추정

 에 대한 가설검정

₁ - ₂



₁

^과 

₂

^가

(3)

두 모집단 평균 차이에 대한 추론

 ₁ - ₂은 두 모집단의 평균의 차이 이다.

= 표본1의 평균, = 표본2의 평균

x₁

x₁ xx₂₂

 두 모집단 1, 2 의 평균의 차이에 대한 점추정치는:

x x

₁₁

  x x

₂₂

 을 모집단 1의 모집단 평균으로, 를 모집단 2의 모집단 평균으로 한다.

 ₂

 ₁

 평균값의 차이( )에 대한 추론을 하기 위해, 모집단 1로부터 개, 모집단 2로부터 개의 표본을 무작위로 선정한다

₁ - ₂

n₁ n₂

(4)

 기대값

의 표본분포

x

₁

 x

₂

x

₁

 x

₂

E x( ₁  x₂)  ₁  ₂ E x( ₁  x₂)  ₁  ₂

 표준편차 (표준오차; standard error))

  

x x

n n

1 2

1

2 2

2

  

  

x x

n n

1 2

1

2 2

2

  

여기서: ₁ = 모집단 1의 표준편차

₂ = 모집단 2의 표준편차 n₁= 모집단 1의 표본규모 n₂ = 모집단 2의 표본규모

(5)

신뢰구간 추정



₁

_- 

₂

^{의 신뢰구간 추정} _:



₁

^와 

₂

가 알려져 있는 경우

2 2

1 2

1 2 / 2

1 2

x x z

n n



 

 

¹²



²²

1 2 / 2

1 2

x x z

n n



 

  

여기서: 1 -  ^{는 신뢰계수}

(6)

예: Par사



₁

_- 

₂

^{신뢰구간 추정} _:



₁

^과 

₂

가 알려져 있는 경우

 기계장치를 이용한 드라이빙거리 시험에서, Par사 골프공 표본을 경쟁사인 Rap 사의 골프공 표본과

비교하였다. 표본통계량이 다음 슬라이더에 나와 있다.

 Par사는 골프 용품 제조업체로써 훨씬 멀리 나가는 새로운 골프공을 개발하였다.

(7)

예: Par사



₁

_- 

₂

^{의 신뢰구간 추정} _:



₁

^과 

₂

가 알려져 있는 경우

표본규모 표본평균

표본 #1 Par사

표본 #2 Rap사 120 개 80 개

275 yards 258 yards

이전 시험을 기초로 할 때 , 두 모집단의 표준편차는

₁ = 15 yards 와  ₂ = 20 yards 로 알려져 있다.

(8)



₁

_- 

₂

^{신뢰구간 추정} _:



₁

^과 

₂

가 알려져 있는 경우

예: Par사

 두 골프공의 드라이빙거리 평균 차이에 대해 95%의 신뢰구간을 추정 해 보자.

(9)

두 모집단 평균의 차이에 대한 추정

m₁ _– ₂ = 두 평균거리의 차이

x₁ - x₂ = m₁ _– ₂ ^{의 점추정치} 모집단 1

Par사 골프공

₁ = Par사 골프공의 평균 거리

모집단2 Rap사 골프공

₂ _{= Rap사} 골프공의

평균거리

R ap사 골프공의 단순무작위 표본수:n₂

x₂ = Rap사 공의 표본평균거리 Par사 골프공의 단순무작위

표본수: n₁

x₁ = Par사 공의 표본평균거리

(10)



₁

_- 

₂

^{의 점추정치}

 ₁  ₂^{의 점추정치}= xx₁₁  xx₂₂

여기서:

₁ = Par사 골프공의 모집단의 평균거리

₂ = Rap사 골프공의 모집단의 평균거리

= 275  258

= 17 yards

(11)

x x z

n n

1 2 2 1

2

1

2 2

2

2 2

17 1 96 15 120

20

  _       80

/ . ( ) ( )

x x z

n n

1 2 2 1

2

1

2 2

2

2 2

17 1 96 15 120

20

  _       80

/ . ( ) ( )



₁

_- 

₂

^{의 구간 추정} _:



₁

^과 

₂

^{가 알려진 경우}

Par사 골프공과 Rap사 골프공의 평균드라이빙거리 차이는 11.86 에서 22.14 yards 이다는 것을 95%

신뢰한다.

17 + 5.14 또는 11.86 yards에서 22.14 yards

(12)



₁

 

₂

^{에 대한 가설 검정} _:



₁

^과 

₂

^{가 알려진 경우}

 가설

1 2 0

2 2

1 2

( x x ) D z

n n

 

 





1 2 0

2 2

1 2

( x x ) D z

n n

 

 





 

₁

 

₂ ₀

a

:

H_a

:  

₁

 

₂ D₀

H D

   

0

:

1 2 0

H₀

:  

₁

 

₂ D₀

H D

   

0

:

1 2 0

H₀

:  

₁

 

₂ D₀

H D

 

₁

 

₂ ₀

a

:

H_a

:  

₁

 

₂ D₀

H D

   

0

:

1 2 0

H₀

:  

₁

 

₂ D₀

H D

 

₁

 

₂ ₀

a

:

H_a

:  

₁

 

₂ D₀

H D

왼쪽 검정 오른쪽 검정 양측 검정

 검정통계량(test statistics)

(13)

예: Par사



₁

 

₂

^{에 대한 가설 검정} _:



₁

^과 

₂

^{가 알려진 경우}

유의수준  = .01에서, 이 회사의 골프공의 평균 드라이빙 거리가 Rap사 골프공의 평균

드라이빙 거리보다 더 멀다고 결론지을 수 있는가 ?

(14)

H₀: ₁- ₂ < 0  H_a: ₁- ₂ > 0 여기서:

₁ = Par사 골프공의모집단의 평균거리

₂ = Rap사 골프공의 모집단의 평균거리 1. 가설 수립

 p –값 과 임계값을 이용한 방법



₁

 

₂

^{에 대한 가설 검정} _:



₁

^과 

₂

^{가 알려진 경우}

2. 유의수준 설정  = .01

(15)

3. 검정통계량 계산



₁

 

₂

^{에 대한 가설 검정} _:



₁

^과 

₂

^{가 알려진 경우}

 p –값 과 임계값을 이용한 방법

 

 





1 2 0

2 2

1 2

(x x ) D z

n n

 

 





1 2 0

2 2

1 2

(x x ) D z

n n

(16)

 p –값 접근법 4. p–값 계산

z = 6.49에 대하여, p –값 < .0001.



₁

 

₂

^{에 대한 가설 검정} _:



₁

^과 

₂

^{가 알려진 경우}

5. 귀무가설( H₀)을 기각할지를 결정 p–값 <  = .01, H₀를 기각

.01 의 유의수준에서, 표본자료는 Par사 골프공이 Rap사 골프공보다 평균 드라이빙거리가 더 멀다는 것을 보여준다.

(17)



₁

 

₂

^{에 대한 가설 검정} _:



₁

^과 

₂

^{가 알려진 경우}

5. 귀무가설( H₀)을 기각할 것인지 결정 z = 6.49 > 2.33, H₀을 기각

 임계값 접근법

 = .01에서, z_.01 = 2.33 4. 임계값과 기각법칙 결정

z > 2.33이면^{, H} ₀^{을 기각}

표본자료는 Par사 골프공이 Rap사 골프공보다 평균 드라이빙거리가 더 멀다는 것을 보여준다.

(18)

두 모집단 평균의 차이에 대한 추론 :



₁

^과 

₂

가 알려지지 않은 경우

 ₁ –  ₂^{의 신뢰구간 추정}

 ₁ –  ₂^{의 가설 검정}

(19)



₁

_- 

₂

^{의 신뢰구간 추정} _:



₁

^과 

₂

가 알려지지 않은 경우

 ₁ ^과 ₂ ^{을 모르고 있을 때} :

•

^z__/2 ^를 ^t__/2^{로 대체}

•

^{표본의 표준편차} ^s₁ ^과 ^s₂^을 ^σ1과 σ₂의 추정치로 이용

(20)

2 2

1 2

1 2 / 2

1 2

s s x x t

n n

 

 ¹²



²²

1 2 / 2

1 2

s s x x t

n n

 





t__/2 에 대한 자유도:



₁

_- 

₂

에 대한 신뢰구간 추정 :



₁

^과 

₂

가 알려지지 않은 경우

신뢰구간 추정치

2 2 2

1 2

2 2

1 2

1 1 2 2

1 1

s s

n n

df

s s

n n n n

 

  

 

    

    

     

2 2 2

1 2

2 2

1 2

1 1 2 2

1 1

s s

n n

df

s s

n n n n

 

  

 

    

    

     

(21)

예 : Specific Motors

두 모집단 평균의 차이 :



₁

^과 

₂

가 알려지지 않은 경우

D etroit의 Specific Motors는 M car라는 새로운 자동차를 개발 하였다.

연비 (miles-per-gallon: mpg) 비교를 위해 M car 24대와 J cars 28대(일본산) 로 실험을 하였다. 표본통계량은 다음 슬라이더에 제공되어 있다.

(22)

두 모집단 평균의 차이 :



₁

^과 

₂

가 알려지지 않은 경우

표본규모 표본평균

표본표준편차 표본#1

M Cars

표본 #2 J Cars 24 대 28 대 29.8 mpg 27.3 mpg 2.56 mpg 1.81 mpg

(23)

두 모집단 평균의 차이 :



₁

^과 

₂

가 알려지지 않은 경우

두 자동차 연비의 모집단 평균의 차이에 대하여 90%의 신뢰구간을 추정해 보자.

(24)

 ₁  ₂^{의 점추정치} = xx₁₁  xx₂₂



₁

 

₂

^{의 점추정치}

여기서:

₁ = M car의 평균연비(mpg)

₂ = J car 의 평균연비(m pg)

= 29.8 - 27.3

= 2.5 mpg

(25)



₁

 

₂

^{의 구간 추정}



₁

^과 

₂

가 알려지지 않은 경우

 t__/2 의 자유도:

2 2 2

2 2

(2.56) (1.81)

24 28

24.07 24 1 (2.56) 1 (1.81)

24 1 24 28 1 28

df

 

  

 

  

   

    

     

2 2 2

2 2

(2.56) (1.81)

24 28

24.07 24 1 (2.56) 1 (1.81)

24 1 24 28 1 28

df

 

  

 

  

   

    

     

 /2 = .05 이고, df = 24, t__/2 = 1.711

(26)



₁

 

₂

^{의 구간추정} _:



₁

^과 

₂

가 알려지지 않은 경우

2 2 2 2

1 2

1 2 / 2

1 2

(2.56) (1.81)

29.8 27.3 1.711

24 28

s s

x x t

n n

   ¹²  ²²    ²  ²

1 2 / 2

1 2

(2.56) (1.81)

29.8 27.3 1.711

24 28

s s

x x t

n n

       

 M cars 와 J cars의 평균 연비 차이가 1.431 에서 3.569 mpg 이다는 것을 90% 신뢰한다.

 2.5 + 1.069 또는 1.431에서 3.569 mpg

(27)

μ

₁

 

₂

^{에 대한 가설검정} _:



₁

^과 

₂

가 알려지지 않은 경우

 가설

1 2 0

2 2

1 2

( x x ) D t

s s

n n

 





1 2 0

2 2

1 2

( x x ) D t

s s

n n

 





 

₁

 

₂ ₀

a

:

H_a

:  

₁

 

₂ D₀

H D

   

0

:

1 2 0

H₀

:  

₁

 

₂ D₀

H D

   

0

:

1 2 0

H₀

:  

₁

 

₂ D₀

H D

 

₁

 

₂ ₀

a

:

H_a

:  

₁

 

₂ D₀

H D

   

0

:

1 2 0

H₀

:  

₁

 

₂ D₀

H D

 

₁

 

₂ ₀

a

:

H_a

:  

₁

 

₂ D₀

H D

왼쪽 검정 오른쪽 검정 양측 검정

 검정통계량

(28)

예: Specific Motors



₁

 

₂

^{에 대한 가설 검정} _:



₁

^과 

₂

가 알려지지 않은 경우

 0.05 의 유의수준에서, M cars의 연비 ^{(m pg)}가 J cars의 연비 ^{(m pg)보다} 크다고 결론을 내릴 수 있는가?

(29)

H₀: ₁- ₂ < 0  H_a: ₁- ₂ > 0 여기서:

₁ = M cars 모집단의 평균 mpg

₂ = J cars 모집단의 평균 mpg 1. 가설 수립

 p –값과 임계값을 이용한 방법



₁

 

₂

^{에 대한 가설 검정} _:



₁

^과 

₂

가 알려지지 않은 경우

(30)

2. 유의수준 설정 3. 검정통계량 계산

 = .05

 p –값과 임계값 접근 방법



₁

 

₂

^{에 대한 가설 검정} _:



₁

^과 

₂

가 알려지지 않은 경우

1 2 0

2 2 2 2

1 2

( ) (29.8 27.3) 0

4.003 (2.56) (1.81)

24 28

x x D

t

s s

n n

   

  

 

1 2 0

2 2 2 2

1 2

( ) (29.8 27.3) 0

4.003 (2.56) (1.81)

24 28

x x D

t

s s

n n

   

  

 

(31)



₁

 

₂

^{에 대한 가설 검정} _:



₁

^과 

₂

가 알려지지 않은 경우

 p –값 접근법 4. p –값 계산

t_ 에 대한 자유도:

2 2 2

2 2

(2.56) (1.81)

24 28

24.07 24 1 (2.56) 1 (1.81)

24 1 24 28 1 28

df

 

  

 

  

   

    

     

2 2 2

2 2

(2.56) (1.81)

24 28

24.07 24 1 (2.56) 1 (1.81)

24 1 24 28 1 28

df

 

  

 

  

   

    

     

t = 4.003 > t_.005 = 2.797 에서, p–값 < .005.

(32)

5. H₀을 기각할지 결정

M cars의 연비 (mpg) 가 J cars의 연비 (mpg) 보다 우수하다는 것을 적어도 95% 신뢰한다.

 p –값 접근법

p–값 <  = .05, H₀을 기각한다.



₁

 

₂

^{에 대한 가설 검정}



₁

^과 

₂

가 알려지지 않은 경우

(33)

4. 임계값과 기각법칙 결정



₁

 

₂

^{에 대한 가설 검정} _:



₁

^과 

₂

가 알려지지 않은 경우

 = .05 와 df = 24에서, t_.05 = 1.711 t > 1.711일 경우, ^H ₀ ^기각 5. H₀을 기각할지 결정

4.003 > 1.711에서, H₀을 기각한다.

M cars의 연비 (mpg) 가 J cars의 연비 (mpg) 보다 우수하다는 것을 적어도 95% 신뢰한다.

(34)

 짝 표본 방법에서는 추출된 각 표본항목이 한 쌍의 자료값을 가지고 있다.

 독립표본 설계에 비하여 낮은 표본오차를 보인다. 이것은 짝표본 설계에서는 표본항목들 사이의 변동이 제거되어

낮은 표본오차(sam pling error)를 보일 수 있기 때문이다.

두 모집단 평균의 차이에 대한 추론 :

짝 표본 (matched samples)의 경우

(35)

예 : Express D eliveries

두 모집단 평균의 차이에 대한 추론 : 짝 표본의 경우

 Chicago에 있는 한 회사는 미국 전지점에 급히 배송해야 할 서류를 가지고 있다. 이 회사는 UPX (United Parcel Express) 와 INTEX(International Express)라는

두 택배 회사 중 하나를 선택하여 서류를 배송해야 한다.

(36)

예 : Express Deliveries

두 모집단 평균 차이에 대한 추론 : 짝 표본의 경우

 두 택배사의 배송시간 검정을 위해, 이 회사는 전국 지점들

중 무작위로 선정해서 두 개의 서류 중 하나는 UPX 로 다른 하나는 INTEX로 보냈다. 다음 슬라이더에 있는 데이터로

두 택배회사의 평균배송시간에 차이가 있다고 할 수 있는가? 유의수준은 .05로 한다.

(37)

32 30 19 16 15 18 14 10 7 16

25 24 15 15 13 15 15 8 9 11

UPX INTEX 배송시간차이 지점

Seattle

Los Angeles Boston

Cleveland New York Houston Atlanta St. Louis Milwaukee Denver

배송시간 (시간)

7 6 4 1 2 3 -1 2 -2 5

두 모집단 평균 차이에 대한 추론 :

짝 표본의 경우

(38)

H₀: _d= 0  H_a: _d 

_d= 모집단 지점에 대한 두 배송서비스 시간 차이의 평균

1. 가설 수립

두 모집단 평균의 차이에 대한 추론 : 짝 표본의 경우

 p –값과 임계값 접근법

(39)

2. 유의수준 설정  = .05

두 모집단 평균의 차이에 대한 추론 : 짝 표본의 경우

 p –값과 임계값 접근법

3. 검정통계량 계산

d d

n

  i     ( ... ) 

7 6 5 .

10 2 7

d d

n

  i     ( ... ) 

7 6 5 .

10 2 7

s d d

d   ni 

  

( ) .

.

2

1

76 1

9 2 9

s d d

d   ni 

  

( ) .

.

2

1

76 1

9 2 9 2.7 0 2.94 2.9 10

d d

t d

s n



 

  2.7 0  2.94 2.9 10

d d

t d

s n



 

  

(40)

5. H₀을 기각할지를 결정

두 택배회사의 평균 배송시간에 차이가 있다는 것을 적어도 95% 신뢰한다.

4. p –값 계산

t = 2.94 와 df = 9에서, p–값은 .02 와 .01사이에

있다. (이것은 양측 검정이므로 우측검정 때의 면적 0.01과 0.005를 각각 두 배로 하였다)

p–값 <  = .05에서, H₀을 기각한다.

두 모집단 평균의 차이에 대한 추론 : 짝 표본의 경우

 p –값 접근법

(41)

4. 임계값과 기각법칙 결정

두 모집단 평균의 차이에 대한 검정 : 짝 표본의 경우

 = .05 과 df = 9에서, t_.025 = 2.262.

t > 2.262경우, ^H ₀ ^기각 5. H₀을 기각할지를 결정

t = 2.94 > 2.262에서, H₀을 기각한다.

두 택배회사의 평균 배송시간에 차이가 있다는 것을 적어도 95% 신뢰한다.

(42)

10장 끝

Part A

평균에 대한 비교 (comparisons involving means) Part A

10장