• 검색 결과가 없습니다.

평균에 대한 비교 (comparisons involving means) Part A

N/A
N/A
Protected

Academic year: 2022

Share "평균에 대한 비교 (comparisons involving means) Part A"

Copied!
42
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

10장

평균에 대한 비교 (comparisons involving means) Part A

 두 모집단 평균 차이에 대한 추론: 과 가 알려져 있는 경우

 두 모집단 평균 차이에 대한 추론: 짝 표본의 경우

1

2

 두 모집단 평균 차이에 대한 추론: 과 가 알려져 있지 않은 경우

1

2

(2)

두 모집단 평균 차이에 대한 추론 : 알려져 있는 경우

 에 대한 신뢰구간 추정

 에 대한 가설검정

1 - 2

1 - 2

1

2

(3)

두 모집단 평균 차이에 대한 추론

 1 - 2은 두 모집단의 평균의 차이 이다.

= 표본1의 평균, = 표본2의 평균

x1

x1 xx22

두 모집단 1, 2 의 평균의 차이에 대한 점추정치는:

x x

11

  x x

22

을 모집단 1의 모집단 평균으로, 를 모집단 2의 모집단 평균으로 한다.

2

1

평균값의 차이( )에 대한 추론을 하기 위해, 모집단 1로부터 개, 모집단 2로부터 개의 표본을 무작위로 선정한다

1 - 2

n1 n2

(4)

 기대값

의 표본분포

x

1

x

2

x

1

x

2

E x( 1 x2) 1 2 E x( 1 x2) 1 2

 표준편차 (표준오차; standard error))

  

x x

n n

1 2

1 2

1

2 2

2

  

x x

n n

1 2

1 2

1

2 2

2

여기서: 1 = 모집단 1의 표준편차

2 = 모집단 2의 표준편차 n1 = 모집단 1의 표본규모 n2 = 모집단 2의 표본규모

(5)

 신뢰구간 추정

1

-

2

의 신뢰구간 추정 :

1

2

가 알려져 있는 경우

2 2

1 2

1 2 / 2

1 2

x x z

n n

 

 

12

22

1 2 / 2

1 2

x x z

n n

 

  

여기서: 1 -  는 신뢰계수

(6)

 예: Par사

1

-

2

신뢰구간 추정 :

1

2

가 알려져 있는 경우

 기계장치를 이용한 드라이빙거리 시험에서, Par사 골프공 표본을 경쟁사인 Rap 사의 골프공 표본과

비교하였다. 표본통계량이 다음 슬라이더에 나와 있다.

 Par사는 골프 용품 제조업체로써 훨씬 멀리 나가는 새로운 골프공을 개발하였다.

(7)

 예: Par사

1

-

2

의 신뢰구간 추정 :

1

2

가 알려져 있는 경우

표본규모 표본평균

표본 #1 Par사

표본 #2 Rap사 120 개 80 개

275 yards 258 yards

이전 시험을 기초로 할 때 , 두 모집단의 표준편차는

1 = 15 yards 와  2 = 20 yards 로 알려져 있다.

(8)

1

-

2

신뢰구간 추정 :

1

2

가 알려져 있는 경우

 예: Par사

 두 골프공의 드라이빙거리 평균 차이에 대해 95%의 신뢰구간을 추정 해 보자.

(9)

두 모집단 평균의 차이에 대한 추정

m1 2 = 두 평균거리의 차이

x1 - x2 = m1 2 의 점추정치 모집단 1

Par사 골프공

1 = Par사 골프공의 평균 거리

모집단2 Rap사 골프공

2 = Rap사 골프공의

평균거리

R ap사 골프공의 단순무작위 표본수:n2

x2 = Rap사 공의 표본평균거리 Par사 골프공의 단순무작위

표본수: n1

x1 = Par사 공의 표본평균거리

(10)

1

-

2

의 점추정치

 1  2 의 점추정치= xx11  xx22

여기서:

1 = Par사 골프공의 모집단의 평균거리

2 = Rap사 골프공의 모집단의 평균거리

= 275  258

= 17 yards

(11)

x x z

n n

1 2 2 1

2

1

2 2

2

2 2

17 1 96 15 120

20

80

/ . ( ) ( )

x x z

n n

1 2 2 1

2

1

2 2

2

2 2

17 1 96 15 120

20

80

/ . ( ) ( )

1

-

2

의 구간 추정 :

1

2

가 알려진 경우

Par사 골프공과 Rap사 골프공의 평균드라이빙거리 차이는 11.86 에서 22.14 yards 이다는 것을 95%

신뢰한다.

17 + 5.14 또는 11.86 yards에서 22.14 yards

(12)

1

 

2

에 대한 가설 검정 :

1

2

가 알려진 경우

 가설

1 2 0

2 2

1 2

1 2

( x x ) D z

n n

 

 

1 2 0

2 2

1 2

1 2

( x x ) D z

n n

 

 

 

1

 

2 0

a

:

Ha

:  

1

 

2 D0

H D

   

0

:

1 2 0

H0

:  

1

 

2 D0

H D

   

0

:

1 2 0

H0

:  

1

 

2 D0

H D

 

1

 

2 0

a

:

Ha

:  

1

 

2 D0

H D

   

0

:

1 2 0

H0

:  

1

 

2 D0

H D

 

1

 

2 0

a

:

Ha

:  

1

 

2 D0

H D

왼쪽 검정 오른쪽 검정 양측 검정

 검정통계량(test statistics)

(13)

 예: Par사

1

 

2

에 대한 가설 검정 :

1

2

가 알려진 경우

유의수준  = .01에서, 이 회사의 골프공의 평균 드라이빙 거리가 Rap사 골프공의 평균

드라이빙 거리보다 더 멀다고 결론지을 수 있는가 ?

(14)

H0: 1 - 2 < 0  Ha: 1 - 2 > 0 여기서:

1 = Par사 골프공의모집단의 평균거리

2 = Rap사 골프공의 모집단의 평균거리 1. 가설 수립

p –값 과 임계값을 이용한 방법

1

 

2

에 대한 가설 검정 :

1

2

가 알려진 경우

2. 유의수준 설정  = .01

(15)

3. 검정통계량 계산

1

 

2

에 대한 가설 검정 :

1

2

가 알려진 경우

p –값 과 임계값을 이용한 방법

1 2 0

2 2

1 2

1 2

(x x ) D z

n n

1 2 0

2 2

1 2

1 2

(x x ) D z

n n

(16)

p –값 접근법 4. p–값 계산

z = 6.49에 대하여, p –값 < .0001.

1

 

2

에 대한 가설 검정 :

1

2

가 알려진 경우

5. 귀무가설( H0)을 기각할지를 결정 p–값 <= .01, H0를 기각

.01 의 유의수준에서, 표본자료는 Par사 골프공이 Rap사 골프공보다 평균 드라이빙거리가 더 멀다는 것을 보여준다.

(17)

1

 

2

에 대한 가설 검정 :

1

2

가 알려진 경우

5. 귀무가설( H0)을 기각할 것인지 결정 z = 6.49 > 2.33, H0을 기각

 임계값 접근법

= .01에서, z.01 = 2.33 4. 임계값과 기각법칙 결정

z > 2.33이면, H 0을 기각

표본자료는 Par사 골프공이 Rap사 골프공보다 평균 드라이빙거리가 더 멀다는 것을 보여준다.

(18)

두 모집단 평균의 차이에 대한 추론 :

1

2

가 알려지지 않은 경우

1 –  2 의 신뢰구간 추정

1 –  2의 가설 검정

(19)

1

-

2

의 신뢰구간 추정 :

1

2

가 알려지지 않은 경우

 1 2 을 모르고 있을 때 :

z/2 t/2로 대체

표본의 표준편차 s1 s2 σ1과 σ2의 추정치로 이용

(20)

2 2

1 2

1 2 / 2

1 2

s s x x t

n n

 

12

22

1 2 / 2

1 2

s s x x t

n n

 

t/2 에 대한 자유도:

1

-

2

에 대한 신뢰구간 추정 :

1

2

가 알려지지 않은 경우

 신뢰구간 추정치

2 2 2

1 2

1 2

2 2

2 2

1 2

1 1 2 2

1 1

1 1

s s

n n

df

s s

n n n n

 

  

 

    

    

     

2 2 2

1 2

1 2

2 2

2 2

1 2

1 1 2 2

1 1

1 1

s s

n n

df

s s

n n n n

 

  

 

    

    

     

(21)

 예 : Specific Motors

두 모집단 평균의 차이 :

1

2

가 알려지지 않은 경우

D etroit의 Specific Motors는 M car라는 새로운 자동차를 개발 하였다.

연비 (miles-per-gallon: mpg) 비교를 위해 M car 24대와 J cars 28대(일본산) 로 실험을 하였다. 표본통계량은 다음 슬라이더에 제공되어 있다.

(22)

두 모집단 평균의 차이 :

1

2

가 알려지지 않은 경우

 예 : Specific Motors

표본규모 표본평균

표본표준편차 표본#1

M Cars

표본 #2 J Cars 24 대 28 대 29.8 mpg 27.3 mpg 2.56 mpg 1.81 mpg

(23)

두 모집단 평균의 차이 :

1

2

가 알려지지 않은 경우

두 자동차 연비의 모집단 평균의 차이에 대하여 90%의 신뢰구간을 추정해 보자.

 예 : Specific Motors

(24)

 1  2 의 점추정치 = xx11  xx22

1

 

2

의 점추정치

여기서:

1 = M car의 평균연비(mpg)

2 = J car 의 평균연비(m pg)

= 29.8 - 27.3

= 2.5 mpg

(25)

1

 

2

의 구간 추정

1

2

가 알려지지 않은 경우

t/2 의 자유도:

2 2 2

2 2

2 2

(2.56) (1.81)

24 28

24.07 24 1 (2.56) 1 (1.81)

24 1 24 28 1 28

df

 

  

 

  

   

    

     

2 2 2

2 2

2 2

(2.56) (1.81)

24 28

24.07 24 1 (2.56) 1 (1.81)

24 1 24 28 1 28

df

 

  

 

  

   

    

     

 /2 = .05 이고, df = 24, t/2 = 1.711

(26)

1

 

2

의 구간추정 :

1

2

가 알려지지 않은 경우

2 2 2 2

1 2

1 2 / 2

1 2

(2.56) (1.81)

29.8 27.3 1.711

24 28

s s

x x t

n n

  1222    22

1 2 / 2

1 2

(2.56) (1.81)

29.8 27.3 1.711

24 28

s s

x x t

n n

      

 M cars 와 J cars의 평균 연비 차이가 1.431 에서 3.569 mpg 이다는 것을 90% 신뢰한다.

 2.5 + 1.069 또는 1.431에서 3.569 mpg

(27)

μ

1

 

2

에 대한 가설검정 :

1

2

가 알려지지 않은 경우

 가설

1 2 0

2 2

1 2

1 2

( x x ) D t

s s

n n

 

1 2 0

2 2

1 2

1 2

( x x ) D t

s s

n n

 

 

1

 

2 0

a

:

Ha

:  

1

 

2 D0

H D

   

0

:

1 2 0

H0

:  

1

 

2 D0

H D

   

0

:

1 2 0

H0

:  

1

 

2 D0

H D

 

1

 

2 0

a

:

Ha

:  

1

 

2 D0

H D

   

0

:

1 2 0

H0

:  

1

 

2 D0

H D

 

1

 

2 0

a

:

Ha

:  

1

 

2 D0

H D

왼쪽 검정 오른쪽 검정 양측 검정

 검정통계량

(28)

 예: Specific Motors

1

 

2

에 대한 가설 검정 :

1

2

가 알려지지 않은 경우

 0.05 의 유의수준에서, M cars의 연비 (m pg) 가 J cars의 연비 (m pg)보다 크다고 결론을 내릴 수 있는가?

(29)

H0: 1 - 2 < 0  Ha: 1 - 2 > 0 여기서:

1 = M cars 모집단의 평균 mpg

2 = J cars 모집단의 평균 mpg 1. 가설 수립

p –값과 임계값을 이용한 방법

1

 

2

에 대한 가설 검정 :

1

2

가 알려지지 않은 경우

(30)

2. 유의수준 설정 3. 검정통계량 계산

 = .05

p –값과 임계값 접근 방법

1

 

2

에 대한 가설 검정 :

1

2

가 알려지지 않은 경우

1 2 0

2 2 2 2

1 2

1 2

( ) (29.8 27.3) 0

4.003 (2.56) (1.81)

24 28

x x D

t

s s

n n

   

  

 

1 2 0

2 2 2 2

1 2

1 2

( ) (29.8 27.3) 0

4.003 (2.56) (1.81)

24 28

x x D

t

s s

n n

   

  

 

(31)

1

 

2

에 대한 가설 검정 :

1

2

가 알려지지 않은 경우

p –값 접근법 4. p –값 계산

t 에 대한 자유도:

2 2 2

2 2

2 2

(2.56) (1.81)

24 28

24.07 24 1 (2.56) 1 (1.81)

24 1 24 28 1 28

df

 

  

 

  

   

    

     

2 2 2

2 2

2 2

(2.56) (1.81)

24 28

24.07 24 1 (2.56) 1 (1.81)

24 1 24 28 1 28

df

 

  

 

  

   

    

     

t = 4.003 > t.005 = 2.797 에서, p–값 < .005.

(32)

5. H0을 기각할지 결정

M cars의 연비 (mpg) 가 J cars의 연비 (mpg) 보다 우수하다는 것을 적어도 95% 신뢰한다.

p –값 접근법

p–값 <= .05, H0을 기각한다.

1

 

2

에 대한 가설 검정

1

2

가 알려지지 않은 경우

(33)

4. 임계값과 기각법칙 결정

 임계값 접근법

1

 

2

에 대한 가설 검정 :

1

2

가 알려지지 않은 경우

= .05 와 df = 24에서, t.05 = 1.711 t > 1.711일 경우, H 0 기각 5. H0을 기각할지 결정

4.003 > 1.711에서, H0을 기각한다.

M cars의 연비 (mpg) 가 J cars의 연비 (mpg) 보다 우수하다는 것을 적어도 95% 신뢰한다.

(34)

짝 표본 방법에서는 추출된 각 표본항목이 한 쌍의 자료값을 가지고 있다.

독립표본 설계에 비하여 낮은 표본오차를 보인다. 이것은 짝표본 설계에서는 표본항목들 사이의 변동이 제거되어

낮은 표본오차(sam pling error)를 보일 수 있기 때문이다.

두 모집단 평균의 차이에 대한 추론 :

짝 표본 (matched samples)의 경우

(35)

 예 : Express D eliveries

두 모집단 평균의 차이에 대한 추론 : 짝 표본의 경우

 Chicago에 있는 한 회사는 미국 전지점에 급히 배송해야 할 서류를 가지고 있다. 이 회사는 UPX (United Parcel Express) 와 INTEX(International Express)라는

두 택배 회사 중 하나를 선택하여 서류를 배송해야 한다.

(36)

 예 : Express Deliveries

두 모집단 평균 차이에 대한 추론 : 짝 표본의 경우

 두 택배사의 배송시간 검정을 위해, 이 회사는 전국 지점들

중 무작위로 선정해서 두 개의 서류 중 하나는 UPX 로 다른 하나는 INTEX로 보냈다. 다음 슬라이더에 있는 데이터로

두 택배회사의 평균배송시간에 차이가 있다고 할 수 있는가? 유의수준은 .05로 한다.

(37)

32 30 19 16 15 18 14 10 7 16

25 24 15 15 13 15 15 8 9 11

UPX INTEX 배송시간차이 지점

Seattle

Los Angeles Boston

Cleveland New York Houston Atlanta St. Louis Milwaukee Denver

배송시간 (시간)

7 6 4 1 2 3 -1 2 -2 5

두 모집단 평균 차이에 대한 추론 :

짝 표본의 경우

(38)

H0: d = 0  Ha: d 

d = 모집단 지점에 대한 두 배송서비스 시간 차이의 평균

1. 가설 수립

두 모집단 평균의 차이에 대한 추론 : 짝 표본의 경우

p –값과 임계값 접근법

(39)

2. 유의수준 설정  = .05

두 모집단 평균의 차이에 대한 추론 : 짝 표본의 경우

p –값과 임계값 접근법

3. 검정통계량 계산

d d

n

  i    ( ... )

7 6 5 .

10 2 7

d d

n

  i    ( ... )

7 6 5 .

10 2 7

s d d

d ni

( ) .

.

2

1

76 1

9 2 9

s d d

d ni

( ) .

.

2

1

76 1

9 2 9 2.7 0 2.94 2.9 10

d d

t d

s n

2.7 0 2.94 2.9 10

d d

t d

s n

(40)

5. H0을 기각할지를 결정

두 택배회사의 평균 배송시간에 차이가 있다는 것을 적어도 95% 신뢰한다.

4. p –값 계산

t = 2.94 와 df = 9에서, p–값은 .02 와 .01사이에

있다. (이것은 양측 검정이므로 우측검정 때의 면적 0.01과 0.005를 각각 두 배로 하였다)

p–값 <= .05에서, H0을 기각한다.

두 모집단 평균의 차이에 대한 추론 : 짝 표본의 경우

p –값 접근법

(41)

4. 임계값과 기각법칙 결정

두 모집단 평균의 차이에 대한 검정 : 짝 표본의 경우

 임계값 접근법

= .05 과 df = 9에서, t.025 = 2.262.

t > 2.262경우, H 0 기각 5. H0을 기각할지를 결정

t = 2.94 > 2.262에서, H0을 기각한다.

두 택배회사의 평균 배송시간에 차이가 있다는 것을 적어도 95% 신뢰한다.

(42)

10장 끝

Part A

참조

관련 문서

소속 대학의 대학생 청소년 교육지원사 업 신청기간이 어떻게 설정되어있는지 소속 대학으로 문의하여 주시기

․겹침이음은 두 철근의 겹침길이를 충분히 하여 원래 철근의 힘이 콘크리트의 부착 응력에 의하여 이어지는 철근으로 전달되도록 하는 이음방법이다.

- DES보다 안전하며, PGP(Pretty Good Privacy)의 암호 알고리즘으로 사용되고 있다.. •인수분해 문제(Prime

예제 7.2) 새로운 두통약을 개발한 제약회사에서 새로 개발된 두통약 의 평균 치유시간이 기존에 시판되고 있는 다른 두통약의 평균치 유 시간인 20분보다 짧다는

표본의 크기 n이 크면, 평균 μ, 표준편차 σ인 모집단 에서의 확률표본에 대하여 의 분포는 평균 μ이고 표준편차 인 정규분포와 근사하게 된다..

대한의사협회 회원자율징계제도에 회원자율징계제도에 대한 대한 토론회 토론회 개최하 개최하 여 여 전문가단체의 전문가단체의 회원징계제도에 회원징계제도에 대한

 그러므로, 더 나은 것을 개발하기 위해서 개념을 결합하고 개선하는

▸Cospaces/Tinkercad 프로그램을 활용하여 제작한 미술작품을 HMD에 적용시키 고 감상한다... Cospaces/Tinkercad 프로 그램을 활용하여