• 검색 결과가 없습니다.

양적 모집단에서 모평균의 신뢰구간 ②모집단이 비정규분포, , 이 크면

N/A
N/A
Protected

Academic year: 2022

Share "양적 모집단에서 모평균의 신뢰구간 ②모집단이 비정규분포, , 이 크면"

Copied!
33
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

Chapter 9. 추

Honggie Kim

양적 모집단에서 모평균의 신뢰구간

②모집단이 비정규분포, , 이 크면

9. 3 모집단이 하나일 때의 신뢰구간

)

2(

known

n

) ,

(

~

2

N n

X

.

 

중심극한정리

그러므로

100 ( 1 )%

의 근사적 신뢰구간은

z n

x

2

(2)

신뢰구간과 표본크기

신뢰구간의 길이

똑같은 신뢰계수라면 짧을수록 좋다

표본크기의 결정

을 알 때 를 오차 한계가 보다 작게 추정할 확률이 100 % 이려면 표본크기 은?

zn

2

2

가 크면 커진다 )

1 (

 

: 가 크면 커진다

(신뢰계수)

의 100% 신뢰구간은

. 

Note    ,  

이 크면 작아진다

n

) 1

(   n e

z  

2

n

ze

2

n

e

z   

 

2

2

2

e

n

(3)

Chapter 9. 추

Honggie Kim

확률예제

Ex) 충남남학생들의 키는 표준편차가 6cm인 정규분포라 한다. 평균키 와 추정치와의

차이가 2cm이하일 확률이 0.95가 되기 위해선 몇 명을 조사해야 하는가?

9. 3 모집단이 하나일 때의 신뢰구간

z n

x

025 .

0

)

2

2 6 96

.

( 1 

n

34.57

 35

x

cm 2

(무조건 올림)

(4)

양적 모집단에서 모평균의 신뢰구간

③모집단이 정규분포, , 이 작으면

2(

unknown

)

n

6 ,

100

11 1

, 3

12 0

: , 2

6

n n

S n

cm

일 때,

) (

~ v t n

S

X  

) 7 (

t t ( 3 )

) 1 ( t

t s

Student `

분포

(정규분포와 비슷, 분포의 자유도

vtn  1

)

] ,

[

nju nu v

영어의

n

에 해당하는

Greek

) 1 , 0 (

N

자유도( ), 즉 표본크기가

커질수록 에 접근

 1 n

) 1 , 0 (

N

(5)

Chapter 9. 추

Honggie Kim

확률예제

Ex) 정규 모집단에서 크기가 10인 표본을 구하여 를 얻었다. 의 95% 신뢰구간은?

9. 3 모집단이 하나일 때의 신뢰구간

9 ,

18

2

s

x

262 .

2 )

9 ( )

9

( 0.025

2

  t

t

[표 A.4]

95% 의 신뢰구간은

n

t s

x

2

(  )

146 .

2 10 18

262 3 .

2

18   

) 146 .

20 , 854 .

15

 (

) 9 ( t

262 . 2

025

.

0

(6)

양적 모집단에서 모평균의 신뢰구간

앞의 예에서 만약

2

9(

known

)이면

z n

x

2

10 96 3

. 1 18 

86 . 1 18 

) 86 . 19 , 14 . 16

 (

) 1 , 0 ( N

96 . 1

025 . 0

, 더 좁다(더 좋다)

72

. 3 292 .

4 

(7)

Chapter 9. 추

Honggie Kim

양적 모집단에서 모평균의 신뢰구간

④모집단이 정규분포, , 이 크면

해석 1

9. 3 모집단이 하나일 때의 신뢰구간

)

2(

unknown

n

) 1 (

~ 

t n n

S

X

그러므로

100 ( 1   )% 

의 근사적 신뢰구간은

n

z s x

2

6 ,

100

11 1

, 3

12 0

: , 2

6

n n

S n

cm

일 때,

이 커지면( 분포의 자유도가 커지면)

n t

) (

2

v t

2

z

(8)

양적 모집단에서 모평균의 신뢰구간

④모집단이 정규분포, , 이 크면

해석 2

)

2(

unknown

n

) 1 , 0 ( n ~ N

X

) 1 , 0 ( n ~ N

S

X   .

그러므로

100 ( 1   )% 

의 근사적 신뢰구간은

n

z s x

2

에서

대신

S

사용( 이 크면

n   S

)

(9)

Chapter 9. 추

양적 모집단에서 모평균의 신뢰구간

⑤모집단이 비정규분포, , 이 크면

모집단이 비정규분포, , 이 작으면

모집단이 비정규분포, , 이 작으면

9. 3 모집단이 하나일 때의 신뢰구간

)

2(

known

n

)

2(

unknown

)

2(

unknown

n

n

통3

n

X

N ( 0 , 1 )

n S

X   . .

그러므로

100 ( 1 )%

의 근사적 신뢰구간은

n z s

x

2

(10)

질적 모집단에서 모비율의 신뢰구간

질적 모집단에서 모비율( )의 신뢰구간

p

no yes

no yes

p

크기 n

표본

      

 ( 1 ) ( 1 ) ) 1

(

2 2

n p z p

n p X

n p z p

n P X

이 크면

n

)) 1

, ( (

~

n

p p p

n N

X

.

상수

오차한계 의 점추정

p

) ) 1

( ,

) 1

(

(

2 2

n n

x n

x n z

x n

n x n

x n z

x

 

의 표준오차 p

의 신뢰구간은 를 추정치 로 대치한

p

)%

1 ( 100  

n p x

비모수적 방법

(통계학과 3학년) .

Note n

이 작으면

(11)

Chapter 9. 추

Honggie Kim

질적 모집단에서 표본크기

표본크기(질적 모집단일때)

: 최대허용오차

: 신뢰계수(신뢰수준)

① 전에 추정한 사용

② 소 표본으로 추정하여 계산 후 필요한 표본 더추출

이용

9. 3 모집단이 하나일 때의 신뢰구간

n e p z p ( 1  ) 

2 2

2

( 1 ) )

( e

p z p

n

e

 1

4 ) 1 2 1 1 2 ( ) 1 1

(

p    p

2 2

) ) 1

( (

e

p p

z

2 2

2 ) 1 ( e

z n

) 1 ( )

( p p p

f  

4 1

2 /

1 1

p

2 2

2

4e nz

p p

필요한 표본수 충분히 확보

n

(12)

확률예제

Ex) 새 법률안의 찬반 여론 조사.

실제 찬성률 를 95%확률로 (또는 95% 신뢰수준

에서) 오차 한계 3% 포인트 내로 추정하려면 은?

2 2

025 . 0

) 03 . 0 ( 4

nz )

2

03 . 0

96 . ( 1 4

 1 

1067.11

.

Note

대부분의 여론 조사는 1,000명을 표본크기로 함

n p

 1068

(명)

(13)

Chapter 9. 추

Honggie Kim

9. 4 두 모집단에서의 신뢰구간

두 양적 모집단

모집단 1 모집단 2

,

X2

X

평균 분산 평균

Y

,

분산

Y2

표본크기

m

표본크기

n

X

m

X

X

1 , 2 , ,

Y

1 ,

Y

2 , ,

Y

n

(14)

두 양적 모집단에서의 신뢰구간

두 모집단에서의 신뢰구간

작다 크다 작다 크다

안 다 모른다

모집단 분 포

비정규 통3 통3

(모분산들)

2 2, Y

X

표본크기

m, n

Z

Z

Z

Z

t

t

비현실적 ※ 3-ⓑ도 통3

(15)

Chapter 9. 추

Honggie Kim

두 양적 모집단에서의 신뢰구간

①모집단이 정규분포, , 의 크기 상관없음

9. 4 두 모집단에서의 신뢰구간

) (

, 2

2 Y

known

X

m, n

) ,

(

~

) ,

(

~

2 2

N n Y

N m X

Y Y

X X

 

 

) ,

(

~

2 2

n N m

Y

X  

X

 

Y

X

 

Y

2

)

2

( X Y

X Y

V      V ( XY )  

X2

 

Y2 .

Note

서로 독립인 두 확률 변수의 합과 차의 분산

:

X

: Y

:

Y X

: Y X

- 1 - 1

1

1 - 2 2

- 2 2

(16)

두 양적 모집단에서의 신뢰구간 ①

 

X

 

Y

100 ( 1   )%

신뢰구간은

n z m

y

x

X Y

2 2

2

)

(  

) ( 

X

 

Y

점추정치

정규분포

상수

( x y )

의 표준오차

1

신뢰수준에서의 오차한계

n z m

y

x

1 1

) (

2

만약

X2

 

Y2

 

2이라면

(17)

Chapter 9. 추

Honggie Kim

평균 차의 추정에 관심이 있는 이유

왜 의 추정과 신뢰구간에만 관심이 있는가?

의 추정에는 대부분의 경우 관심이 없다

Ex) 충남대 남학생의 키 과기대 남학생의 키

9. 4 두 모집단에서의 신뢰구간

Y

X

 

Y

X

 

: ,

, ,

2

1

X X

m

X

: ,

, ,

2

1

Y Y

n

Y

 175 x

 170 y

Y

X

 

의 추정치는

xy  345

Y

X

 

의 추정치는

xy  5

(무슨의미?)

(충남대 남학생의 평균키가 5cm 크다)

(18)

확률예제

Ex) 계란에 들어있는 베타카로틴은 표준편차가 10mg, 오리알에 들어있는 베타카로틴은 표준편차가

24mg으로 알려져 있으며 베타카로틴의 분포는 정규분포에 따른다고 알려져 있다. 계란 25개로 부터 측정한 베타카로틴의 양의 평균이 400mg, 오리알 12개로부터 측정한 베터카로틴의 양의 평균이 350mg이었다. 계란과 오리알 간의 베타 카로틴의 평균의 차이에 대한 95% 신뢰구간을 구하라

(19)

Chapter 9. 추

Honggie Kim

확률예제

풀이)

9. 4 두 모집단에서의 신뢰구간

) (

100 10

, 25 ,

400

m

2 2

known

x   

X

 

) (

576 24

, 12 ,

350

n

2 2

known

y   

Y

 

12 576 25

96 100 .

1 )

350 400

(   

n z m

y

x

X Y

2 2

2

)

(  

211 .

7 96 . 1

50

 

134 .

14 50 

) 134 .

64 , 866 .

35

(

(20)

두 양적 모집단에서의 신뢰구간

② 모집단이 비정규분포, , 이 크다

정규모집단이 아니더라도 이 모두 크면(보통 30이상)

의 근사적 신뢰구간은

) (

, 2

2 Y

known

X

m, n

n m,

) ,

(

~

2

N m

X .

X

X

~ . ( , )

2

N n

Y

Y

Y

n z m

y

x

X Y

2 2

2

)

(  

Y

X

100(1

 

)%

(21)

Chapter 9. 추

Honggie Kim

두 양적 모집단에서의 신뢰구간

④ 모집단이 정규분포, , 이 크다

이 모두 크므로(보통 30이상)

의 근사적 신뢰구간은

) (

, 2

2 Y

unknown

X

m, n

n m,

n s m

z s y

x

X Y

2 2

2

)

(  

Y

X

100(1

 

)%

9. 4 두 모집단에서의 신뢰구간

2 2

2

2 X

,

Y Y

X

S

S    

(22)

두 양적 모집단에서의 신뢰구간

⑤ 모집단이 비정규분포, , 이 크다

이 모두 크므로(보통 30이상)

의 근사적(두번근사) 신뢰구간은

) (

, 2

2 Y

unknown

X

m, n

n m,

n s m

z s y

x

X Y

2 2

2

)

(  

Y

X

 

100(1

 

)%

2 2

X

S

X

 

) ,

(

~

2

N m

X .

X

X

~ . ( , )

2

N n

Y

Y

Y

2 2

Y

S

Y

 

.

Note

(크다) 경우에는 정규모집단

여부가 중요하지 않음

n m unknown

Y

X2 ,

2( ), ,

이 큰 게 가장 큰 힘

n

m,

(23)

Chapter 9. 추

Honggie Kim

확률예제

Ex) 요즈음의 초등학교 6학년 남학생의 평균키 를 추정하기 위해 100명을 조사해

을 얻었다.

9. 4 두 모집단에서의 신뢰구간

10년 전 자료를 조사해 보니 비슷한 연구가 있었고, 그 때는 120명을 조사해

을 얻었던 것으로 나타났다. 에 대한 95% 신뢰구간을 구하라

) (

36 ,

) (

150 cm s

2

cm

2

x

X

) ( 

X

) (

30 ,

) (

146 cm s

2

cm

2

y

Y

Y

X

 

(24)

확률예제

풀이) 모집단분포-무관, , 이 크다

X2,

Y2(

unknown

)

m, n

n s m

z s y

x

X Y

2 2

2

)

(  

 120

30 100

96 36 . 1 )

146 150

(   

4

1.96

0.36

0.25

4

1.96 0.61 781 .

0 96 . 1

4

 

531 .

1 4 

) 531 .

5 , 469 .

2

 (

(25)

Chapter 9. 추

Honggie Kim

두 양적 모집단에서의 신뢰구간

③모집단이 정규분포, , 이 작다

③-ⓐ 모르지만 같다(등분산 가정)

③-ⓑ

Ex1) 관심 – 충남대 지렁이하고 과기대 지렁이하고 어느 쪽이 길까?

충남대 지렁이의 평균길이

과기대 지렁이의 평균길이

Ex2) 관심 – 내가 가지고 있는 필기구와 지렁이 중 어느 쪽이 길까?

필기구의 평균길이

지렁이의 평균길이

9. 4 두 모집단에서의 신뢰구간

) (

, 2

2 Y

unknown

X

m, n

)

2(

2

2 Y

unknown

X

 

  

) (

, 2

2 Y

unknown

X

통3 (비모수적 방법)

2 2

2

 

X

Y

X

Y

X2

Y2

X

Y (모름)으로

가정 가능

으로 가정불가

(26)

두 양적 모집단에서의 신뢰구간 ⑤

지렁이의 표준편차(분산)가 필기구의 표준편차(분산)

보다 훨씬 큼(Ex2의 경우)

동종비교  등분산 가정가능

이종비교  등분산 가정불가

※ 통계분석의 대부분은 동종비교임

③ - ⓐ 등분산 가정이 가능하면

n z m

y

x 1 1

) (

2

(

2

2

2 )

Y X

모르기 때문에 추정치로 대체

를 추정치로 대체하면

t

분포계수가 됨

(27)

Chapter 9. 추

Honggie Kim

등분산 가정 하에 모분산 추정

등분산 가정하에 의 추정

의 추정량이고 의 추정량이다

그런데 이므로, , 모두 을 추정한다

9. 4 두 모집단에서의 신뢰구간

2

2

S

X

X2 2

S

Y

Y2 2 2

2

 

X

Y

S

X2

S

Y2

2

2 2

2

2 Y :

X

S

S

의 추정량

) 2 (

) 1 (

) 1

(

2 2

 

n m

S n

S

m

x Y

) 2 (

) (

)

(

2 2

   

n m

Y Y

X

X

i i

n

m

이면 OK!

) :

var ) (

1 (

) 1 (

) 1 (

) 1

(

2 2

2

pooled iance

n m

S n

S

S

p

m

x Y

 

합병분산

.

Note

소표본에서 를 로 대신하면

2

2

t

z

S

신뢰구간은

)

( 

X

 

Y

100 ( 1   )%

n s m

n m t

y

x

p

1 1

) 2 (

) (

2

(28)

확률예제

Ex) 사과 과수원을 경영하는 김씨는 자신의 과수원 을 두부분으로 나누어 한쪽은 살충제를 뿌리고

다른 한 쪽은 직접 벌레를 잡아 주었다. 직접 벌레를 잡아준 쪽의 나무 10그루를 조사하니 사과의 개수가 평균 , 표준편차

이었고, 살충제를 뿌린 쪽의 나무 12그루를 조사 하니 사과의 개수가 평균 , 표준편차

이었다.

 350 x

 220

y s

Y

 40

 30 s

X

등분산성 가정하에, 직접벌레를 잡아 주었을 때, 살충제를 부렸을 때보다 증가하는

그루당 사과 수를 95%신뢰수준에서 구간 추정하라

(그루당 사과 수는 정규분포에 따른다고 한다)

(29)

Chapter 9. 추

Honggie Kim

확률예제

풀이)

9. 4 두 모집단에서의 신뢰구간

30 ,

350 ,

10  

x s

X

m

40 ,

220 ,

12  

y s

Y

n

2 ) 1 (

) 1

( 2 2

2

 

n m

s n

s

s

p

m

x Y

1285

2 12 10

40 )

1 12 ( 30

) 1 10

(

2 2

 

 

086 .

2 )

20 (

,

t

0.025

n s m

n m

t y

x

p

1 1

) 2 (

) (

2

)

2(

2

2 Y

unknown

X

 

  

정규모집단, 등분산가정

2

2

40

30

사이의 값임 )

( 847 .

35

1285 X Y

p

s s

s  

사이의 값

) 205 .

205 ,

795 .

54

 (

205 .

75 130

428 .

0 847

. 35 086

. 2

130     

 12

1 10

847 1 .

35 086

. 2 )

220 350

(    

(30)

두 질적 모집단에서의 신뢰구간

두 질적 모집단( 이 큰 경우)

 

 

 

n p p p

n N

Y ( 1 )

,

~ .

2 2 2

 

 

 

m p p p

m N

X ( 1 )

,

~ .

1 1 1

 

 

    

n

p p

m p p p

p n N

Y m

X ( 1 ) ( 1 )

,

~ .

1 2 1 1 2 2

n m,

p

1

yes

p

2

yes

(31)

Chapter 9. 추

Honggie Kim

두 질적 모집단에서의 신뢰구간

9. 4 두 모집단에서의 신뢰구간

n n

y n

y m

m x m

x n z

y m

x ( 1 ) ( 1 )

2

 

 

 

 

  

) (

)%

1 (

100   p

1

p

2 의 근사적 신뢰구간은

m

p

1

x

대체

n

p

2

y

대체

(32)

확률예제

Ex) 국회의원 후보인 C씨의 지역구는 고향인 D읍과 그 인근 지역인 E군으로 되어있다. D읍 주민

200명 중 160명이, E군 주민 180명중 90명이 각각 C씨 지지의사를 표명하였다. 두 지역의

C씨에 대한 지지율의 차이에 대한 95%

신뢰구간을 구하라

(33)

Chapter 9. 추

Honggie Kim

확률예제

풀이)

9. 4 두 모집단에서의 신뢰구간

8 . 0 ,

160 ,

200

 

m

x x

m  180 ,  90 ,  0 . 5

n y y

n

180 5 . 0 5 . 0 200

2 . 0 8 . 96 0

. 1 ) 5 . 0 8 . 0

( 

 

0468 .

0 96 . 1 3 .

0  

0.3

0.092

( 0 . 208 , 0 . 392 ) E

p

D p

2

1 읍에서의 실제 지지율 군에서의 실제 지지율

n n

y n

y m

m x m

x n z

y m

x ( 1 ) ( 1 )

2

 

 

 

 

  

작은 수

참조

관련 문서

 주어진 유의수준에 따라 귀무가설의 기각 여부를 결정하는

- 자유주의와 부르주아의 권력 도전을 방어 - 노동계급의 사회주의적 저항과 혁명을 방지 국가가 노동계급의 복지제공자 역할 수행 노동자는 군주에게

When the camera receives commands, it notifies the sender which command buffer was used using the socket number of the ACK message. As the completion message or error message also

을 형성하는 수단이다( Pol ki nghor ne ,1 998 ;허희옥,2 006 .재인용) .또한,사회 문화적인 차원에서 스토리텔링은 자신의 생각을 다른 사람과 공유하고

동일한 지시 대상을 가리키는 두 단어 가운데 한쪽이 중립적인 의미를 갖고 다른 쪽은 특별히 첨가된 내포적 의미를 갖고 있을 때

『젊은 베르테르의 슬픔』에 대한 것과 같은 열광에서 출발하여 영국과 프랑스에서의 수용양태가 한쪽은 모랄리즘으로 다른 한쪽은

기타 다른 준비물은 실험실 장비이용 ex)색이 다른 유체(물), 기타

이것은 동조의 한 형태로 서 본의 아니게 동조를 하게 되는 심리적 형상으로서 남 들과 다른 의견을 갖고 있는 것이 불안하여 자신의 생각 을 상대의 생각에