• 검색 결과가 없습니다.

양적 모집단에서 모평균의 신뢰구간 ②모집단이 비정규분포, , 이 크면

N/A
N/A
Protected

Academic year: 2022

Share "양적 모집단에서 모평균의 신뢰구간 ②모집단이 비정규분포, , 이 크면"

Copied!
33
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

Chapter 9. 추

Honggie Kim

양적 모집단에서 모평균의 신뢰구간

②모집단이 비정규분포, , 이 크면

9. 3 모집단이 하나일 때의 신뢰구간

)

2(

known

n

) ,

(

~

2

N n

X

.

 

중심극한정리

그러므로

100 ( 1 )%

의 근사적 신뢰구간은

z n

x

2

(2)

신뢰구간과 표본크기

신뢰구간의 길이

똑같은 신뢰계수라면 짧을수록 좋다

표본크기의 결정

을 알 때 를 오차 한계가 보다 작게 추정할 확률이 100 % 이려면 표본크기 은?

zn

2

2

가 크면 커진다 )

1 (

 

: 가 크면 커진다

(신뢰계수)

의 100% 신뢰구간은

. 

Note    ,  

이 크면 작아진다

n

) 1

(   n e

z  

2

n

ze

2

n

e

z   

 

2

2

2

e

n

(3)

Chapter 9. 추

Honggie Kim

확률예제

Ex) 충남남학생들의 키는 표준편차가 6cm인 정규분포라 한다. 평균키 와 추정치와의

차이가 2cm이하일 확률이 0.95가 되기 위해선 몇 명을 조사해야 하는가?

9. 3 모집단이 하나일 때의 신뢰구간

z n

x

025 .

0

)

2

2 6 96

.

( 1 

n

34.57

 35

x

cm 2

(무조건 올림)

(4)

양적 모집단에서 모평균의 신뢰구간

③모집단이 정규분포, , 이 작으면

2(

unknown

)

n

6 ,

100

11 1

, 3

12 0

: , 2

6

n n

S n

cm

일 때,

) (

~ v t n

S

X  

) 7 (

t t ( 3 )

) 1 ( t

t s

Student `

분포

(정규분포와 비슷, 분포의 자유도

vtn  1

)

] ,

[

nju nu v

영어의

n

에 해당하는

Greek

) 1 , 0 (

N

자유도( ), 즉 표본크기가

커질수록 에 접근

 1 n

) 1 , 0 (

N

(5)

Chapter 9. 추

Honggie Kim

확률예제

Ex) 정규 모집단에서 크기가 10인 표본을 구하여 를 얻었다. 의 95% 신뢰구간은?

9. 3 모집단이 하나일 때의 신뢰구간

9 ,

18

2

s

x

262 .

2 )

9 ( )

9

( 0.025

2

  t

t

[표 A.4]

95% 의 신뢰구간은

n

t s

x

2

(  )

146 .

2 10 18

262 3 .

2

18   

) 146 .

20 , 854 .

15

 (

) 9 ( t

262 . 2

025

.

0

(6)

양적 모집단에서 모평균의 신뢰구간

앞의 예에서 만약

2

9(

known

)이면

z n

x

2

10 96 3

. 1 18 

86 . 1 18 

) 86 . 19 , 14 . 16

 (

) 1 , 0 ( N

96 . 1

025 . 0

, 더 좁다(더 좋다)

72

. 3 292 .

4 

(7)

Chapter 9. 추

Honggie Kim

양적 모집단에서 모평균의 신뢰구간

④모집단이 정규분포, , 이 크면

해석 1

9. 3 모집단이 하나일 때의 신뢰구간

)

2(

unknown

n

) 1 (

~ 

t n n

S

X

그러므로

100 ( 1   )% 

의 근사적 신뢰구간은

n

z s x

2

6 ,

100

11 1

, 3

12 0

: , 2

6

n n

S n

cm

일 때,

이 커지면( 분포의 자유도가 커지면)

n t

) (

2

v t

2

z

(8)

양적 모집단에서 모평균의 신뢰구간

④모집단이 정규분포, , 이 크면

해석 2

)

2(

unknown

n

) 1 , 0 ( n ~ N

X

) 1 , 0 ( n ~ N

S

X   .

그러므로

100 ( 1   )% 

의 근사적 신뢰구간은

n

z s x

2

에서

대신

S

사용( 이 크면

n   S

)

(9)

Chapter 9. 추

양적 모집단에서 모평균의 신뢰구간

⑤모집단이 비정규분포, , 이 크면

모집단이 비정규분포, , 이 작으면

모집단이 비정규분포, , 이 작으면

9. 3 모집단이 하나일 때의 신뢰구간

)

2(

known

n

)

2(

unknown

)

2(

unknown

n

n

통3

n

X

N ( 0 , 1 )

n S

X   . .

그러므로

100 ( 1 )%

의 근사적 신뢰구간은

n z s

x

2

(10)

질적 모집단에서 모비율의 신뢰구간

질적 모집단에서 모비율( )의 신뢰구간

p

no yes

no yes

p

크기 n

표본

      

 ( 1 ) ( 1 ) ) 1

(

2 2

n p z p

n p X

n p z p

n P X

이 크면

n

)) 1

, ( (

~

n

p p p

n N

X

.

상수

오차한계 의 점추정

p

) ) 1

( ,

) 1

(

(

2 2

n n

x n

x n z

x n

n x n

x n z

x

 

의 표준오차 p

의 신뢰구간은 를 추정치 로 대치한

p

)%

1 ( 100  

n p x

비모수적 방법

(통계학과 3학년) .

Note n

이 작으면

(11)

Chapter 9. 추

Honggie Kim

질적 모집단에서 표본크기

표본크기(질적 모집단일때)

: 최대허용오차

: 신뢰계수(신뢰수준)

① 전에 추정한 사용

② 소 표본으로 추정하여 계산 후 필요한 표본 더추출

이용

9. 3 모집단이 하나일 때의 신뢰구간

n e p z p ( 1  ) 

2 2

2

( 1 ) )

( e

p z p

n

e

 1

4 ) 1 2 1 1 2 ( ) 1 1

(

p    p

2 2

) ) 1

( (

e

p p

z

2 2

2 ) 1 ( e

z n

) 1 ( )

( p p p

f  

4 1

2 /

1 1

p

2 2

2

4e nz

p p

필요한 표본수 충분히 확보

n

(12)

확률예제

Ex) 새 법률안의 찬반 여론 조사.

실제 찬성률 를 95%확률로 (또는 95% 신뢰수준

에서) 오차 한계 3% 포인트 내로 추정하려면 은?

2 2

025 . 0

) 03 . 0 ( 4

nz )

2

03 . 0

96 . ( 1 4

 1 

1067.11

.

Note

대부분의 여론 조사는 1,000명을 표본크기로 함

n p

 1068

(명)

(13)

Chapter 9. 추

Honggie Kim

9. 4 두 모집단에서의 신뢰구간

두 양적 모집단

모집단 1 모집단 2

,

X2

X

평균 분산 평균

Y

,

분산

Y2

표본크기

m

표본크기

n

X

m

X

X

1 , 2 , ,

Y

1 ,

Y

2 , ,

Y

n

(14)

두 양적 모집단에서의 신뢰구간

두 모집단에서의 신뢰구간

작다 크다 작다 크다

안 다 모른다

모집단 분 포

비정규 통3 통3

(모분산들)

2 2, Y

X

표본크기

m, n

Z

Z

Z

Z

t

t

비현실적 ※ 3-ⓑ도 통3

(15)

Chapter 9. 추

Honggie Kim

두 양적 모집단에서의 신뢰구간

①모집단이 정규분포, , 의 크기 상관없음

9. 4 두 모집단에서의 신뢰구간

) (

, 2

2 Y

known

X

m, n

) ,

(

~

) ,

(

~

2 2

N n Y

N m X

Y Y

X X

 

 

) ,

(

~

2 2

n N m

Y

X  

X

 

Y

X

 

Y

2

)

2

( X Y

X Y

V      V ( XY )  

X2

 

Y2 .

Note

서로 독립인 두 확률 변수의 합과 차의 분산

:

X

: Y

:

Y X

: Y X

- 1 - 1

1

1 - 2 2

- 2 2

(16)

두 양적 모집단에서의 신뢰구간 ①

 

X

 

Y

100 ( 1   )%

신뢰구간은

n z m

y

x

X Y

2 2

2

)

(  

) ( 

X

 

Y

점추정치

정규분포

상수

( x y )

의 표준오차

1

신뢰수준에서의 오차한계

n z m

y

x

1 1

) (

2

만약

X2

 

Y2

 

2이라면

(17)

Chapter 9. 추

Honggie Kim

평균 차의 추정에 관심이 있는 이유

왜 의 추정과 신뢰구간에만 관심이 있는가?

의 추정에는 대부분의 경우 관심이 없다

Ex) 충남대 남학생의 키 과기대 남학생의 키

9. 4 두 모집단에서의 신뢰구간

Y

X

 

Y

X

 

: ,

, ,

2

1

X X

m

X

: ,

, ,

2

1

Y Y

n

Y

 175 x

 170 y

Y

X

 

의 추정치는

xy  345

Y

X

 

의 추정치는

xy  5

(무슨의미?)

(충남대 남학생의 평균키가 5cm 크다)

(18)

확률예제

Ex) 계란에 들어있는 베타카로틴은 표준편차가 10mg, 오리알에 들어있는 베타카로틴은 표준편차가

24mg으로 알려져 있으며 베타카로틴의 분포는 정규분포에 따른다고 알려져 있다. 계란 25개로 부터 측정한 베타카로틴의 양의 평균이 400mg, 오리알 12개로부터 측정한 베터카로틴의 양의 평균이 350mg이었다. 계란과 오리알 간의 베타 카로틴의 평균의 차이에 대한 95% 신뢰구간을 구하라

(19)

Chapter 9. 추

Honggie Kim

확률예제

풀이)

9. 4 두 모집단에서의 신뢰구간

) (

100 10

, 25 ,

400

m

2 2

known

x   

X

 

) (

576 24

, 12 ,

350

n

2 2

known

y   

Y

 

12 576 25

96 100 .

1 )

350 400

(   

n z m

y

x

X Y

2 2

2

)

(  

211 .

7 96 . 1

50

 

134 .

14 50 

) 134 .

64 , 866 .

35

(

(20)

두 양적 모집단에서의 신뢰구간

② 모집단이 비정규분포, , 이 크다

정규모집단이 아니더라도 이 모두 크면(보통 30이상)

의 근사적 신뢰구간은

) (

, 2

2 Y

known

X

m, n

n m,

) ,

(

~

2

N m

X .

X

X

~ . ( , )

2

N n

Y

Y

Y

n z m

y

x

X Y

2 2

2

)

(  

Y

X

100(1

 

)%

(21)

Chapter 9. 추

Honggie Kim

두 양적 모집단에서의 신뢰구간

④ 모집단이 정규분포, , 이 크다

이 모두 크므로(보통 30이상)

의 근사적 신뢰구간은

) (

, 2

2 Y

unknown

X

m, n

n m,

n s m

z s y

x

X Y

2 2

2

)

(  

Y

X

100(1

 

)%

9. 4 두 모집단에서의 신뢰구간

2 2

2

2 X

,

Y Y

X

S

S    

(22)

두 양적 모집단에서의 신뢰구간

⑤ 모집단이 비정규분포, , 이 크다

이 모두 크므로(보통 30이상)

의 근사적(두번근사) 신뢰구간은

) (

, 2

2 Y

unknown

X

m, n

n m,

n s m

z s y

x

X Y

2 2

2

)

(  

Y

X

 

100(1

 

)%

2 2

X

S

X

 

) ,

(

~

2

N m

X .

X

X

~ . ( , )

2

N n

Y

Y

Y

2 2

Y

S

Y

 

.

Note

(크다) 경우에는 정규모집단

여부가 중요하지 않음

n m unknown

Y

X2 ,

2( ), ,

이 큰 게 가장 큰 힘

n

m,

(23)

Chapter 9. 추

Honggie Kim

확률예제

Ex) 요즈음의 초등학교 6학년 남학생의 평균키 를 추정하기 위해 100명을 조사해

을 얻었다.

9. 4 두 모집단에서의 신뢰구간

10년 전 자료를 조사해 보니 비슷한 연구가 있었고, 그 때는 120명을 조사해

을 얻었던 것으로 나타났다. 에 대한 95% 신뢰구간을 구하라

) (

36 ,

) (

150 cm s

2

cm

2

x

X

) ( 

X

) (

30 ,

) (

146 cm s

2

cm

2

y

Y

Y

X

 

(24)

확률예제

풀이) 모집단분포-무관, , 이 크다

X2,

Y2(

unknown

)

m, n

n s m

z s y

x

X Y

2 2

2

)

(  

 120

30 100

96 36 . 1 )

146 150

(   

4

1.96

0.36

0.25

4

1.96 0.61 781 .

0 96 . 1

4

 

531 .

1 4 

) 531 .

5 , 469 .

2

 (

(25)

Chapter 9. 추

Honggie Kim

두 양적 모집단에서의 신뢰구간

③모집단이 정규분포, , 이 작다

③-ⓐ 모르지만 같다(등분산 가정)

③-ⓑ

Ex1) 관심 – 충남대 지렁이하고 과기대 지렁이하고 어느 쪽이 길까?

충남대 지렁이의 평균길이

과기대 지렁이의 평균길이

Ex2) 관심 – 내가 가지고 있는 필기구와 지렁이 중 어느 쪽이 길까?

필기구의 평균길이

지렁이의 평균길이

9. 4 두 모집단에서의 신뢰구간

) (

, 2

2 Y

unknown

X

m, n

)

2(

2

2 Y

unknown

X

 

  

) (

, 2

2 Y

unknown

X

통3 (비모수적 방법)

2 2

2

 

X

Y

X

Y

X2

Y2

X

Y (모름)으로

가정 가능

으로 가정불가

(26)

두 양적 모집단에서의 신뢰구간 ⑤

지렁이의 표준편차(분산)가 필기구의 표준편차(분산)

보다 훨씬 큼(Ex2의 경우)

동종비교  등분산 가정가능

이종비교  등분산 가정불가

※ 통계분석의 대부분은 동종비교임

③ - ⓐ 등분산 가정이 가능하면

n z m

y

x 1 1

) (

2

(

2

2

2 )

Y X

모르기 때문에 추정치로 대체

를 추정치로 대체하면

t

분포계수가 됨

(27)

Chapter 9. 추

Honggie Kim

등분산 가정 하에 모분산 추정

등분산 가정하에 의 추정

의 추정량이고 의 추정량이다

그런데 이므로, , 모두 을 추정한다

9. 4 두 모집단에서의 신뢰구간

2

2

S

X

X2 2

S

Y

Y2 2 2

2

 

X

Y

S

X2

S

Y2

2

2 2

2

2 Y :

X

S

S

의 추정량

) 2 (

) 1 (

) 1

(

2 2

 

n m

S n

S

m

x Y

) 2 (

) (

)

(

2 2

   

n m

Y Y

X

X

i i

n

m

이면 OK!

) :

var ) (

1 (

) 1 (

) 1 (

) 1

(

2 2

2

pooled iance

n m

S n

S

S

p

m

x Y

 

합병분산

.

Note

소표본에서 를 로 대신하면

2

2

t

z

S

신뢰구간은

)

( 

X

 

Y

100 ( 1   )%

n s m

n m t

y

x

p

1 1

) 2 (

) (

2

(28)

확률예제

Ex) 사과 과수원을 경영하는 김씨는 자신의 과수원 을 두부분으로 나누어 한쪽은 살충제를 뿌리고

다른 한 쪽은 직접 벌레를 잡아 주었다. 직접 벌레를 잡아준 쪽의 나무 10그루를 조사하니 사과의 개수가 평균 , 표준편차

이었고, 살충제를 뿌린 쪽의 나무 12그루를 조사 하니 사과의 개수가 평균 , 표준편차

이었다.

 350 x

 220

y s

Y

 40

 30 s

X

등분산성 가정하에, 직접벌레를 잡아 주었을 때, 살충제를 부렸을 때보다 증가하는

그루당 사과 수를 95%신뢰수준에서 구간 추정하라

(그루당 사과 수는 정규분포에 따른다고 한다)

(29)

Chapter 9. 추

Honggie Kim

확률예제

풀이)

9. 4 두 모집단에서의 신뢰구간

30 ,

350 ,

10  

x s

X

m

40 ,

220 ,

12  

y s

Y

n

2 ) 1 (

) 1

( 2 2

2

 

n m

s n

s

s

p

m

x Y

1285

2 12 10

40 )

1 12 ( 30

) 1 10

(

2 2

 

 

086 .

2 )

20 (

,

t

0.025

n s m

n m

t y

x

p

1 1

) 2 (

) (

2

)

2(

2

2 Y

unknown

X

 

  

정규모집단, 등분산가정

2

2

40

30

사이의 값임 )

( 847 .

35

1285 X Y

p

s s

s  

사이의 값

) 205 .

205 ,

795 .

54

 (

205 .

75 130

428 .

0 847

. 35 086

. 2

130     

 12

1 10

847 1 .

35 086

. 2 )

220 350

(    

(30)

두 질적 모집단에서의 신뢰구간

두 질적 모집단( 이 큰 경우)

 

 

 

n p p p

n N

Y ( 1 )

,

~ .

2 2 2

 

 

 

m p p p

m N

X ( 1 )

,

~ .

1 1 1

 

 

    

n

p p

m p p p

p n N

Y m

X ( 1 ) ( 1 )

,

~ .

1 2 1 1 2 2

n m,

p

1

yes

p

2

yes

(31)

Chapter 9. 추

Honggie Kim

두 질적 모집단에서의 신뢰구간

9. 4 두 모집단에서의 신뢰구간

n n

y n

y m

m x m

x n z

y m

x ( 1 ) ( 1 )

2

 

 

 

 

  

) (

)%

1 (

100   p

1

p

2 의 근사적 신뢰구간은

m

p

1

x

대체

n

p

2

y

대체

(32)

확률예제

Ex) 국회의원 후보인 C씨의 지역구는 고향인 D읍과 그 인근 지역인 E군으로 되어있다. D읍 주민

200명 중 160명이, E군 주민 180명중 90명이 각각 C씨 지지의사를 표명하였다. 두 지역의

C씨에 대한 지지율의 차이에 대한 95%

신뢰구간을 구하라

(33)

Chapter 9. 추

Honggie Kim

확률예제

풀이)

9. 4 두 모집단에서의 신뢰구간

8 . 0 ,

160 ,

200

 

m

x x

m  180 ,  90 ,  0 . 5

n y y

n

180 5 . 0 5 . 0 200

2 . 0 8 . 96 0

. 1 ) 5 . 0 8 . 0

( 

 

0468 .

0 96 . 1 3 .

0  

0.3

0.092

( 0 . 208 , 0 . 392 ) E

p

D p

2

1 읍에서의 실제 지지율 군에서의 실제 지지율

n n

y n

y m

m x m

x n z

y m

x ( 1 ) ( 1 )

2

 

 

 

 

  

작은 수

참조

관련 문서

일반적으로는 앙와위에서 시행하며 견관절을 중립회전, 20도 외전, 20도 굴곡 시킨 상태에서 검사자가 한 손으로는 환자의 전완부를 잡아 상완골 두를 관절와 내에서 동심성

이는 자신의 삶이 일반적인 사람들의 삶의 방식이나 가치 관과는 다른, ‘백에 하나 있거나 아주 없거나’ 한 것임을 부각하는 것으로, 자신의 삶에 대한 자부심을 우회적으로

자신의 집단이 긍정적인 행동을 행한 경 우에 내적 귀인하고, 다른 집단이 한 경우 에는 외적 귀인한다...

고역가, 저결합활성을 가진 항체는 임상적으로 중요한 다른 적혈구 동종항체의 검출을 방해하기 도 하며, 국내에서 직접 동정하기가 어려워 해외 표준검사실에

둘째, 전문 영역이 다른 교사들이 자신의 학문에 대한 태도가 조금씩은 다름을 인정 하고, 교과별 프로그램 개발 시 타교과의 내용 요소 및 지도 주안점을 학생 입장에서

학생들은 모둠별로 모델을 평가하기 위한 기준을 만들고 이를 통해 모둠 내에서 논의를 통해 다른 모둠의 모델을 평가하고 , 자신들의 모델 에 대한 다른 모둠의 평가

즉 한 산업에서 생산된 상품이 다른 산업의 상품생산을 위한 원자재로 투입됨으로써 각 산업은 직접 간접으로 서로 밀접한 연관관계를

• A는 B의 부재로 인해 사과 배달이 좌절되고 이후 사과가 멸실되었으므로 B에게 대금지급을 요구하 고, B는 자신의 과실 없이 배달시간에 돌아오지 못 한 것이므로