Chapter 9. 추 정
Honggie Kim
양적 모집단에서 모평균의 신뢰구간
②모집단이 비정규분포, , 이 크면
9. 3 모집단이 하나일 때의 신뢰구간
)
2(
known
n
) ,
(
~
2
N n
X
.
중심극한정리그러므로
100 ( 1 )%
의 근사적 신뢰구간은z n
x
2
신뢰구간과 표본크기
신뢰구간의 길이
똑같은 신뢰계수라면 짧을수록 좋다
표본크기의 결정
을 알 때 를 오차 한계가 보다 작게 추정할 확률이 100 % 이려면 표본크기 은?z n
2
2
가 크면 커진다 )
1 (
: 가 크면 커진다
(신뢰계수)
의 100% 신뢰구간은
.
Note ,
이 크면 작아진다
n
) 1
( n e
z
2
n
z e
2
n
e
z
22
2 e
n
Chapter 9. 추 정
Honggie Kim
확률예제
Ex) 충남남학생들의 키는 표준편차가 6cm인 정규분포라 한다. 평균키 와 추정치와의차이가 2cm이하일 확률이 0.95가 되기 위해선 몇 명을 조사해야 하는가?
9. 3 모집단이 하나일 때의 신뢰구간
z n
x
025 .
0)
22 6 96
.
( 1
n
34.57 35
x
cm 2
(무조건 올림)
양적 모집단에서 모평균의 신뢰구간
③모집단이 정규분포, , 이 작으면
2(unknown
)n
6 ,
100
11 1
, 3
12 0
: , 2
6
n n
S n
cm
일 때,) (
~ v t n
S
X
) 7 (
t t ( 3 )
) 1 ( t
t s
Student `
분포(정규분포와 비슷, 분포의 자유도
v t n 1
)] ,
[
nju nu v
영어의
n
에 해당하는Greek
) 1 , 0 (
N
자유도( ), 즉 표본크기가
커질수록 에 접근
1 n
) 1 , 0 (
N
Chapter 9. 추 정
Honggie Kim
확률예제
Ex) 정규 모집단에서 크기가 10인 표본을 구하여 를 얻었다. 의 95% 신뢰구간은?9. 3 모집단이 하나일 때의 신뢰구간
9 ,
18
2
s
x
262 .
2 )
9 ( )
9
( 0.025
2
t
t
[표 A.4]95% 의 신뢰구간은
n
t s
x
2( )
146 .
2 10 18
262 3 .
2
18
) 146 .
20 , 854 .
15
(
) 9 ( t
262 . 2
025
.
0
양적 모집단에서 모평균의 신뢰구간
앞의 예에서 만약
2
9(known
)이면z n
x
2
10 96 3
. 1 18
86 . 1 18
) 86 . 19 , 14 . 16
(
) 1 , 0 ( N
96 . 1
025 . 0
, 더 좁다(더 좋다)
72
. 3 292 .
4
Chapter 9. 추 정
Honggie Kim
양적 모집단에서 모평균의 신뢰구간
④모집단이 정규분포, , 이 크면
해석 19. 3 모집단이 하나일 때의 신뢰구간
)
2(
unknown
n
) 1 (
~
t n n
S
X
그러므로
100 ( 1 )%
의 근사적 신뢰구간은n
z s x
2
6 ,
100
11 1
, 3
12 0
: , 2
6
n n
S n
cm
일 때,이 커지면( 분포의 자유도가 커지면)
n t
) (
2
v t
2
z
양적 모집단에서 모평균의 신뢰구간
④모집단이 정규분포, , 이 크면
해석 2)
2(
unknown
n
) 1 , 0 ( n ~ N
X
) 1 , 0 ( n ~ N
S
X .
그러므로
100 ( 1 )%
의 근사적 신뢰구간은n
z s x
2
에서
대신S
사용( 이 크면n S
)Chapter 9. 추 정
양적 모집단에서 모평균의 신뢰구간
⑤모집단이 비정규분포, , 이 크면
모집단이 비정규분포, , 이 작으면
모집단이 비정규분포, , 이 작으면9. 3 모집단이 하나일 때의 신뢰구간
)
2(
known
n
)
2(
unknown
)
2(
unknown
n
n
통3
n
X
N ( 0 , 1 )
n S
X . .
그러므로
100 ( 1 )%
의 근사적 신뢰구간은n z s
x
2
질적 모집단에서 모비율의 신뢰구간
질적 모집단에서 모비율( )의 신뢰구간p
no yes
no yes
p
크기 n
표본
( 1 ) ( 1 ) ) 1
(
2 2n p z p
n p X
n p z p
n P X
이 크면
n
)) 1
, ( (
~
n
p p p
n N
X
.
상수
오차한계 의 점추정
p
) ) 1
( ,
) 1
(
(
2 2n n
x n
x n z
x n
n x n
x n z
x
의 표준오차 p
의 신뢰구간은 를 추정치 로 대치한
p
)%
1 ( 100
n p x
비모수적 방법
(통계학과 3학년) .
Note n
이 작으면Chapter 9. 추 정
Honggie Kim
질적 모집단에서 표본크기
표본크기(질적 모집단일때)
: 최대허용오차
: 신뢰계수(신뢰수준)① 전에 추정한 사용
② 소 표본으로 추정하여 계산 후 필요한 표본 더추출
③ 이용
9. 3 모집단이 하나일 때의 신뢰구간
n e p z p ( 1 )
2 2
2
( 1 ) )
( e
p z p
n
e
1
4 ) 1 2 1 1 2 ( ) 1 1
(
p p
2 2
) ) 1
( (
e
p p
z
2 2
2 ) 1 ( e
z n
) 1 ( )
( p p p
f
4 1
2 /
1 1
p
2 2
2
4e n z
p p
필요한 표본수 충분히 확보
n
확률예제
Ex) 새 법률안의 찬반 여론 조사.실제 찬성률 를 95%확률로 (또는 95% 신뢰수준
에서) 오차 한계 3% 포인트 내로 추정하려면 은?
2 2
025 . 0
) 03 . 0 ( 4
n z )
203 . 0
96 . ( 1 4
1
1067.11.
Note
대부분의 여론 조사는 1,000명을 표본크기로 함n p
1068
(명)Chapter 9. 추 정
Honggie Kim
9. 4 두 모집단에서의 신뢰구간
두 양적 모집단모집단 1 모집단 2
,
X2X
평균 분산 평균
Y,
분산
Y2표본크기
m
표본크기n
X
mX
X
1 , 2 , ,Y
1 ,Y
2 , ,Y
n두 양적 모집단에서의 신뢰구간
두 모집단에서의 신뢰구간작다 크다 작다 크다
안 다 모른다
모집단 분 포
정 규
비정규 통3 통3
(모분산들)
2 2, Y
X
표본크기
m, n
Z
①Z
②Z
④Z
⑤t
ⓐ
③
ⓑ
t
비현실적 ※ 3-ⓑ도 통3
Chapter 9. 추 정
Honggie Kim
두 양적 모집단에서의 신뢰구간
①모집단이 정규분포, , 의 크기 상관없음
9. 4 두 모집단에서의 신뢰구간
) (
, 2
2 Y
known
X
m, n
) ,
(
~
) ,
(
~
2 2
N n Y
N m X
Y Y
X X
) ,
(
~
2 2
n N m
Y
X
X
Y
X
Y2
)
2( X Y
X YV V ( X Y )
X2
Y2 .Note
서로 독립인 두 확률 변수의 합과 차의 분산:
X
: Y
:
Y X
: Y X
- 1 - 1
1
1 - 2 2
- 2 2
두 양적 모집단에서의 신뢰구간 ①
X
Y 의100 ( 1 )%
신뢰구간은n z m
y
x
X Y2 2
2
)
(
) (
X
Y 의점추정치
정규분포
상수
( x y )
의 표준오차
1
신뢰수준에서의 오차한계n z m
y
x
1 1) (
2
만약
X2
Y2
2이라면Chapter 9. 추 정
Honggie Kim
평균 차의 추정에 관심이 있는 이유
왜 의 추정과 신뢰구간에만 관심이 있는가?
의 추정에는 대부분의 경우 관심이 없다
Ex) 충남대 남학생의 키 과기대 남학생의 키9. 4 두 모집단에서의 신뢰구간
Y
X
Y
X
: ,
, ,
21
X X
mX
: ,
, ,
21
Y Y
nY
175 x
170 y
Y
X
의 추정치는x y 345
Y
X
의 추정치는x y 5
(무슨의미?)
(충남대 남학생의 평균키가 5cm 크다)
확률예제
Ex) 계란에 들어있는 베타카로틴은 표준편차가 10mg, 오리알에 들어있는 베타카로틴은 표준편차가24mg으로 알려져 있으며 베타카로틴의 분포는 정규분포에 따른다고 알려져 있다. 계란 25개로 부터 측정한 베타카로틴의 양의 평균이 400mg, 오리알 12개로부터 측정한 베터카로틴의 양의 평균이 350mg이었다. 계란과 오리알 간의 베타 카로틴의 평균의 차이에 대한 95% 신뢰구간을 구하라
Chapter 9. 추 정
Honggie Kim
확률예제
풀이)9. 4 두 모집단에서의 신뢰구간
) (
100 10
, 25 ,
400
m
2 2known
x
X
) (
576 24
, 12 ,
350
n
2 2known
y
Y
12 576 25
96 100 .
1 )
350 400
(
n z m
y
x
X Y2 2
2
)
(
211 .
7 96 . 1
50
134 .
14 50
) 134 .
64 , 866 .
35
(두 양적 모집단에서의 신뢰구간
② 모집단이 비정규분포, , 이 크다
정규모집단이 아니더라도 이 모두 크면(보통 30이상)의 의 근사적 신뢰구간은
) (
, 2
2 Y
known
X
m, n
n m,
) ,
(
~
2
N m
X .
X
X~ . ( , )
2
N n
Y
Y
Yn z m
y
x
X Y2 2
2
)
(
Y
X
100(1
)%Chapter 9. 추 정
Honggie Kim
두 양적 모집단에서의 신뢰구간
④ 모집단이 정규분포, , 이 크다
이 모두 크므로(보통 30이상)의 의 근사적 신뢰구간은
) (
, 2
2 Y
unknown
X
m, n
n m,
n s m
z s y
x
X Y2 2
2
)
(
Y
X
100(1
)%9. 4 두 모집단에서의 신뢰구간
2 2
2
2 X
,
Y YX
S
S
두 양적 모집단에서의 신뢰구간
⑤ 모집단이 비정규분포, , 이 크다
이 모두 크므로(보통 30이상)의 의 근사적(두번근사) 신뢰구간은
) (
, 2
2 Y
unknown
X
m, n
n m,
n s m
z s y
x
X Y2 2
2
)
(
Y
X
100(1
)%2 2
X
S
X
) ,
(
~
2
N m
X .
X
X~ . ( , )
2
N n
Y
Y
Y2 2
Y
S
Y
.
Note
(크다) 경우에는 정규모집단여부가 중요하지 않음
n m unknown
Y
X2 ,
2( ), ,
이 큰 게 가장 큰 힘
n
m,
Chapter 9. 추 정
Honggie Kim
확률예제
Ex) 요즈음의 초등학교 6학년 남학생의 평균키 를 추정하기 위해 100명을 조사해을 얻었다.
9. 4 두 모집단에서의 신뢰구간
10년 전 자료를 조사해 보니 비슷한 연구가 있었고, 그 때는 120명을 조사해
을 얻었던 것으로 나타났다. 에 대한 95% 신뢰구간을 구하라
) (
36 ,
) (
150 cm s
2cm
2x
X
) (
X) (
30 ,
) (
146 cm s
2cm
2y
Y
Y
X
확률예제
풀이) 모집단분포-무관, , 이 크다
X2,
Y2(unknown
)m, n
n s m
z s y
x
X Y2 2
2
)
(
120
30 100
96 36 . 1 )
146 150
(
4
1.96
0.36
0.25
4
1.96 0.61 781 .0 96 . 1
4
531 .
1 4
) 531 .
5 , 469 .
2
(
Chapter 9. 추 정
Honggie Kim
두 양적 모집단에서의 신뢰구간
③모집단이 정규분포, , 이 작다
③-ⓐ 모르지만 같다(등분산 가정)
③-ⓑ
Ex1) 관심 – 충남대 지렁이하고 과기대 지렁이하고 어느 쪽이 길까?
충남대 지렁이의 평균길이
과기대 지렁이의 평균길이
Ex2) 관심 – 내가 가지고 있는 필기구와 지렁이 중 어느 쪽이 길까?
필기구의 평균길이
지렁이의 평균길이9. 4 두 모집단에서의 신뢰구간
) (
, 2
2 Y
unknown
X
m, n
)
2(
2
2 Y
unknown
X
) (
, 2
2 Y
unknown
X
통3 (비모수적 방법)2 2
2
X
Y
X
Y
X2
Y2
X
Y (모름)으로가정 가능
으로 가정불가
두 양적 모집단에서의 신뢰구간 ⑤
지렁이의 표준편차(분산)가 필기구의 표준편차(분산)보다 훨씬 큼(Ex2의 경우)
동종비교 등분산 가정가능
이종비교 등분산 가정불가※ 통계분석의 대부분은 동종비교임
③ - ⓐ 등분산 가정이 가능하면n z m
y
x 1 1
) (
2
(
2
2
2 )Y X
모르기 때문에 추정치로 대체
를 추정치로 대체하면t
분포계수가 됨
Chapter 9. 추 정
Honggie Kim
등분산 가정 하에 모분산 추정
등분산 가정하에 의 추정
은 의 추정량이고 은 의 추정량이다그런데 이므로, , 모두 을 추정한다
9. 4 두 모집단에서의 신뢰구간
22
S
X
X2 2S
Y
Y2 2 22
X
Y S
X2S
Y2
22 2
2
2 Y :
X
S
S
의 추정량
) 2 (
) 1 (
) 1
(
2 2
n m
S n
S
m
x Y) 2 (
) (
)
(
2 2
n m
Y Y
X
X
i in
m
이면 OK!) :
var ) (
1 (
) 1 (
) 1 (
) 1
(
2 22
pooled iance
n m
S n
S
S
pm
x Y
합병분산.
Note
소표본에서 를 로 대신하면2
2
t
z
S
의 신뢰구간은
)
(
X
Y100 ( 1 )%
n s m
n m t
y
x
p1 1
) 2 (
) (
2
확률예제
Ex) 사과 과수원을 경영하는 김씨는 자신의 과수원 을 두부분으로 나누어 한쪽은 살충제를 뿌리고다른 한 쪽은 직접 벌레를 잡아 주었다. 직접 벌레를 잡아준 쪽의 나무 10그루를 조사하니 사과의 개수가 평균 , 표준편차
이었고, 살충제를 뿌린 쪽의 나무 12그루를 조사 하니 사과의 개수가 평균 , 표준편차
이었다.
350 x
220
y s
Y 40
30 s
X등분산성 가정하에, 직접벌레를 잡아 주었을 때, 살충제를 부렸을 때보다 증가하는
그루당 사과 수를 95%신뢰수준에서 구간 추정하라
(그루당 사과 수는 정규분포에 따른다고 한다)
Chapter 9. 추 정
Honggie Kim
확률예제
풀이)9. 4 두 모집단에서의 신뢰구간
30 ,
350 ,
10
x s
Xm
40 ,
220 ,
12
y s
Yn
2 ) 1 (
) 1
( 2 2
2
n m
s n
s
s
pm
x Y1285
2 12 10
40 )
1 12 ( 30
) 1 10
(
2 2
086 .
2 )
20 (
,
t
0.025
n s m
n m
t y
x
p1 1
) 2 (
) (
2
)
2(
2
2 Y
unknown
X
정규모집단, 등분산가정
2
2
40
30
과사이의 값임 )
( 847 .
35
1285 X Y
p
s s
s
와 사이의 값) 205 .
205 ,
795 .
54
(
205 .
75 130
428 .
0 847
. 35 086
. 2
130
12
1 10
847 1 .
35 086
. 2 )
220 350
(
두 질적 모집단에서의 신뢰구간
두 질적 모집단( 이 큰 경우)
n p p p
n N
Y ( 1 )
,
~ .
2 2 2
m p p p
m N
X ( 1 )
,
~ .
1 1 1
n
p p
m p p p
p n N
Y m
X ( 1 ) ( 1 )
,
~ .
1 2 1 1 2 2n m,
p
1yes
p
2yes
Chapter 9. 추 정
Honggie Kim
두 질적 모집단에서의 신뢰구간
9. 4 두 모집단에서의 신뢰구간
n n
y n
y m
m x m
x n z
y m
x ( 1 ) ( 1 )
2
) (
)%
1 (
100 p
1 p
2 의 근사적 신뢰구간은m
p
1를x
대체n
p
2를y
대체확률예제
Ex) 국회의원 후보인 C씨의 지역구는 고향인 D읍과 그 인근 지역인 E군으로 되어있다. D읍 주민200명 중 160명이, E군 주민 180명중 90명이 각각 C씨 지지의사를 표명하였다. 두 지역의
C씨에 대한 지지율의 차이에 대한 95%
신뢰구간을 구하라
Chapter 9. 추 정
Honggie Kim
확률예제
풀이)9. 4 두 모집단에서의 신뢰구간
8 . 0 ,
160 ,
200
m
x x
m 180 , 90 , 0 . 5
n y y
n
180 5 . 0 5 . 0 200
2 . 0 8 . 96 0
. 1 ) 5 . 0 8 . 0
(
0468 .
0 96 . 1 3 .
0
0.3
0.092 ( 0 . 208 , 0 . 392 ) E
p
D p
2
1 읍에서의 실제 지지율 군에서의 실제 지지율
n n
y n
y m
m x m
x n z
y m
x ( 1 ) ( 1 )
2
작은 수