추정의 기본원리
estimation
학습 내용
추정의 개념
점추정
구간추정
정규모집단에서 모평균의 추정방법
표본의 크기 결정방법
점추정
(point estimation)
구간추정
(interval estimation) 추정
추정의 개념
추정량과 추정치
추정량 (estimator)
추정에 사용되는 통계량
추정치를 구하는 식
추정치 (estimate)
표본의 실제값을 추정량에 대입하여 구한 값
) 1 /(
) (
,
/
2 21
n X
X S
n X
X
in
i
i
, s 2
x
점추정(Point Estimation)
좋은 추정량의 조건
不偏性(unbiasedness)
효율성(efficiency)
일치성(consistency)
주요 모수의 불편추정량과 분산
모분산의 점추정
추정량의 분포
A B
C D
불편성(unbiasedness)
표본평균
중앙값
표본분산
표본비율
( ˆ ) Bias E
ˆ ) (
추정치 E
모수의 ˆ
모수 추정하려는
효율성(efficiency)
추정량의 분산과 관련된 성질
분산이 더 적은 추정량이 더 효율적
효율성 …
MVUE(minimum variance unbiased estimator)
m n n V
X
V e
2 2
57 .
1 )
(
)
(
일치성(consistency)
X P(X)
A
B
Smaller sample
size Larger
sample size
as n
ˆ
표본 평균
표본 비율
표본 분산
주요 모수의 불편추정량과 분산
모수
표본의크기
불편추정량
분산
2모평균
n X
2/ n
모비율
p n
n p ˆ X
n p p ( 1 )
두 모집단의 모평균차
1
2n
1
& n
2X
1 X
22 2 2 1
2 1
n n
두 모집단의 모비율차
p
1 p
2n
1
& n
2p ˆ
1 p ˆ
22 2 2
1 1
1
( 1 ) ( 1 )
n p p
n p
p
• 모집단의 분포에 관계없이 성립한다.
• 표본의 크기가 커지면 모든 추정량이 정규분포에 가까와진다.
p for
5 )
1 ( and
5
, for 30
p n
np
n
중심극한정리가 적용될 수 있는 조건
카이제곱 분포
0 2 ,
1 ) 2 / ( ) 1
(
/2 /2 1 /2
x
e
x x m
f
m m xE(X) = m V(X) = 2m
Γ(k)=(k-1)(k-2)…(2)(1)
) (
~ 2 m
X
m: 자유도 (degree of freedom)자유도(Degree of Freedom)
데이터의 개수에서 통계량을 계산하는 데 사용된 추정치의 수를 빼준 값
통계량을 계산한 후에 자유롭게 변할 수 있는 관측치의 수
Example
Sum of 3 numbers is 6
X
1 = 1 (or any number)X
2 = 2 (or any number)X
3 = 3 (cannot vary)Sum = 6
degrees of freedom =
n -1
= 3 -1
= 2
카이제곱 분포
) (
~ ) (
) (
) ,
(
~
1 2 22
1
2
2
n
X X N
X
n
i n i
i
i
) 1 (
) ~ 1 ) (
(
2 2
2 2
1
2
X X n S n
n
i
i
) 1 (
~
22
Z
N(0,1)
~
Z
).
(
~
t.
independen are
' and
) (
~
2 1
2 2
1 2
k k
i i
i
r r
r W
W W
U
s W r
W
모분산의 점추정
2 2 )
(
E S
1 1 ]
[ ]
[
22 2
1
2
n
σ
)S E (n
σ
) X (X
E
n
i
i
표본분산은
2의 불편추정량이다.S :
S :
ˆ
ˆ 2 2
2
카이제곱 분포의 임계값
)
2
(
df
카이제곱 분포의 임계값
카이제곱분포표
Excel
)
2
(
df
P(X>a) = chidist(a,df)
P(X>a) = 인 a = chiinv(,df)
chisq.dist.rt(a,df)
a
=chisq.inv(1-,df)
P(X<a) = chisq.dist(a,df,true) P(X>a) = chisq.dist.rt(a,df)
P(X>a) = 인 a = chisq.inv(1-,df) P(X>a) = 인 a = chisq.inv.rt(,df)
Office 2007
Office 2010
구간추정
Interval Estimation
구간 추정 방법
좋은 구간추정의 요건
점추정 - 활쏘기
구간추정 - 밧줄(그물,고리) 던지기
구간 추정
신뢰하한 신뢰상한
신뢰구간
점추정치
정규모집단에서 의 구간추정( 알 때)
] z
z - P[
] / z
P[-z
] z P[-z
= -
1
N(0,1)
~>
= / Z
) / ,
(
~
/2 /2
/2 /2
/2 /2
2
X n X n
n X
Z n X
n N
X
2
/
2z
/ z
1 - /2
/2
0 z
정규모집단에서 의 구간추정( 알 때)
x
μ
z n
x
/2
x z n
/2
신뢰하한 신뢰상한
z n
x
: / 2
] z
z - [ P
= -
1
/2 /2X n
X n
좋은 구간 추정이란?
신뢰수준(신뢰확률; confidence level)
신뢰구간 내에 모수가 포함될 확률(1-)
신뢰구간 (confidence interval)의 폭
폭이 커지면 정보가치가 감소
신뢰수준과 상반관계
표준편차가 커지면 폭이 넓어진다.
표본의 크기가 커지면 폭이 작아진다.
z n
x
/ 2
신뢰구간의 폭
신뢰수준과 표본크기의 함수
신뢰수준이 일정하면 신뢰구간의 폭은 표본의 크기에 따라 결정됨