통계적 추론
(Statistical Inference)
신뢰구간에 대한 해석
• 만일 모평균에 대한 95%의 신뢰구간이 (340, 299)으로 구간 추정 되었을 때 추정결과에 대한 해석에 유의해야 한다.
-잘못된 해석: 모집단의 평균이 추정된 구간 사이에 있을 확률 이 95%이다
-추정된 구간은 표본분포를 토대로 산출된 것이므로 추정구간 의 실제 의미는 모집단으로 부터 같은 크기의 표본을 100개 추 출하여 이들 표본을 가지고 100번의 구간추정을 하였을 때 추정 된 구간들 중에서 약 95개의 표본평균을 가지고 추정한 구간들 이 모집단 평균을 포함하고 있음을 나타낸다.
신뢰구간의 크기
• 신뢰구간의 크기가 클 수록 정확한 정보를 얻기 어 렵다
-예를 들어 신입사원 초임에 대한 95%의 신뢰구간 이 (1500만원, 3000만원)인 경우와 (2000만원,
2500만원)인 경우, 후자의 구간이 신입사원 초임에 대한 보다 더 정확한 정보를 제공한다
• 신뢰구간의 크기는 신뢰수준(1-α), 모집단(표본)
신뢰구간 크기와 신뢰수준
• 신뢰수준이 클 수록 구간의 크기도 커진다
신뢰구간 크기와 표준편차
• 표준편차의 값이 클 수록 구간의 크기가 커진다
21
신뢰구간 크기와 표본크기
• 표본의 크기가 클 수록 구간의 크기는 작아진다
-대신 많은 자료를 얻기 위한 비용의 증가가 따른다
• 표본크기 결정
) ,
( 1
)
(
/2 /2 /2 /2Z n n X
Z X
Z Z
Z
P
2 2 2
2 /
2 2
2 2 / 2
/
) 4 (
) 4 2 (
Z E n
n E Z
E n
Z
표본크기 결정
• 신뢰구간의 길이가 E보다 작길 원한다면
• Ex) 기계가 고장나는 횟수를 조사하고자 한다. 신뢰 구간의 길이가 1보다 작길 원한다면 조사일수는 최 소한 얼마이어야 하는가? (σ=2)
2
2 2 /
2 ( )
4
E n Z
점추정
• 점추정은 표본을 이용하여 하나의 값(점)을 이용하여 미지의 모수값에 대해 추정함으로써 모집단에 대한 추론하는 방법이다
- 예) 표본평균값을 이용하여 모집단의 평균값을 추정하는 것
• 평균제곱오차(mean squared error: MSE)
- 모집단에서 무수히 많은 표본을 추출하여 각 표본통계량을 계산하였을 때 추정량이 바람직하기 위해서는 추정 값들의 확률분포가 모수를 중심 으로 밀집되어야 한다
- 이러한 표본통계량의 밀집 정도를 나태는 것이 평균제곱오차(MSE)이다
바람직한 추정량
• 바람직한 추정량의 특성 - 불편의성(Unbiasedness)
X : E ( X )
n n E
n X i
n i
) 1 (
1 :
1 1 1
Ex)
표본평균( )은 모평균(µ )의 불편의 추정량이다X
바람직한 추정량
- 효율성(Efficiency)
서로다른 불편의 추정량의 확률분포
바람직한 추정량
- 일치성(Consistency):표본크기가 무한히 증가할때 추정량(θ^)이 모수(θ)에 근접하려는 특성
표본크기(n)증가에 따른 표본평균의 확률분포 변화
점추정량 연습문제
• 모집단~N(μ, δ2)에서 2개인 관측치(x1,x2)를 추출하였다.
모평균(μ)를 추정하기 위한 두 가지 점추정량이 아래 식과 같다.
1) 위의 두 점추정량이 모두 모평균의 불편의 추정량인가?
2) 어느 점추정량이 보다 더 효율적인가?
4 , 3
5 2
3
1 22 2
1
1
x x
x
x