제10장 모집단평균의 추정
통계적 추론
실제 조사대상 모집단의 특성(평균, 분산 등)을 알고 있는 경우가 드물고 오히려 모집단의 특성 을 알아내기 위해 표본을 추출하고 이를 바탕으 로 모집단의 특성을 추정하는 경우가 대부분이 다.
통계적 추론(statistical inference)
표본으로부터 얻은 정보를 이용하여 모집단의 모수를 추정하는 과정
추리통계학(inference statistics)
통계적 추론의 목적
추정(estimation)
가설검정(hypothesis testing)
점추정
점추정: 모집단의 특성을 구체적인 하나의 수치 로 추정하는 과정
점추정치(point estimate)
모집단 특성을 하나의 수치에 의해 추정할 때 이 수치 를 그 특성의 점추정치라고 한다.
추정량(estimator)
모집단 특성을 추정하기 위하여 이용되는 통계량으로 확률변수이다.
추정치(estimate)
추정량을 통하여 계산된 구체적인 수치
좋은 점추정량의 조건
불편성(unbiasdness)
추정량이 취하는 확률분포의 중심이 추정하고자 하는 모수에 가까 울 수록 바람직하다.
효율성(efficiency)
두개의 추정량이 모두 불편추정량이라고 한다면 변이성이 작은 추 정량이 더 좋은 것이다.
일치성(consistency)
표본크기를 크게 하면 할수록 추정치가 모집단 특서에 가까워 질 때 그 추정량은 모수에 대한 일치추정량이다.
충분성(sufficiency)
추정량이 모집단 특성에 대하여 다른 어떤 추정량보다 더 많은 정 보를 제공해 줄 때, 그 추정량을 충분추정량이라고 한다.
ˆ) : 0, ( ) ( ˆ)( bias E
E 편의 편의
ˆ . ˆ
ˆ ) ( ˆ )
( ˆ )
( ˆ )
(
2 1
2 2 1
2 2
1
효율적이다 더
상대적으로 보다
이
이면 이고
E
E
1 ) ˆ |
(|
lim
n
n P
신뢰구간추정
신뢰구간 추정의 필요성
점추정은 추정의 정확도(precision)에 정보를 제공해 주지 못하는 단점
실질적으로 점추정치가 모수와 같을 확률은 0이다.(특정값의 적분 값은 0)
L(lower boumd)<μ<U(upper bound)
표본조사에 따른 오차의 한계를 나타내주는 신뢰구간추정을 위 해서는 의 표본분산을 추정하여야 한다.
모집단의 분산 을 모를 때에는 의 불편추정량인 을 이용 하여도 무방하다.
X
2
2s
2n X s
n s X s
s ( ) ( )
2 2
N n n
s N
n N n
X s N s
n n
s N
n N n X s
s ( ) ( ) ( 1 ) ( ) 1
2 2
2
유한모집단의 경우
신뢰구간의 추정:표본크기가 클 때(1)
신뢰계수(confidence coefficient)
옳은 구간치를 얻을 확률: 1- α
일반적을 %로 나타나며: 100(1- α)%
신뢰계수(confidence interval)
L≤μ≤U
L은 신뢰구간의 하한치
U는 신뢰구간의 상한치
신뢰구간
P(L≤μ≤U)= 1- α
중심극한정리의 확장
표본크기가 충분히 크면, 어떤 모집단에 대하여서도 는 표준정규분포에 접근한다.
) ( X s X
X Z s
X ) (
신뢰구간의 추정:표본크기가 클 때(2)
표본크기가 충분히 클 때, μ에 대한 신뢰계수가 1- α인 신 뢰구간은
명확한 정보→신뢰구간을 좁힘→신뢰계수가 낮아짐→구간 에 위치할 확률이 떨어짐→신뢰구간의 의미가 없다.
따라서 신뢰계수를 적정하게 유지하면서 구간의 폭을 좁히 는 것이 바람직한데 이는 표본의 크기를 늘리는 방법만이 가능하다.
신뢰계수의 선택: 일반적으로 실무에서 90, 95, 99% 사용
n
z s n X
z s
X
1 2
1 2
신뢰구간의 추정:표본크기가 작을 때(1)
표본크기가 작을 때는 중심극한 정리 적용 불가능
는 표준정규분포에 근접한다고 볼 수 없다. 따라서 앞과 같은 방법으로 신뢰구간을 만들 수 없고 모집단의 성격에 따 라 신뢰구간을 만드는 방법이 달라야 한다.
모집단이 정규분포이고 σ가 알려져 있을 때
모집단이 정규분포이고 모집단의 표준편차 σ가 알려져 있어 표 본표준편차 s를 사용할 필요가 없을 때, 도 정확히 알 수 있 어 비록 표본의 크기가 작아서 중심극한정리를 적용할 수 없다 고 하더라고 여전히 표준정규분포를 이용할 수 있다.
) ( X s X
) (X
모집단이 정규분포이고 σ 가 알려져 있지 않을 때
정규분포로부터 n개의 표본을 무작위로 추출하면 는 자유도가 (n-1)인 t분포를 따른다.
모집단이 정규분포이거나 정규분포에서 크게 벗어나 지 않으면 μ에 대한 1-α 신뢰구간은 다음과 같다.
t분포는 평균은 0이나 분산이 1이 아니지만 좌우대칭인 종모양으 로 Z분포와 유사하나 분산이 커서 퍼져 있는 정도가 약간 크다 그러나 자유도가 커지면 t분포는 Z분포에 근접한다.
신뢰구간의 추정:표본크기가 작을 때(2)
) ( X s X
) 1 ) (
(
n X t
s
X
) (
) 1 2 ;
1
( n s X
t
X
신뢰구간의 추정:표본크기가 작을 때(3)
모집단이 정규분포가 아닐 때
모집단이 정규분포가 아니더라도 표본크기가 충분히 크면 중심극한정리를 사용할 수 있다.
통계이론에서는 모집단이 정규분포가 아니더 라도 정규분포에 크게 벗어나지 않고, 표본크 기 n이 아주 작지만 않으면 는 t(n-1)에 근접한다고 한다.
따라서 모집단의 비대칭도가 아주 심한 경우 를 제외하고는 t분포에 의해 신뢰구간을 구할 수 있게 된다.
) ( X s X
표본크기의 계획
필요한 표본크기의 계산
신뢰계수 결정
신뢰구간의 넓이 또는 추정의 정확도 결정
모집단표준편차를 알아야 한다.
과거의 자료 또는 표본조사를 통해 얻은 예상치 사용
2
2 2
1 2 1 2
1 2 )
2 ( 1
h z
n n z
h
z n X
X z
X
모집단합계에 대한 추정
모집단합계
(population total)에 대한 신뢰구간
됨 곱하면 만
신뢰구간에 대한
에 신뢰구간은
에대한 타우)
(
1
N N
X
N
i
i
모집단평균에 대한 단측신뢰구간
단측신뢰구간
(one-sided confidence interval) 상위신뢰구간 (upper confidence interval)
표본이 충분히 크면 μ에 대한 상위신뢰구간은
모집단이 정규분포이거나 정규분포에서 크게 벗어나지 않 고 표본크기가 작을 때에는 양측구간추정에서와 마찬가지 로 t분포를 사용한다.
하위신뢰구간 (lower confidence interval)
상위신뢰구간에서 부호만 반대