제 7주차
표본분포이론(2)
<학습목표>
•
추측통계학에서 표본분포이론의 필요성 및 역할에 대해 학습 한다.<학습내용>
1. 표본분포
2. 표본추출
1. 표본분포
1) 표본분포 학습의 필요성
<note> 표본추출 결과에 대해
① 임의표본은 어떤 것이 추출될지 예측하기 어렵다.
② 즉, 동일한 모집단으로부터 같은 크기의 두 개의 표본을 추출 할 때 비슷하거나 같은 표본평균을 갖는다고 예상할 수 없다.
③ 확률표본으로부터 계산되는 표본평균과 같은 임의의 통계량 은 표본에 따라 그 값이 변한다.
④ 따라서 모든 가능한 통계량 값에 대한 분포의 연구가 필요하 다.
⑤ 이러한 분포에 대한 정보는 표본을 이용하여 모집단을 추론 하는 추론통계에서 아주 중요하다.
⑥ 이러한 분포를 연구함으로써 미지의 모집단 모수를 추정하는 데 사용되는 표본통계량의 신뢰도를 판단할 수 있다.
⑦ 표본평균과 같은 통계량의 값은 표본에 따라 값이 변하므로 통계량은 확률변수(random variable)가 되며, 표본통계량의 분포를 표본분포(sampling distributions)라 한다.
편의상 모집단을 X, 평균의 표본분포를 로 표시하자. 일반적으 로 통계량의 표본분포는 동일한 크기의 표본으로부터 계산된 모든 가능한 통계량 값의 분포를 나타낸다.
1. 표본분포
ㅡ
X
⑧ 표본평균의 분포는 모집단 분포가 유한모집단이냐 무한모집단이냐 에 따라 그 분포가 달라지며,
⑨ 모집단이 정규모집단이냐 아니냐에 따라서도 그 분포가 다르게 나 타난다.
⑩ 또한, 모집단으로부터 표본을 복원으로 추출하느냐 비복원으로 추출 하느냐에 따라 표본평균의 분포에 대한 분산의 형태가 달라진다.
1. 표본분포
도수
0 1
2 1
4 1
6 1
합계 4
1) 표본평균의 분포
예제5
표본평균의 표본분포를 설명하기 위하여 {0, 2, 4, 6}으로 구성된 모 집단으로부터 2개의 표본을 임의로 추출하는 문제를 생각해 보기로 하자. 모집단에 대한 정보를 얻기 위하여 모집단의 도수분포를 표로 나타내면 다음과 같다.
x
<표 8.2> 모집단의 도수분포표
위의 <표 8.2>로부터 모평균과 모분산을 각각 구해 보면 다음과 같다.
따라서 모표준편차는 이다.
모집단 {0,2,4,6}에서 크기가 2인 임의표본을 복원추출할 경우 가능한 표본과 그 평균을 구해 보면 다음과 같다.
1) 표본평균의 분포
5
4
) 3 6
( )
3 4
( )
3 2
( )
3 0
(
) (
2 2
2 2
2 2
N
x
4 3
6 4 2
0
2 5
가능한 표본 표본평균 가능한 표본 표본평균
{0,0} 0 {4,0} 2
{0,2} 1 {4,2} 3
{0,4} 2 {4.4} 4
{0,6} 3 {4,6} 5
{2,0} 1 {6,0} 3
{2,4} 3 {6,2} 4
{2,6} 4 {6,4} 5
{2,8} 5 {6,6} 6
1) 표본평균의 분포
위의 표를 이용하여 표본평균의 도수분포를 나타내면 다음과 같다.
도수
0 1
1 2
2 3
3 4
4 3
5 2
6 1
합계 16
x
1) 표본평균의 분포
표본평균들의 표본분포에 대한 평균은
3 3 48 16
) 1 )(
6 ( ) 2 )(
5 ( ) 3 )(
4 ( ) 4 )(
3 ( ) 3 )(
2 ( ) 2 )(
1 ( ) 1 )(
0 (
) (
f x f
x
이고 표준편차는 이다.
1) 표본평균의 분포
표본평균들의 표본분포에 대한 분산을 다음 표를 이용하여 계산한다.
0 1 0-3=-3 9 9
1 2 1-3=-2 4 8
2 3 2-3=-1 1 3
3 4 3-3=0 0 0
4 3 4-3=1 1 3
5 2 5-3=2 4 8
6 1 6-3=3 9 9
합계 16 40
x f
x x ( x x ) 2 ( x x ) 2 f
표본평균의 표본분포의 분산은 2,5 16
2 40
n
x
2 1.58
표본평균 는 모평균 와 그 값이 같지는 않지만 평균적으로 같음을 알 수 있다. 그러므로, 모평균이 인 모집단으로부터 임의표본을 복원 또는 비복원으 로 추출했을 때, 모평균 와 표본평균 사이에는 다음과 같은 관계가 성립된 다.
1) 표본평균의 분포
다른 확률변수와 마찬가지로 표본평균의 분포도 평균(기대값), 분산, 표준편차를 갖는다.
x
x
x E(x) <예제>
이전 시간에 학습했던, <예제 4>의 표본평균에 대한 표본분포의 예에서
1) 각 표본평균에 대한 표본오차 2) 표본오차의 평균
3) 표본오차의 표준편차를 구하여라.
순서표본 표본평균 표본오차
{2,2} 2 2-4=-2
{2,4} 3 3-4=-1
{2,6} 4 4-4=0
{4,2} 3 3-4=-1
{4,4} 4 4-4=0
{4,6} 5 5-4=1
{6,2} 4 4-4=0
{6,4} 5 5-4=1
{6,6} 6 6-4=2
<풀이>
1) 표본, 표본평균, 표본오차는 다음과 같다.
2)
표본오차의 평균가능한
표본 표본평균 표본오차 가능한
표본 표본평균 표본오차
{0,0} 0 0-3=-3 {4,0} 2 2-3=-1
{0,2} 1 1-3=-2 {4,2} 3 3-3=0
{0,4} 2 2-3=-1 {4.4} 4 4-3=1
{0,6} 3 3-3=0 {4,6} 5 5-3=2
{2,0} 1 1-3=-2 {6,0} 3 3-3=0
{2,4} 3 3-3=0 {6,2} 4 4-3=1
{2,6} 4 4-3=1 {6,4} 5 5-3=2
{2,8} 5 5-3=2 {6,6} 6 6-3=3
<풀이>
3) 표본평균의 표본분포의 분산을 다음 표를 이용하여 계산한다.
표준오차분포의 분산은 이고,
표준편차는 이다.
e
-3 1 -3-0=-3 9
-2 2 -2-0=-2 8
-1 3 -1-0=-1 3
0 4 0-0=0 0
1 3 1-0=1 3
2 2 2-0=2 8
3 1 3-0=3 9
합계 16 40
<note>
• 앞의 예제에서 표본평균의 표준편차와 표본오차의 표본편차 가 1,58로 서로 같다.
⇒ 이러한 이유로 표본평균의 표준편차라는 용어 대신에 표본평 균의 표본오차라고 말한다. 통계량의 표본분포의 표준편차를 통계량의 표준오차(standard error)라 한다.
2. 정규모집단에서의 표본추출
1) 앞에서
• 표본평균의 평균은 모평균과 같고, 즉,
• 표본평균의 분산은 모분산에 자료의 수를 나눈 것과 같다.
즉,
2) 그런데, 표본의 자료가 커지면 이러한 관계를 예로들어 설명 하기 힘들다.
⇒ 따라서, 이를 위해 모집단의 분포에 따라 표본평균의 분포에 대한 다음과 같은 이론들이 개발되어 있다.
많은 통계량의 표본분포는 모집단이 정규분포를 따른다는 가정 에 한다. 만일 모집단 분포가 정규분포일 때 표본평균의 분포 는 어떤 분포를 따를 것인가
) (
ㅡ
X E
X n
Var(ㅡ )
22) 정규 모집단으로부터의 표본추출
⇒ 만일 정규모집단으로부터 표본크기 n인 임의표본이 추출된다 면 표본평균의 표본분포는 정규분포를 따른다
.
◀ 1단계 :
⇒ 모집단분포가 정규분포를 따를 때, 표본평균의 분포도 정규분 포를 따른다는 사실로부터 정규모집단 에서 크기 n 인 표본의 표본평균 는 정규분포 을 한다.
◀ 2단계 :
⇒ 이 때, 표본평균 를 표준화시킨 표준화 확률변수 는 표준정규분포 을 한다.
<예제7>
평균이 , 분산이 인 정규모집단으로부터 크기 9인 임의표본을 추출하였다. 표본평균 가 28보다 클 확률은 얼마 인가?
<풀이>
• 표본평균 는 평균 ,
표준오차 인 정규분
포를 따른다.
의 z값은 이다. 따라서
이다.
<예제8>
어떤 작업을 완료하는데 걸리는 시간은 평균이 30분 표준편차가 9분인 정규분포를 따른다. 25명의 작업자를 임의로 추출했을 때 평균작업시간이 28분에서 33분 사이일 확률을 구하여라.
<풀이>
• 작업완료 시간에 대한 모집단 정규분포의 평균이 , 표준 편차가 임으로 표본평균 분포의 평균 은 과 표준 오차 인 정규분포를 따른다 . 의 z값은
. 이고, 의 z값은
이다. 따라서 이다.