표본분포이론 제 9장
<학습목표, 내용>
• 추측통계학에서 표본분포이론의 필요성 및 역할에 대해 학습한다.
1. t-분포
2. 표본비율에 대한 표본분포
앞에서
1단계 :
⇒ 모집단분포가 정규분포를 따를 때, 표
본평균의 분포도 정규분포를 따른다는 사실로 부터 정규모집단 에서 크기 n 인 표본의 표본평균 는 정규분포 을 한다.
2단계 :
이 때, 표본평균 를 표준화시킨 표준화확률변 수 는 표준정규분포 N(0,1) 을 한다.
임을 학습하였다.
) ,
(
2N
x
x
t-분포
그러나 모집단 표준편차가 미지이면 표본평 균의 표준화를 할 수 없다.
실제 응용문제에서는 모집단 표준편차를 모 르고 있는 경우가 대부분이고 표본표준편차
를 미지의 모수인 의 추정값으로 사용한 다.
s
t-통계량
• 따라서 표본평균의 표준화변량 은 표준 정규분포를 따를지 않는다. 따라서 를
로 대입하여 얻게되는 새로운 확률변수
• 가 어떤 분포를 따르는지 알아야 한다. 이 통계량을 t-통계량이라 한다.
n s
x /
s
n s
t x
/
t-통계량
2) t-통계량에 대한 표본분포
① t-통계량에 대한 표본분포는 표준정규분포와 유사하다.
② 두 분포 모두 종모양의 분포이며 평균이 0이고 이 평균에 대칭인 분포이다.
③ t-분포는 표준정규분포보다 변동이 크다.
④ z통계량에서는 만이 표본에 따라 변하는 변수이지만,
⇒ t-통계량의 경우에는 와 s 두 개의 변수가 표본에 따라 값 이 변하는 변수이다.
⑤ 정확한 t-분포는 자유도(degrees of freedom(df))이라는 단 일 모수에 의해 완전히 설명된다.
⇒ 표본크기 n 인 표본은 자유도가 이 된다.
x
x
1
n df
<NOTE>
t-분포는 일반적으로 다음과 같은 성질을 갖고 있다.
① 평균은 이다
② 평균에 대해 대칭이다.
③ 표준정규분포보다 변동이 더 크다.
④ 종 모양의 분포이다.
⑤ t-분포는 자유도 에 의해 분포의 모양이 결 정된다.
⑥ t-분포는 표본크기가 증가할수록 표준정규분포에 가까워지며, n이 30 이상이면 표준정규분포와 거 의 일치한다.
0
1
n
df
• t-분포는 표준정규분포보다 분산이 크므로 표준 정규분포와 비슷하나 표준정규분포보다 양쪽 꼬 리부분이 두텁고 가운데 부분의 높이가 낮다. 다 음은 여러 가지 자유도에 따른 분포의 모양이 <
그림 8.1>에 주어져 있다.
t-분포표 보기
자유도 n인 t -분포에서 를 만족하 는 상수 을 자유도가 n 인 t-분포의 점이라 하며, 로 표기한다.
자유도 n과 a 의 변화에 따른 의 값은 부 록에 수록되어 있다.
a t
t
P ( )
0
t
0 ) , (n at
) , (n a
t
t-분포표 보기
• <예를 들어> n=15 이고 a=0.05일 때, 이다.
753 .
)
1
05 . 0 , 15
(
t
예제9
• 평균이 인 정규모집단으로부터 크기 n=16인 임의표본을 추 출하였다. 만일 표본 표준편차가 s=4 라고 하면
를 구하여라.
<풀이>
• t-통계량 값은
• 따라서
자유도가 임으로 확률분포표에서 자유도를 나타내는 행에서 15 를 찾고, 1.753이 위치한 열의 머리부분을 읽으면 가 된다.
따라서 이다.
) 754 . 21 (X P
15 1
16
1
n df
• 표준정규 확률분포표와는 다르게 t 확률분 포에서는 단지 다섯 개의 꼬리 면적에 대 한 확률만 주어져 있다. 이것이 단점이기 는 하나 후에 가설검정의 응용에서 보면 이 값으로 충분할 것이다.
표본비율에 대한 표본분포
이항모집단(binomial population)은 모집단 이 두 개의 범주인 성공과 실패로 분류되는 질적자료로 구성된다. 다음 그림은 모집단 이 성공을 a로 실패를 b로 나타낸 것이다.
표본비율에 대한 표본분포
• 다음은 이항모집단의 예들이다.
1) 이항모집단
⇒ 임의의 이항모집단은 0과 1로 구성되는 이 항모집단으로 만들 수 있다.
예제10
• 예를 들어, 모집단이 a 개의 A와 b 개의 B로 구성되어 있다고 하자.
1단계 : 이 모집단은 a 개의 0과 b 개의 1로 변 환할 수 있다.
2단계 : 0과 1로 분류되는 이항모집단을 가정하 자. 만일 X가 단지 0과 1만을 갖는 확률변수(베 루누이 확률변수)라고 하면, 는 이항모집단 에서 X의 값이 1인 관측치의 개수와 같다.
X
예제10
3단계 : 예를 들면, 이항모집단에 4개의 A와 6개의 B가 있고, A에 1을 B에 0을 대응시켜 보자.
이항모집단에서 A의 비율 p는 p=4/10이다.
예제10
4단계 : 0과 1의 모집단에 대한 평균은
이다.
5단계 :
따라서 이항모집단에서 A를 1로 B를 0으로 대응시키 면 모집단에서
① A의 비율은 0과 1의 모집단에서의 평균과 같다.
즉 이다.
② 0과1의 모집단의 분산은 와 같다.
5 2 10
0 0 0 0 0 0 1 1 1
1
n
x
p
) 1
2
(
p p
o
표본비율의 표본분포
• 만일 아주 큰 이항모집단으로부터 크기 n 인 임의표본을 추출하여, 각 표본으로부터 표본비율 를 계산했을 때 표본비율의 모 임을 표본비율의 표본분포(sampling
distribution of sample proportion)이라 한 다.
pˆ
예제11
• 두 개의 불량품(D)과 세 개의 양품(G)으로 구성되어 있는 트랜지스터의 모집단에서 크기 3인 순서표본을 비복원 추출한다고 하자. 만일 불량품에 1의 값을 양품에 0의 값을 대응시키면, 모집단은 다음과 같다.
<풀이>
• 1단계 : 크기 3인 표본을 비복원 추출하면, 모든 가능한 표본은 개이다.
다음 표는 모든 가능한 표본과 불량품에 대 한 표본비율을 나타낸 것이다.
3 10 5
• 2단계 : 10개의 표본비율에 대한 평균은
이며 이는 모집단에서 불량품의 비율 2/5와 같다.
• 3단계 : 다음은 표본비율 의 표본분포 도수 그래프이다.
좌우대칭의 정규분포 모양에 근사함.
이항모집단으로부터 추출된 표본에서 성공의 비율(표본 비율)은 0과 1로 구성된 모집단에서 추출된 표본의 평균 과 같기 때문에 표본평균에 대한 성질을 이용하여 표본 비율의 분포를 구할 수 있다.
표본비율의 표본분포
① 표본비율의 표본분포는 면 근사적 으로 정규분포를 따른다
② ( 는 0과 1로 구성된 모집단 평균이고 p는 모집단에서 1의 비율이다)
③ ( 는 0과 1로 구성된 모집단 표준편차)
30
n
x
p
p
ˆ
x
n
pˆ
/
표본비율의 표본분포
0과 1로 구성된 모집단의 표준편차는
이므로, 표본비율 의 표준 오차는 이 된다
④ 따라서 표본비율 의 z값(표준화변수) 은 근사적으로 표준정규분포를 따른다.
) 1
(
p p
pˆ
pˆ
예제12
• 대학생의 60%가 흡연을 한다고 한다. 표본 으로 조사된 800명의 학생 중 440명이 흡 연을 한다고 대답하였다. 표본비율의 분포 에서 관측된 표본비율보다 작을 확률은 얼 마인가?
<풀이>
표본크기가 n=800 이므로 표본비율 의 표 본분포는 근사적으로 정규분포를 한다.
① 표본비율 의 평균은 이고
② 표준오차는 이 된다.
③ 표본으로부터 관측된 표본비율 값은 이며
pˆ
pˆ
pˆ p 0.600173 .
800 0 ) 4 . 0 )(
6 . 0 ( )
1 (
ˆ
n p p
p55 . 440 0
ˆ
p n
④ z값은 따라서 이다.
89 . 0173 2
. 0
60 . 0 55 . 0 /
) 1 (
ˆ
n p p
p z p
% 9 . 1 0019
. 0 4981
. 0 5
. 0 )
89 . 2 (
) 55 . ˆ 0
(
p
P Z
P
<퀴즈>
1. t-분포의 성질에 대해 말하여라.
2. 표본비율에 대한 표본분포에 대해 말하여 라.