표본확률분포
(Sampling Probability Distribution)
2
표본확률분포와 표본평균의 확률분포
• 표본(확률)분포: 모집단에서 일정크기의 모든 가 능한 표본들을 추출하였을 때 그 모든 표본들로 부 터 계산된 통계량의 확률분포이다
- 표본평균의 표본분포: 일정한 크기의 모든 가능한 표본에서 계산된 모든 표본평균들의 확률분포이다
•표본분포를 파악하기 위해 확률의 법칙과 기대값
과 분산에 대한 법칙들을 이용한다
x 1 2 3 4 5 6 P(x) 1/6 1/6 1/6 1/6 1/6 1/6
확률변수의 확률분포
•
주사위 1개 던지기를 무한하게 많이 반복하였을 때 나온 숫 자들을 확률변수(X)로 정의한다: 모집단{1….1,2…..2,….,6….6}
- 확률변수 (X)의 확률분포(균일 분포)
-
확률변수(X)의 평균(기대값)과 분산, 표준편차는,4
표본평균의 표본분포
• 모집단으로 부터 표본크기 (n= 2)인 표본을 추출하였을 때 [주사위 2개를 던지는 실 험을 하였을 경우], 각 표본의 평균을 구하면,
- 총 36개의 표본크기가 2인 모든 표본들로부터 모두 11개의 표본평균( ) 을 구하였고 이들 중 몇가지 평균값들은 다른 값들보다 빈번하게 발생하였다
표본평균의 표본분포
•이를 토대로 표본평균( )의 표본분포를 도출하면
1.0 1/36
1.5 2/36
2.0 3/36
2.5 4/36
3.0 5/36
3.5 6/36
4.0 5/36
4.5 4/36
5.0 3/36
5.5 2/36
6.0 1/36
P( )
1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5 6.0
6/36 5/36 4/36 3/36 2/36 1/36
P( )
6
확률변수의 확률분포와 표본평균의 표본분포
• 확률변수(X)의 확률분포
… 표본평균( )의 표본분포
두 확률분포간의 관계:
1 2 3 4 5 6 1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5 6.0
표본평균의 평균과 분산, 표준편차
• 만일 n개의 주사위를 던졌다고 가정한다면 [표본크기=n], 표본평균의 평균과 분산값은,
-
표본평균의 표준편차( 표준오차 :Standard Error)
8
표본평균의 평균과 분산, 표준편차:증명
) 1 (
) .
. . 1 (
1 ) ( )
(
, )
( ,
) (
, :
n n
X X
n E n X
E X
E
X Var X
E n
n i
i
i
표본크기
i2 2 1 2
1
)]
( .
. . ) (
1 [
) .
. . 1 (
)]
. . . 1 (
[ )
(
n
X Var X
n Var
X X
n Var
X n X
Var X
Var
n n
i
n i
표본평균의 표본분포
10
표본평균의 표본분포
• 모집단의 평균(μ)과 분산(δ
2
)을 알고 정규분포를 따르면, 표본 평균( )은 표본크기에 관계없이 항상 정규분포를 따른다: ~ N(μ, δ
2
/n)•중심극한이론(Central Limit Theorem): 정규분포가 아닌 모집 단(μ, δ
2
) 에서 추출된 임의의 표본에서 표본크기(n)가 충분히 크다면(n>30), 표본평균의 표본분포는 근접하게 정규분포 특성 을 갖는다 ~ N(μ, δ
2
/n)- 표본의 크기(n)가 클수록, 표본평균의 표본분포는 정규분포에 더 근접하게 된다
중심극한이론(Central Limit Theorem:CLT)
12
표본평균의 표본분포: 응용
표본평균의 표본분포: 응용
•
표본평균이 정규분포를 따르면 표본평균이 특정구간 내에 있을 확률산 출과 추정과정에 이용할 수 있다-표준화 과정:
~ N(0,1)
- 확률산출: 표준화 과정과 표준정규분포를 이용하여 산출
- 추정과정:표본평균이 특정구간 내에 포함될 확률이100(1-α)%의 확률 일 경우 구간의 값 추정
n /
Z X
z X z ) 1
(
P
14
표본평균의 표본분포: 확률산출의 예시(1)
• 정규분포를 따르는 모집단의 평균,
µ = 800
, 표준편차,σ = 100일 때, 표본크기, n = 25인 표본을 추출하여 표본평균을 구하였을때 표본평균이 특정구간(748.5, 851.5)에 포함될 확률을 구하시오.~ N(800, 100 2 /25)
) 575 .
2 575
. 2
( Z P
9902 .
0 4963
. 0 2
) 58 .
2 0
(
2 P Z
] 25 )
/ 100
) 800 5
. 851 (
25 /
100
) 800 5
. 748 [ (
/
n
Z
XP
] ) 5 . 851 5
. 748
[ X
P
표본평균의 표본분포: 확률산출의 예시(2)
• 확률분포 특성을 모르는 모집단의 평균,
µ = 800
, 표준편차,σ = 100일때, 표본크기, n = 100인 표본을 추출하여 표본평균을 구하 였을때 표본평균이 특정구간(790.5, 810.5)에 포함될 확률을 구하 시오~ N(800, 100 2 /100): CLT 에 의거
] ) 5 . 810 5
. 790
[ X
P
] ) ) 800 5
. 810 (
) 800 5
. 790 [ (
/
n
Z
XP
16
표본평균의 표본분포: 모집단의 분산(표준편차)를 모를 경우
• 만일 모집단이 정규분포를 따르나. 분산(표준편차)을 모를 경 우, 표본평균은 정규분포를 따르나. 표준화 변수는 (n-1)의 자유도를 가진 t-분포를 따르게 된다
• 표본평균이 특정구간 내에 있을 확률산출과 추정과정을 위해 t-분포를 이용해야 한다
표준화 과정: 모집단의 표준편차(σ) 대신 표본의 분산(s)를 이용한다
~ t(n-1)
n s
t X
표본평균의 표본분포: 확률산출의 예시(4)
• 정규분포를 가지고 평균
µ = 800
인 모집단에서 표본크기, n = 25, 표본표준편 차, s =100인 표본을 추출하여 표본평균을 구하였을때 표본평균이 특정구간(748.5, 851.5)에 포함될 확률은?
~ N(800,100
2
/25)~ t(24)
] ) 25
/ 100
) 800 5
. 851 (
25 /
100
) 800 5
. 748 [ (
/
n s
t
XP
] ) 5 . 851 5
. 748
[ X
P
n s
t X
18
표본분산의 표본분포
확률분포, 표본분포 그리고 통계적 추정
• 모집단의 분포특성과 모수값(모평균, 모분산, 모표준편차)에 대 한 정보를 이용하여 모집단의 개별 확률변수들의 확률 분포
(probability distribution)를 파악할 수 있다.
•모집단의 분포특성과 모수값(모평균, 모분산, 모표준편차)에 대 한 정보를 이용하여 표본의 통계량(표본평균, 표본분산)의 표본분 포(sampling distribution)를 파악할 수 있다.
통계량
)
(
&
) (
Parameter Population 모수
모집단
표본분포(Sampling distributi on
)20
확률분포, 표본분포 그리고 통계적 추정
•
통계적 추정(statistical inference)과정은 이전의 과정을 거꾸로 실행함으로써 이루어진다•모집단의 모수나 분포특성에 대한 정보가 없다고 가정을 하고, 표본자료를 이용하여 표본의 통계량(표본평균, 표본분산)을 산출 하여 이들의 표본분포를 이용하여 모집단의 모수들에 대한 추정 을 한다
표본의 통계량 모집단의 모수
표본분포
확률분포, 표본분포 그리고 통계적 추정
연습문제
• 한 공장에서 새롭게 개발한 형광등은 평균수명이 1200시간이고 표준편차가 400시시간이라고 한다.
모집단이 정규분포를 따르고 한 전자상가에 임의로 9개의 형광등이 공급된다고 하자.
1) 표본 평균수명의 표본분포에서 평균수명시간은?
2) 표본 평균수명의 분산은?
3) 9개의 표본 형광등이 1050시간 보다 짧을 확률은?
22