표본통계량의 분포
t 분포
자유도
( 관심의 대상 전체 )
모집단
표본통계량 (Sample Statistics)?
표본에서 구한 값
예 > 표본평균 , 표본분산 , 표본 비율
표본 � =´
∑
���
�
∑ (¿ ¿ � − ´� )2
� − 1
�2=¿
�= � ^
� = 성공 횟 수 시 행횟 수
�1, �2,⋯, ��
확률변수 확률분포
표본평균의 분포 ?
중심극한정리에서 배운 것
표본평균은 정규분포에 근사 (n 이 30 이상 )
즉
그런데 σ 대신 S 를 사용하면 분포가 어떻게 변하는가
� =´
∑
���
�
∑ (¿ ¿ � − � )´ 2
� − 1
�2=¿
) 1 , 0 / N (
n
X
? / 어떤 분포
n S
X
σ 대신 s 를 사 용한
표준화 변수는
t 분포를 따른다
Student’s t distribution
이 에서 뽑은 확률표본일 때
자유도
� −� ´
� / √ �
�(�−1)
d.f.
degree of freedom
위키백과의 t- 분포
The derivation of the t-distribution was first published at 1908 in Biometrika by William Sealy Gosset, while he worked at a Guinness Brewery in Dublin.
He was prohibited from publishing under his own name, so the paper was written under the pseudonym Student.
The t-test and the associated theory became well-known through the work of R.A. Fisher, who called the distribution
"Student's distribution".
t- 분포의 모양은 어떻게 생겼을까 ?
´� −�
� / √ � � (0,1)
� −� ´
� / √ � �(�− 1)
1
�
0 1 2 3
−3 −2 −1
상수
변수
표본의 개수에 따라 분포의 모양이 다르다
-5 -4 -3 -2 -1 0 1 2 3 4 5
자유도에 따른 t 분포
k=inf nity k=10 k=5 k=2 k=1
표본의 크기에 따라 어떻게 생겼을까 ?
k 는 자유도 (degree of freedom)
표준정규분포와 표본수가 커지면 비슷…
점점 같아지네
� −� ´
� / √ � �(�− 1)
� −� ´
� / √ � � (0,1)
자유도 (degree of freedom)
자유도 = 자유로운 표본의 개수
이론적 정의 = 추정값을 구하는데 사용된 정보의 개수
σ2 를 추정하기 위해 에 사용된 정보의 개수
표본이 이면 자유로운 표본의 개수는 ?
n? NO! n-1.
계산식에 표본평균이 포함 . 표본평균을 맞춰주기 위해 자유도 하나 를 잃음
예 : 홍길동 4 과목 평균 =90, 국영수는 차례로 90,91,92 사회과목 점수는 ?
87
요 약
표본평균을 S 로 표준화해준 변수가 t 분포를 따름
이때 t 분포의 자유도 (d.f.) 는 n-1
표본이 이지만 표본평균을 맞춰주기 위해 자유로운 표본의 개수는 n-1.
어려운 표현
른표현 1> 이므로 자유도 1 을 잃음
다른표현 2> 표본의 개수에서 제약식의 수를 빼주므로 자유도는 n- 1.
� −� ´
� / √ � �(�− 1)
책 뒤의 t 분포
표 보는 법
390 쪽
자유도에 따라 표가 준비
특정 확률에 대해서만 표시하기 때문에 백분위수만 구할 수 있 다
【예제 3.14 】
교재의 부록에 있는 t 분포표를 이용 하여 , 변수 t 가 자유도 15 인 t 분포 를 따를 때 상위 2.5% 백분위수를 구 하시오 .
2.131
• 엑셀에서 t 분포의 확률계 산
T.DIST 함수
좌측 누적 확률
T.DIST.RT
우측 꼬리 확률
T.DIST.2T
양측 꼬리 확률
2.131
2.131
2.131 -2.131
t(15)
통계학교재의 분포표로는 일
부 확률만 구 할 수 있지만
엑셀에서는
모든 값에 대한 확률을 다 구할 수 있다 .
즉 Pr(T≥2)= 단 , T~t(10)
표에서는 못 구하지만 엑셀에서 는
=T.DIST.RT(2,10)
t 분포의 상위 백분위수
�(� ,�)
�
�(�)
t(0.025, 10):
= T.INV(0.975, 10)
표본분산의 분포 ?
�
∑(¿ ¿� − ´� )2
� − 1
�2=¿
�
∑ (¿ ¿ � − � )´ 2
� 2 � 2( � − 1) (� − 1 ) �2
� 2 =¿
N(0,1) 에서 뽑은 확률표본일 때
�
12+ �
22+ ⋯+�
�2�
2(�)
�
∑ (¿ ¿ � − �)2
� 2 �2(�)
∴ ¿
교과과정외
표본비율의 분포 ?
�= �^
� =성공횟수 시행횟수
성공횟수의 분포는 ?
즉 , 표본비율의 분
또는
【예제 3.17 】
어떤 정책의 지지도를 추정하기 위해 100 명의 유권자에게 찬반여부를 물 었다 . 그 결과 표본비율 ( 표본지지율 ) 은 0.6 이었다 . 실제로는 지지율 (p) 이 0.5 인데도 , 여론조사가 이와 같이 ‘ 60% 이상 지지’로 나올 확률 은 얼마인가 ?
Pr ( � ≥ 0.6 ^ | �=0.5 ¿ =¿
Pr ( � −� ≥ 0.6 −� ^ | �=0.5 ¿
� − �^
√
� (1 − �)� ≥0.6 −�
√
� ( 1− � )� |�= 0.5)¿ Pr ¿
¿ Pr
(
� ≥√
.6 − .5.5 × .5100)
=Pr ( � ≥ 2)=0.0228
그림으로 풀면
그러므로 표준정규분포에서 2 이상일 확률
0.5
0.05
0.6
수고하셨습니다
9 주차 이론 강의를 마칩니 다