• 검색 결과가 없습니다.

표본통계량의 분포

N/A
N/A
Protected

Academic year: 2022

Share "표본통계량의 분포"

Copied!
19
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

표본통계량의 분포

t 분포

자유도

(2)

( 관심의 대상 전체 )

모집단

표본통계량 (Sample Statistics)?

표본에서 구한 값

예 > 표본평균 , 표본분산 , 표본 비율

표본 � =´

 

(¿ ¿ � − ´� )2

� − 1

2=¿

 

�= � ^

= 성공 횟 수 시 행횟 수

 

1, 2,⋯, �  

확률변수 확률분포

(3)

표본평균의 분포 ?

중심극한정리에서 배운 것

표본평균은 정규분포에 근사 (n 이 30 이상 )

즉

그런데 σ 대신 S 를 사용하면 분포가 어떻게 변하는가

� =´

 

(¿ ¿ � − � )´ 2

� − 1

2=¿

 

) 1 , 0 / N (

n

X  

? /  어떤 분포

n S

X

(4)

σ 대신 s 를 사 용한

표준화 변수는

 t 분포를 따른다

 Student’s t distribution

 이 에서 뽑은 확률표본일 때

자유도

� −� ´

� /

 

�(�−1)

 

d.f.

degree of freedom

(5)

위키백과의 t- 분포

The derivation of the t-distribution was first published at 1908 in Biometrika by William Sealy Gosset, while he worked at a Guinness Brewery in Dublin.

He was prohibited from publishing under his own name, so the paper was written under the pseudonym Student.

The t-test and the associated theory became well-known through the work of R.A. Fisher, who called the distribution

"Student's distribution".

(6)

t- 분포의 모양은 어떻게 생겼을까 ?

´� −�

� / � (0,1)

 

� −� ´

� / �(�− 1)

 

1 

 

0  1  2  3 

−3  −2  −1 

표본의 개수에 따라 분포의 모양이 다르다

(7)

-5 -4 -3 -2 -1 0 1 2 3 4 5

자유도에 따른 t 분포

k=inf nity k=10 k=5 k=2 k=1

표본의 크기에 따라 어떻게 생겼을까 ?

k 는 자유도 (degree of freedom)

표준정규분포와 표본수가 커지면 비슷…

점점 같아지네

� −� ´

� / �(�− 1)

 

� −� ´

� / � (0,1)

 

(8)

자유도 (degree of freedom)

자유도 = 자유로운 표본의 개수

 이론적 정의 = 추정값을 구하는데 사용된 정보의 개수

σ2 를 추정하기 위해 에 사용된 정보의 개수

표본이 이면 자유로운 표본의 개수는 ?

 n? NO! n-1.

 계산식에 표본평균이 포함 . 표본평균을 맞춰주기 위해 자유도 하나 를 잃음

예 : 홍길동 4 과목 평균 =90, 국영수는 차례로 90,91,92 사회과목 점수는 ?

 87

(9)

요 약

표본평균을 S 로 표준화해준 변수가 t 분포를 따름

이때 t 분포의 자유도 (d.f.) 는 n-1

 표본이 이지만 표본평균을 맞춰주기 위해 자유로운 표본의 개수는 n-1.

어려운 표현

 른표현 1> 이므로 자유도 1 을 잃음

 다른표현 2> 표본의 개수에서 제약식의 수를 빼주므로 자유도는 n- 1.

� −� ´

� / �(�− 1)

 

(10)

책 뒤의 t 분포

표 보는 법

390 쪽

자유도에 따라 표가 준비

특정 확률에 대해서만 표시하기 때문에 백분위수만 구할 수 있

(11)

【예제 3.14 】

교재의 부록에 있는 t 분포표를 이용 하여 , 변수 t 가 자유도 15 인 t 분포 를 따를 때 상위 2.5% 백분위수를 구 하시오 .

2.131

(12)

• 엑셀에서 t 분포의 확률계 산

T.DIST 함수

좌측 누적 확률

T.DIST.RT

우측 꼬리 확률

T.DIST.2T

양측 꼬리 확률

2.131

2.131

2.131 -2.131

t(15)

(13)

통계학교재의 분포표로는 일

부 확률만 구 할 수 있지만

엑셀에서는

모든 값에 대한 확률을 다 구할 수 있다 .

즉 Pr(T≥2)= 단 , T~t(10)

표에서는 못 구하지만 엑셀에서 는

=T.DIST.RT(2,10)

(14)

t 분포의 상위 백분위수

 

 

�(� ,�)

 

 

�(�)

 

t(0.025, 10):

= T.INV(0.975, 10)

(15)

표본분산의 분포 ?

(¿ ¿� − ´� )2

� − 1

2=¿

 

(¿ ¿ � − � )´ 2

2 2( � − 1) (� − 1 ) �2

2 =¿

 

N(0,1) 에서 뽑은 확률표본일 때

 

12

+

22

+ ⋯+�

2

2

(�)

 

(¿ ¿ � − �)2

2 2(�)

¿

 

교과과정외

(16)

표본비율의 분포 ?

�= �^

=성공횟수 시행횟수

 

성공횟수의 분포는 ?

 즉 , 표본비율의 분

 또는

 

(17)

【예제 3.17 】

어떤 정책의 지지도를 추정하기 위해 100 명의 유권자에게 찬반여부를 물 었다 . 그 결과 표본비율 ( 표본지지율 ) 은 0.6 이었다 . 실제로는 지지율 (p) 이 0.5 인데도 , 여론조사가 이와 같이 ‘ 60% 이상 지지’로 나올 확률 은 얼마인가 ?

Pr ( � ≥ 0.6 ^ | �=0.5 ¿ =¿

   

Pr ( � −� ≥ 0.6 −� ^ | �=0.5 ¿

� − �^

� (1 − �)

0.6 −

� ( 1− � ) |�= 0.5)

¿ Pr ¿

 

¿ Pr

(

� ≥

.6 − .5.5 × .5100

)

=Pr ( � ≥ 2)=0.0228

 

(18)

그림으로 풀면

그러므로 표준정규분포에서 2 이상일 확률

0.5

0.05

0.6

(19)

수고하셨습니다

9 주차 이론 강의를 마칩니

참조

관련 문서