• 검색 결과가 없습니다.

표본분포이론 제 9장

N/A
N/A
Protected

Academic year: 2022

Share "표본분포이론 제 9장"

Copied!
28
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

표본분포이론 제 9장

(2)

<학습목표, 내용>

추측통계학에서 표본분포이론의 필요성 및 역할에 대해 학습한다.

1. t-분포

2. 표본비율에 대한 표본분포

(3)

앞에서

1단계 :

⇒ 모집단분포가 정규분포를 따를 때, 표

본평균의 분포도 정규분포를 따른다는 사실로 부터 정규모집단 에서 크기 n 인 표본의 표본평균 는 정규분포 을 한다.

2단계 :

이 때, 표본평균 를 표준화시킨 표준화확률변 는 표준정규분포 N(0,1) 을 한다.

임을 학습하였다.

) ,

(  

2

N

x

x

(4)

t-분포

그러나 모집단 표준편차가 미지이면 표본평 균의 표준화를 할 수 없다.

실제 응용문제에서는 모집단 표준편차를 모 르고 있는 경우가 대부분이고 표본표준편차

를 미지의 모수인 의 추정값으로 사용한 다.

s

(5)

t-통계량

• 따라서 표본평균의 표준화변량 은 표준 정규분포를 따를지 않는다. 따라서 를

로 대입하여 얻게되는 새로운 확률변수

• 가 어떤 분포를 따르는지 알아야 한다. 이 통계량을 t-통계량이라 한다.

n s

x /

s

n s

t x

/

 

(6)

t-통계량

2) t-통계량에 대한 표본분포

① t-통계량에 대한 표본분포는 표준정규분포와 유사하다.

② 두 분포 모두 종모양의 분포이며 평균이 0이고 이 평균에 대칭인 분포이다.

③ t-분포는 표준정규분포보다 변동이 크다.

④ z통계량에서는 만이 표본에 따라 변하는 변수이지만,

⇒ t-통계량의 경우에는 와 s 두 개의 변수가 표본에 따라 값 이 변하는 변수이다.

⑤ 정확한 t-분포는 자유도(degrees of freedom(df))이라는 단 일 모수에 의해 완전히 설명된다.

⇒ 표본크기 n 인 표본은 자유도가 이 된다.

x

x

1

 n df

(7)

<NOTE>

t-분포는 일반적으로 다음과 같은 성질을 갖고 있다.

① 평균은 이다

② 평균에 대해 대칭이다.

③ 표준정규분포보다 변동이 더 크다.

④ 종 모양의 분포이다.

⑤ t-분포는 자유도 에 의해 분포의 모양이 결 정된다.

⑥ t-분포는 표본크기가 증가할수록 표준정규분포에 가까워지며, n이 30 이상이면 표준정규분포와 거 의 일치한다.

 0

 1

 n

df

(8)

t-분포는 표준정규분포보다 분산이 크므로 표준 정규분포와 비슷하나 표준정규분포보다 양쪽 꼬 리부분이 두텁고 가운데 부분의 높이가 낮다. 다 음은 여러 가지 자유도에 따른 분포의 모양이 <

그림 8.1>에 주어져 있다.

(9)

t-분포표 보기

자유도 n인 t -분포에서 를 만족하 는 상수 을 자유도가 n 인 t-분포의 점이라 하며, 로 표기한다.

자유도 n과 a 의 변화에 따른 의 값은 부 록에 수록되어 있다.

a t

t

P (  )

0

t

0 ) , (n a

t

) , (n a

t

(10)

t-분포표 보기

• <예를 들어> n=15 이고 a=0.05일 때, 이다.

753 .

)

1

05 . 0 , 15

(

t

(11)

예제9

평균이 인 정규모집단으로부터 크기 n=16인 임의표본을 추 출하였다. 만일 표본 표준편차가 s=4 라고 하면

를 구하여라.

<풀이>

t-통계량 값은

따라서

자유도가 임으로 확률분포표에서 자유도를 나타내는 행에서 15 를 찾고, 1.753이 위치한 열의 머리부분을 읽으면 가 된다.

따라서 이다.

) 754 . 21 (XP

15 1

16

1  

 n df

(12)

• 표준정규 확률분포표와는 다르게 t 확률분 포에서는 단지 다섯 개의 꼬리 면적에 대 한 확률만 주어져 있다. 이것이 단점이기 는 하나 후에 가설검정의 응용에서 보면 이 값으로 충분할 것이다.

(13)

표본비율에 대한 표본분포

이항모집단(binomial population)은 모집단 이 두 개의 범주인 성공과 실패로 분류되는 질적자료로 구성된다. 다음 그림은 모집단 이 성공을 a로 실패를 b로 나타낸 것이다.

(14)

표본비율에 대한 표본분포

다음은 이항모집단의 예들이다.

1) 이항모집단

⇒ 임의의 이항모집단은 0과 1로 구성되는 이 항모집단으로 만들 수 있다.

(15)

예제10

예를 들어, 모집단이 a 개의 A와 b 개의 B로 구성되어 있다고 하자.

1단계 : 이 모집단은 a 개의 0과 b 개의 1로 변 환할 수 있다.

2단계 : 0과 1로 분류되는 이항모집단을 가정하 자. 만일 X가 단지 0과 1만을 갖는 확률변수(베 루누이 확률변수)라고 하면, 는 이항모집단 에서 X의 값이 1인 관측치의 개수와 같다.

X

(16)

예제10

3단계 : 예를 들면, 이항모집단에 4개의 A와 6개의 B가 있고, A에 1을 B에 0을 대응시켜 보자.

이항모집단에서 A의 비율 p는 p=4/10이다.

(17)

예제10

4단계 : 0과 1의 모집단에 대한 평균은

이다.

5단계 :

따라서 이항모집단에서 A를 1로 B를 0으로 대응시키 면 모집단에서

① A의 비율은 0과 1의 모집단에서의 평균과 같다.

이다.

② 0과1의 모집단의 분산은 와 같다.

5 2 10

0 0 0 0 0 0 1 1 1

1         

n

x

p

) 1

2

(

p p

o  

(18)

표본비율의 표본분포

• 만일 아주 큰 이항모집단으로부터 크기 n 인 임의표본을 추출하여, 각 표본으로부터 표본비율 를 계산했을 때 표본비율의 모 임을 표본비율의 표본분포(sampling

distribution of sample proportion)이라 한 다.

(19)

예제11

• 두 개의 불량품(D)과 세 개의 양품(G)으로 구성되어 있는 트랜지스터의 모집단에서 크기 3인 순서표본을 비복원 추출한다고 하자. 만일 불량품에 1의 값을 양품에 0의 값을 대응시키면, 모집단은 다음과 같다.

(20)

<풀이>

• 1단계 : 크기 3인 표본을 비복원 추출하면, 모든 가능한 표본은 개이다.

다음 표는 모든 가능한 표본과 불량품에 대 한 표본비율을 나타낸 것이다.

3 10 5 

 

(21)

• 2단계 : 10개의 표본비율에 대한 평균은

이며 이는 모집단에서 불량품의 비율 2/5와 같다.

(22)

3단계 : 다음은 표본비율 의 표본분포 도수 그래프이다.

좌우대칭의 정규분포 모양에 근사함.

이항모집단으로부터 추출된 표본에서 성공의 비율(표본 비율)은 0과 1로 구성된 모집단에서 추출된 표본의 평균 과 같기 때문에 표본평균에 대한 성질을 이용하여 표본 비율의 분포를 구할 수 있다.

(23)

표본비율의 표본분포

① 표본비율의 표본분포는 면 근사적 으로 정규분포를 따른다

② ( 는 0과 1로 구성된 모집단 평균이고 p는 모집단에서 1의 비율이다)

③ ( 는 0과 1로 구성된 모집단 표준편차)

30

n

x

p

p

    

ˆ

x

n

pˆ

  /

   

(24)

표본비율의 표본분포

0과 1로 구성된 모집단의 표준편차는

이므로, 표본비율 의 표준 오차는 이 된다

④ 따라서 표본비율 의 z값(표준화변수) 은 근사적으로 표준정규분포를 따른다.

) 1

(

p p

(25)

예제12

• 대학생의 60%가 흡연을 한다고 한다. 표본 으로 조사된 800명의 학생 중 440명이 흡 연을 한다고 대답하였다. 표본비율의 분포 에서 관측된 표본비율보다 작을 확률은 얼 마인가?

(26)

<풀이>

표본크기가 n=800 이므로 표본비율 의 표 본분포는 근사적으로 정규분포를 한다.

① 표본비율 의 평균은 이고

② 표준오차는 이 된다.

③ 표본으로부터 관측된 표본비율 값은 이며

pˆ  p 0.60

0173 .

800 0 ) 4 . 0 )(

6 . 0 ( )

1 (

ˆ

   

n p p

p

55 . 440 0

ˆ  

p n

(27)

④ z값은 따라서 이다.

89 . 0173 2

. 0

60 . 0 55 . 0 /

) 1 (

ˆ    

 

n p p

p z p

% 9 . 1 0019

. 0 4981

. 0 5

. 0 )

89 . 2 (

) 55 . ˆ 0

(

p

P Z

P

(28)

<퀴즈>

1. t-분포의 성질에 대해 말하여라.

2. 표본비율에 대한 표본분포에 대해 말하여 라.

참조

관련 문서

- 하이포이드 기어는 스파이럴 베벨 기어와 비슷하나 맞물린 두 기어의 회전축이 교차하지 않을

[r]

확대관과 같이 반송속도가 저하하는 부분의 전/후에 속도압 감소의 일부는 압력 손실로 되고, 나머지는 정압의 회복이 된다.. 축소관과 같이 반송속도가 증가하는

③ 한 이동통신회사의 통계자료에 의하면 과거 고객들의 평균 통화시간은 2분 30초였다. 그런데 이 통신회사는 통화요금을 인하하면 고객들의 평균 통화시 간이

이산적

표본의 크기 n이 크면, 평균 μ, 표준편차 σ인 모집단 에서의 확률표본에 대하여 의 분포는 평균 μ이고 표준편차 인 정규분포와 근사하게 된다..

3주기 후에 고장이 스스로 제 거되었으며, 계전기 오작동으로 모든 차단기가 닫힌 상태에 있다.. 이런 경우 안정 여부를 판단

⑦ 표본평균과 같은 통계량의 값은 표본에 따라 값이 변하므로 통계량은 확률변수(random variable)가 되며, 표본통계량의 분포를 표본분포(sampling distributions)라