• 검색 결과가 없습니다.

표본분포이론(2)

N/A
N/A
Protected

Academic year: 2022

Share "표본분포이론(2)"

Copied!
22
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

제 7주차

표본분포이론(2)

(2)

<학습목표>

추측통계학에서 표본분포이론의 필요성 및 역할에 대해 학습 한다.

<학습내용>

1. 표본분포

2. 표본추출

(3)

1. 표본분포

1) 표본분포 학습의 필요성

<note> 표본추출 결과에 대해

① 임의표본은 어떤 것이 추출될지 예측하기 어렵다.

② 즉, 동일한 모집단으로부터 같은 크기의 두 개의 표본을 추출 할 때 비슷하거나 같은 표본평균을 갖는다고 예상할 수 없다.

③ 확률표본으로부터 계산되는 표본평균과 같은 임의의 통계량 은 표본에 따라 그 값이 변한다.

④ 따라서 모든 가능한 통계량 값에 대한 분포의 연구가 필요하 다.

(4)

⑤ 이러한 분포에 대한 정보는 표본을 이용하여 모집단을 추론 하는 추론통계에서 아주 중요하다.

⑥ 이러한 분포를 연구함으로써 미지의 모집단 모수를 추정하는 데 사용되는 표본통계량의 신뢰도를 판단할 수 있다.

⑦ 표본평균과 같은 통계량의 값은 표본에 따라 값이 변하므로 통계량은 확률변수(random variable)가 되며, 표본통계량의 분포를 표본분포(sampling distributions)라 한다.

편의상 모집단을 X, 평균의 표본분포를 로 표시하자. 일반적으 로 통계량의 표본분포는 동일한 크기의 표본으로부터 계산된 모든 가능한 통계량 값의 분포를 나타낸다.

1. 표본분포

X

(5)

⑧ 표본평균의 분포는 모집단 분포가 유한모집단이냐 무한모집단이냐 에 따라 그 분포가 달라지며,

⑨ 모집단이 정규모집단이냐 아니냐에 따라서도 그 분포가 다르게 나 타난다.

⑩ 또한, 모집단으로부터 표본을 복원으로 추출하느냐 비복원으로 추출 하느냐에 따라 표본평균의 분포에 대한 분산의 형태가 달라진다.

1. 표본분포

(6)

도수

0 1

2 1

4 1

6 1

합계 4

1) 표본평균의 분포

예제5

표본평균의 표본분포를 설명하기 위하여 {0, 2, 4, 6}으로 구성된 모 집단으로부터 2개의 표본을 임의로 추출하는 문제를 생각해 보기로 하자. 모집단에 대한 정보를 얻기 위하여 모집단의 도수분포를 표로 나타내면 다음과 같다.

x

<표 8.2> 모집단의 도수분포표

(7)

위의 <표 8.2>로부터 모평균과 모분산을 각각 구해 보면 다음과 같다.

따라서 모표준편차는 이다.

모집단 {0,2,4,6}에서 크기가 2인 임의표본을 복원추출할 경우 가능한 표본과 그 평균을 구해 보면 다음과 같다.

1) 표본평균의 분포

5

4

) 3 6

( )

3 4

( )

3 2

( )

3 0

(

) (

2 2

2 2

2 2

N

x

4 3

6 4 2

0   

 

2 5

(8)

가능한 표본 표본평균 가능한 표본 표본평균

{0,0} 0 {4,0} 2

{0,2} 1 {4,2} 3

{0,4} 2 {4.4} 4

{0,6} 3 {4,6} 5

{2,0} 1 {6,0} 3

{2,4} 3 {6,2} 4

{2,6} 4 {6,4} 5

{2,8} 5 {6,6} 6

1) 표본평균의 분포

위의 표를 이용하여 표본평균의 도수분포를 나타내면 다음과 같다.

(9)

도수

0 1

1 2

2 3

3 4

4 3

5 2

6 1

합계 16

x

1) 표본평균의 분포

표본평균들의 표본분포에 대한 평균은

3 3 48 16

) 1 )(

6 ( ) 2 )(

5 ( ) 3 )(

4 ( ) 4 )(

3 ( ) 3 )(

2 ( ) 2 )(

1 ( ) 1 )(

0 (

) (

 

 

 

f x f

x

(10)

이고 표준편차는 이다.

1) 표본평균의 분포

표본평균들의 표본분포에 대한 분산을 다음 표를 이용하여 계산한다.

0 1 0-3=-3 9 9

1 2 1-3=-2 4 8

2 3 2-3=-1 1 3

3 4 3-3=0 0 0

4 3 4-3=1 1 3

5 2 5-3=2 4 8

6 1 6-3=3 9 9

합계 16 40

x f

x   x ( x   x ) 2 ( x   x ) 2 f

표본평균의 표본분포의 분산은 2,5 16

2 40

n

x

2 1.58

(11)

표본평균 는 모평균 와 그 값이 같지는 않지만 평균적으로 같음을 알 수 있다. 그러므로, 모평균이 인 모집단으로부터 임의표본을 복원 또는 비복원으 로 추출했을 때, 모평균 와 표본평균 사이에는 다음과 같은 관계가 성립된 .

1) 표본평균의 분포

다른 확률변수와 마찬가지로 표본평균의 분포도 평균(기대값), 분산, 표준편차를 갖는다.

x

 

x

x E(x)

(12)

<예제>

이전 시간에 학습했던, <예제 4>의 표본평균에 대한 표본분포의 예에서

1) 각 표본평균에 대한 표본오차 2) 표본오차의 평균

3) 표본오차의 표준편차를 구하여라.

순서표본 표본평균 표본오차

{2,2} 2 2-4=-2

{2,4} 3 3-4=-1

{2,6} 4 4-4=0

{4,2} 3 3-4=-1

{4,4} 4 4-4=0

{4,6} 5 5-4=1

{6,2} 4 4-4=0

{6,4} 5 5-4=1

{6,6} 6 6-4=2

(13)

<풀이>

1) 표본, 표본평균, 표본오차는 다음과 같다.

2)

표본오차의 평균

가능한

표본 표본평균 표본오차 가능한

표본 표본평균 표본오차

{0,0} 0 0-3=-3 {4,0} 2 2-3=-1

{0,2} 1 1-3=-2 {4,2} 3 3-3=0

{0,4} 2 2-3=-1 {4.4} 4 4-3=1

{0,6} 3 3-3=0 {4,6} 5 5-3=2

{2,0} 1 1-3=-2 {6,0} 3 3-3=0

{2,4} 3 3-3=0 {6,2} 4 4-3=1

{2,6} 4 4-3=1 {6,4} 5 5-3=2

{2,8} 5 5-3=2 {6,6} 6 6-3=3

(14)

<풀이>

3) 표본평균의 표본분포의 분산을 다음 표를 이용하여 계산한다.

표준오차분포의 분산은 이고,

표준편차는 이다.

e

-3 1 -3-0=-3 9

-2 2 -2-0=-2 8

-1 3 -1-0=-1 3

0 4 0-0=0 0

1 3 1-0=1 3

2 2 2-0=2 8

3 1 3-0=3 9

합계 16 40

(15)

<note>

• 앞의 예제에서 표본평균의 표준편차와 표본오차의 표본편차 가 1,58로 서로 같다.

⇒ 이러한 이유로 표본평균의 표준편차라는 용어 대신에 표본평 균의 표본오차라고 말한다. 통계량의 표본분포의 표준편차를 통계량의 표준오차(standard error)라 한다.

(16)

2. 정규모집단에서의 표본추출

1) 앞에서

표본평균의 평균은 모평균과 같고, 즉,

표본평균의 분산은 모분산에 자료의 수를 나눈 것과 같다.

즉,

2) 그런데, 표본의 자료가 커지면 이러한 관계를 예로들어 설명 하기 힘들다.

⇒ 따라서, 이를 위해 모집단의 분포에 따라 표본평균의 분포에 대한 다음과 같은 이론들이 개발되어 있다.

많은 통계량의 표본분포는 모집단이 정규분포를 따른다는 가정 에 한다. 만일 모집단 분포가 정규분포일 때 표본평균의 분포 는 어떤 분포를 따를 것인가

) (

X E

X n

Var( )

2

(17)

2) 정규 모집단으로부터의 표본추출

⇒ 만일 정규모집단으로부터 표본크기 n인 임의표본이 추출된다 면 표본평균의 표본분포는 정규분포를 따른다

.

◀ 1단계 :

⇒ 모집단분포가 정규분포를 따를 때, 표본평균의 분포도 정규분 포를 따른다는 사실로부터 정규모집단 에서 크기 n 인 표본의 표본평균 는 정규분포 을 한다.

◀ 2단계 :

⇒ 이 때, 표본평균 를 표준화시킨 표준화 확률변수 는 표준정규분포 을 한다.

(18)

<예제7>

평균이 , 분산이 인 정규모집단으로부터 크기 9인 임의표본을 추출하였다. 표본평균 가 28보다 클 확률은 얼마 인가?

(19)

<풀이>

• 표본평균 는 평균 ,

표준오차 인 정규분

포를 따른다.

의 z값은 이다. 따라서

이다.

(20)

<예제8>

어떤 작업을 완료하는데 걸리는 시간은 평균이 30분 표준편차가 9분인 정규분포를 따른다. 25명의 작업자를 임의로 추출했을 때 평균작업시간이 28분에서 33분 사이일 확률을 구하여라.

(21)

<풀이>

• 작업완료 시간에 대한 모집단 정규분포의 평균이 , 표준 편차가 임으로 표본평균 분포의 평균 은 과 표준 오차 인 정규분포를 따른다 . 의 z값은

. 이고, 의 z값은

이다. 따라서 이다.

(22)

<퀴즈>

1. 표본분포란 무엇을 의미하는가?

2. 정규모집단으로부터 표본크기 n인 임의표본을 추출하여, 얻어진 표본평균의 표본분포가 정규분포를 따르는 예를 찾아 풀어보아라 .

<차시 학습예고>

• t-분포

• 표본비율에 대한 표본분포

참조

관련 문서

• t-분포는 표준정규분포보다 분산이 크므로 표준 정규분포와 비슷하나 표준정규분포보다 양쪽 꼬 리부분이 두텁고 가운데 부분의 높이가 낮다... 이것이 단점이기

모집단의 개체를 찾기 어려울 때 사용하는 방법으로 표본으로 선택된 개체에게 알고 있는 모집단의 다른 개체를 추천하도록 하여 표본의 수를 늘려 나가는 방법..

그런데 물이 위로 뜨면서 혼자 올라오지 않고 시멘트 입자를 끌고 위로 올라오게 되는데, 이것이 블리딩된 물의 아래 쪽에 가라앉게 되며 레이턴스(laitance)라

확률변수 X의 분산과 표준편차를

적절한 표본추출 방법을 사용하면 , 표본의 결과는 모집단 특성에 대한 좋은 추정치를 제공할 수 있다.. 적절한 표본추출 방법을 사용하면 , 표본의 결과는 모집단

양궁선수와

그런데 물이 위로 뜨면서 혼자 올라오지 않고 시멘트 입자를 끌고 위로 올라오게 되는데, 이것이 블리딩된 물의 아래 쪽에 가라앉게 되며 레이턴스(laitance)라

회귀모형에서, 예측하고자 하는 변수를 종속변수(dependent variable)라 하고, 종속변수의 변화를 설명해 주는 변수를 독립변수(independent variable)이라고