• 검색 결과가 없습니다.

표본확률분포

N/A
N/A
Protected

Academic year: 2022

Share "표본확률분포"

Copied!
22
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

표본확률분포

(Sampling Probability Distribution)

(2)

2

표본확률분포와 표본평균의 확률분포

• 표본(확률)분포: 모집단에서 일정크기의 모든 가 능한 표본들을 추출하였을 때 그 모든 표본들로 부 터 계산된 통계량의 확률분포이다

- 표본평균의 표본분포: 일정한 크기의 모든 가능한 표본에서 계산된 모든 표본평균들의 확률분포이다

•표본분포를 파악하기 위해 확률의 법칙과 기대값

과 분산에 대한 법칙들을 이용한다

(3)

x 1 2 3 4 5 6 P(x) 1/6 1/6 1/6 1/6 1/6 1/6

확률변수의 확률분포

주사위 1개 던지기를 무한하게 많이 반복하였을 때 나온 숫 자들을 확률변수(X)로 정의한다:

 모집단{1….1,2…..2,….,6….6}

- 확률변수 (X)의 확률분포(균일 분포)

-

확률변수(X)의 평균(기대값)과 분산, 표준편차는,

(4)

4

표본평균의 표본분포

모집단으로 부터 표본크기 (n= 2)인 표본을 추출하였을 때 [주사위 2개를 던지는 실 험을 하였을 경우], 각 표본의 평균을 구하면,

- 총 36개의 표본크기가 2인 모든 표본들로부터 모두 11개의 표본평균( ) 을 구하였고 이들 중 몇가지 평균값들은 다른 값들보다 빈번하게 발생하였다

(5)

표본평균의 표본분포

•이를 토대로 표본평균( )의 표본분포를 도출하면

1.0 1/36

1.5 2/36

2.0 3/36

2.5 4/36

3.0 5/36

3.5 6/36

4.0 5/36

4.5 4/36

5.0 3/36

5.5 2/36

6.0 1/36

P( )

1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5 6.0

6/36 5/36 4/36 3/36 2/36 1/36

P( )

(6)

6

확률변수의 확률분포와 표본평균의 표본분포

• 확률변수(X)의 확률분포

… 표본평균( )의 표본분포

 두 확률분포간의 관계:

1 2 3 4 5 6 1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5 6.0

(7)

표본평균의 평균과 분산, 표준편차

• 만일 n개의 주사위를 던졌다고 가정한다면 [표본크기=n], 표본평균의 평균과 분산값은,

-

표본평균의 표준편차( 표준오차 :Standard Error)

(8)

8

표본평균의 평균과 분산, 표준편차:증명

) 1 (

) .

. . 1 (

1 ) ( )

(

, )

( ,

) (

, :

n n

X X

n E n X

E X

E

X Var X

E n

n i

i

i

표본크기

i

2 2 1 2

1

)]

( .

. . ) (

1 [

) .

. . 1 (

)]

. . . 1 (

[ )

(

n

X Var X

n Var

X X

n Var

X n X

Var X

Var

n n

i

n i

(9)

표본평균의 표본분포

(10)

10

표본평균의 표본분포

모집단의 평균(μ)과 분산(δ

2

)을 알고 정규분포를 따르면, 표본 평균( )은 표본크기에 관계없이 항상 정규분포를 따른다:

 ~ N(μ, δ

2

/n)

•중심극한이론(Central Limit Theorem): 정규분포가 아닌 모집 단(μ, δ

2

) 에서 추출된 임의의 표본에서 표본크기(n)가 충분히 크다면(n>30), 표본평균의 표본분포는 근접하게 정규분포 특성 을 갖는다

 ~ N(μ, δ

2

/n)

- 표본의 크기(n)가 클수록, 표본평균의 표본분포는 정규분포에 더 근접하게 된다

(11)

중심극한이론(Central Limit Theorem:CLT)

(12)

12

표본평균의 표본분포: 응용

(13)

표본평균의 표본분포: 응용

표본평균이 정규분포를 따르면 표본평균이 특정구간 내에 있을 확률산 출과 추정과정에 이용할 수 있다

-표준화 과정:

~ N(0,1)

- 확률산출: 표준화 과정과 표준정규분포를 이용하여 산출

- 추정과정:표본평균이 특정구간 내에 포함될 확률이100(1-α)%의 확률 일 경우 구간의 값 추정

n /

Z X

 

 

 

 z X z ) 1

(

P

(14)

14

표본평균의 표본분포: 확률산출의 예시(1)

• 정규분포를 따르는 모집단의 평균,

µ = 800

, 표준편차,σ = 100일 때, 표본크기, n = 25인 표본을 추출하여 표본평균을 구하였을때 표본평균이 특정구간(748.5, 851.5)에 포함될 확률을 구하시오.

~ N(800, 100 2 /25)

) 575 .

2 575

. 2

(   ZP

9902 .

0 4963

. 0 2

) 58 .

2 0

(

2  PZ    

] 25 )

/ 100

) 800 5

. 851 (

25 /

100

) 800 5

. 748 [ (

/

 

 

n

Z

X

P

] ) 5 . 851 5

. 748

[  X

P

(15)

표본평균의 표본분포: 확률산출의 예시(2)

• 확률분포 특성을 모르는 모집단의 평균,

µ = 800

, 표준편차,σ = 100일때, 표본크기, n = 100인 표본을 추출하여 표본평균을 구하 였을때 표본평균이 특정구간(790.5, 810.5)에 포함될 확률을 구하 시오

~ N(800, 100 2 /100): CLT 에 의거

] ) 5 . 810 5

. 790

[  X

P

] ) ) 800 5

. 810 (

) 800 5

. 790 [ (

/

 

 

n

Z

X

P

(16)

16

표본평균의 표본분포: 모집단의 분산(표준편차)를 모를 경우

• 만일 모집단이 정규분포를 따르나. 분산(표준편차)을 모를 경 우, 표본평균은 정규분포를 따르나. 표준화 변수는 (n-1)의 자유도를 가진 t-분포를 따르게 된다

• 표본평균이 특정구간 내에 있을 확률산출과 추정과정을 위해 t-분포를 이용해야 한다

 표준화 과정: 모집단의 표준편차(σ) 대신 표본의 분산(s)를 이용한다

 ~ t(n-1)

n s

t X

(17)

표본평균의 표본분포: 확률산출의 예시(4)

정규분포를 가지고 평균

µ = 800

인 모집단에서 표본크기, n = 25, 표본표준편 차, s =100인 표본을 추출하여 표본평균을 구하였을때 표본평균이 특정구간

(748.5, 851.5)에 포함될 확률은?

 ~ N(800,100

2

/25)

~ t(24)

] ) 25

/ 100

) 800 5

. 851 (

25 /

100

) 800 5

. 748 [ (

/

 

 

n s

t

X

P

] ) 5 . 851 5

. 748

[  X

P

n s

t X

(18)

18

표본분산의 표본분포

(19)

확률분포, 표본분포 그리고 통계적 추정

• 모집단의 분포특성과 모수값(모평균, 모분산, 모표준편차)에 대 한 정보를 이용하여 모집단의 개별 확률변수들의 확률 분포

(probability distribution)를 파악할 수 있다.

•모집단의 분포특성과 모수값(모평균, 모분산, 모표준편차)에 대 한 정보를 이용하여 표본의 통계량(표본평균, 표본분산)의 표본분 포(sampling distribution)를 파악할 수 있다.

통계량

)

(

&

) (

Parameter Population 모수

모집단

표본분포(

Sampling distributi on

)

(20)

20

확률분포, 표본분포 그리고 통계적 추정

통계적 추정(statistical inference)과정은 이전의 과정을 거꾸로 실행함으로써 이루어진다

•모집단의 모수나 분포특성에 대한 정보가 없다고 가정을 하고, 표본자료를 이용하여 표본의 통계량(표본평균, 표본분산)을 산출 하여 이들의 표본분포를 이용하여 모집단의 모수들에 대한 추정 을 한다

표본의 통계량 모집단의 모수

표본분포

(21)

확률분포, 표본분포 그리고 통계적 추정

(22)

연습문제

• 한 공장에서 새롭게 개발한 형광등은 평균수명이 1200시간이고 표준편차가 400시시간이라고 한다.

모집단이 정규분포를 따르고 한 전자상가에 임의로 9개의 형광등이 공급된다고 하자.

1) 표본 평균수명의 표본분포에서 평균수명시간은?

2) 표본 평균수명의 분산은?

3) 9개의 표본 형광등이 1050시간 보다 짧을 확률은?

22

참조

관련 문서

※ 모집단의 특성과 표본조사의 효율성을 고려하여, 연간거래액이 24백만원 이상인 온라인쇼핑 운영업체를

– 방향 정보는 축에 대한 각속도 값을 이용하여 계산 – 소스가 불필요하여 사용 장소에 따른

○ 장래교통수요예측을 위한 일련의 과정 수행 후 대안별로 도출한 장래수요예측 결과를 이용하여 일일 및 연간 운영수익금을

또한, 양자기 설계 알고리즘의 시스템 설계 복잡도를 감소하기 위해 고유 시퀀스와 노드 간의 거리를 이용하여 표본의 수를 절감하였고, 절감된 표본을 이용하여 코드

모분산이 알려진 경우와 모르는 경우에 대한 모평균의 구간 추정과 두 모집단의 평균의 차에 대한 구간추정하는 방법에 대하여 알아본다. 모분산이 알려진 경우와

적절한 표본추출 방법을 사용하면 , 표본의 결과는 모집단 특성에 대한 좋은 추정치를 제공할 수 있다.. 적절한 표본추출 방법을 사용하면 , 표본의 결과는 모집단

모집단의 분포에 대한 가정을 필요로 하지 않으며 질적 자료 혹은 비연속형의 수량적 자료를 분석할

정규분포를 이루지만 모집단의 분산을 모르는 경우 표본의 크기 가 작을 때에는 t 검정을 이용하여 두 표본 평균간의 차에 대한 유 의성을 검정.. 서로