• 검색 결과가 없습니다.

Chapter 7. 중요한 확률분포

N/A
N/A
Protected

Academic year: 2022

Share "Chapter 7. 중요한 확률분포"

Copied!
48
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)
(2)

7. 2

이항 분포

(binomial distribution)

 Bernoulli trial

실험의 결과가 두 가지로 나오는 시행 (확률적 실험)

Ex)

동전을 던진다.

시험에 붙느냐 떨어지느냐

애 낳기

일반적으로 두 결과를 성공

(S, 바람직한 결과)

과 실패

(F, 바람직하지 못한 결과)

로 표현

시행은 관심 없다)

(그렇지 않은

(3)

Honggie Kim

이항 실험

 Binomial experiment

(이항 실험)

⑴ 번의 독립 시행

⑵ 매 시행의 결과는 성공 또는 실패

⑶ 성공 확률 p는 매 시행에서 같다

 성공 , 실패 ,

 확률 변수 를 이항 실험에서의 성공 횟수라 하면 의 가능한 값들은

n 번의 독립 베르누이 시행

p

P

(   

 

  )

P

(   

 

  )

q p q

1

} , ,

2 , 1 , 0

{      n

n

X X

(4)

이항 실험

동전을 4번 던지는 실험 p P

(H )

q P

(T )

TTTT T

HTTT HTTH HTHT HTHH HHTT HHTH

HHHT HHHH S

"

, , , , ,

, , ,

2 3 2 3 3 4

3 2 2

2 2 3

2 2 3 3 4

pq q p

q p

q p

q p

q p

q p

p 3

p

q p2

q p2

pq2

p2

pq

p

q

prob

X

= 앞면수

(5)

Honggie Kim

동전을 4번 던지는 확률적 실험

 의 확률분포

) (

)

(

x P X x

p

x

4 3 2 1 0

4 3

2 2

3 4

4 6 4

p

q p

q p pq q

0 4 3

2 2

3 4 0

4 4 3 4 2 4 1 4 0 4

q p

q p

q p

pq q p





















x xq x p

x

p 



4 4 )

(

4 , ,

1 , 0

, x

X

(6)

확 률 변 수

 번의 독립 시행에서 번 성공할 확률

위의 확률 함수를 갖는 확률 분포를 이항분포라

하고, 확률변수 가 를 확률함수로 가지면 이항확률변수라 한다. 이때 로 쓴다

( 이 1인 이항분포를 베르누이 분포라 한다)

n x

x n

F F

x S S

n x

q x p

n x n x

, ,

1 , 0

,





) ,

; (

, , 1 , 0 ,

) (

p n x b

n x

q x p

x n X

P x n x





x n xq p

:  





x

n 가지

확률

X b(x:n, p)

) , (

~

b n p X

n

(7)

Honggie Kim

이 항 분 포

1 )

( 1 ,





nx pxqnx p q n

p q

b p

a





n

x

x n xb x a

n

0

n n

n

n ab b

n b n

n a

a 







1 1

1

1

b n

a ) (

2

2 2ab b

a

)2

(

. a b Note

라 하면

이항전개

(8)

확률 예제

 Ex) 5지 선다형 문제 6개를 모두 짐작으로 답 했을 때, 4개 이상 맞출 확률은?

017 . 0

0 002 .

0 015 .

0 2

. 0 ,

6

p

n 01696

. 0

000064 .

0 001536 .

0 01536 .

0

6 1

5 2

4 0.8 6 0.2 0.8 0.2 2

. 0

15





26 . 0

0 6

1 5

2

4 0.2 0.8

6 8 6

. 0 2 . 5 0 8 6

. 0 2 . 4 0

6 











) 2 . 0 , 6 : 6 ( )

2 . 0 , 6 : 5 ( )

2 . 0 , 6 : 4 ( )

4

(X b b b

P

) 2 . 0 ,

6 (

~ b n p X

※또한 표 A.2로부터

(9)

Honggie Kim

평균과 분산

이항분포의 평균과 분산

x n x n

x

q x p

n x

x n

)!

(

!

!

0

x n x n

x

q x p

x n





0

n

x

p n x b x X

E

0

) , : ( )

(

) , (

~

b n p X

np

 

 

1 ) (

' '

0

'

'





q n

p

y n y n

y

q y p

np n

1

0

) 1 (

]!

) 1 [(

!

)!

1

n (

y

y n yq y p

n y

np n x 1 y 로 치환

n p px q n x

x n

x

n

n 1 ( 1) ( 1)

)]!

1 (

) 1 [(

)!

1 (

)!

1 (

X=1

(10)

평균과 분산

 Ex) 5지 선다형 200문제를 모두 짐작으로 답할 때 맞는 문제수의 기대값은? 표준편차는?

657 .

5 32

8 . 0 2

. 0

200

npq

40 2

. 0 200

)

(Xnp    E

) 2 . 0 ,

200 (

~

b n p X

npq

npq

2

,

(표준편차)

비슷한 과정을 통해

(11)

Honggie Kim

7. 3 포아송 분포

(Poisson distribution)

포아송 분포

일반적으로 주어진 시간 (또는 정해진 영역) 내에서 발생하는 사건의 수 (이산 확률 변수) 가 다음의 세 조건을 만족할 때 포아송 확률 변수라 한다

주어진 시간

(또는 영역)

내에서 일어나는 사건의 수는 중복되지 않는 다른 시간

(또는 영역)

내에서 일어나는 사건의 수와 독립

짧은 시간

(또는 영역)

내에서 사건이 한번 발생할 확률은 시간의 길이에 비례

짧은 시간

(또는 영역)

내에서 사건이 두 번 이상 발생할 확률은 매우 작아 무시 할 수 있다

X

사건의 임의성

사건의 회귀성

(12)

포아송 분포의 예

포아송 분포를 따르는 예

지갑 잃어 버리기 (1년간 잃어버린 횟수)

교통 사고 수

우주공간의 일정 부분 (1만 광년 ) 내의 항성 수

포아송 분포를 따르지 않는 예

밥 먹기 (하루에 먹은 밥 공기 수)

3

(13)

Honggie Kim

확 률 함 수

포아송 확률 변수가 갖는 분포를 포아송 분포라 하며 확률 함수는

 , 2 , 1 ,

! 0 )

: ( )

(

x x

x e p x

X P

x

 7318 .

 2 e

:

주어진 시간(또는 영역) 내에서

발생하는 사건의 평균값

(14)

확률 예제

Ex) A군은 1년에 평균 3번 지갑을 분실한다.

내년에 지갑을 분실 할 횟수를 라 하면,

~Poisson( =3)이다. 그러므로,

내년에 지갑을 2번 이하로 잃어버릴 확률은

X

, 2 , 1 , 0

! , ) 3

3 :

( )

(

3

x

x x e

p x

X P

x

 

X

4232 .

0 )

5 . 8 ( 2 )

3 9 1

(

3

3

e e

! 2

3

! 1

3

! 0

3

0 3 1 3 2

3 e e

e

) 3 : 2 ( )

3 : 1 ( )

3 : 0 ( )

2

(

X p p p

P

4232 .

0 2240

. 0 1494

. 0 0498

.

0

※또한 표 A. 1로부터

(15)

Honggie Kim

평균과 분산

포아송 분포의 평균

0

0

( : ) !

) (

x

x

x x

x e x

xp X

E

   

 

0 !

y

y

y e

) !

! 3

! 1 2

( 1

! 3

! 1 2

0 3

2 3 2

e x e

e

x

x

.

Note

y

x 1 로 치환

( 1 )!

1

x e x

 

X=1

(16)

평균과 분산

포아송 분포의 분산

)]

( ) [

( ))

1 (

(

)]

( ) [

(

)]

( ) [

(

2 2 2

2 2 2

X X E

E X

X E

X X E

X X E

X X E

E

0 ( 1) !

)) 1 (

(

x

x

x x e

x X

X

E

2 2 2

2

y

x 2 로 치환

( 2)!

2 2

x e x

X=2

(17)

Honggie Kim

이항변수와 포아송변수의 근사성

Ex) A군은 1년에 평균 3번 지갑을 분실한다.

내년에 지갑을 분실 할 횟수를 라 하면,

~Poisson( =3)이다

위의 A군이 내년에 1년동안 지갑을 잃어버린 날을 라 하면

X

X

Y

) 365 /

3 ,

365 (

~ b npY

시행횟수

특정한 날에 지갑을 분실한 확률

X

Y

단, 하루에 두번 분실 확률이 무시할 만큼 작음

(18)

이항분포의 포아송 근사

 이 크고 가 작은 이항 확률 변수는 인 포아송 확률 변수로 근사 가능

 Ex) 어떤 특정 암에 걸려있을 확률이 0.002이다.

1000명중 암 환자가 3명 이하일 확률은?

np

n p

) 002 .

0 ,

1000 (

~ b npX

“1000명에 2명 꼴로 암”

8571 .

0

1804 .

0 2707

. 0 2707

. 0 1353

. 0

) 2 : 3 ( )

2 : 2 ( )

2 : 1 ( )

2 : 0 ( )

3 (

p p p p

X P

) 2 (  

Poissonnp

(19)

Honggie Kim

이항분포의 포아송 근사

 이항분포에서 이면

즉, 평균

분산 이는 Possion 분포의 특성임

  npnp(1 p)  2

0 p

(20)

7. 4 음이항 분포 및 기하 분포

성공확률 인 베르누이 시행을 독립적으로 성공때까지 시행하는 실험

 를 시행 횟수라 하면

p S

P( )

X

} 3 )

1 (

2 )

1 (

1 {

2

p p

FFS

p p

FS

p S

S

q x p

x p x p

x X

P

1

, 2 , 1 ) ,

1

( 1

) (

이와 같은 확률함수를 갖는 분포를

기하분포

(Geometric `distribution)

라 한다

)

로 표시

(

~

g p X

차사순 할머니 이야기

(21)

Honggie Kim

기하분포의 확률함수

) :

( )

(X x q 1 p g x p P   x

1 1 1

) 1

( 2

1

1 1

1

 

p q

q q

p q

p p

q

x

x x

x

기하분포의 확률함수

: ,

, ,

:

2 2

p

q qp p

p q qp

p   

.

Note

기하급수

기하수열

(22)

확률 예제

 Ex) 어느 사람이 운전 면허 시험에 합격할 확률은 0.6이다. 매 시험 후 실력에 변화가 없다고 가정하고 5번 만에 붙을 확률은?

X

는 응시횟수,

X ~ g(0.6)

096 .

0 6

. 0 ) 4 . 0 ( )

5

(X   q4 p4P

(23)

Honggie Kim

k번째 성공할 때까지 계속하는 실험

베르누이 시행을 k번째 성공할 때까지 계속하는 실험

SFS SSFF

FS SSS

S SFS

S FSS

S SS

S

k k x

k k k k

p q

qp qp qp

p

prob

x k k k k

1 1 1

(시행횟수) X

무한집합

(24)

k번째 성공할 때까지 계속하는 실험

x번째 시행에서 번째 성공이 이루어질 확률은?

k k x k

k

x p p q p

q 1

, 1 ,

1 , ) 1

( 



q p x k k

k x x

X

P x k k

번째 시행

prob

x

k

SFS SSFF 

번째 성공

k

번의 시행 중 개의 성공이 있어야 함

• 이 경우 실패의 개수는

k x k

x 1)( 1) (

1 k

1 x

이 경우 가짓수는 



1 1 k

x

(25)

Honggie Kim

k번째 성공할 때까지 계속하는 실험

위와 같은 확률 함수를 갖는 분포를 음이항 분포

(negative binomial distribution)

라 하며 로 쓴다

인 음이항 분포가 기하분포이다

, 1 ,

1 , ) 1

( 



q p x k k

k x x

X

P x k k

) , (

~

b 1 k p X

1 k

) : ( )

(X x q 1p g x p P x

p q

p x q

x X

P x 1 1 x 1

1 1 ) 1

( 



기하분포

음이항 분포 k=1인 경우

b k

a

)

( ( 의 전개를 음이항 전개라고 함)

(26)

확률 예제

 Ex) 어느 복권에 당첨 확률은 0.2이다. 10장째가 3번째 당첨 복권일 확률은?

X

는 3번째 당첨까지 산 복권 수,

X ~ b1(k 3, p 0.2)

0604 .

0 2

. 0 302 .

0

2 . 0 2 . 0 8 . 2 0

9 7 2





3 7 0.2 8

. 1 0 3

1

10 



1 10 ) 1

( 



q p x

k x x

X

P x k k

) 2 . 0 ,

9 :

2 (

8 . 0 2 . 2 0

9 2 7





p n

b

(27)

Honggie Kim

확률 예제

 Ex) A , B 두 팀이 7전 4승의 야구 시합.

A 팀의 승률이 0.6

A) A 팀이 7전째에 4승을 할 확률

= A팀이 4승 때까지의 시합 수

(B팀의 승수에 상관없이)

X

) 6 . 0 ,

4 (

~ b1 k p

k k

x p

k q x

p k x b





1 1

) , :

1(

4 4

7 0.6 4

. 1 0 4

1 ) 7

7

( 



X P

6 . 0 6 . 0 4 . 3 0

6

3 3





1656 .

0 6

. 0 276 .

0

)

6 . 0 ,

6 :

3 (

4 . 0 6 . 3 0

6 3 3





p n

b

(28)

확률 예제

B) B팀이 7전째에 4승을 할 확률

= B팀이 4승 때까지의 시합 수

(A팀의 승수에 상관없이)

C) 시리즈가 7차전까지 갈 확률

) 4 . 0 ,

4 (

~

b1 k p

4 4

7 0.4 6

. 1 0 4

1 ) 7

7

( 



Y P

1104 .

0 4 . 0 276 .

0

4 . 0 4 . 0 6 . 3 0

6

3 3





) (

4 . 0 6 . 3 0

) 6 7 (

) 7

(X P Y 3 3 P

P 



6차전까지 3승3패

) 4 . 0 ,

6 :

3 (

6 . 0 4 . 3 0

6 3 3





p n

b Y

(29)

이산형

(counting)

분포들

Honggie Kim

(30)

베르누이 시행

(성공확률 p)

1번 시행

n번

(고정)

반복

처음 성공시 까지 반복

K번 성공시 까지 반복

베르누이 분포

이항 분포 (관심사는 성공횟수)

포아송 분포 (관심사는 성공횟수)

p가 아주 작고 n이 큼

기하 분포 (관심사는 시행횟수)

음이항 분포 (관심사는 시행횟수)

(31)

Honggie Kim

7. 5 정규 분포

(normal distribution)

정규 곡선(normal curve)

연속 확률 변수가 갖는 확률밀도함수의 한 종류로써 종 모양의 부드러운 곡선이며 많은 확률 현상을

묘사하는 데 쓰임

정규 곡선은 평균 와 표준편차 로 결정

Ex) 1kg 커피병의 용량의 오차 충대 남학생 전체의 키

160 170 180 190

(그림 7.1 참조)

(그림 7.2, 7.3 참조)

(32)

정규곡선

그림 7. 1 얼굴 크기의 정규분포 예시

(33)

Honggie Kim

정규곡선

그림 7. 2

(34)

정규곡선

그림 7. 3

(35)

Honggie Kim

확률밀도함수

 평균 와 표준편차 (혹은 분산 )을 갖는 정규분포의 확률 밀도 함수는

가 위의 를 확률 밀도 함수를 가질 때 으로 쓴다

 

2

x e

x f

x

2 2

2 ) (

2 ) 1

(

) (x X f

) ,

(

~ N   2

X

(36)

표준정규분포

표준정규분포(standard normal distribution)

인 정규 분포를 표준 정규 분포라

한다

이면

(표준 변환, standardization) 일 때,

) 1 (

1 ,

0 2

) ,

(

~ N 2

X

X Z

) 1 , 0 (

~ N Z

(37)

Honggie Kim

정규분포의 확률 계산

 Gosset

(1900년 초기 통계학자)

spent most of his life to compute this

1.73

0

( )

) 73 . 1 0

(

Z f z dz

P

) (?)

?,

( 2 ' 2

2

2 z

z

e dz

e

dz e

z 73 2

. 1 0

2

2

1

(no analytic sol.)

(only numerical sol.)

(38)

정규분포의 확률 계산

표 A.3 은

4582 .

0 7

. 1

4484 .

0 6

. 1

0517 .

0 1

. 0

0120 .

0 0

. 0

03 . 0

Z

0z f

(

t

)

dt

1.73 0

(39)

Honggie Kim

정규분포의 확률 계산

 Ex)

0972 .

0 3849

. 0 4821

. 0

) 20 . 1 0

( )

10 . 2 0

( )

10 . 2 20

. 1 (

Z P Z P Z

P

7803 .

0 2881

. 0 4922

. 0

) 80 . 0 0

( )

42 . 2 0

(

) 80 . 0 0

( )

0 42

. 2 ( )

80 . 0 42

. 2 (

Z P

Z P

Z P

Z P

Z P

25 . 1 3944

. 0 )

0

(

Z c c

P

4750 .

0 )

96 . 1 0

(

Z P

4778 .

0 )

01 . 2 0

(

Z P

(40)

정규분포의 표준화

)

(a X b

P

)

( 

 

 

b

a Z P

dz e

z b

a

2

2

2

1

dz dx

dx x dz

z

dx e

b x

a

1 , ,

2

1 2

2

2 ) (

) ,

(

~ N   2

X

(41)

CH 7 - 41 Honggie Kim

정규분포의 표준화

) ,

(

~ N 2

X

0 1 2 3 -1

-2 -3

a b

2

a

b

2 2

2 ) (

2 ) 1

(

x

e x

f

x z

) 1 , 0 (

~ N 2

Z

2

2

2 ) 1

(

z

e z

f

(42)

정규분포의 표준화

 Ex) 일 때

9876 .

0 4938

. 0

2

) 5 . 2 5

. 2

(

P Z

4 ) 20 30

4 20 (10

) 30 10

( X P Z

P

4772 .

0 )

2 0

(

P Z

4 ) 20 28

4 20 (20

) 28 20

(

X P Z

P

) 16 ,

20 (

~ N 2 X

) 5 . 2 0

(

2

P Z

(43)

 Ex) 일 때

Honggie Kim

정규분포의 확률값

) 3 0

( 2

) 3 3

( X P Z

P

) 2 0

( 2

) 2 2

( X P Z

P

) 1 1

(

P Z

)

(

P Z

) ( X P

) ,

(

~ N 2

X

) 1 0

(

2

P Z

6826 .

0 3413

. 0

2

9544 .

0 4772

. 0

2

9974 .

0 4987

. 0

2

참조

관련 문서

적절한 영양은 운동/훈련에 의한 상해를 줄이고, 상해로 부터의 회복 속도를 빠르게 해 훈련에 따른 최적의 신체 상태를 유지시킴.. 적절한 영양의 공급은 경기를

원자의 종류 및 구조에 대한 활성화 에너지가 다르다..

 정적설계에서 신호인자 추가하기: 정적설계에서 신호인자를 추가할 때 미니탭은 워크 시트의 인자열 다음에 추가될 신호인자 열을 만들고 행을

It is impossible to change the voltage across a capacitor by a finite amount in zero time, for this requires an infinite current through the capacitor.. (A capacitor resists

그러므로 평판에 평행한 유동에서의 항력계수는

-저주파수에서 임피던스 →porous bounded Warburg 모델(‘O’확산요소) -고주파에서 확산층 두께 이 큰 경우 → 무한 Warburg 모델 수렴. -저주파에서 확산층이

<예> 일정지역에서 일정기간에 일어나는 교통사고건수/자살건수 일정기간에 백화점 방문 고객수, 공장에서 발생하는

Wide Dynamic Range Auto On/Off Mode The wide dynamic range can be set to be automatically switched ON/OFF in accordance with the intensity difference obtained by dividing an