7. 2
이항 분포
(binomial distribution) Bernoulli trial
실험의 결과가 두 가지로 나오는 시행 (확률적 실험)
Ex)
•
동전을 던진다.
•
시험에 붙느냐 떨어지느냐
•
애 낳기
일반적으로 두 결과를 성공
(S, 바람직한 결과)
과 실패(F, 바람직하지 못한 결과)
로 표현시행은 관심 없다)
(그렇지 않은
Honggie Kim
이항 실험
Binomial experiment
(이항 실험)
⑴ 번의 독립 시행
⑵ 매 시행의 결과는 성공 또는 실패
⑶ 성공 확률 p는 매 시행에서 같다
성공 , 실패 ,
확률 변수 를 이항 실험에서의 성공 횟수라 하면 의 가능한 값들은
n 번의 독립 베르누이 시행
p
P
(
)
P(
)
q p q 1
} , ,
2 , 1 , 0
{ n
n
X X
이항 실험
동전을 4번 던지는 실험 p P
(H )
q P(T )
TTTT T
HTTT HTTH HTHT HTHH HHTT HHTH
HHHT HHHH S
"
, , , , ,
, , ,
2 3 2 3 3 4
3 2 2
2 2 3
2 2 3 3 4
pq q p
q p
q p
q p
q p
q p
p 3
p
q p2
q p2
pq2
p2
pq
p
q
prob
X= 앞면수
Honggie Kim
동전을 4번 던지는 확률적 실험
의 확률분포
) (
)
(
x P X xp
x
4 3 2 1 0
4 3
2 2
3 4
4 6 4
p
q p
q p pq q
0 4 3
2 2
3 4 0
4 4 3 4 2 4 1 4 0 4
q p
q p
q p
pq q p
x xq x p
x
p
4 4 )
(
4 , ,
1 , 0
, x
X
확 률 변 수
번의 독립 시행에서 번 성공할 확률
위의 확률 함수를 갖는 확률 분포를 이항분포라
하고, 확률변수 가 를 확률함수로 가지면 이항확률변수라 한다. 이때 로 쓴다
( 이 1인 이항분포를 베르누이 분포라 한다)
n x
x n
F F
x S S
n x
q x p
n x n x
, ,
1 , 0
,
) ,
; (
, , 1 , 0 ,
) (
p n x b
n x
q x p
x n X
P x n x
x n xq p
:
x
n 가지
확률
X b(x:n, p)
) , (
~
b n p Xn
Honggie Kim
이 항 분 포
1 )
( 1 ,
nx pxqnx p q np q
b p
a
n
x
x n xb x a
n
0
n n
n
n ab b
n b n
n a
a
1 1
1
1
b n
a ) (
2
2 2ab b
a
)2
(
. a b Note
라 하면
이항전개
확률 예제
Ex) 5지 선다형 문제 6개를 모두 짐작으로 답 했을 때, 4개 이상 맞출 확률은?
017 . 0
0 002 .
0 015 .
0 2
. 0 ,
6
p
n 01696
. 0
000064 .
0 001536 .
0 01536 .
0
6 1
5 2
4 0.8 6 0.2 0.8 0.2 2
. 0
15
26 . 0
0 6
1 5
2
4 0.2 0.8
6 8 6
. 0 2 . 5 0 8 6
. 0 2 . 4 0
6
) 2 . 0 , 6 : 6 ( )
2 . 0 , 6 : 5 ( )
2 . 0 , 6 : 4 ( )
4
(X b b b
P
) 2 . 0 ,
6 (
~ b n p X
※또한 표 A.2로부터
Honggie Kim
평균과 분산
이항분포의 평균과 분산
x n x n
x
q x p
n x
x n
)!
(
!
!
0
x n x n
x
q x p
x n
0
n
x
p n x b x X
E
0
) , : ( )
(
) , (
~
b n p X np
1 ) (
' '
0
'
'
q n
p
y n y n
y
q y p
np n
1
0
) 1 (
]!
) 1 [(
!
)!
1
n (
y
y n yq y p
n y
np n x 1 y 로 치환
n p px q n x
x n
x
n
n 1 ( 1) ( 1)
)]!
1 (
) 1 [(
)!
1 (
)!
1 (
X=1
평균과 분산
Ex) 5지 선다형 200문제를 모두 짐작으로 답할 때 맞는 문제수의 기대값은? 표준편차는?
657 .
5 32
8 . 0 2
. 0
200
npq
40 2
. 0 200
)
(X np E
) 2 . 0 ,
200 (
~
b n p Xnpq
npq
2
,
(표준편차)비슷한 과정을 통해
Honggie Kim
7. 3 포아송 분포
(Poisson distribution)
포아송 분포
일반적으로 주어진 시간 (또는 정해진 영역) 내에서 발생하는 사건의 수 (이산 확률 변수) 가 다음의 세 조건을 만족할 때 포아송 확률 변수라 한다
•
주어진 시간
(또는 영역)내에서 일어나는 사건의 수는 중복되지 않는 다른 시간
(또는 영역)내에서 일어나는 사건의 수와 독립
•
짧은 시간
(또는 영역)내에서 사건이 한번 발생할 확률은 시간의 길이에 비례
•
짧은 시간
(또는 영역)내에서 사건이 두 번 이상 발생할 확률은 매우 작아 무시 할 수 있다
X
사건의 임의성
사건의 회귀성
포아송 분포의 예
포아송 분포를 따르는 예
지갑 잃어 버리기 (1년간 잃어버린 횟수)
교통 사고 수
우주공간의 일정 부분 (1만 광년 ) 내의 항성 수
포아송 분포를 따르지 않는 예
밥 먹기 (하루에 먹은 밥 공기 수)
3
Honggie Kim
확 률 함 수
포아송 확률 변수가 갖는 분포를 포아송 분포라 하며 확률 함수는
, 2 , 1 ,
! 0 )
: ( )
(
x xx e p x
X P
x
7318 .
2 e
:주어진 시간(또는 영역) 내에서
발생하는 사건의 평균값
확률 예제
Ex) A군은 1년에 평균 3번 지갑을 분실한다.
내년에 지갑을 분실 할 횟수를 라 하면,
~Poisson( =3)이다. 그러므로,
내년에 지갑을 2번 이하로 잃어버릴 확률은
X
, 2 , 1 , 0
! , ) 3
3 :
( )
(
3
x
x x e
p x
X P
x
X
4232 .
0 )
5 . 8 ( 2 )
3 9 1
(
33
e e
! 2
3
! 1
3
! 0
3
0 3 1 3 23 e e
e
) 3 : 2 ( )
3 : 1 ( )
3 : 0 ( )
2
(
X p p pP
4232 .
0 2240
. 0 1494
. 0 0498
.
0
※또한 표 A. 1로부터
Honggie Kim
평균과 분산
포아송 분포의 평균
0
0
( : ) !
) (
x
x
x x
x e x
xp X
E
0 !
y
y
y e
) !
! 3
! 1 2
( 1
! 3
! 1 2
0 3
2 3 2
e x e
e
x
x
.
Note
y
x 1 로 치환
( 1 )!
1
x e x
X=1
평균과 분산
포아송 분포의 분산
)]
( ) [
( ))
1 (
(
)]
( ) [
(
)]
( ) [
(
2 2 2
2 2 2
X X E
E X
X E
X X E
X X E
X X E
E
0 ( 1) !
)) 1 (
(
x
x
x x e
x X
X
E
2 2 2
2
y
x 2 로 치환
( 2)!
2 2
x e x
X=2
Honggie Kim
이항변수와 포아송변수의 근사성
Ex) A군은 1년에 평균 3번 지갑을 분실한다.
내년에 지갑을 분실 할 횟수를 라 하면,
~Poisson( =3)이다
위의 A군이 내년에 1년동안 지갑을 잃어버린 날을 라 하면
X
X
Y
) 365 /
3 ,
365 (
~ b n p Y
시행횟수
특정한 날에 지갑을 분실한 확률
X
Y
단, 하루에 두번 분실 확률이 무시할 만큼 작음
이항분포의 포아송 근사
이 크고 가 작은 이항 확률 변수는 인 포아송 확률 변수로 근사 가능
Ex) 어떤 특정 암에 걸려있을 확률이 0.002이다.
1000명중 암 환자가 3명 이하일 확률은?
np
n p
) 002 .
0 ,
1000 (
~ b n p X
“1000명에 2명 꼴로 암”
8571 .
0
1804 .
0 2707
. 0 2707
. 0 1353
. 0
) 2 : 3 ( )
2 : 2 ( )
2 : 1 ( )
2 : 0 ( )
3 (
p p p p
X P
) 2 (
Poisson np
Honggie Kim
이항분포의 포아송 근사
이항분포에서 이면
즉, 평균
분산 이는 Possion 분포의 특성임 np np(1 p) 2
0 p
7. 4 음이항 분포 및 기하 분포
성공확률 인 베르누이 시행을 독립적으로 성공때까지 시행하는 실험
를 시행 횟수라 하면
p S
P( )
X
} 3 )
1 (
2 )
1 (
1 {
2
p p
FFS
p p
FS
p S
S
q x p
x p x p
x X
P
1
, 2 , 1 ) ,
1
( 1
) (
이와 같은 확률함수를 갖는 분포를
기하분포
(Geometric `distribution)
라 한다
)
로 표시(
~
g p X차사순 할머니 이야기
Honggie Kim
기하분포의 확률함수
) :
( )
(X x q 1 p g x p P x
1 1 1
) 1
( 2
1
1 1
1
p q
q q
p q
p p
q
x
x x
x
기하분포의 확률함수
: ,
, ,
:
2 2
p
q qp p
p q qp
p
.
Note
기하급수
기하수열
확률 예제
Ex) 어느 사람이 운전 면허 시험에 합격할 확률은 0.6이다. 매 시험 후 실력에 변화가 없다고 가정하고 5번 만에 붙을 확률은?
X
는 응시횟수,
X ~ g(0.6)096 .
0 6
. 0 ) 4 . 0 ( )
5
(X q4 p 4 P
Honggie Kim
k번째 성공할 때까지 계속하는 실험
베르누이 시행을 k번째 성공할 때까지 계속하는 실험
SFS SSFF
FS SSS
S SFS
S FSS
S SS
S
k k x
k k k k
p q
qp qp qp
p
prob
x k k k k
1 1 1
(시행횟수) X
무한집합
k번째 성공할 때까지 계속하는 실험
x번째 시행에서 번째 성공이 이루어질 확률은?
k k x k
k
x p p q p
q 1
, 1 ,
1 , ) 1
(
q p x k k
k x x
X
P x k k
번째 시행
prob
xk
SFS SSFF
번째 성공
k
• 번의 시행 중 개의 성공이 있어야 함
• 이 경우 실패의 개수는
k x k
x 1)( 1) (
1 k
1 x
이 경우 가짓수는
1 1 k
x
Honggie Kim
k번째 성공할 때까지 계속하는 실험
위와 같은 확률 함수를 갖는 분포를 음이항 분포
(negative binomial distribution)
라 하며 로 쓴다
인 음이항 분포가 기하분포이다
, 1 ,
1 , ) 1
(
q p x k k
k x x
X
P x k k
) , (
~
b 1 k p X 1 k
) : ( )
(X x q 1p g x p P x
p q
p x q
x X
P x 1 1 x 1
1 1 ) 1
(
기하분포
음이항 분포 k=1인 경우
b k
a
)
( ( 의 전개를 음이항 전개라고 함)
확률 예제
Ex) 어느 복권에 당첨 확률은 0.2이다. 10장째가 3번째 당첨 복권일 확률은?
X
는 3번째 당첨까지 산 복권 수,
X ~ b1(k 3, p 0.2)0604 .
0 2
. 0 302 .
0
2 . 0 2 . 0 8 . 2 0
9 7 2
3 7 0.2 8
. 1 0 3
1
10
1 10 ) 1
(
q p x
k x x
X
P x k k
) 2 . 0 ,
9 :
2 (
8 . 0 2 . 2 0
9 2 7
p n
b
Honggie Kim
확률 예제
Ex) A , B 두 팀이 7전 4승의 야구 시합.
A 팀의 승률이 0.6
A) A 팀이 7전째에 4승을 할 확률
= A팀이 4승 때까지의 시합 수
(B팀의 승수에 상관없이)X
) 6 . 0 ,
4 (
~ b1 k p
k k
x p
k q x
p k x b
1 1
) , :
1(
4 4
7 0.6 4
. 1 0 4
1 ) 7
7
(
X P
6 . 0 6 . 0 4 . 3 0
6
3 3
1656 .
0 6
. 0 276 .
0
)
6 . 0 ,
6 :
3 (
4 . 0 6 . 3 0
6 3 3
p n
b
확률 예제
B) B팀이 7전째에 4승을 할 확률
= B팀이 4승 때까지의 시합 수
(A팀의 승수에 상관없이)
C) 시리즈가 7차전까지 갈 확률
) 4 . 0 ,
4 (
~
b1 k p 4 4
7 0.4 6
. 1 0 4
1 ) 7
7
(
Y P
1104 .
0 4 . 0 276 .
0
4 . 0 4 . 0 6 . 3 0
6
3 3
) (
4 . 0 6 . 3 0
) 6 7 (
) 7
(X P Y 3 3 P
P
6차전까지 3승3패
) 4 . 0 ,
6 :
3 (
6 . 0 4 . 3 0
6 3 3
p n
b Y
이산형
(counting)분포들
Honggie Kim
베르누이 시행
(성공확률 p)1번 시행
n번
(고정)
반복처음 성공시 까지 반복
K번 성공시 까지 반복
베르누이 분포
이항 분포 (관심사는 성공횟수)
포아송 분포 (관심사는 성공횟수)
p가 아주 작고 n이 큼
기하 분포 (관심사는 시행횟수)
음이항 분포 (관심사는 시행횟수)
Honggie Kim
7. 5 정규 분포
(normal distribution)
정규 곡선(normal curve)
연속 확률 변수가 갖는 확률밀도함수의 한 종류로써 종 모양의 부드러운 곡선이며 많은 확률 현상을
묘사하는 데 쓰임
정규 곡선은 평균 와 표준편차 로 결정
Ex) 1kg 커피병의 용량의 오차 충대 남학생 전체의 키
160 170 180 190
(그림 7.1 참조)
(그림 7.2, 7.3 참조)
정규곡선
그림 7. 1 얼굴 크기의 정규분포 예시
Honggie Kim
정규곡선
그림 7. 2
정규곡선
그림 7. 3
Honggie Kim
확률밀도함수
평균 와 표준편차 (혹은 분산 )을 갖는 정규분포의 확률 밀도 함수는
가 위의 를 확률 밀도 함수를 가질 때 으로 쓴다
2
x e
x f
x
2 2
2 ) (
2 ) 1
(
) (x X f
) ,
(
~ N 2
X
표준정규분포
표준정규분포(standard normal distribution)
인 정규 분포를 표준 정규 분포라
한다
이면
(표준 변환, standardization) 일 때,
) 1 (
1 ,
0 2
) ,
(
~ N 2
X
X Z
) 1 , 0 (
~ N Z
Honggie Kim
정규분포의 확률 계산
Gosset
(1900년 초기 통계학자)
spent most of his life to compute this
1.73
0
( )
) 73 . 1 0
(
Z f z dzP
) (?)
?,
( 2 ' 2
2
2 z
z
e dz
e
dz e
z 73 2
. 1 0
2
2
1
(no analytic sol.)
(only numerical sol.)
정규분포의 확률 계산
표 A.3 은
4582 .
0 7
. 1
4484 .
0 6
. 1
0517 .
0 1
. 0
0120 .
0 0
. 0
03 . 0
Z
0z f(
t)
dt1.73 0
Honggie Kim
정규분포의 확률 계산
Ex)
0972 .
0 3849
. 0 4821
. 0
) 20 . 1 0
( )
10 . 2 0
( )
10 . 2 20
. 1 (
Z P Z P Z
P
7803 .
0 2881
. 0 4922
. 0
) 80 . 0 0
( )
42 . 2 0
(
) 80 . 0 0
( )
0 42
. 2 ( )
80 . 0 42
. 2 (
Z P
Z P
Z P
Z P
Z P
25 . 1 3944
. 0 )
0
(
Z c c P
인
4750 .
0 )
96 . 1 0
(
Z P4778 .
0 )
01 . 2 0
(
Z P정규분포의 표준화
)
(a X b
P
)
(
b
a Z P
dz e
z b
a
2
2
2
1
dz dx
dx x dz
z
dx e
b x
a
1 , ,
2
1 2
2
2 ) (
) ,
(
~ N 2
X
CH 7 - 41 Honggie Kim
정규분포의 표준화
) ,
(
~ N 2
X
0 1 2 3 -1
-2 -3
a b
2
a
b
2 2
2 ) (
2 ) 1
(
x
e x
f
x z
) 1 , 0 (
~ N 2
Z
2
2
2 ) 1
(
z
e z
f
정규분포의 표준화
Ex) 일 때
9876 .
0 4938
. 0
2
) 5 . 2 5
. 2
(
P Z
4 ) 20 30
4 20 (10
) 30 10
( X P Z
P
4772 .
0 )
2 0
(
P Z
4 ) 20 28
4 20 (20
) 28 20
(
X P Z
P
) 16 ,
20 (
~ N 2 X
) 5 . 2 0
(
2
P Z
Ex) 일 때
Honggie Kim
정규분포의 확률값
) 3 0
( 2
) 3 3
( X P Z
P
) 2 0
( 2
) 2 2
( X P Z
P
) 1 1
(
P Z
)
(
P Z
) ( X P
) ,
(
~ N 2
X
) 1 0
(
2
P Z
6826 .
0 3413
. 0
2
9544 .
0 4772
. 0
2
9974 .
0 4987
. 0
2