1 표본공간과 사건 2 확률의 정의
3 사건의 관계와 확률 4 조건부 확률과 독립 5 베이즈 법칙
3장 확률
복습 –
ㆍ데이터의 특징중 중심측도는
( ), ( ), ( )등이있다.
ㆍ사분위, 100분위수 계산법?
예) 예제 2.9에서 제 90, 75백분위수를 계 산 등등
ㆍ줄기-잎 그림의 결과로 상자그림(Box
Plot) 그리기? 분포모양파악
복습 –
• 데이터의 특징중 변이측도로는 (편차 ), ( ), ( ), ( ),
( )등이있다.
이변량 데이터요약-
범주형- ( ),(주변합의 상대도수) 수치형- ( 산점도), ( )
• Spss 결과 해석하기
표본공간(sample space) : 확률실험을 통해 얻어질 수 있는 모든 가능한 결과들을 모아놓은 집합= S
이 표본공간에 속하는 각각의 결과를 표본공간의 기본결 과(elementary outcome) 혹은 원소(element)라고 한다. 이 때, 사건(event)은 특정한 성질을 지닌 기본결 과들로 이루어진 모임으로서 표본공간의 부분집합에 해 당된다 =
확률실험을 행했을 때, 사건 =A에 속하는 기본결과들 중 어느 하나가 얻어지면 우리는 사건 A가 발생했다고 한다.
A, B, C 등으로 나타낸다.
},
{ },
{ e 1 e 2
표본공간 (S), 기본결과, 사건(event)
예제 3.1) 한 개의 동전을 던져서 어느 면이 나타나는지를 관찰하는 실험을 생각하자. 이 확률실험을 통해 얻어지 는 표본공간 S는 동전의 앞면을 H, 뒷면을 T로 표시하 면,
S={H,T}
가 된다.
사건 A를 동전의 앞면이 나오는 사건이라고 하면, 사건 A는
A={H}
으로 나타낼 수 있다.
표본공간 (S), 기본결과, 사건(event) ?
사건 A의 여사건(complement)은 사건 A에 포함되지 않는 표본공간에 속하는 모든 기본결과의 모임으로
로 나타낸다. 여사건 가 일어난다는 것은 사건 A가 일어나지 않음을 의미한다.
A
cA
cA
A
c 두 사건 A와 B의 합사건(union)은 기호 A∪B로 나타내며 사건 A나 B 둘 중 하나에 속하는 기본결과들의 모임으로 합사건 A∪B가 일어 난다는 것은 사건 A 또는 B가 발생함을 의미한다.
두 사건 A와 B의 교사건(intersection)은 기호 A∩B로 표시하며, 사건 A와 B에 동시에 속하는 기본결과의 모임이다. 교사건 A∩B가 일어난다는 것은 사건 A와 B가 동시에 함께 일어남을 의미한다.
A B A B
기본결과를 하나도 포함하지 않는 사건을 특별히 공사건(null event) 혹은 영사건이라고 하며 기호 Φ로 표기한다.
만약 두 사건 A와 B에 대해 교사건 A∩B이 공사건이면, 즉
A∩B=Φ이면 두 사건 A와 B는 서로 배반(mutually exclusive)인 사건이라고 한다.
예제 3.2
주사위 1개를 던져서 맨 윗면에 나타내는 눈의 수를 관찰한다고 하자.
이 때 주사위를 던지는 실험은 확률실험이 되며, 이 실험에서 얻어지 는
표본공간 S는
S={1,2,3,4,5,6} 으로 나타난다.
특별히 짝수의 눈이 나오는 경우에 관심이 있어서 사건 A로 나타내면 사건 A는 A={2,4,6}가 되며,
한편 3의 배수의 눈이 나오는 사건을 B라고 하면 사건 B는 B={3,6}
로 나타내진다.
두 사건 A와 B의 합사건과 교사건은 각각 A∪B={2,3,4,6}와 A∩B={6}이 된다.
주사위를 던져서 1의 눈이 나오는 사건을 C라고 하면 C={1}이 되고 사건 A와 C는 A∩C=Φ이기 때문에 서로 배반인 사건이 된다.
3.3 확률의 정의
확률이란 확률실험에서 특정한 기본결과들이 나올 가능성의 수치적 측도라고 할 수 있다.
고전적 확률(Classical probability) : 어떤 확률실험에서 나타나 는 모든 기본결과들의 개수에 대한 특정한 사건에 해당하는 기본결과 들의 개수의 비율로 정의된다.
경험적 확률(Empirical probability) : 윳놀이에서처럼 기본결과들 이 같은 정도로 나온다고 가정할 수 없을 때의 실험
공리적 확률(probability defined by axioms) : 사건의 발생 확률 값을 세 가지 공리를 만족하게끔 배정한다는 것이다. 공리란 증명이 필요없는 자명한 진리로써 그것을 출발점으로 하여 다른 명제를 증명 하는 기본 명제를 뜻한다.
고전적 확률 (classical probability)
주사위의 6개의 면이 나타날 가능성이 동일한 주사위를 “공정한”
주사위라고 한다
=> 주사위를 던져서 얻을 수 있는 전체 가능한 결과들은 {1,2,3,4,5,6}
이고 이 중에 홀수의 눈에 해당하는 결과들은 {1,3,5}이다.
각 결과들의 발생가능성은 동일하기 때문에 홀수의 눈이 나올 확률 값 은 3/6으로써 1/2로 계산될 것이다.
모든 기본결과들의 발생 가능성이 동일한 표본공간을 균일표본공간이 라고 하며,
균일표본공간에서의 확률
표본공간에 속하는 모든 기본결과들의 발생 가능성이 동일한 경우에 사건 A가 발생할 확률 P(A)는 다음과 같다.
P(A)=
수 기본결과들의 속하는
에 표본공간
수 기본결과들의 속하는
에 사건
S
A
경험적 확률 (Empirical probability)
윳놀이에서처럼 기본결과들이 같은 정도로 나온다고 가정할 수 없을 때는 실험을 직접 여러 번 반복해서 실행한 후,
N을 실험을 반복 시행한 횟수라고 하고, N(A)를 N번의 시행에서 사 건 A가 일어나는 횟수라고 하면
는 N번의 시행에서 사건 A가 발생하는 상대도수가 된다
N A A N
r
N( ) )
(
공리적 확률
확률의 공리
사건의 발생 확률 P(A)는 다음의 공리를 만족하도록 각 사건 A에 대 하여 정의하는 실수 값을 갖는 함수이다.
[공리 1]
[공리 2] 표본공간 S에 대하여 P(S) = 1
[공리 3] 사건들 가 서로 배반인 사건들일 때,
1 )
(
0 P A
, ,
21
A
A
1 1
) ( )
(
n
n n
n P A
A P
3.4 사건의 관계와 확률
사건 A의 확률은 사건 A에 포함되는 모든 기본결과에 대한 확률의 합 이다.
e A
A
P ( ) P(e)
원소 의
사건
합 는 사건 A에 속하는 모든 기본결과의 확률과 사건 A에 속하지 않는 모든 기본결과의 확률의 합이다.
) ( 1
) ( 1
) ( )
( A P A P A P A
P
) ( )
(
A P A P
합사건의 연산에서 P(A∪B)는 사건 A 또는 사건 B에 속하는 기본결 과에 할당된 확률이다
) (
) ( )
( )
( A B P A P B P A B
P
만약, 사건 A와 B가 서로 배반 사건들이면, 교사건 A∩B는 공사건이 므로 P(A∩B)=0이다.
서로 배반인 사건들 A,B에 대하여 P(A∪B)=P(A)+P(B)이다
3.4 사건의 관계와 확률
예제 3.4
앞면과 뒷면이 나올 가능성이 동일한 공정한 동전을 두 번 던지는 확 률실험의 결과에 대한 벤다이어그램을 그리라. 그리고 다음의 사건들 을 표시하여 합사건 A∪B의 확률을 구하라.
A : 첫 번째 동전이 앞면인 사건 B : 두 번째 동전이 앞면인 사건
풀이
동전의 앞면을 H, 뒷면을 T로 표시하면, 이 확률실험의 표본공간 S={HH,HT,TH,TT}이 되고, 두 사건 A={HT,HH}
B={HT,TT}이다.
따라서 A∩B={HT}, A∪B ={HH,HT,TT}이고 공정한 동전이므로 P(A)=1/2이고 P(B)=1/2이며 P(A∩B)=1/4이므로 합사건의 확률 P(A∪B)=1/2+1/2-1/4=3/4이다.
3.4 사건의 관계와 확률
3.5 조건부 확률과 독립
사건 B가 일어났음을 알았을 때 사건 A의 조정된 확률을 사건 B가 주 어졌을 때 사건 A의 조건부 확률(conditional probability)이라고 하며 P(A|B)로 나타낸다.
) (
) ) (
|
( P B
B A
B P A
P
예제 3.5
어느 지역에 거주하는 학생들의 주사 접종에 대한 태도를 조사하여 다 음과 같이 여러 범주에 따른 비율을 얻었다.
초등학생 중학생 고등학생 합계 두려워 함 0.12 0.08 0.05 0.25 두려워하지 않음 0.28 0.25 0.22 0.75 합계 0.4 0.33 0.27 1.00
(a) 이 지역의 학생들 중에서 임의로 뽑힌 학생이 주사 접종을 두려워하는 학생 일 확률은 얼마인가?
(b) 이 지역의 학생들 중에서 임의로 뽑힌 학생이 중학생임을 알았다. 이 중학 생이 주사 접종을 두려워하는 학생일 확률은 얼마인가?
3.5 조건부 확률과 독립
풀이
사건 A를 임의로 뽑힌 학생이 주사 접종을 두려워하는 학생일 사건 B를 임의로 뽑힌 학생이 중학생 사건
(a) 전체의 25%에 해당하는 학생들이 주사 접종을 두려워하는 학생들이 다. 임의로 뽑힌 학생이 이 학생들에 해당될 확률은 P(A)=0.25이다.
이 확률은 사건 A의 무조건적인 확률이다.
(b) 뽑힌 사람이 중학생임을 알게 되면, 두 번째 열의 중학생인 사람만 모 은 집단에서 주사 접종을 두려워 하는 학생들의 비율은 0.08/0.33임 을 알 수 있다. 따라서 이 사람이 중학생이라는 정보가 주어지면, 그 사람이 주사 접종을 두려워하는 학생일 확률은
P(A|B)=0.08/0.33=0.24이다.
3.5 조건부 확률과 독립
사건 A가 일어났음을 알았을 때 사건 B의 조정된 확률을 사건 A가 주 어졌을 때 사건 B의 조건부 확률(conditional probability)이라고 하며 P(A|B)로 나타낸다.
) (
) ) (
|
( P A
B A
A P B
P
3.4 조건부확률과 독립
사건 B가 주어졌을 때 사건 B의 조건부 확률(conditional probability)이라고 하며 P(A|B), 혹은 P(B|A)
단, P(B)>0이어야 한다. 위의 조건부 확률의 정의에서 우변의 분모를 양변에 곱하면
)
| (
) (
)
( A B P B P A B P
이 공식을 확률의 곱셈법칙(multiplication law of probability)이라고 한다.
) (
) ) (
|
( P A
B A
A P B
P
) (
) ) (
|
( P B
B A
B P A
P
예제 3.6
CD를 생산하는 업체에서는 한 상자에 CD 20장을 넣어 포장한다. 판 매에 앞서 20장의 CD 중에 임의로 2개를 추출하여 불량여부를 면밀 히 검사한다고 하자. 이 상자 안에 불량 CD가 원래 3장 포함되어 있 다면 임의로 추출한 CD 2개 모두 정상으로 나올 확률은 얼마인가?
즉, 사건 G1을 첫 번째로 추출한 CD가 정상 제품일 사건이라고 하고, 사건 G2를 두 번째로 추출한 CD가 정상 제품일 사건이라고 하자
P(G1∩G2) = ?
통계학의 상호독립
풀이
2개 모두 정상으로 나올 사건은 두 사건 G1과 G2가 동시에 발생하는 교사건 G1∩G2이 일어나는 사건이 된다. 따라서 그 확률은
P(G1∩G2)=P(G1)P(G2|G1)
으로 얻어진다. 여기서 P(G1)=17/20이고
P(G2|G1)은 이미 사건 G1이 발생했으므로 상자 안에는 정상인 CD 16장과 불량인 CD 3장이 남아 있으므로 이중에 임의로 한 개를 추출 했을 때 정상일 확률은 16/19가 된다. 따라서 구하고자 하는 확률은
P(G1∩G2)=P(G1)P(G2|G1)
=17 /20*16/19
=0.72
요 약 (복습)
표본공간 (S) ?
기본결과 (e1, e2, …) 사건 ( A, B, C, …)
P(A), P(B), …
조건부확률 = P(B|A), P(A|B) ?
두 사건 A, B는 서로 독립이다 ?
확률의 법칙과 베이즈법칙 ?
독립의 정의)
조건부확률 P(A|B) 와 P(A) 가 같게 될때
사건 A 와 B가 상호독립 (Mutually Independent)이라 정의한다. 즉,
예제 3.7
예제 3.5에서 두 사건 A=[주사 접종을 두려워 하는 사건]과 B=[중학 생인 사건]은 서로 독립인가?
풀이
예제 3.5에서 P(A)=0.25
P(A|B)=P(A∩B)/P(B)=0.08/.33=0.242
두 확률 값이 같지 않다. 따라서 두 사건 A와 B는 독립이 아니다 !!.
) ( ) ( )
| ( ) ( )
( A B P B P A B P A P B
P
예제 3.8
두 개의 공정한 주사위를 던지는 실험에서 사건 A를 두 주사위 눈의 합이 7인 사건이라고 하고 B를 첫 번째 주사위눈이 2인 사건이라고 하자. 1) 이 두 사건은 서로 독립인가?
2) 그리고 두 주사위 눈의 합이 5가 되는 사건을 C라고 할 때, 사건 B 와 C는 서로 독립인가?
풀이
2개의 주사위를 던지는 실험에서 얻을 수 있는 가능한 기본결과들은 (1,1) (1,2) (1,3) (1,4) (1,5) (1,6)
(2,1) (2,2) … … … (2,6)
(3,1) (3,2) … … … (3,6)
… … … …
(6,1) (6,2) … … … (6,6)
통계학의 상호독립
(풀이)
이 중 사건 A에 해당하는 결과들은
{(1,6),(2,5),(3,4),(4,3),(5,2),(6,1)}로 6개이며 따라서 P(A)=6/36=1/6이다.
사건 B에 해당하는 결과들은 {(2,1),(2,2),(2,3),(2,4),(2,5),(2,6)}
로 확률은 P(B)=6/36=1/6이다 또한 A∩B={(2,5)}로서 그 확률은 P(A∩B)=1/36이 된다.
1) P(A∩B)=1/36=1/6*1/6=P(A)P(B)를 만족하여 두 사건 A와 B는 서로 독립인 사건이 된다.
2) 사건 C는 C={(1,4),(2,3),(3,2),(4,1)}이고 P(C)=4/36=1/9로서 사건 B와 C는 독립이 아니다.
) ( ) 6 (
1 9
1 36
) 1
( C B P C P B
P
3.5 조건부확률과 독립
예제 3.9
서로 독립적으로 작동하는 두 개의 부품으로 구성된 기계가 있다. 각 부품이 성공적으로 작동할 확률이 0.9일 때, 다음과 같이 구성된 각 기계가 성공적으로 작동할 확률은 얼마인가?
(a) 두 개의 부품이 모두 작동할 때만 작동하는 구조의 기계
(b) 두 개의 부품 중 적어도 한 개가 작동할 때 작동하는 구조의 기계
풀이
두 개의 부품에 대해
A1: 부품 1이 작동하는 사건 A2: 부품 2가 작동하는 사건
3.5 조건부확률과 독립
(a)두 개의 부품이 모두 작동할 때만 작동하는 구조의 기계 A: 기계가 작동하는 사건
이 세 사건은 A=A1∩A2의 관계를 만족한다. 두 부품들이 서로 독립적으로 작 동하므로, 사건 A1과 A2는 독립이다.
P(A)=P(A1∩A2)=P(A1)P(A2)=0.9*0.9=0.81 따라서 기계가 성공적으로 작동할 확률은 0.81이다.
(b)두 개의 부품 중 적어도 한 개가 작동할 때 작동하는 구조의 기계 B: 기계가 작동하는 사건
B=A1∪A2의 관계가 된다.P(B)=P(A1∪A2)=P(A1)+P(A2)-P(A1∩A2)가 되고, 두 부품들이 서로 독립적으로 작동하므로 P(A1∩A2)=P(A1)P(A2)이다
P(B=A1∪A2 ) =P(A1)+P(A2)-P(A1)P(A2)
=0.9+0.9-0.81 =0.99이다
따라서 두 개의 부품 중 적어도 한 개가 작동할 때 작동하는 구조의 기계가 성공적으로 작동할 확률은 0.99이다.
성숙한 인격의 8가지 자질 - 첫번째 용기 - 두려움을 극복하는 용기 ( 빌 하이빌스) - 두번째 자기통제력 - 고통을 경험하라
•즉각적인 즐거움과 손쉬운 해결책을 쫓는 오늘날, 자기 통제력을 발휘하여 즐거움을 유보하고 현재의 고통을 감내한다면, 반드시 보상의 날이 올 것입니다.
•수업중 폰문자 ? 보낼까요?
•당신은 이 아름다움을 위해 간직하시렵니까?
•아님 먹는 즐거움을 통제하지 않겠습니까?
• 일본소도시-초중등생 밤 9시이후는 휴대폰 부모가 보관 (2014. 3. 20 뉴스)
3.6 베이즈법칙
3.6. 1) 확률의법칙 예 )
)
| ( ) ( )
| ( ) ( )
( A P B P A B P B P A B
P
3.6.1) 확률의 법칙
예제 3.10
어느 지역 인구의 1% 정도가 특정 질병에 감염되어 있다고 한다. 이 질병은 혈액검사를 통해 찾을 수 있는데 혈액검사는 감염된 사람의 97%를 정확하게 진단하는 반면에 건강한 사람들의 6%에 대해서는 잘못 진단할 수 있다고 한다. 이 지역에서 임의로 한 사람을 선택하여 혈액검사를 했을때 결과가 양성일 확률은?
풀이
사건 A : 혈액검사에서 양성인 결과가 나오는 사건 => P(A)= ? 사건 B : 질병에 실제로 감염된 사건
: 질병에 감염되지 않는 사건
B
사건 B와 여사건 는 항상 서로 배반이기 때문에 사건 A에 대하여 항상 A=(B∩A)∪( ∩A)로 나타낼 수 있다.
B
B
3.6.1) 확률의법칙
P(A|B) : 질병에 감염된 사람에 대해서 양성인 결과가 나올 확률 0.97 : 건강한 사람에 대해서 검사결과가 양성으로 잘 못 나올 확률 0.06
P(B)= 전체 인구의 약 1%가 감염된다 0.01
= 0.99
주의: 실제 감염은 1%지만 검사결과는 6.91%가 양성으로 나타났다 !!
)
| ( ) ( )
| ( ) (
) (
) (
)) (
) ((
) (
B A P B P B
A P B P
A B
P A
B P
A B
A B
P A
P
) (B P
)
| ( A B P
0691 .
0
06 . 0 99
. 0 97
. 0 01 . 0
)
| ( ) ( )
| ( ) ( )
(
P B P A B P B P A B A
P
3.6.1 총확률법칙
앞의 예제는 사건 A가 발생할 확률을 서로 배반인 두 개의 사건들로 구별하여 각각의 확률을 구한 뒤 더해서 해결한 것이다. 위의 식을 n 개의 사건들로 확장을 하면 다음과 같은 총 확률 법칙(law of total probability)을 얻을 수 있다
총확률법칙
예제 3.11
볼트를 생산하는 회사에는 3개의 생산 공장이 있다. 전체 생산량의 30%는 제 1공장에서 만들어지고, 50%는 제 2공장에서 생산되며 나 머지 20%는 제 3공장에서 생산되고 있다. 제 1공장에서 생산되는 볼 트의 불량률은 4%, 제 2공장은 5%, 제 3공장은 3%라고 한다면 이 회사에서 생산되는 볼트를 임의로 한 개 추출했을 때, 이 볼트가 불량 품일 확률은 얼마인가?
풀이
임의로 선택된 볼트가 불량품이 되는 사건을 A라고 하자.
B1 : 제 1공장에서 생산될 사건 B2 : 제 2공장에서 생산될 사건 B3 : 제 3공장에서 생산될 사건
총확률법칙
풀이)세 사건 B1,B2,B3은 서로 배반이며
B1∪B2∪B3은 표본공간 S가 된다.
각 공장에서 생산한 볼트가 불량품이 될 확률이 각각 0.04,0.05 그리 고 0.03이므로 P(A|B1)=0.04, P(A|B2)=0.05 그리고
P(A|B3)=0.03이 된다.
043 .
0
2 . 0 03 . 0 5
. 0 05 . 0 3
. 0 04 . 0
) (
)
| ( )
( )
| ( )
( )
| ( )
(
1 1 2 2 3 3
P A B P B P A B P B P A B P B A
P
3.6.2) 베이즈 법칙 예제
예제 3.10에서 만일 어떤 사람이 혈액검사에서 양성결과가 나왔다고 할 때, 실제로 그 사람이 그 질병에 걸렸을 확률 P(B|A)를 구해 보자.
) (
) ) (
|
( P A
A B
A P B
P
분모에 총 확률 법칙을 적용하고 분자를 조건부 확률로 바꾸자
)
| ( ) ( )
| ( ) (
)
| ( ) ) (
|
( P B P A B P B P A B
B A P B A P
B
P
따라서
즉, 그 사람이 그 질병에 걸렸을 확률 P(B|A)은 0.14, 14%이다.
14 . 0
06 . 0 99 . 0 97 . 0 01 . 0
97 . 0 01 . ) 0
| (
A
B
P
3.6.2) 베이즈 법칙
앞의 결과를 일반적인 경우로 확장하여 설명한 것이 다음의 베이즈 법 칙이다.
예제 3.12
예제 3.11에서 임의로 추출한 볼트가 불량품으로 확인되었다. 이 불 량품이 제 2공장에서 생산되었을 확률은 얼마인가?
풀이
이 문제는 예제 3.11의 풀이에서 정의했던 사건들로 표현하면 P(B2|A)를 구하는 문제이다.
)
| ( ) ( )
| ( ) ( )
| ( ) (
)
| ( ) ) (
| (
3 3
2 2
1 1
2 2
2
P B P A B P B P A B P B P A B
B A P B A P
B
P
581 . 0
043 . 0
025 . 0
2 . 0 03 . 0 5 . 0 05 . 0 3 . 0 04 . 0
5 . 0 05 . ) 0
| ( 2
A B P
각 확률을 대입하면