금융데이터분석
4주차 1강
원광대학교 경영학부 담당교수: 정호일
금융데이터분석
제4장: 확률이론
사상과 표본공간
집합이론
확률의 정의
확률의 연산법칙
1. 사상과 표본공간
실험(experiment)이란 관찰(시행) 또는 측정하기 전에는 확실하게 예측할 수 없는 결과를 유발하는 행위 또는 과정 을 말하는데 그 결과에 대해 구체적인 값을 부여하게 된다.
단일사상(simple event)이란 더 이상 단순한 결과로 분해 할 수 없는 실험의 기본결과를 말하는데 표본점(sample point)이라고도 한다.
사상(event)이란 하나 또는 둘 이상의 단일사상의 집합을 말하는데 사건이라고도 한다. 표본공간의 특정 표본점
표본공간(sample space)이란 실험 또는 표본의 실현가능 한 모든 결과의 집합을 말한다.
2. 집합이론
• 집합의 개념
집합(set)이란 명확히 정의된 개체 또는 항목의 모임을 말한다.
• 집합의 종류
합집합(union set)
교집합(intersection set)
차집합(difference set) {집합A원소가운데 집합B의 원소를 제외한 나머 지 원소의 집합}
여집합(complementary set)
={전집합U의 부분집합 A에 있어 전체집합 U와 집합A의 차집합}
} B
A
{집합 또는집합 에속하는모든원소
B A
} B
A
{집합 와집합 에속하는공통원소
B A
B A
}
{x x A A
3. 확률의 정의
사상에 확률을 부여하는 방법으로 세가지 방법 이 있다.
객관적 방법 고전적 방법
상대도수 방법
주관적 방법
•고전적 방법
고전적 방법은 실험의 결과로 나타나는 각 사상이 발생할 가능성이 모두 동일한(equally likely)경우에 적용된다.
사상A와 관련된 사상의 수 P(A)=
표본공간에 속하는 전체 사상의 수
•상대도수 방법
상대도수적 확률개념을 사용할 때 어떤 사상이 발생할 확률이란 실험의 횟수가 증가함에 따라 장기적으로 얻어지는 그 사상의 상대도수의 수렴치를 뜻한다.
N:실험의 총시행횟수 n:사상 A가 발생한 횟수
N A n
P
N lim )
(
•주관적 방법
고전적 개념과 상대도수 개념은 사실에 입각하여 사상에 확 률을 부여할 수 있을 때 사용되지만 결과들이 똑같이 발 생하지 않는 상황이나 자료를 구할 수 없는 경우에는 주 관적 지식,경험,통찰력,정보에 입각하여 발생확률을 결정 하게 되는데 이를 주관적 방법이라 한다.
4. 확률의 연산법칙
사상을 결합시키는 기본적인 확률법칙은 다음과 같이 구분 할 수 있다.
덧셈법칙 일반법칙:두 사상이 상호배타적이 아닌 경우 특별법칙:두 사상이 상호배타적인 경우
곱셈법칙 일반법칙:두 사상이 종속적인 경우 특별법칙:두 사상이 독립적인 경우
•덧셈법칙
덧셈법칙은 두 사상의 합확률(union probability)을 계산하 는데 이용된다.
) (
) ( )
( )
(
A B P A P B P A B
P
) ( )
( )
( A B P A P B P
특별법칙:두 사상이 배타적인 경우
일반법칙: 두 사상이 배타적이 아닌 경우
•조건확률
또는
) (
) ) (
(
) (
) ) (
(
A P
B A
A P B P
B P
B A
B P A P
또는
조건확률:두 사상이 종속적인 경우
조건확률이란 다른 사상이 이미 발생하였다는 조건하에서 어떤 한 특정사상이 발행할 가능성을 측정하는 확률을 말한다.
조건확률: 두 사상이 독립적인 경우
) ( )
(
) ( )
(
B P A
B P
A P B
A P
주변확률과 결합확률
두사상 A와 B에 대하여
주변확률: 단일사상의 발생확률 즉, P(A)와 P(B)
결합확률: 두 사상이 동시에 나타날 확률, 즉 P(A∩B)
•곱셈법칙
) (
) ( )
(
) (
) ( )
(
A B P A P B
A P
B A P B P B
A P
또는
일반법칙:두 사상이 종속적인 경우
특별법칙: 두 사상이 독립적인 경우
𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴)𝑃(𝐵)
𝑃(𝐵 ∩ 𝐴) = 𝑃(𝐵)𝑃(𝐴)예) W자동차㈜가 2019년 생산판매한 20,000대 차량의 모델별, 색깔별 분할표가 다음과 같다.
1) 무작위로 한 대를 뽑을 때 청색일 확률을 구하라.
2) 무작위로 뽑은 한대의 모델이 워드일때 그의 색깔이 청색일 확률을 구하라.
모델 칼라
빨강 흰색 청색 합계
워드 2,000 5,500 2,500 10,000 엑셀 2,000 4,500 3,500 10,000 합계 4,000 10,000 6,000 20,000
모델 칼라
빨강 흰색 청색 합계
워드 엑셀 합계
예) 1,200명의 승진대상 교사가운데 남자 800명, 여자400명이다. 교사가운데 지난 2년간 승진한 교사는 250명, 승진하지 못한 교사는 950명이라고 한다.
1) 교사가 남자라는 사실을 알고 있을 때 한 남자교사가 승진할 확률은?
2) 교사가 여자라는 사실을 알고 있을 때 한 여자교사가 승진할 확률은?
남자(M) 여자(F) 합계
승진(U) 200 50 250 탈락(D) 600 350 950
합계 800 400 1200
남자(M) 여자(F) 합계
승진(U) 탈락(D)
합계
예제) 한 상자 속에 크기가 같은 건전지 10개가 있다. 이 가운데 불량품은 3개라고 한다.
이 상자에서 비복원추출로 건전지를 1개씩 차례로 2개를 꺼낼 때 두개가 모두 불량일 확률은 얼마인가?
(단, 첫번째 꺼낸 건전지가 불량일 사상을 A, 두번째 꺼낸 건전지가 불량일 사상을 B라고 하자.)
예제) 6개의 흰돌과 4개의 검은 돌이 들어있는 바둑통에서 돌을 하나씩 두번 꺼내는 실험을 실시 하려고 한다.
1) 복원추출하는 경우 두 돌이 모두 흰돌일 확률을 구하라.
2) 비복원추출하는 경우 두 돌이 모두 흰돌일 확률을 구하라.