• 검색 결과가 없습니다.

제 5 장 확률변수와 확률분포

N/A
N/A
Protected

Academic year: 2022

Share "제 5 장 확률변수와 확률분포"

Copied!
25
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

금융데이터분석

(2)

제 5 장 확률변수와 확률분포

 확률변수

 확률분포

 확률함수

 기대값과 분산

 결합확률분포

 공분산과 상관계수

(3)

1. 확률변수

확률변수 (random variable)

확률실험의 결과로 결정되는 수치를 취할 가능성을 확률로 표시할 수 있 는 변수를 말한다.

이산확률변수와 연속확률변수

이산확률변수(discrete random variable)

셀 수 있는 정수값을 취하는 변수를 말한다. (예: 가족중 남자의 수,한시간 동 안 어떤은행에 도착하는 고객의 수 등)

연속확률변수(continuous random variable)

일정한 실수구간 내에서 연속적인 값을 취할 수 있는 확률변수를 말한다. (예:

가족의 연간소득,증권의 수익률,체중,키,온도)

(4)

2. 확률분포

확률분포 (probability distribution)

실험의 가능한 모든 결과를 수치로 나타내고 각 결과에 대응하는 확률을 표, 그래프, 함수 등으로 나타낸 것.

이산확률분포와 연속확률분포

 이산확률분포(discrete probability distribution)란 이산확률변수의 확 률분포를 말한다. 예) 이항분포, 포아송분포, 초기하분포 등

연속확률분포(continuous probability distribution)란 연속확률변수의 확률분포를 말한다. 특정한 확률변수에서는 확률을 구할 수 없으며

(P(x=X)=0), 변수값의 일정 범위(P(a<X<b)에서 구함.

예) 균등분포,정규분포,지수분포,t분포,F분포,카이제곱(X2)분포 등

(5)

주사위 한 개를 던지는 실험의 눈금수를 확률변수 X라고 할 때 확률분포를 나타내시오.

동전을 세개를 한번에 던지는 실험에서

1)앞면을 H, 뒷면을 T라고 할 때 표본공간을 구하시오.

2)확률변수 X를 앞면이 나오는 수라고 정의할 때 확률분포를 표로 나타내 시오.

(6)

3. 확률함수

확률함수 (probability function)

확률변수 X가 어떤 특정한 실수값 x를 취할 확률을 일일이 나열하지 않고 x의 함수로 간편하게 나타낸 것을 말한다.

 확률함수는 대상이 되는 변수가 이산이냐 또는 연속이냐에 따라 확률질량 함수(probability mass function : pmf)와 확률밀도함수(probability density function : pdf)로 나뉜다.

(7)

 확률질량함수(PMF, probability mass function)

이산확률변수 X가 취할 수 있는 각각의 실수값에 확률을 대 응시키는 방법/규칙으로 일반적으로 P(X)로 나타냄

조건

모든 실수값 x에 대하여 P(X=x)  0

 확률밀도함수(PDF, probability density function)

연속확률변수 X가 취할 수 있는 실수구간에 대하여 확률을 대응시키는 방법/규칙으로 일반적으로 f(X)로 나타냄

조건

모든 x에 대하여, f(x)  0

모든 X에 대한 확률의 합은 1이다.

−∞

𝑓(𝑥)𝑑𝑥 = 1

𝑥

𝑃(𝑋 = 𝑥) = 1

(8)

확률변수 X가 1,2,3,4의 가능한 값을 갖는다고 하자.각 값의 대응하는 확률이 다음 과 같다.

1) 확률변수 X의 확률함수를 구하라.

2) 위에서 구한 함수는 확률질량함수인가?

다음 함수는 확률밀도함수인가?

𝒇 𝒙 =

𝒙𝟐

𝟑 (−𝟏 ≤ 𝒙 ≤ 𝟐) 𝟎 (그 이외의 점)

X P(X)

1 1/10

2 2/10

3 3/10

4 4/10

(9)

4. 기대값(expected value)

기대값은 자료의 중심적 경향을 나타내 주는 수치적 척도 로써, 확률변수가 취할 수 있는 모든 값의 평균을 의미한다 .

X가 이산변수인 경우:

X가 연속변수인 경우:

𝐸[𝑋] = ෍ 모든⥂𝑥

𝑋𝑃(𝑋)

𝐸[𝑋] = න 모든⥂𝑥

𝑋𝑓(𝑋) 𝑑(𝑥)

(10)

기대값의 특성

a a

E ( ) 

) ( )

( bX bE X

E

) ( )

( a bX a bE X E   

) ( )

( )

( X Y E X E Y

E   

) ( )

( )

( aX bY aE X bE Y

E   

(단, a와 b는 상수, X와 Y는 확률변수)

(11)

다음은 어떤 가계의 하루 판매량과 확률을 나타낸 확률분포표이다. 하루 판매량의 기대값을 구하라.

X P(X)

0 0.2

1 0.3

2 0.4

3 0.1

(12)

기대값은 확률분포의 집중경향을 나타내는데 반하여 분산(variance) 또는 표준편차(standard deviation)는 확률변수들이 기대값을 중심으로 얼마나 흩어져 있는가를 나타내는 산포도(degree of dispersion)의 측정치이다

5. 분산(Variance)

𝑉𝑎𝑟[𝑋] = 모든⥂𝑥

𝑋 − 𝐸 𝑋 2𝑃(𝑋)

𝑉𝑎𝑟[𝑋] = න 모든⥂𝑥

𝑋 − 𝐸 𝑋 2𝑓(𝑋) 𝑑(𝑥) 이산확률분포

연속확률분포

(13)

분산의 특징

𝑉𝑎𝑟(𝑎) = 0

𝑉𝑎𝑟(𝑎 ± 𝑥) = 𝑉𝑎𝑟(𝑥) 𝑉𝑎𝑟(𝑎𝑥 ± 𝑏) = 𝑎2𝑉𝑎𝑟(𝑥)

𝑉𝑎𝑟(𝑥 ± 𝑦) = 𝑉𝑎𝑟(𝑥) + 𝑉𝑎𝑟(𝑦)(단, 𝑋와 𝑌가 독립)

𝑉𝑎𝑟 𝑥 ± 𝑦 = 𝑉𝑎𝑟 𝑥 + 𝑉𝑎𝑟 𝑦 ± 2𝑐𝑜𝑣(𝑥, 𝑦)(단, 𝑋와 𝑌가 종속) 𝑉𝑎𝑟(𝑎𝑥 ± 𝑏𝑦) = 𝑎2𝑉𝑎𝑟(𝑥) + 𝑏2𝑉𝑎𝑟(𝑦)(단, 𝑋와 𝑌가 독립)

𝑉𝑎𝑟(𝑎𝑥 ± 𝑏𝑦) = 𝑎2𝑉𝑎𝑟(𝑥) + 𝑏2𝑉𝑎𝑟(𝑦) ± 2𝑎𝑏𝐶𝑜𝑣(𝑋, 𝑌)(단, 𝑋와 𝑌가 종속)

(14)

다음은 어떤 가계의 하루 판매량과 확률을 나타낸 확률분포표이다. 하루 판매량의 분산과 표준편차를 구하라.

X P(X)

0 0.2

1 0.3

2 0.4

3 0.1

(15)

5. 결합확률분포

) ,

( )

, (

.

,

y Y x X P Y

X P

y Y

x X

Y X

말한다 함수를

발생시키는 확률을

대응하는 취할때

실수값

변수 실수값

변수

결합확률함수란

이산변수

 결합확률함수

− 모든 실수값 𝑥, 𝑦에 대하여 𝑃(𝑋, 𝑌) ≥ 0이다.

− 두 변수 𝑋와𝑌가 취할 수 있는 모든 값에 대한 확률의 합은 1이다.

결합확률함수의 조건

 결합확률분포

둘이상의 확률변수가 서로 연관된 확률분포로서 확률변수 X와

Y의 값의 모든 쌍에 대하여 결합확률 𝑷(𝑿𝒊, 𝒀𝒋) = 𝑷(𝑿 = 𝒙 ∩ 𝒀 = 𝒚)를 나타낸 것.

(16)

주변확률함수

 

 

x y

Y X P Y

P

Y X P X

P

Y X

모든 모든

같다 다음과

주변확률함수는 의

와 이산확률변수

) , ( )

(

) , ( )

(

.

(17)

 X와 Y의 관계

𝐶𝑜𝑣(𝑋, 𝑌) = 𝐸[(𝑋 − 𝐸(𝑋))(𝑌 − 𝐸(𝑌))]

= 𝐸(𝑋𝑌) − 𝐸(𝑋)𝐸(𝑌)

공분산(Covarience): 두 변수 간의 선형관계 여부를 측정하는 척도

𝐶𝑜𝑣(𝑋, 𝑌) > 0 X와 Y가 정의 선형관계

𝐶𝑜𝑣(𝑋, 𝑌) < 0 X와 Y가 부의 선형관계

𝐶𝑜𝑣(𝑋, 𝑌) = 0 X와 Y는 선형관계 없음

6. 공분산과 상관계수

(18)

변수 X와 Y의 관계

𝐶𝑜𝑣(𝑋, 𝑌) = 𝐸[(𝑋 − 𝐸(𝑋))(𝑌 − 𝐸(𝑌))]

= 𝐸(𝑋𝑌) − 𝐸(𝑋)𝐸(𝑌)

(19)

𝜌𝑋𝑌 = 𝐶𝑜𝑣(𝑋, 𝑌) 𝜎𝑋𝜎𝑌

𝜎𝑋: 변수 𝑋의 표준편차 𝜎𝑌: 변수 Y의 표준편차

공분산의 단점은 X와 Y가 선형관계가 있는지, 그리고 그것이 정의 관계인지 부의관계 인지는 알려주지만, 공분산의 값이 얼마나 커야 밀접한 선형관계에 있는지를 제시 못함.

상관계수(correlation coefficient)

−1 ≤ 𝜌𝑋𝑌 ≤ 1

𝑖𝑓 𝜌𝑋𝑌 = 1, 𝑋와 𝑌가 완전 정(+)의 상관 𝑖𝑓 0 < 𝜌𝑋𝑌 < 1, 𝑋와 𝑌가 정(+)의 상관 𝑖𝑓 𝜌𝑋𝑌 = 0, 𝑋와 𝑌가 무상관

𝑖𝑓 − 1 < 𝜌𝑋𝑌 < 0, 𝑋와 𝑌가 부(-)의 상관 𝑖𝑓 𝜌𝑋𝑌 = −1, 𝑋와 𝑌가 완전 부(+)의 상관

(20)

예제1: 결합확률분포표를 이용해서 다음을 계산하시오.

X

Y 200 100 0 주변확률

100 0.1 0.1 0.2 0.4

0 0.1 0.3 0.2 0.6

주변확률 0.2 0.4 0.4 1.0

[ 결합확률분포표 ]

1) 변수 X와 Y의 기대값을 구하시오.

2) 변수 X와 Y의 분산 및 표준편차를 구하시오.

(21)

예제1: 결합확률분포표를 이용해서 다음을 계산하시오.

X

Y 200 100 0 주변확률

100 0.1 0.1 0.2 0.4

0 0.1 0.3 0.2 0.6

주변확률 0.2 0.4 0.4 1.0

[ 결합확률분포표 ]

3) 공분산과 상관계수를 구하고 의미를 설명하시오

(22)

예제2: 투자자 김씨는 내년에 주식X 또는 펀드 Y에 투자할 계획을 가지고 있다. 각 대안에 100만원을 투자하였을 때 예상되는 각 경제상황에 다른 연간 수익과 확률을 나타낸 확률분포가 다음과 같다.

경제상황 확률 주식X 펀드 Y

불황 0.2 -200 200

보통 0.5 100 80

호황 0.3 250 -100

[ 수익의 확률분포표 ]

3) 확률변수 X와 Y의 합의 기대값을 구하라

1) X와 Y의 기대수익을 구하라.

2) X와 Y의 분산과 표준편차를 구하라.

(23)

예제2: 투자자 김씨는 내년에 주식X 또는 펀드 Y에 투자할 계획을 가지고 있다. 각 대안에 100만원을 투자하였을 때 예상되는 각 경제상황에 다른 연간 수익과 확률을 나타낸 확률분포가 다음과 같다.

경제상황 확률 주식X 펀드 Y

불황 0.2 -200 200

보통 0.5 100 80

호황 0.3 250 -100

[ 수익의 확률분포표 ] 4) 확률변수 X와 Y의 공분산을 구하라.

5) 확률변수 X와 Y의 상관계수를 구하라.

(24)

예제3: 투자자 강씨는 주식 A와 B를 소유하고 있다. 이들 두 주식에 대한 예상수익률을 확률변수 X와 Y라고 정의할 때 결합확률분포가 다음가 같다고 하자.

X Y 5% 10%

0% 0.25 0.25 5% 0.25 0.25

[ 수익률의 결합확률분포표 ] 1) 확률변수 X와 Y의 주변확률을 구하라.

3) 확률변수 X와 Y의 기대수익률을 구하라.

2) 확률변수 X와 Y의 독립성을 판정하라.

(25)

예제3: 투자자 강씨는 주식 A와 B를 소유하고 있다. 이들 두 주식에 대한 예상수익률을 확률변수 X와 Y라고 정의할 때 결합확률분포가 다음가 같다고 하자.

X Y 5% 10%

0% 0.25 0.25 5% 0.25 0.25

[ 수익률의 결합확률분포표 ]

4) 확률변수 X와 Y의 분산과 표준편차을 구하라

5) Cov(X,Y)과 𝜌𝑋𝑌를 구하라.

6) E(X+Y)를 구하라.

7) Var(X+Y)를 구하라.

참조

관련 문서

진로와 직업과는 자신의 흥미, 적성, 능력을 이해하고 다양한 직업 세계 및 진로에 대한 폭넓은 탐색과 경험을 바탕으로 진로 계획을 수립하며 진학 또는 취업에 필요한

확률변수와 확률분포 (Random Variable. &amp;

직원과 마찬가지로 서비스의 생산과 전달 과정에 참여 준직원으로서 고객이 가지는 불확실성에 유의해야 함 준직원.. 고객에게 최적의 역할을 부여하면

 오로지 조직을 생산과 효율성의 도구로만 인식 (Organization as Machine)..  One Best Way in

대출이자를 견디다 못한 김씨는 결국 2억 원에 집을 내놓게 된다.. 만약 김씨가 온전히 자기 돈으로 집을 샀다면 아무리 경기가

 컴퓨터공학과의 김이화 학생과 환경공학과의 홍이화 학생의 정보를 저장 하고자 한다... (예제2) 학과 주소를

In sows, ovulatory size (8 mm to 11 mm) follicles develop only during the follicular phase after luteal regression.. Prior to luteal regression, the number of small antral

 Ex) 사과 과수원을 경영하는 김씨는 자신의 과수원 을 두부분으로 나누어 한쪽은 살충제를 뿌리고. 다른 한 쪽은 직접 벌레를