연속확률분포(2) 제 4장
<학습목표>
• 연속확률분포에 해당하는 여러 가지
분포들을 소개하고 그 특징을 알아본
다.
<학습내용>
1. 이항분포의 정규근사
2. 표본분포이론
<본문내용>
1. 수업에 앞서 1) 앞에서
⇒ 실험결과가 성공이나 실패, 두 가지만 나 오는 시행에서 각 시행마다 일정한 성공확률 을 라 하고 이러한 시행을 번 독립적으로 반 복했을 때 성공한 횟수인 이항확률변수에 대 하여 알아보았다.
2) 문제는
⇒ 그러나, 이 커지면 이항분포의 확률을 계산 하는 것이 매우 복잡하고 이항분포표를 이용 할 수도 없다. 따라서 6.3절에서 이 크고 가 0 에 가까울 때 이항분포가 포아송분포에 근사 한다는 것을 알아보았다.
3) 대안으로
⇒ 이 절에서는 이 크고 가 0이나 1에 가깝지 않을 경우 이항분포가 정규분포에 근사 한다는 것을 설명하고자 한다.
4) 예를 들어
⇒ <그림 7.15>는 일 때 으로 변화시켜 가면서 이항분포의 모양을 나타내고 있다. n이 커짐에 따라 분포의 모양이 중심에 대하여 대칭인 종 모양으로 되어간다.
5) 정규근사
⇒ 이러한 현상은 이 점점 더 커짐에 따라 더욱더 정규분포의 모양을 닮아간다.
◀ 1단계
⇒ n이 커지고 p의 값이 0이나 1에 가깝지 않을 경우(일반적으로 np>5 이고 n(1-p)>5 일 경우) 이항확률변수 는 평균이
이고 분산이 np(1-p)인 정규분포 N(np,np(1-p)) 에 가까워진다.
◀ 2단계
⇒ 따라서 n이 충분히 크고, X~B(n,p)일 때,
의 분포는 근사적으로 표준정규분포 N(0,1) 을 따른다.
X가 n=25, p=0.4 인 이항분포를 따를 때, 다음의 확률을 구하여라.
1) X가 9에서 12 사이에 포함될 확률은?
2) X가 5 이하일 확률은?
<풀이>
먼저 X의 평균과 분산을 구하여 보자.
평균 = np =(25)(0.4) = 10
분산 = np(1-p) =(25)(0.4)(0.6) = 6 이므로,
<예제 6>의 근사적인 결과와 실제로 부록
<표 1>의 이항분포표를 이용한 결과를 비교 하여 근사 정도를 알아보도록 하자. 2)번의 경우 n=25, p=0.4 인 이항분포표로부터
가 정확한 값이 된다.
6) 문제의 발생
⇒ 실제 정확한 값과 근사적인 값이 약간의 차이가 있다. 따라서 근사적인 값이 좀더
실제 값에 가깝게 하기 위한 방법을 생각해 보자.
<예제 6> (2)의 확률 은 <그림 7.16>의 빗금 친 부분의 면적으로서 실제로는 5.5까지의 직사각형들의 면적합이다. 이 확률은 연속적인 정규분포의 확률밀도곡선에서 5.5까지의 면적을 구하면 좀 더 정밀한 근사 값을 얻을 수 있을 것 이다. 따라서
7) 연속성수정
⇒ 이와 같이 이산형 분포를 연속형 분포로 근사 시킬 때 약간의 수정(여기서는 +0.5)을 하는 것을 연속성 수정(continuity correction) 이라 한다. 위의 예에서 연속성 수정후의 값 0.0333은 (예제 6)(2)의 값 0.0207보다 실제 값 0.029 에 더 가까워졌음을 알 수 있다.
<note> 수정의 방법
최근의 설문조사에 의하면 대학교 남학생의 흡연률이 60%라고 조사되었다. 무작위로 15 명의 남학생을 추출하였을 때 그 중 8명 또 는 9명이 흡연할 확률을 다음을 이용하여 구 하여라.
1) 이항분포의 공식(식(6.1))을 이용하여 구하여라.
2) 연속성 수정을 하지 않고 정규분포의 근사를 이 용하여 근사확률을 구하여라.
3) 연속성 수정을 하여 (3)과 같이 근사확률을 구하 여라.
<풀이>
X를 흡연하는 학생수라고 했을 때 n=15, p=0.6이고, x=8 또는 9이다.
따라서 구하고자 하는 확률은
이다.
1) 식 (6.1)의 이항분포 공식을 이용하면
이므로
평균 np = (15)(0.6) =9
분산 = np(1-p) = (15)(0.6)(0.4) =3.6
결론적으로, 연속성 수정을 한 3)의 값이 2)보다 1)의 값에 가깝다.