이기훈
정규분포 정규분포
통계학 개론 6 주차 강의
이기훈
오늘 배울
내용은
• 지난 주엔
• 확률분포 중에서 먼저
• 이항분포 배웠고
• 오늘은 정규분포
� 1 � 2 � 3 � 4 � 5 � 6
⋯
연속형 (continuous) 분포 이산형 (discrete) 분포
이기훈
정규분포 (Normal Distribution)
• Normal?
• 정상적인 ?
• 과거에는 모든 분포가 이런 모양이 어야 정상이라 생각
• 특징
• 평균을 중심으로 좌우대칭
• 평균주변의 확률이 가장 높다
• ±3σ 안에 대부분
X~N(μ, σ
2)
�
�
�+� �+2 � �+3 �
�−3 � �−2 � �− �
�
이기훈
정규분포 의 예
교재 88 쪽
• 성인남자의 신장
• X~N(172,3
2)
3
�
172 175 178 181 1 63 166 1 69
이기훈
정규분포 의 예
교재 88 쪽
• 일반여성의 임신기간
• X~N(270,10
2)
10
�
270 280 290 300 240 250 260
이기훈
정규분포 의 예
교재 88 쪽
• A 제품의 길이
• X~N(100, 0.5
2)
0.5
�
100 1 00.5 101.0 1 01.5
98.5 99.0 99.5
이기훈
정규분포의 대략적인 확률은
� �+� �+2 � �+3 �
�−3 � �−2 � �− �
�
68.3%95.4%
99.7%
이기훈
정규분포 X 의 확률값
계산은 ?
� 1 � 2 � 3 � 4 � 5 � 6⋯
연속형 (continuous) 분포의 확률은 ?
이산형 (discrete) 분포의 확률은 ?
Pr(�2≤ � ≤ �4)=¿
Pr(� ≤ � ≤ �)=¿
�
�
구간을 무한히 많은 점으로세분화하여 각점에서
확률을 더해줌 = 적분
¿ ∫
�
�
�
(�
)��
이기훈
정규분포의 확률값은 표준정규분포를 이용한다
X~N(μ, σ
2)
�
�
�+� �+2 � �+3�
�−3 � �−2 � �− �
�
Z~N(0, 1)
0 1
1 2 3
−3 −2 −1
�
�
�
�′ �′¿ ∫
�
�
1
√ 2 � � �
−(� − �)2
2�2
ⅆ �
¿ ∫
�′
�′
1
√ 2 � �
− �2
2
ⅆ �
� = � − �
�
이기훈
표준정규분포 의 확률은
• 책뒤의 부록표에서 구한다
– 교재 389 쪽입니다
• 표준정규분포표를 이용하려면 먼저 표준화부터
• X~N(172,3
2) 에서
X=172 => Z= ? X=175 => Z= ? X=178 => Z= ? X=169 => Z= ? X=165 => Z= ?
� = � − �
�
0 1
2 -1 -7/3
엑셀에서는 쉽게 확률을 구할 수 있음
이기훈
표준정규분포는
•X ~ N(μ, σ 2 )
•Z ~ N(0, 1)
표준화
X~N(μ, σ
2)
� �
Z~N(0, 1)
0 � − �
�
표준정규분포 표에서 찾음
이기훈
표준정규 분포표 보는 법
Z~N(0, 1)
0 1
Z~N(0, 1)
0 1.64
이기훈
예제 2.
9
• X ~ N(180, 50
2)
1) 270 이상일 확률은
3) 180 에서 230 사이의 확률은 2) 상위 5% 안에 들려면 ?
50
�
180 230 280 330 30 80 130 270
1
�
0 1 2 3
−3 −2 −1 1.8
270− 180
50 =1.8
이기훈
1
�
0 1 2 3
−3 −2 −1 1.8
.9641
1-.9641
=.0359
이기훈
예제 2.
9 • X ~ N(180, 50
2)
1) 270 이상일 확률은
3) 180 에서 230 사이의 확률은 2) 상위 5% 안에 들려면 ?
�
180 230 280 330 30 80 130
50
1
�
0 1 2 3
−3 −2 −1
230− 180
50 =1
이기훈
�
0 1 2 3
−3 −2 −1
.8413
0.8413-0.5
=.3413
이기훈
예제 2.
9
• X ~ N(180, 50
2)
1) 270 이상일 확률은
3) 180 에서 230 사이의 확률은 2) 상위 5% 안에 들려면 ?
50
�
180 230 280 330 30 80 130 ? ? ? ?
1
�
0 1 2 3
−3 −2 −1 1.645
0.05
0.05
이기훈
�
0 1 2 3
−3 −2 −1
.9495
1.6 4
이기훈
예제 2.
9
• X ~ N(180, 50
2)
1) 270 이상일 확률은
3) 180 에서 230 사이의 확률은 2) 상위 5% 안에 들려면 ?
50
�
180 230 280 330
30 80 130 �
1
�
0 1 2 3
−3 −2 −1 1.645
0.05
0.05
�−180
50 =1.645
�=180+50 ×1.645=262.25
이기훈
표준정규분포 상위백분위수
• Z
α• 표준정규분포에서 상위 α 확률이 되는 z 값
1
�
0 1 2 3
−3 −2 −1
�
��
이기훈
연습
• Z
0.025• Z
0.05• Z
0.011
�
0 1 2 3
−3 −2 −1
�
0.0250.025
1
�
0 1 2 3
−3 −2 −1
�
0.050.05
1
�
0 1 2 3
−3 −2 −1
�
0.010.01
이기훈
참고 1> 표준점수
• 수능표준점수
• A 과목의 60 점 ( 원점수 )
• B 과목의 60 점 비교
• A 에서 Z 값은 -1
• B 에서 Z 값은 +1
• A 에서 표준점수는 100+20*(-1)
• B 에서 표준점수는 100+20*(+1)
• A 에서 만점자의 표준점수는 ?
• B 에서 만점자의 표준점수는 ?
10
�
60 70 80 90 30 40 50
10
�
60 70 80 90 30 40 50
이기훈
참고 2> 골다공증 표준점수
• T-score & Z-score
• T-score 는 전체분포에서 표준화
• Z-score 는 동일연령대에서 표준화
• T-score 가 -2.5 미만이면 골다공증 판정
• 골다공증 환자의 비율은 ?
• =1-0.9938=0.0062
1
�
0 1 2 3
−3 −2 −1
�
이기훈
� �+� �+2 � �+3 �
�−3 � �−2 � �− �
�
�
• 품질관리
• 생산제품이 항상 일정한 양을 유지
• 표준편차가 작아지도록 품질관리
• 불량율을 최대한 줄이는 방식
• 이때 불량율은 ?
참고 3> six-sigma
우량 불량
불량
�
� �+3 � �+6�
�−6 � �−3 �
이기훈