10. 1 개 요
추론(inference) Ex)
의사결정의 일반적 방법 Ex) 9시 수업이 있는데 늦잠을 잤다
추정 : 모집단에 대한 선입관이 없다
가설검정 : 모집단에 대한 선입관이 있다
오늘 비가 오나 안오나? 창문열고 확인
9시 뉴스 일기예보(내일맑음) 물소리 비오나? 창문열고 확인
택시를 타고 수업에 간다
버스를 타고 가다 늦으면 제낀다
Action Cost Reward
택 시 돈 수 업
버 스 수 업 돈
평범한 날
Action Cost Reward
택 시 돈 학 점
버 스 학 점 돈
시험보는 날
10. 2 통계적 가설
Ex1) 동전이 정상이다
Ex2) 새타이어의 수명이 km 보다 길다) (H P
p 일 때,
2
1
p 이다
000 ,
40 000
,
40
, 여기서 는 새 타이어의 평균 수명
, 40,000 2
1
p
귀무가설(null hypothesis)
대립가설(alternative hypothesis) 새로운 주장
※대립가설을 채택할 충분한 이유가 없으면 귀무가설로 돌아감
통계적 가설의 예
Ex1) 9시 일기예보
Ex2) 형사재판
Ex3) 처음 만난 사람에 대한 평가물소리 비오나? 확인
0 :
:
맑 음 비
사기 2 ~ 3번
기존의 이론
증명하고 싶은 새로운 주장
0 :
:
무 죄 유 죄
0 :
:
착한 사람 나쁜 놈
0 :
:
나쁜 놈 착한 사람
0 :
:
두 종류의 Error
두 종류의 error0
error
TypeⅠ 가 사실인데 기각
0
error
Type Ⅱ 가 거짓인데 기각하지 않음
0
reject Action
reject not
Do
False
True TypeⅠerror
error Type Ⅱ
OK
OK error
TypeⅠ
일반적으로 가 더 심각
) (Type error
P Ⅰ
) (Type error
P Ⅱ
와 가 모두 적은 결정법칙이 최선
가 감소하면 가 증가, 가 감소하면 가 증가
두 종류 Error의 증감
Ex) 운전면허 필기시험 Test 1 : 50문항중 30개 이상 맞으면 합격
Test 2 : 50문항중 20개 이상 맞으면 합격
Test 3 : 50문항중 40개 이상 맞으면 합격
운전능력 없다
0 :
: 운전 능력 있다
운전능력 없는 사람이 있다고 판정)
(
P
) (
P
운전능력 있는 사람이 불합격
Test 1 Test 2, 는 증가, 는 감소
Test 1 Test 3, 는 감소, 는 증가
Ex) 운전면허 필기시험 Test 4 : 50문항중 0개 이상 맞으면 합격
Test 5 : 50문항중 50개 다 맞으면 합격
어느 Test를 택하느냐는 를 정함으로써 결정되는 선택의 문제임
운전능력 없다
0 :
: 운전 능력 있다
운전능력 없는 사람이 있다고 판정)
(
P
) (
P
운전능력 있는 사람이 불합격
0 ,
1
1 ,
0
두 종류 Error의 증감
Ex) 0 : 착한친구 : 나쁜친구가 작은 사람
두 종류의 Error
가 큰 사람
웬만해선 나쁜 친구로 판정 안함
조금만 잘못해도 나쁜친구로 판정
(친구가 별로 없음)
사기를 잘 안당함 인 유일한 인간
0
사기를 잘 당함
가 큼
가 작음
Ex) 0 : 평범한 땅선사유적지
:
두 종류의 Error
돌도끼 한 개 발견 돌도끼 두 개 발견
돌도끼 100개, 조개껍질무덤, …
0
평범한 땅을
선사유적지로 판정)
(
P
선사유적지를
평범한 땅으로 판정)
(
P
0 :
선사유적지 평범한 땅
:
고고학회
0 :
평범한 땅으로 판단
선사유적지로 판단
:
두 종류의 Error 기준
Ex1) 사법시험
Ex2) 사법재판평범한 사람
0 :
: 법조인
) (
P
평범한 사람을 법조인으로
) (
P
법조인 자격이 있는 사람을 평범한 사람으로
무 죄
0 :
: 유 죄
) (
P
무죄인 사람을 죄인으로
) (
P
죄인을 죄가없는 사람으로
자격이 있는 사람이 떨어지면 내년 재시험
사법시험은 가 보다 훨씬 작은 시험
이며, 가 큼
0
10. 3 가설검정의 방법
Ex) 현재 생산되는 전구의 수명은 평균 인 정규 분포에 따른다. 450
2 2 60
450 :
450
0
: H
A
H
새 기술을 적용하면 평균 수명이 늘어날 것이다
(단위 : 연속사용시간)
새 기술을 적용한 전구 중 개를 확률 표본으로 뽑아 수명 검사 후 표본평균 를 계산
n
X
에 대한 평가는 X를 통해서만 가능하다
0를 기각할 이유가 전혀 없다 를 기각하고 쪽으로!!!!
0
만약, x 400 만약, x 500
결정법칙
결정법칙(decision rule) 표본 평균 가 475보다 크면 를 기각한다
x 0475 임계치(critical value)
기각역(rejection region)혹은 위험역(critical region)
475
x x R
가 참일 때 의 분포 곡선 X
0 가 참일 때
의 분포 곡선 X
[그림 10.1] 기각역이 일 때 제 1종 및 제 2종의 오류를 범할 확률
450 475 500
결정법칙
) 450 /
475
(
P X
3 ) 60
450
( 475
n
P X
) 25 . 1 (
P Z
11 . 0 1056
. 0 3944
. 0 5 .
0
같은 실험을 100번 반복하면 평균 11번 를 잘못 기각하는 오류(제 1종 오류)를 범한다
0
9 ) , 60 450 (
9 )
, (
~
2 2
N n n
N
X 만약 라면
) /
(0 0
P
기각 사실
450 475 500
결정법칙
가 500이라 가정 HA
) 500 /
475
(
P X )
9 , 60 500 (
~
2
N X
3 ) 60
500
( 475
n
P X
) 25 . 1 (
P Z
) 25 . 1 (
P Z
11 . 0 1056
.
0
400
500
) /
(H0 HA
P
불기각 사실
475 c
450 475 500
결정법칙
만약, 결정법칙이“ 가x 490 이상이면 0기각” 으로 바뀌면
) 450 /
490
(
P X
3 ) 60
450 ( 490
P Z
) 2 (
P Z
) 500 /
490
(
P X
3 ) 60
500 ( 490
P Z
) 5 . 0 (
P Z 0.3085
결정기준이 바뀌면 가 변한다
, 0228
.
0 450 490 500
결정법칙을 구하는 법(단측)
3 ) 60 ( 450
3 ) 60
( 450
c
Z c P
n P X
645 .
3 1 60
450
c
) 1 . 0 01
. 0 (
05 .
0
또는 또는 인 결정법칙(기준)을 구하라
? 05
. 0 )
450 /
(
P X c c
인
05 . 0 )
645 .
1
(Z
P 이므로
“ 가x 482.9 이상이면 기각” 0.05
450 c
05 . 0
9 .
482 c
결정법칙을 구하는 법(단측)
9 .
482
x 1.645
n x
) (
, ) ,
(
~ ,
,
, 2 2 2
1 X X N Known
X n
0 0
0 : :
검정통계량
의 기각역을 직접 구하는 것보다
검정 통계량의 값을 와 비교하는 것이 편리 x
z
0
0
z n
x 이면 기각
결정법칙을 구하는 법(양측)
) (
:
0
0 0 :
양측검정
2 0
0
z n
x 이면 기각
0 2
2
확률예제
Ex) 철수는 숫자가 적힌 5개의 공이 들어 있는 항아리를 갖고 있는데, 이 공들은 1, 2, 3, 4, 5의 수가 적혀 있거나
5, 6, 7, 8, 9의 숫자가 적혀있다는 것을 알았다. 철수는 항아리에서 하나의 공을 꺼내보고 다음과 같은 가설을 검정하려 한다(교과서 p.346, 문제3)
공에 적힌 수는 1, 2, 3, 4, 5 이다
0 :
공에 적힌 수는 5, 6, 7, 8, 9 이다
:
제 1종의 오류를 범할 확률은 0이고, 제 2종의 오류를 범할 확률은 최소가 되게하는 결정기준은 무엇인가?
① 기각역
② 만약,
③ 만약,
풀이) 이려면 1, 2, 3, 4, 5는 기각역에 들어가면 안된다 0 }
9 , 8 , 7 , 6
{
R 1/5 P{ X 5/사실} }
9 , 8 , 7 , 6 , 5
{
R 이면 1/5, 0 }
9 , 8 , 7
{
R 이면 0, 2/5
선택 poor
정답!!