표본의 크기가 작은 소표본에서는 중심극한 정리를 이용할 수 없 기 때문에 표본평균의 분포에 대한 가정이 필요하다.
일반적으로 소표본에서 필요한 가정이 모집단 분포가 정규분포라는 것이다.
소표본 (n<30) 에서 모평균의 가설검정 (p186)
모분산을 알 때
정규모집단에서 모분산을 아는 경우의 검정통계량
n Z X
/
0
0
Z0~N(0,1)이므로 대표본에서 사용한 검정규칙을 그대로 적용할 수 있다.
예제 7.6) 모분산이 36인 정규모집단에서 16개의 데이터를 추출한 결과 표본평균이 32.5였다. 을 유의수준 0.05에서 검정하여라.
소표본에서 모평균의 가설검정
30 :
, 30
: 1
0 H
H
풀이) 검정통계량의 관측값
67 . 16 1
/ 6
30 5
. 32
0
z
기각역 R:Z0 z0.05 1.645
검정통계량이 기각역에 포함되기 때문에 귀무가설을 기각한다.
이 검정의 p-값은 아래와 같다.
p-값=P[Z≥1.67]=0.0475
모분산을 모를 때( p187)
평균이 μ이고 분산이 σ2인 정규모집단에서 크기 n인 확률표본 X1,…,Xn을 추출할 때, 는 평균이 μ이고 분산이 σ2/n인 정규 분포를 따른다.
위의 통계량은 미지의 모수를 포함하고 있기 때문에 통계량이 될 수 없다.이 경우 대표본에서와 같이 σ2의 추정량인 표본분산 S2 으로 σ2을 추정한다.
소표본에서 모평균의 가설검정
n Z X
/
0
0
n S
T X
/
0 0
위의 통계량은 정규분포가 아닌 자유도가 n-1인 t-분포를 따르 기 대문에 기각역을 결정하기 위해 t-분포를 이용해야 한다.
X
소표본에서 모평균 μ의 가설검정
표본의 크기가 작을 때, 정규모집단의 모평균 μ에 관한 가설의 검 정통계량과 검정규칙은 다음과 같다.
(2) 검정통계량 :
유의수준 α에서의 기각역과 p-값은 대립가설에 따라 다음과 같다.
여기서 t0는 T0의 관측값이다.
소표본에서 모평균의 가설검정 (p188)
n S
T X
/
0 0
(1) 대립가설 (3) 기각역 P-값
0 1: H
0 1: H
0 1: H
) 1 ( :T0 t n
R
) 1 ( :T0 t n
R
) 1 (
|
:|T0 t /2 n
R
] )
1 (
[t n t0
P
] )
1 (
[t n t0
P
|]
| ) 1 ( [
2P t n t0
예제 7.8) 새로 개발된 소형 자동차의 연비가 기존의 소형 자동차 연 비인 1l당 12km에 비해 개선이 되었는지를 검정하고자 한다.
16대의 소형 자동차를 대상으로 연비를 측정한 결과 평균연비 가 13.3km이고 표준편차 1.46km이었다. 새로 개발된 소형자 동차의 연비가 개선되었다고 할 수 있는지 유의수준 0.05에서 검정하라. 단 소형자동차의 연비는 정규분포를 따른다고 하자.
소표본에서 모평균의 가설검정
풀이) 검정하고자 하는 가설
12 :
, 12
:
10
H
H
이므로 검정통계량의 관측값을 계산하면 아래와 같다.
46 . 1 ,
3 .
13
s
x
562 . 16 3
/ 46 . 1
12 3 . 13
0
T
기각역 (15) 1.753
16 /
12
: 0 / 0 t0.05 S
X n
S T X
R
검정통계량 3.562는 기각역에 포함되므로 유의수준 0.05에서 귀무 가설을 기각한다. 따라서 새로 개발된 소형 자동차의 연비가 기존 자동차에 비해 개선되었다고 할 수 있다.
예제 7.9) 예제 7.2의 새로 개발한 두통약의 치유시간이 20분 미만인 지 검정하기 위해 20명의 두통환자를 대상으로 새로운 두통약을 복용시킨 후 두통이 해소되는데 걸리는 시간을 측정하였다. 20명 환자들의 평균시간은 17.65이었으며 표준편차는 4.671이었다.
새로운 두통약의 치유시간이 20분 미만이라 할 수 있는가? 단, 두통약의 치유시간은 정규분포를 따른다고 가정한다.
소표본에서 모평균의 가설검정
풀이) 검정하고자 하는 가설
20 :
, 20
:
10
H
H
671 . 4 ,
650 .
17
s
x
250 . 20 2
/ 671 . 4
20 650
. 17
0
T
이므로 검정통계량은 아래와 같다.
자유도 19인 t-분포에서 t0.05(19)=1.729이므로
기각역은 T0≤-1.729가 된다. 따라서 귀무가설을 기각한다.
즉, 기존에 판매되고 있는 두통약의 평균 치유시간인 20분보다 새로운 두통약의 치유시간이 짧다고 할 수 있다.
모평균 (대표본)의 가설검정(복습, p183)
대표본에서 모평균 μ의 가설검정
표본의 크기가 클 때, 모평균 μ에 관한 가설의 검정통계량과 검정규칙은 다음과 같다.
2) 검정통계량 :
유의수준 α에서의 기각역과 p-값은 대립가설에 따라 다음과 같다.
n S
Z X
/
0 0
1) 대립가설 3) 기각역 3) P-값
0 1: H
0 1: H
0 1: H
z
Z R: 0
z
Z
R: 0
2 / 0 | :| Z z
R
] [Z z0 P
] [Z z0 P
]
|
| [
2P Z z0
소표본에서 모평균 μ의 가설검정
표본의 크기가 작을 때, 정규모집단의 모평균 μ에 관한 가설의 검 정통계량과 검정규칙은 다음과 같다.
(2) 검정통계량 :
유의수준 α에서의 기각역과 p-값은 대립가설에 따라 다음과 같다.
여기서 t0는 T0의 관측값이다.
소표본에서 모평균의 가설검정 (복습)
n S
T X
/
0 0
(1) 대립가설 (3) 기각역 P-값
0 1: H
0 1: H
0 1: H
) 1 ( :T0 t n
R
) 1 ( :T0 t n
R
) 1 (
|
:|T0 t /2 n
R
] )
1 (
[t n t0
P
] )
1 (
[t n t0
P
|]
| ) 1 ( [
2P t n t0
대표본인 경우 모비율 p에 관한 가설의검정에 대해 살펴보자.
대표본인 경우(일반적으로 np≥5, n(1-p)≥5) 표본비율
은 평균이 p이고 분산이 p(1-p)/n인 정규분포를 근사적으로 따르 기 때문에 정규분포를 이용하여 검정을 할 수 있다.
모비율 (P)의 가설검정
n X p
ˆ
/n p p
p Z p
/ ) 1
( ˆ
위의 통계량은 근사적으로 표준정규분포 N(0,1)을 따른다.
모비율 (p)의 가설검정
대표본에서 모비율 p의 가설검정
표본의 크기가 클 때, 모비율 p에 관한 가설의 검정통계량과 검정규 칙은 다음과 같다.
(2) 검정통계량 :
유의수준 α에서의 기각역과 p-값은 대립가설에 따라 다음과 같다.
n p
p
p Z p
/ ) 1
( ˆ
0 0
0
0
(1) 대립가설 (3) 기각역 P-값
0 1: p p
H
0 1: p p
H
0 1: p p
H
z
Z R: 0
z
Z
R: 0
2 / 0 | :| Z z
R
] [Z z0
P
] [Z z0 P
| ]
| [
2P Z z0
예제 7.10) 제 6장 예제 6.1에서 A후보의 지지율이 35%를 초과한다 고 단정할 수 있는지 유의수준 α=0.01에서 검정하라.
모비율 (P)의 가설검정
풀이) A후보의 지지율을 p, p가 0.35보다 큰지를 검정 가설 H0 : p 0.35, H1: p 0.35
유건자 1000명을 조사하여 지지자의 수가 390명이므로 표본비 율은
p ˆ 0 . 39
이었다.검정통계량 2.65
1000 /
) 35 . 0 1 ( 35 . 0
35 . 0 39 . 0
0
z
Z0.01=2.33이므로 기각역은 R:Z0≥2.33이다.
따라서 α=0.01에서 귀무가설을 기각한다. A후보의 지지율이 0.39보다 높다고 결론 내릴 수 있다.
P-값을 계산해보면
p-값=P[Z≥2.65]=0.004
예제 7.11 ) 최근 2000명의 경제활동인구를 대상으로 조사한 결과 실업자의 수가 72명으로 나타났다. 지난해 우리나라의 실업률은 3.9%였다. 지난해에 비해 실업률이 감소되었다고 말할 수 있는 가?
모비율의 가설검정
풀이) 올해 우리나라 실업률을 p
가설 H0 : p 0.039, H1 : p 0.039
경제활동인구 2000명을 조사하여 실업자의 수가 72명이므로 표 본비율은 0.036이다.
검정통계량 0.693
2000 /
) 039 . 0 1 ( 039 . 0
039 . 0 036 . 0
0
Z
Z0.05=1.645이므로 기각역은 R:Z0≤-1.645이다.
따라서 귀무가설을 기각할 수 없다. 따라서 올해 실업률이 작년에 비해 감소했다는 확실한 증거를 제시하지 못한다.
P-값을 계산해보면
p-값=P[Z≤-0.693]=0.2451
가설검정 (확인)
1.. 모평균(μ)의 가설검정 (대표본) - 모분산 ( )을 알때,
모를때 ( 사용) : ( )-검정 2. 모평균 (μ) 의 가설검정 (소표본)
1) 모분산 ( )을 알때 : ( ) 검정 2) 모분산( )을 모를때 사용: ( )검정 3. 모비율(p)의 가설검정 : ( )검정 4. 모분산( )의 가설검정 ?
2
2
2
2
S
2S
2 모집단 분포가 정규분포라는 가정하에 모분산 σ2에 관한 검정해보자.
모분산 σ2의 추정량으로는 표본분산 S2을 이용한다
모집단 분포가 정규분포라는 가정하에 표분분산은 다음과 같이 카이 제곱 분포를 따른다.
모분산 ( σ 2 )의 가설검정
) 1 (
) ~ 1
(
22
2
S n
n
정규모집단에서 모분산 σ2의 가설검정
정규모집단의 분산 σ2에 관한 가설의 검정통계량과 검정규칙 (2) 검정통계량
유의수준 α에서의 기각역과 p-값은 대립가설에 따라 다음과 같다.
2 0
2 2
0
) 1 (
n S
(1) 대립가설 (3) 기각역 P-값
20 2
1: H
20 2
1: H
20 2
1: H
) 1 ( : 20 2 n R
) 1 (
: 21
20 n
R
) 1 (
) 1 ( :
2 2 / 1 2
0
2 2 / 2
0
n
n R
또는
] )
1 - (
[2 n 02 P
] )
1 (
[2 n 02 P
배 두 값의 작은
중에서 값
두 위의
예제 7.12) 제 6장 예제 6.11의 데이터를 이용하여 새로운 시스템에 서 대기시간의 분산이 6이내라고 주장 할 수 있는지 유의수준 0.05로 검정하라.
모분산의 가설검정
풀이) 가설 H0 :2 6, H1:2 6
검정통계량 7.947 6
298 . 5
2 9
0
기각역 R:
02
02.95(9) 3.33검정통계량이 기각역에 들어가지 않으므로 귀무가설을 기각 할 수 없다. 따라서 유의수준 0.05에서 분산이 6이내라는 주 장을 뒷받침할 근거가 없다.
신뢰구간과 가설검정은 밀접한 관련
이 있다.
대표본에서 모평균 μ의 양측가설에 대한 다음의 기각역을 살펴보자
2 / 0
: /
n z S
R X
기각역 R에 상반되는 영역을 채택역 Rc로 나타내면
2 / 0
: /
n z S
Rc X
이므로 부등식을 풀어 μ0에 관해 정리하면
n z S
n X z S
X /2 0 /2
이러한 사실로 부터 신뢰구간은 대응되는 검정의 채택역에 의해 유도 될 수 있으므로 귀무가설에 대응되는 값이 신뢰구간에 포함되면 귀무 가설을 기각할 수 없다. 즉 귀무가설의 μ0가 100(1-α)% 신뢰구간 에 포함되지 않으면 유의수준 α에서 귀무가설을 기각할 수 있다.
예제 7.13) 제 6장 예제 6.8의 데이터에서 제품의 평균용량이 200 이라고 말할 수 있는지 유의수준 0.05에서 검정하라.
풀이) 검정하고자 하는 가설
H
0: 200 , H
1: 200
예제 6.8에서 구한 평균용량의 95% 신뢰구간은 (199.81, 204,19) 이다. 이 구간에 μ0=200이 포함되므로 유의수준 0.05에서 귀무가 설을 기각할 수 없다.
실제 기각역을 이용해 검정해 보자.
검정통계량 1.788
36 / 71 . 6
200 202
0
Z
기각역 1.96
: / 0 /2
z n S R X
검정통계량이 기각역을 포함하지 않으므로 귀무가설을 기각할 수 없다. 즉 , 신뢰구간과 양측가설검정은 실질적 같은 의미를 가진다.
신뢰구간과 가설검정 관계
예제 7.13) 닭고기를 재료로 만든 핫도그에 포함되어 있는 칼로리의 평균이 150보다 적은지를 검정하고자 한다. 단, 핫도그에 포함되 어 있는 칼로리는 정규분포를 따른다고 한다.
129 132 102 106 94 102 87 99
107 113 135 142 86 143 152 146 144
SPSS를 이용한 실습
풀이) 을 검정하기 위한 자료입력H0 : 150 H1 : 150
실행순서
SPSS를 이용한 실습
위의 결과 검정통계량이 -5.711이고 유의확률이 0.000으로 유 의수준 0.01에서 귀무가설을 기각하게 된다. 따라서 닭고기로 만 든 핫도그의 칼로리가 150보다 적음을 알 수 있다.
이 때 유의확률은 양측 검정에 대해 P[|t(16)}>5.711]을 구한 값 이므로 단측 검정일 때의 유의확률은 0.000/2=0.000이다.
SPSS를 이용한 실습
예제 7.14) 휴대폰을 충전하는데 걸리는 평균시간이 180분인지 검정 하고자 10개의 자료를 얻었다. 단, 휴대폰 충전시간은 정규분포 를 따른다고 가정 한다.
120 100 250 180 110 150 140 160 110 130
SPSS를 이용한 실습
풀이) 을 검정하기 예제 7.13과 같이 데이터 를 입력하며 검정변수에 battery를 검정값에 180을 입력하고 확 인을 누른다.
180 :
, 180
: 1
0 H
H
검정통계량이 -2.485이고 유의확률이 0.035로 유의수준 0.05 에서 귀무가설을기각하게 된다.
HW6
• P 201 : 2, 3, 6, 9, 11, 14, 15
• QUIZ 2-
• 일시 : 수업중 (2015. 11. 23(월))
• 범위 : 6장, 7장 까지
(23)
우리의 선택은 ? Outliers (Extreme values, 극 과 극)
중국어는 어느정도 공부하면 일상대화가 가능할까요?
=> 탈북자는 한달이면 가능합니다.
왜냐하면 000이 있기 때문입니다.
모평균 (대표본)의 가설검정 (복습)
대표본에서 모평균 μ의 가설검정
표본의 크기가 클 때, 모평균 μ에 관한 가설의 검정통계량과 검정규칙은 다음과 같다.
2) 검정통계량 :
유의수준 α에서의 기각역과 p-값은 대립가설에 따라 다음과 같다.
n S
Z X
/
0 0
1) 대립가설 3) 기각역 3) P-값
0 1: H
0 1: H
0 1: H
z
Z R: 0
z
Z
R: 0
2 / 0 | :| Z z
R
] [Z z0 P
] [Z z0 P
]
|
| [
2P Z z0
소표본에서 모평균 μ의 가설검정
표본의 크기가 작을 때, 정규모집단의 모평균 μ에 관한 가설의 검 정통계량과 검정규칙은 다음과 같다.
(2) 검정통계량 :
유의수준 α에서의 기각역과 p-값은 대립가설에 따라 다음과 같다.
여기서 t0는 T0의 관측값이다.
소표본에서 모평균의 가설검정
n S
T X
/
0 0
(1) 대립가설 (3) 기각역 P-값
0 1: H
0 1: H
0 1: H
) 1 ( :T0 t n
R
) 1 ( :T0 t n
R
) 1 (
|
:|T0 t /2 n
R
] )
1 (
[t n t0
P
] )
1 (
[t n t0
P
|]
| ) 1 ( [
2P t n t0
모비율의 가설검정 (복습)
대표본에서 모비율 p의 가설검정
표본의 크기가 클 때, 모비율 p에 관한 가설의 검정통계량과 검정규 칙은 다음과 같다.
(2) 검정통계량 :
유의수준 α에서의 기각역과 p-값은 대립가설에 따라 다음과 같다.
n p
p
p Z p
/ ) 1
( ˆ
0 0
0
0
(1) 대립가설 (3) 기각역 P-값
0 1: p p
H
0 1: p p
H
0 1: p p
H
z
Z R: 0
z
Z
R: 0
2 / 0 | :| Z z
R
] [Z z0
P
] [Z z0 P
| ]
| [
2P Z z0
모집단 분포가 정규분포라는 가정하에 모분산 σ2에 관한 검정해보자.
모분산 σ2의 추정량으로는 표본분산 S2을 이용한다
모집단 분포가 정규분포라는 가정하에 표분분산은 다음과 같이 카이 제곱 분포를 따른다.
모분산 ( σ 2 )의 가설검정 (복습)
) 1 (
) ~ 1
(
22
2
S n
n
정규모집단에서 모분산 σ2의 가설검정
정규모집단의 분산 σ2에 관한 가설의 검정통계량과 검정규칙 (2) 검정통계량
유의수준 α에서의 기각역과 p-값은 대립가설에 따라 다음과 같다.
2 0
2 2
0
) 1 (
n S
(1) 대립가설 (3) 기각역 P-값
20 2
1: H
20 2
1: H
20 2
1: H
) 1 ( : 20 2 n R
) 1 (
: 21
20 n
R
) 1 (
) 1 ( :
2 2 / 1 2
0
2 2 / 2
0
n
n R
또는
] )
1 - (
[2 n 02 P
] )
1 (
[2 n 02 P
배 두 값의 작은
중에서 값
두 위의
추정 (복습)
정규모집단에서 μ 의 100(1-α )% 신뢰구간 (대표본/소표본)
정규모집단에서 μ 의 100(1-α )% 신뢰구간 (소표본) ?
정규모집단에서 P 의 100(1-α )% 신뢰구간 (대표본) ?
n z
X n z
X
/2
,
/2 정규모집단의 모분산 σ2의 100(1-α)% 신뢰구간
모집단 분포가 정규분포인 경우, σ2의 100(1-α)% 신 뢰구간은 다음과 같다.
여기서 은 자유도 n-1인 카이제곱 분포의 상 위 α/2인 점이고 은 하위 α/2인 점이다.
모분산의 신뢰구간 (6장 복습)
) 1
2 (
2
/ n
) 1
2 (
2 /
1
n
( 1 )
) 1 , (
) 1 (
) 1 (
2 2 / 1
2 2
2 /
2
n S n
n S n
모평균 μ의 추정에서 100(1-α)% 오차한계를 이용하 여 표본의 크기를 결정할 수 있다.
에 의한 μ의 추정에서 100(1-α)% 오차한계 d
표본크기 (n) 의 결정 (6장 복습)
Z n
d
/2
위의 식을 n에 관하여 풀면 다음과 같다.
2 2 /
d
n Z
이 때 n은 표본크기이므로 계산된 값이 정수가 아닌 경 우, 계산된 값보다 큰 최소의 정수로 결정한다.