Probability and Statistics for Environmental Engineers
부산가톨릭대학교 환경공학과 2학년
환경통계학
8. 모평균의 검정
모평균의 검정
정규집단이고, 모분산이 알려져 있는 경우
(1) 모평균 에 대한 검정
(2) 두 모평균의 차이 에 대한 검정
모분산이 알려져 있지 않은 경우
(1) 모평균 에 대한 검정
(2) 두 모평균의 차이 에 대한 검정
(3) 대응을 이룰 경우의 두 모평균의 차 에 대한 검정 µ
1 2
µ µ−
µ
1 2
µ µ−
1 2
µ µ−
정규모집단 , 모분산이 알려져 있는경우
모분산 이 알려진 정규모집단 에서 모평균 의 검정은 아 래와 같은 검정통계량의 분포
가 표준정규분포 N(0,1)을 따른다는 사실을 이용하여 다룰 수 있다.
즉, 모분산이 알려진 경우의 모평균의 검정에 있어서 귀무가설 에 대한 검정통계량의 값은 아래와 같다.
여기서, 문제의 성격에 따라 양측검정, 단측검정을 결정하고 그에 따라 기각역의 범위가 설정된다.
σ2 N( ,µ σ2)
µ
0 0
H :μ=μ
0
/ Z X
n µ σ
= −
0
/ z x
n µ σ
= −
정리 ) 이 알려져 있을 때의 에 관한 검정절차
1) (또는 )을 세운다 2) 표본의 관찰 값 에서
3) 검정통계량의 값(z)을 계산한다
4) 검정통계량의 값 z가 기각역에 포함되면 귀무가설을 기각하고, 채택 역에 포함되면 귀무가설을 채택한다.
에서 가 기각되면 와 의 차이는 “유의적”
에서 가 기각되면 와 의 차이는 “매우 유의적”
σ
2μ=μ
00 0 1 0
H :μ=μ , H :μ μ≠ μ>μ , μ μ0 < 0 1, 2,..., n
x x x
0
/ z x
n µ σ
= −
α = 0.05 H :0 μ=μ0 X
µ
0α = 0.05 H :0 μ=μ0 X
µ
0모분산이 알려진 두 정규모집단의 평균이 같은가의 검정
모분산 이 알려진 두 정규모집단
으로부터 각각 크기 인 표본을 아래와 같이 추출하고, 표본평균을 라 하면 의 분포는 아래와 같으므로
검정통계량 아래를 이용하여 귀무가설 를 검정한다.
2 2
1 , 2
σ σ
2 2
1 1 2 2
A : (N µ σ, ) B : (N µ σ, )
µ
0 1 2
H :μ =μ
1, 2
n n
1 2
1 2 1 2
(X X, ,..., Xn ), ( ,Y Y ,...,Yn ) ,
X Y X −Y
2 2
1 2
1 2
1 2
( , )
N n n
σ σ µ µ− +
1 2
2 2
1 2
1 2
( )
(0,1) X Y
Z N
n n µ µ σ σ
− − −
=
+
정리 ) 이 알려져 있을 때의 에 관한 검정절차
1) 등을 세운다
2) 두 표본의 관찰 값 에서
를 구한다.
3) 검정통계량의 값(z)을 계산한다
4) 검정통계량의 값 z가 기각역에 포함되면 귀무가설을 기각하고, 채택 역에 포함되면 귀무가설을 채택한다.
2 2
1
,
2σ σ μ -μ
1 20 1 2 1 1 2
H :μ =μ , H :μ ≠ μ
1 2
1 2 1 2
(X X, ,..., Xn ), ( ,Y Y ,...,Yn )
1
1 1
1 n
i i
x x
n =
=
∑
22 1
1 n
i j
y y
n =
=
∑
1 2
2 2
1 2
1 2
( )
(0,1) X Y
Z N
n n µ µ σ σ
− − −
=
+
모평균의 검정
정규집단이고, 모분산이 알려져 있는 경우
(1) 모평균 에 대한 검정
(2) 두 모평균의 차이 에 대한 검정
모분산이 알려져 있지 않은 경우
(1) 모평균 에 대한 검정
(2) 두 모평균의 차이 에 대한 검정
(3) 대응을 이룰 경우의 두 모평균의 차 에 대한 검정 µ
1 2
µ µ−
µ
1 2
µ µ−
1 2
µ µ−
모분산을 모르는 경우, 모평균 에 관한 검정
모분산 이 알려져 있지 않고 표본 크기 n이 클 때(대표본)
대신 을 사용하면 됨.
모분산 이 알려져 있지 않고 소표본일 때(n<30) , t-분포 사용
이 검정통계량임
대신, 자유도 n-1인 t-분포의 값을 구하여 사용함
이렇게 t-분포를 이용한 가설검정을 t-검정 (t-test)이라고 한다.
σ2
0 ( 1)
/
T X t n
S n µ
= − −
µ
2 2
1
( ) / ( 1)
n i i
S X X n
=
=
∑
− −σ 2
σ2
/ 2,
zα zα tα/ 2, tα
정리) 이 알려져 있지 않고, 소표본의 경우의 에 관한 검정절차 1) (또는 )을 세운다
2) 표본의 관찰 값 에서 계산 3) 검정통계량의 값(t)을 계산한다
4) 검정통계량의 값 t가 기각역에 포함되면 귀무가설을 기각하고, 채택 역에 포함되면 귀무가설을 채택한다.
에서 가 기각되면 와 의 차이는 “유의적”
에서 가 기각되면 와 의 차이는 “매우 유의적”
σ
2μ=μ
00 0 1 0
H :μ=μ , H :μ μ≠ μ>μ , μ μ0 < 0 1, 2,..., n
x x x
0
/ t x
s n µ
= −
α = 0.05 H :0 μ=μ0 X
µ
0α = 0.05 H :0 μ=μ0 X
µ
01
1 1
1 n
i i
x x
n =
=
∑
21
( ) / ( 1)
n i i
s x x n
=
=
∑
− −이 미지이고 소표본인 경우 에 관한 검정
모분산 이 미지이고 <30인 소표본 의 경우
두 정규 모집단
으로부터 각각 크기 인 표본을 아래와 같이 추출하고,
표본평균을 라 하면 의 분포에 의한 두 모평균의 차에 대한 검정 을 행함.
여기서는 의 경우만을 고려,
대신 이것의 불편추정량인 합동추정량 을 구하여 사용,
두 확률표본에서의 분산.
검정통계량 아래를 이용하여 귀무가설 를 검정한다.
2 2
1 , 2
σ σ
2 2
1 1 2 2
A : (N µ σ, ) B : (N µ σ, )
0 1 2
H :μ =μ
1, 2
n n
1 2
1 2 1 2
(X X, ,..., Xn ), ( ,Y Y ,...,Yn ) ,
X Y X −Y
1 2
1 2
2 2
1 2
1 2
( )
( 2)
p
X Y
T t n n
S n n
µ µ σ σ
− − −
= + −
+
2 2
1 , 2
σ σ μ -μ1 2
1 2
n , n
2 2 2
1 2
σ =σ =σ
σ2 Sp2
2 2
2 1 1 2 2
1 2
( 1) ( 1)
p 2
n S n S
S n n
− + −
= + − S12,S22 =
정리) 이 미지이며( ), 에 관한 검정절차 1) 등을 세운다
2) 두 표본의 관찰 값 에서 의 추정량
를 구한다.
3) 검정통계량의 값 t를 구한다
4) 검정통계량의 값 t가 기각역에 포함되면 귀무가설을 기각하고, 채택 역에 포함되면 귀무가설을 채택한다.
2 2
1
,
2σ σ
μ -μ1 20 1 2 1 1 2
H :μ =μ , H :μ ≠ μ
1 2
1 2 1 2
(X X, ,..., Xn ), ( ,Y Y ,...,Yn )
2 2 2
1 2
σ =σ =σ
σ 2 2 1 12 2 22
1 2
( 1) ( 1)
p 2
n S n S
S n n
− + −
= + −
1 2
1 2
2 2
1 2
1 2
( )
( 2)
p
X Y
t t n n
S n n
µ µ σ σ
− − −
= + −
+
대응을 이룬 두 모평균의 차 에 대한 검정
μ -μ1 2 대응을 이룬 확률표본 은 서로 독립이며 는 일반적으로 독립이 아닌 경우, 각 표본의 차이
에 근거하여 두 모집단 평균을 구함
대응비교(paired comparision) : 실험단위를 동질적인 쌍으로 묶은 다음, 각 쌍에서 랜덤하게 두 처리를 적용하고, 각 쌍에서 얻은 관측값의 차를 이용하여 두 모평균을 비교하는 방법
1 1 2 2
(X Y, ), (X Y, ),..., (X Yn, n) (X Yi, )i
( 1, 2,..., )
i i i
D = X −Y i = n
1 X1 Y1 D1=X1-Y1
2 X2 Y2 D2=X2-Y2
3 … … …
4 Xn Yn Dn=Xn-Yn
대응을 이룬 두 모평균의 차 에 대한 검정
μ -μ1 2 대응을 이룬 확률표본 은 서로 독립이며 는 일반적으로 독립이 아닌 경우, 각 표본의 차이
에 근거하여 두 모집단 평균을 구함
이 때, 검정통계량 에 따른 검정을 수행한다.
대응비교(paired comparision, 쌍체비교, paired t-test) : 실험단위를 동질적 인 쌍으로 묶은 다음, 각 쌍에서 랜덤하게 두 처리를 적용하고, 각 쌍에서 얻은 관측값의 차를 이용하여 두 모평균을 비교하는 방법
1 1 2 2
(X Y, ), (X Y, ),..., (X Yn, n) (X Yi, )i
( 1, 2,..., )
i i i
D = X −Y i = n
쌍체비교 예제
두 가지 수면제 A,B를 10명의 환자에게 복용시켰을 때의 연장된 수면시간을 조사한 표에서, A, B 두 수면제의 효과에 유의적인 차이가 있는가를 유의수준 0.05에서 검정하라.
환자 1 2 3 4 5 6 7 8 9 10
A 1.9 0.8 1.1 0.1 -0.1 4.4 5.5 1.6 4.6 3.4
B 0.7 -1.6 -0.2 1.2 -0.1 3.4 3.7 0.8 0.0 2.0
유의확률 (p)
가설검정에서 검정통계량의 값과 검정통계량의 분포에 대한 임계값(z 값, t 값 등)을 비교하여 귀무가설 Ho의 채택여부를 결정하였으나,
통계패키지에서는 임계값보다는 p 값으로 귀무가설의 채택여부를 유
의수준 a와 비교하여 결정한다.
p-value
귀무가설하의 검정통계량 분포에서 검정통계량의 값을 임계값으로
하는 최소의 유의수준을 유의확률이라 한다.
예) 검정 통계량의 값이 t=2.827, 자유도 9인 t 분포에서 P(T>2.827)=0.0098, 양측 검정이므로 p-값 = 0.0098*2=0.0196이다.
예제) 크기 5인 표본 추출하여 표본평균 65, 표준편차 11.6을 얻었다. 유의수준 0.05에서 모평균 mu=50인가를 검정하는 문제에서 p 값을 구하여라.