Probability and Statistics for Environmental Engineers

(1)

Probability and Statistics for Environmental Engineers

부산가톨릭대학교 환경공학과 2학년

(2)

환경통계학

8. 모평균의 검정

(3)

모평균의 검정

 정규집단이고, 모분산이 알려져 있는 경우

 (1) 모평균 에 대한 검정

 (2) 두 모평균의 차이 에 대한 검정

 모분산이 알려져 있지 않은 경우

 (3) 대응을 이룰 경우의 두 모평균의 차 에 대한 검정 µ

1 2

µ µ−

µ

1 2

µ µ−

1 2

µ µ−

(4)

정규모집단 , 모분산이 알려져 있는경우

 모분산 이 알려진 정규모집단 에서 모평균 의 검정은 아 래와 같은 검정통계량의 분포

 가 표준정규분포 N(0,1)을 따른다는 사실을 이용하여 다룰 수 있다.

 즉, 모분산이 알려진 경우의 모평균의 검정에 있어서 귀무가설 에 대한 검정통계량의 값은 아래와 같다.

여기서, 문제의 성격에 따라 양측검정, 단측검정을 결정하고 그에 따라 기각역의 범위가 설정된다.

σ2 ^N^{( ,}^{µ σ}²⁾

µ

0 0

H :μ=μ

0

/ Z X

n µ σ

= −

0

/ z x

n µ σ

= −

(5)

정리 ) 이 알려져 있을 때의 에 관한 검정절차

1) (또는 )을 세운다 2) 표본의 관찰 값 에서

3) 검정통계량의 값(z)을 계산한다

4) 검정통계량의 값 z가 기각역에 포함되면 귀무가설을 기각하고, 채택 역에 포함되면 귀무가설을 채택한다.

에서 가 기각되면 와 의 차이는 “유의적”

에서 가 기각되면 와 의 차이는 “매우 유의적”

σ

2

^μ=μ

⁰

0 0 1 0

H :μ=μ , H :μ μ≠ μ>μ , μ μ0 < 0 1, 2,..., _n

x x x

0

/ z x

n µ σ

= −

α = 0.05 H :₀ μ=μ₀ X

µ

₀

α = 0.05 H :0 μ=μ0 X

µ

₀

(6)

모분산이 알려진 두 정규모집단의 평균이 같은가의 검정

 모분산 이 알려진 두 정규모집단

으로부터 각각 크기 인 표본을 아래와 같이 추출하고, 표본평균을 라 하면 의 분포는 아래와 같으므로

검정통계량 아래를 이용하여 귀무가설 를 검정한다.

2 2

1 , 2

σ σ

2 2

1 1 2 2

A : (N µ σ, ) B : (N µ σ, )

µ

0 1 2

H :μ =μ

1, 2

n n

1 2

1 2 1 2

(X X, ,..., X_n ), ( ,Y Y ,...,Y_n ) ,

X Y X −Y

2 2

1 2

( , )

N n n

σ σ µ µ− +

1 2

2 2

1 2

( )

(0,1) X Y

Z N

n n µ µ σ σ

− − −

=

+



(7)

정리 ) 이 알려져 있을 때의 에 관한 검정절차

1) 등을 세운다

2) 두 표본의 관찰 값 에서

를 구한다.

3) 검정통계량의 값(z)을 계산한다

4) 검정통계량의 값 z가 기각역에 포함되면 귀무가설을 기각하고, 채택 역에 포함되면 귀무가설을 채택한다.

2 2

1

,

2

σ σ μ -μ

1 2

0 1 2 1 1 2

H :μ =μ , H :μ ≠ μ

1 2

1 2 1 2

(X X, ,..., X_n ), ( ,Y Y ,...,Y_n )

1

1 1

1 ⁿ

i i

x x

n ₌

=

∑

²

2 1

1 ⁿ

i j

y y

n ₌

=

∑

1 2

2 2

1 2

( )

(0,1) X Y

Z N

n n µ µ σ σ

− − −

=

+



(8)

모평균의 검정

 정규집단이고, 모분산이 알려져 있는 경우

 모분산이 알려져 있지 않은 경우

 (3) 대응을 이룰 경우의 두 모평균의 차 에 대한 검정 µ

1 2

µ µ−

µ

1 2

µ µ−

1 2

µ µ−

(9)

모분산을 모르는 경우, 모평균 에 관한 검정

 모분산 이 알려져 있지 않고 표본 크기 n이 클 때(대표본)

 대신 을 사용하면 됨.

 모분산 이 알려져 있지 않고 소표본일 때(n<30) , t-분포 사용

이 검정통계량임

대신, 자유도 n-1인 t-분포의 값을 구하여 사용함

이렇게 t-분포를 이용한 가설검정을 t-검정 (t-test)이라고 한다.

σ2

0 ( 1)

/

T X t n

S n µ

= −  −

µ

2 2

1

( ) / ( 1)

n i i

S X X n

=

∑

− −

σ 2

σ2

/ 2,

z_α z_α t_α_{/ 2}, t_α

(10)

정리) 이 알려져 있지 않고, 소표본의 경우의 에 관한 검정절차 1) (또는 )을 세운다

2) 표본의 관찰 값 에서 계산 3) 검정통계량의 값(t)을 계산한다

4) 검정통계량의 값 t가 기각역에 포함되면 귀무가설을 기각하고, 채택 역에 포함되면 귀무가설을 채택한다.

에서 가 기각되면 와 의 차이는 “유의적”

에서 가 기각되면 와 의 차이는 “매우 유의적”

σ

2

^μ=μ

⁰

0 0 1 0

H :μ=μ , H :μ μ≠ μ>μ , μ μ0 < 0 1, 2,..., _n

x x x

0

/ t x

s n µ

= −

α = 0.05 H :₀ μ=μ₀ X

µ

₀

α = 0.05 H :0 μ=μ0 X

µ

₀

1

1 1

1 ⁿ

i i

x x

n ₌

=

∑

²

1

( ) / ( 1)

n i i

s x x n

=

∑

− −

(11)

이 미지이고 소표본인 경우 에 관한 검정

 모분산 이 미지이고 <30인 소표본 의 경우

두 정규 모집단

으로부터 각각 크기 인 표본을 아래와 같이 추출하고,

표본평균을 라 하면 의 분포에 의한 두 모평균의 차에 대한 검정 을 행함.

여기서는 의 경우만을 고려,

대신 이것의 불편추정량인 합동추정량 을 구하여 사용,

두 확률표본에서의 분산.

검정통계량 아래를 이용하여 귀무가설 를 검정한다.

2 2

1 , 2

σ σ

2 2

1 1 2 2

A : (N µ σ, ) B : (N µ σ, )

0 1 2

H :μ =μ

1, 2

n n

1 2

1 2 1 2

(X X, ,..., X_n ), ( ,Y Y ,...,Y_n ) ,

X Y X −Y

1 2

2 2

1 2

( )

( 2)

p

X Y

T t n n

S n n

µ µ σ σ

− − −

= + −

+



2 2

1 , 2

σ σ μ -μ₁ ₂

1 2

n , n

2 2 2

1 2

σ =σ =σ

σ2 S_p²

2 2

2 1 1 2 2

1 2

( 1) ( 1)

p 2

n S n S

S n n

− + −

= + − S₁²,S₂² =

(12)

정리) 이 미지이며( ), 에 관한 검정절차 1) 등을 세운다

2) 두 표본의 관찰 값 에서 의 추정량

를 구한다.

3) 검정통계량의 값 t를 구한다

4) 검정통계량의 값 t가 기각역에 포함되면 귀무가설을 기각하고, 채택 역에 포함되면 귀무가설을 채택한다.

2 2

1

,

2

σ σ

_{μ -μ}₁ ₂

0 1 2 1 1 2

H :μ =μ , H :μ ≠ μ

1 2

1 2 1 2

(X X, ,..., X_n ), ( ,Y Y ,...,Y_n )

2 2 2

1 2

σ =σ =σ

σ 2 ₂ ₁ ₁² ₂ ₂²

1 2

( 1) ( 1)

p 2

n S n S

S n n

− + −

= + −

1 2

2 2

1 2

( )

( 2)

p

X Y

t t n n

S n n

µ µ σ σ

− − −

= + −

+



(13)

대응을 이룬 두 모평균의 차 에 대한 검정

^{μ -μ}¹ ²

 대응을 이룬 확률표본 은 서로 독립이며 는 일반적으로 독립이 아닌 경우, 각 표본의 차이

에 근거하여 두 모집단 평균을 구함

 대응비교(paired comparision) : 실험단위를 동질적인 쌍으로 묶은 다음, 각 쌍에서 랜덤하게 두 처리를 적용하고, 각 쌍에서 얻은 관측값의 차를 이용하여 두 모평균을 비교하는 방법

1 1 2 2

(X Y, ), (X Y, ),..., (X Y_n, _n) (X Y_i, )_i

( 1, 2,..., )

i i i

D = X −Y i = n

1 X¹ Y¹ D1=X1-Y1

2 X² Y² D²=X²-Y²

3 … … …

4 Xn Yn Dⁿ=Xⁿ-Yⁿ

(14)

대응을 이룬 두 모평균의 차 에 대한 검정

^{μ -μ}¹ ²

 대응을 이룬 확률표본 은 서로 독립이며 는 일반적으로 독립이 아닌 경우, 각 표본의 차이

에 근거하여 두 모집단 평균을 구함

 이 때, 검정통계량 에 따른 검정을 수행한다.

 대응비교(paired comparision, 쌍체비교, paired t-test) : 실험단위를 동질적 인 쌍으로 묶은 다음, 각 쌍에서 랜덤하게 두 처리를 적용하고, 각 쌍에서 얻은 관측값의 차를 이용하여 두 모평균을 비교하는 방법

1 1 2 2

(X Y, ), (X Y, ),..., (X Y_n, _n) (X Y_i, )_i

( 1, 2,..., )

i i i

D = X −Y i = n

(15)

쌍체비교 예제

 두 가지 수면제 A,B를 10명의 환자에게 복용시켰을 때의 연장된 수면시간을 조사한 표에서, A, B 두 수면제의 효과에 유의적인 차이가 있는가를 유의수준 0.05에서 검정하라.

환자 1 2 3 4 5 6 7 8 9 10

A 1.9 0.8 1.1 0.1 -0.1 4.4 5.5 1.6 4.6 3.4

B 0.7 -1.6 -0.2 1.2 -0.1 3.4 3.7 0.8 0.0 2.0

(16)

유의확률 (p)

 가설검정에서 검정통계량의 값과 검정통계량의 분포에 대한 임계값(z 값, t 값 등)을 비교하여 귀무가설 Ho의 채택여부를 결정하였으나,

 통계패키지에서는 임계값보다는 p 값으로 귀무가설의 채택여부를 유

의수준 a와 비교하여 결정한다.

 p-value

 귀무가설하의 검정통계량 분포에서 검정통계량의 값을 임계값으로

하는 최소의 유의수준을 유의확률이라 한다.

 예) 검정 통계량의 값이 t=2.827, 자유도 9인 t 분포에서 P(T>2.827)=0.0098, 양측 검정이므로 p-값 = 0.0098*2=0.0196이다.

 예제) 크기 5인 표본 추출하여 표본평균 65, 표준편차 11.6을 얻었다. 유의수준 0.05에서 모평균 mu=50인가를 검정하는 문제에서 p 값을 구하여라.