• 검색 결과가 없습니다.

소표본

N/A
N/A
Protected

Academic year: 2022

Share "소표본"

Copied!
30
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

 표본의 크기가 작은 소표본에서는 중심극한 정리를 이용할 수 없 기 때문에 표본평균의 분포에 대한 가정이 필요하다.

일반적으로 소표본에서 필요한 가정이 모집단 분포가 정규분포라는 것이다.

소표본 (n<30) 에서 모평균의 가설검정 (p186)

 모분산을 알 때

정규모집단에서 모분산을 아는 경우의 검정통계량

n Z X

/

0

0

 

Z0~N(0,1)이므로 대표본에서 사용한 검정규칙을 그대로 적용할 수 있다.

(2)

예제 7.6) 모분산이 36인 정규모집단에서 16개의 데이터를 추출한 결과 표본평균이 32.5였다. 을 유의수준 0.05에서 검정하여라.

소표본에서 모평균의 가설검정

30 :

, 30

: 1

0   H  

H

풀이) 검정통계량의 관측값

67 . 16 1

/ 6

30 5

. 32

0   

z

기각역 R:Z0z0.05 1.645

검정통계량이 기각역에 포함되기 때문에 귀무가설을 기각한다.

이 검정의 p-값은 아래와 같다.

p-값=P[Z≥1.67]=0.0475

(3)

 모분산을 모를 때( p187)

평균이 μ이고 분산이 σ2인 정규모집단에서 크기 n인 확률표본 X1,…,Xn을 추출할 때, 는 평균이 μ이고 분산이 σ2/n인 정규 분포를 따른다.

위의 통계량은 미지의 모수를 포함하고 있기 때문에 통계량이 될 수 없다.이 경우 대표본에서와 같이 σ2의 추정량인 표본분산 S2 으로 σ2을 추정한다.

소표본에서 모평균의 가설검정

n Z X

/

0

0

 

n S

T X

/

0 0

 

위의 통계량은 정규분포가 아닌 자유도가 n-1인 t-분포를 따르 기 대문에 기각역을 결정하기 위해 t-분포를 이용해야 한다.

X

(4)

소표본에서 모평균 μ의 가설검정

표본의 크기가 작을 때, 정규모집단의 모평균 μ에 관한 가설의 검 정통계량과 검정규칙은 다음과 같다.

(2) 검정통계량 :

유의수준 α에서의 기각역과 p-값은 대립가설에 따라 다음과 같다.

여기서 t0는 T0의 관측값이다.

소표본에서 모평균의 가설검정 (p188)

n S

T X

/

0 0

 

(1) 대립가설 (3) 기각역 P-값

0 1:H

0 1:H

0 1:H

) 1 ( :T0 t n

R

) 1 ( :T0 t n

R

) 1 (

|

:|T0 t /2 n

R

] )

1 (

[t n t0

P

] )

1 (

[t n t0

P

|]

| ) 1 ( [

2P t n t0

(5)

예제 7.8) 새로 개발된 소형 자동차의 연비가 기존의 소형 자동차 연 비인 1l당 12km에 비해 개선이 되었는지를 검정하고자 한다.

16대의 소형 자동차를 대상으로 연비를 측정한 결과 평균연비 가 13.3km이고 표준편차 1.46km이었다. 새로 개발된 소형자 동차의 연비가 개선되었다고 할 수 있는지 유의수준 0.05에서 검정하라. 단 소형자동차의 연비는 정규분포를 따른다고 하자.

소표본에서 모평균의 가설검정

풀이) 검정하고자 하는 가설

12 :

, 12

:

1

0

  H  

H

이므로 검정통계량의 관측값을 계산하면 아래와 같다.

46 . 1 ,

3 .

13 

s

x

562 . 16 3

/ 46 . 1

12 3 . 13

0   

T

기각역 (15) 1.753

16 /

12

: 0 / 0 t0.05 S

X n

S T X

R

검정통계량 3.562는 기각역에 포함되므로 유의수준 0.05에서 귀무 가설을 기각한다. 따라서 새로 개발된 소형 자동차의 연비가 기존 자동차에 비해 개선되었다고 할 수 있다.

(6)

예제 7.9) 예제 7.2의 새로 개발한 두통약의 치유시간이 20분 미만인 지 검정하기 위해 20명의 두통환자를 대상으로 새로운 두통약을 복용시킨 후 두통이 해소되는데 걸리는 시간을 측정하였다. 20명 환자들의 평균시간은 17.65이었으며 표준편차는 4.671이었다.

새로운 두통약의 치유시간이 20분 미만이라 할 수 있는가? 단, 두통약의 치유시간은 정규분포를 따른다고 가정한다.

소표본에서 모평균의 가설검정

풀이) 검정하고자 하는 가설

20 :

, 20

:

1

0

  H  

H

671 . 4 ,

650 .

17

s

x

250 . 20 2

/ 671 . 4

20 650

. 17

0    

T

이므로 검정통계량은 아래와 같다.

자유도 19인 t-분포에서 t0.05(19)=1.729이므로

기각역은 T0≤-1.729가 된다. 따라서 귀무가설을 기각한다.

즉, 기존에 판매되고 있는 두통약의 평균 치유시간인 20분보다 새로운 두통약의 치유시간이 짧다고 할 수 있다.

(7)

모평균 (대표본)의 가설검정(복습, p183)

 대표본에서 모평균 μ의 가설검정

표본의 크기가 클 때, 모평균 μ에 관한 가설의 검정통계량과 검정규칙은 다음과 같다.

2) 검정통계량 :

유의수준 α에서의 기각역과 p-값은 대립가설에 따라 다음과 같다.

n S

Z X

/

0 0

 

1) 대립가설 3) 기각역 3) P-값

0 1:H

0 1:H

0 1:H

z

Z R: 0

z

Z

R: 0

2 / 0 | :| Z z

R

] [Z z0 P

] [Z z0 P

]

|

| [

2P Z z0

(8)

소표본에서 모평균 μ의 가설검정

표본의 크기가 작을 때, 정규모집단의 모평균 μ에 관한 가설의 검 정통계량과 검정규칙은 다음과 같다.

(2) 검정통계량 :

유의수준 α에서의 기각역과 p-값은 대립가설에 따라 다음과 같다.

여기서 t0는 T0의 관측값이다.

소표본에서 모평균의 가설검정 (복습)

n S

T X

/

0 0

 

(1) 대립가설 (3) 기각역 P-값

0 1:H

0 1:H

0 1:H

) 1 ( :T0 t n

R

) 1 ( :T0 t n

R

) 1 (

|

:|T0 t /2 n

R

] )

1 (

[t n t0

P

] )

1 (

[t n t0

P

|]

| ) 1 ( [

2P t n t0

(9)

대표본인 경우 모비율 p에 관한 가설의검정에 대해 살펴보자.

대표본인 경우(일반적으로 np≥5, n(1-p)≥5) 표본비율

은 평균이 p이고 분산이 p(1-p)/n인 정규분포를 근사적으로 따르 기 때문에 정규분포를 이용하여 검정을 할 수 있다.

모비율 (P)의 가설검정

n X p

ˆ

/

n p p

p Z p

/ ) 1

( ˆ

 

위의 통계량은 근사적으로 표준정규분포 N(0,1)을 따른다.

(10)

모비율 (p)의 가설검정

 대표본에서 모비율 p의 가설검정

표본의 크기가 클 때, 모비율 p에 관한 가설의 검정통계량과 검정규 칙은 다음과 같다.

(2) 검정통계량 :

유의수준 α에서의 기각역과 p-값은 대립가설에 따라 다음과 같다.

n p

p

p Z p

/ ) 1

( ˆ

0 0

0

0

 

(1) 대립가설 (3) 기각역 P-값

0 1: p p

H

0 1: p p

H

0 1: p p

H

z

Z R: 0

z

Z

R: 0

2 / 0 | :| Z z

R

] [Z z0

P

] [Z z0 P

| ]

| [

2P Z z0

(11)

예제 7.10) 제 6장 예제 6.1에서 A후보의 지지율이 35%를 초과한다 고 단정할 수 있는지 유의수준 α=0.01에서 검정하라.

모비율 (P)의 가설검정

풀이) A후보의 지지율을 p, p가 0.35보다 큰지를 검정 가설 H0 : p  0.35, H1: p  0.35

유건자 1000명을 조사하여 지지자의 수가 390명이므로 표본비 율은

p ˆ  0 . 39

이었다.

검정통계량 2.65

1000 /

) 35 . 0 1 ( 35 . 0

35 . 0 39 . 0

0

  z

Z0.01=2.33이므로 기각역은 R:Z0≥2.33이다.

따라서 α=0.01에서 귀무가설을 기각한다. A후보의 지지율이 0.39보다 높다고 결론 내릴 수 있다.

P-값을 계산해보면

p-값=P[Z≥2.65]=0.004

(12)

예제 7.11 ) 최근 2000명의 경제활동인구를 대상으로 조사한 결과 실업자의 수가 72명으로 나타났다. 지난해 우리나라의 실업률은 3.9%였다. 지난해에 비해 실업률이 감소되었다고 말할 수 있는 가?

모비율의 가설검정

풀이) 올해 우리나라 실업률을 p

가설 H0 : p 0.039, H1 : p 0.039

경제활동인구 2000명을 조사하여 실업자의 수가 72명이므로 표 본비율은 0.036이다.

검정통계량 0.693

2000 /

) 039 . 0 1 ( 039 . 0

039 . 0 036 . 0

0  

  Z

Z0.05=1.645이므로 기각역은 R:Z0≤-1.645이다.

따라서 귀무가설을 기각할 수 없다. 따라서 올해 실업률이 작년에 비해 감소했다는 확실한 증거를 제시하지 못한다.

P-값을 계산해보면

p-값=P[Z≤-0.693]=0.2451

(13)

가설검정 (확인)

1.. 모평균(μ)의 가설검정 (대표본) - 모분산 ( )을 알때,

모를때 ( 사용) : ( )-검정 2. 모평균 (μ) 의 가설검정 (소표본)

1) 모분산 ( )을 알때 : ( ) 검정 2) 모분산( )을 모를때 사용: ( )검정 3. 모비율(p)의 가설검정 : ( )검정 4. 모분산( )의 가설검정 ?

 2

 2

 2

 2

S

2

S

2

(14)

 모집단 분포가 정규분포라는 가정하에 모분산 σ2에 관한 검정해보자.

모분산 σ2의 추정량으로는 표본분산 S2을 이용한다

모집단 분포가 정규분포라는 가정하에 표분분산은 다음과 같이 카이 제곱 분포를 따른다.

모분산 ( σ 2 )의 가설검정

) 1 (

) ~ 1

(

2

2

2

S n

n

정규모집단에서 모분산 σ2의 가설검정

정규모집단의 분산 σ2에 관한 가설의 검정통계량과 검정규칙 (2) 검정통계량

유의수준 α에서의 기각역과 p-값은 대립가설에 따라 다음과 같다.

2 0

2 2

0

) 1 (

  n S

(1) 대립가설 (3) 기각역 P-값

20 2

1:H

20 2

1:H

20 2

1:H

) 1 ( : 20 2 n R  

) 1 (

: 21

20 n

R  

) 1 (

) 1 ( :

2 2 / 1 2

0

2 2 / 2

0

n

n R

또는

] )

1 - (

[2 n 02 P

] )

1 (

[2 n 02 P

값의 작은

중에서

위의

(15)

예제 7.12) 제 6장 예제 6.11의 데이터를 이용하여 새로운 시스템에 서 대기시간의 분산이 6이내라고 주장 할 수 있는지 유의수준 0.05로 검정하라.

모분산의 가설검정

풀이) 가설 H0 :2 6, H1:2 6

검정통계량 7.947 6

298 . 5

2 9

0   

기각역 R:

02

02.95(9) 3.33

검정통계량이 기각역에 들어가지 않으므로 귀무가설을 기각 할 수 없다. 따라서 유의수준 0.05에서 분산이 6이내라는 주 장을 뒷받침할 근거가 없다.

(16)

신뢰구간과 가설검정은 밀접한 관련

이 있다.

대표본에서 모평균 μ의 양측가설에 대한 다음의 기각역을 살펴보자

2 / 0

: /

n z S

R X

기각역 R에 상반되는 영역을 채택역 Rc로 나타내면

2 / 0

: /

n z S

Rc X

이므로 부등식을 풀어 μ0에 관해 정리하면

n z S

n X z S

X /2 0 /2

이러한 사실로 부터 신뢰구간은 대응되는 검정의 채택역에 의해 유도 될 수 있으므로 귀무가설에 대응되는 값이 신뢰구간에 포함되면 귀무 가설을 기각할 수 없다. 즉 귀무가설의 μ0가 100(1-α)% 신뢰구간 에 포함되지 않으면 유의수준 α에서 귀무가설을 기각할 수 있다.

(17)

예제 7.13) 제 6장 예제 6.8의 데이터에서 제품의 평균용량이 200 이라고 말할 수 있는지 유의수준 0.05에서 검정하라.

풀이) 검정하고자 하는 가설

H

0

:   200 , H

1

:   200

예제 6.8에서 구한 평균용량의 95% 신뢰구간은 (199.81, 204,19) 이다. 이 구간에 μ0=200이 포함되므로 유의수준 0.05에서 귀무가 설을 기각할 수 없다.

실제 기각역을 이용해 검정해 보자.

검정통계량 1.788

36 / 71 . 6

200 202

0

Z

기각역 1.96

: / 0 /2

z n S R X

검정통계량이 기각역을 포함하지 않으므로 귀무가설을 기각할 수 없다. 즉 , 신뢰구간과 양측가설검정은 실질적 같은 의미를 가진다.

신뢰구간과 가설검정 관계

(18)

예제 7.13) 닭고기를 재료로 만든 핫도그에 포함되어 있는 칼로리의 평균이 150보다 적은지를 검정하고자 한다. 단, 핫도그에 포함되 어 있는 칼로리는 정규분포를 따른다고 한다.

129 132 102 106 94 102 87 99

107 113 135 142 86 143 152 146 144

SPSS를 이용한 실습

풀이) 을 검정하기 위한 자료입력H0 : 150 H1 :  150

(19)

실행순서

SPSS를 이용한 실습

(20)

위의 결과 검정통계량이 -5.711이고 유의확률이 0.000으로 유 의수준 0.01에서 귀무가설을 기각하게 된다. 따라서 닭고기로 만 든 핫도그의 칼로리가 150보다 적음을 알 수 있다.

이 때 유의확률은 양측 검정에 대해 P[|t(16)}>5.711]을 구한 값 이므로 단측 검정일 때의 유의확률은 0.000/2=0.000이다.

SPSS를 이용한 실습

(21)

예제 7.14) 휴대폰을 충전하는데 걸리는 평균시간이 180분인지 검정 하고자 10개의 자료를 얻었다. 단, 휴대폰 충전시간은 정규분포 를 따른다고 가정 한다.

120 100 250 180 110 150 140 160 110 130

SPSS를 이용한 실습

풀이) 을 검정하기 예제 7.13과 같이 데이터 를 입력하며 검정변수에 battery를 검정값에 180을 입력하고 확 인을 누른다.

180 :

, 180

: 1

0   H  

H

검정통계량이 -2.485이고 유의확률이 0.035로 유의수준 0.05 에서 귀무가설을기각하게 된다.

(22)

HW6

• P 201 : 2, 3, 6, 9, 11, 14, 15

• QUIZ 2-

• 일시 : 수업중 (2015. 11. 23(월))

• 범위 : 6장, 7장 까지

(23)

(23)

우리의 선택은 ? Outliers (Extreme values, 극 과 극)

중국어는 어느정도 공부하면 일상대화가 가능할까요?

=> 탈북자는 한달이면 가능합니다.

왜냐하면 000이 있기 때문입니다.

(24)

모평균 (대표본)의 가설검정 (복습)

 대표본에서 모평균 μ의 가설검정

표본의 크기가 클 때, 모평균 μ에 관한 가설의 검정통계량과 검정규칙은 다음과 같다.

2) 검정통계량 :

유의수준 α에서의 기각역과 p-값은 대립가설에 따라 다음과 같다.

n S

Z X

/

0 0

 

1) 대립가설 3) 기각역 3) P-값

0 1:H

0 1:H

0 1:H

z

Z R: 0

z

Z

R: 0

2 / 0 | :| Z z

R

] [Z z0 P

] [Z z0 P

]

|

| [

2P Z z0

(25)

소표본에서 모평균 μ의 가설검정

표본의 크기가 작을 때, 정규모집단의 모평균 μ에 관한 가설의 검 정통계량과 검정규칙은 다음과 같다.

(2) 검정통계량 :

유의수준 α에서의 기각역과 p-값은 대립가설에 따라 다음과 같다.

여기서 t0는 T0의 관측값이다.

소표본에서 모평균의 가설검정

n S

T X

/

0 0

 

(1) 대립가설 (3) 기각역 P-값

0 1:H

0 1:H

0 1:H

) 1 ( :T0 t n

R

) 1 ( :T0 t n

R

) 1 (

|

:|T0 t /2 n

R

] )

1 (

[t n t0

P

] )

1 (

[t n t0

P

|]

| ) 1 ( [

2P t n t0

(26)

모비율의 가설검정 (복습)

 대표본에서 모비율 p의 가설검정

표본의 크기가 클 때, 모비율 p에 관한 가설의 검정통계량과 검정규 칙은 다음과 같다.

(2) 검정통계량 :

유의수준 α에서의 기각역과 p-값은 대립가설에 따라 다음과 같다.

n p

p

p Z p

/ ) 1

( ˆ

0 0

0

0

 

(1) 대립가설 (3) 기각역 P-값

0 1: p p

H

0 1: p p

H

0 1: p p

H

z

Z R: 0

z

Z

R: 0

2 / 0 | :| Z z

R

] [Z z0

P

] [Z z0 P

| ]

| [

2P Z z0

(27)

 모집단 분포가 정규분포라는 가정하에 모분산 σ2에 관한 검정해보자.

모분산 σ2의 추정량으로는 표본분산 S2을 이용한다

모집단 분포가 정규분포라는 가정하에 표분분산은 다음과 같이 카이 제곱 분포를 따른다.

모분산 ( σ 2 )의 가설검정 (복습)

) 1 (

) ~ 1

(

2

2

2

S n

n

정규모집단에서 모분산 σ2의 가설검정

정규모집단의 분산 σ2에 관한 가설의 검정통계량과 검정규칙 (2) 검정통계량

유의수준 α에서의 기각역과 p-값은 대립가설에 따라 다음과 같다.

2 0

2 2

0

) 1 (

  n S

(1) 대립가설 (3) 기각역 P-값

20 2

1:H

20 2

1:H

20 2

1:H

) 1 ( : 20 2 n R  

) 1 (

: 21

20 n

R  

) 1 (

) 1 ( :

2 2 / 1 2

0

2 2 / 2

0

n

n R

또는

] )

1 - (

[2 n 02 P

] )

1 (

[2 n 02 P

값의 작은

중에서

위의

(28)

추정 (복습)

 정규모집단에서 μ 의 100(1-α )% 신뢰구간 (대표본/소표본)

 정규모집단에서 μ 의 100(1-α )% 신뢰구간 (소표본) ?

 정규모집단에서 P 의 100(1-α )% 신뢰구간 (대표본) ?

 

 

  

n z

X n z

X  

/2

,

/2

(29)

 정규모집단의 모분산 σ2의 100(1-α)% 신뢰구간

모집단 분포가 정규분포인 경우, σ2의 100(1-α)% 신 뢰구간은 다음과 같다.

여기서 은 자유도 n-1인 카이제곱 분포의 상 위 α/2인 점이고 은 하위 α/2인 점이다.

모분산의 신뢰구간 (6장 복습)

) 1

2 (

2

/ n

) 1

2 (

2 /

1

n

 

 

( 1 )

) 1 , (

) 1 (

) 1 (

2 2 / 1

2 2

2 /

2

n S n

n S n

(30)

 모평균 μ의 추정에서 100(1-α)% 오차한계를 이용하 여 표본의 크기를 결정할 수 있다.

에 의한 μ의 추정에서 100(1-α)% 오차한계 d

표본크기 (n) 의 결정 (6장 복습)

Z n

d

/2

위의 식을 n에 관하여 풀면 다음과 같다.

2 2 /

 

 

d

n Z

이 때 n은 표본크기이므로 계산된 값이 정수가 아닌 경 우, 계산된 값보다 큰 최소의 정수로 결정한다.

X

참조

관련 문서

따라서 재폐로 기능이 있는 보호기기들을 적절히 배치 운영하여 선로고장을 효과 적으로 대응할 수 있다. 재폐로 기능이

그림 5.7 반응식에 있는 어떤 두 물질의 몰 관계를 알기 위하여 반응식을 이용...

따라서 주어진 자료에서 대표치 이외의 통계적 정보를 얻고자 하는 경우에는 산술평균를 선택하는 것이 바람직하다고 볼 수 있다.. •

❍ 중국의 채소는 산둥성, 산둥성의 채소는 서우광시라고 할 수 있을 만큼 서우광의 채소 산업은 중국 채소산업의 발전을 선도하고 있다... 따라서 서우광시

유의수준은 귀무가설하에서 귀무가설을 기각 할 확률입니다...

3) 진단 : 조영제를 이용한 전산화 단층촬영이나 혈관조영술이 진단에 도 움이 되나, 신장기능 정도에 따라서 조영제에 의한 급성신부전이 발생 할 수

자율주행이 자동차의 딜레마 상황처럼, 인공지능과 관련하여 발생할 수 있는 문제에 예방 및 대응 하기 위해서는 인공지능을 개발하는 단계, 개발된 인공지능을

­ 나이가 들수록 신경세포는 줄어도 독서와 같은 지적 자극을 통해 신경회로는 늘일 수 있다.. ­ 따라서 노인도 젊은 사람