• 검색 결과가 없습니다.

보건통계학7장

N/A
N/A
Protected

Academic year: 2022

Share "보건통계학7장"

Copied!
24
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

1001944 제 7장. 가설검정 과목명 : 보건통계학 담당교수 : 손애리 교수

이 강의록은 저작권법에 의해 보호받는 저작물로써 저작권자의 허락 없이

저작재산권 일체(복제권, 배포권, 대여권, 공연권, 공중전송권, 전시권, 2차적저작물작성권)를 침해시 저작권법에 의거 처벌받을 수 있습니다.

1001944

(2)

보건통계학 7장

가설검정

손 애 리

(3)

1. 가설검정의 개념

3. 독립표본 T 검정

가설검정

목 차

2. T 검정

4. 대응표본 T 검정

5. 모집단 비율의 검정

(4)

1. 가설검정의 개념

(5)

1. 가설검정

 연구가설(research hypothesis)

 통계적 가설(statistical hypothesis)

(6)

 가설검정(hypothesis test): 가설검정은 통계적 가설의 타 당성을 검정하는 것으로 표본의 분포나 자료로부터 그 표 본이 추출된 모집단에 관하여 사전에 설정된 통계적 가설 이 사실인지 아닌지 타당성을 판정하는 과정

2. 가설검정의 개념

(7)

가설

 대립가설(alternative hypothesis):

대립가설은 귀무가설에 대 립되는 개념으로 새로운 예상이나 주장을 하고자 설정하는 모집단의 모수에 관한 가설로 가설을 채택할 것을 전제로 한 가설

𝑯𝑯

𝑨𝑨

혹은 𝑯𝑯

𝟏𝟏으로 표기

 귀무가설(null hypothesis):

귀무가설 혹은 영가설은 가설을 무 효화(nullifying)하기 위해 설정하는 모수의 값이라는 의미에서 붙여진 것이며 가설을 기각할 것을 전제로 한 가설

𝑯𝑯

𝟎𝟎로 표기

 통계적 가설(statistical hypothesis):

서술적 가설을 기호나 숫 자로 표현한 가설

2. 가설검정의 개념

(8)

통계적 가설의 예

 어느 모집단의 성인 남성 키의 평균이 170cm가 아니라고 할 수 있 는가? 그 때 귀무가설 는 다음과 같이 설정한다.

𝑯𝑯𝟎𝟎 ∶ 𝝁𝝁 = 𝟏𝟏𝟏𝟏𝟎𝟎𝟏𝟏𝟏𝟏

 이때 대립가설 는 다음과 같이 표시된다.

𝑯𝑯𝟎𝟎 ∶ 𝝁𝝁 ≠ 𝟏𝟏𝟏𝟏𝟎𝟎𝟏𝟏𝟏𝟏

 만일 모평균이 170cm보다 크다고 할 수 있는지 알아보려고 할 경 우 귀무가설과 대립가설은 다음과 같다.

𝑯𝑯𝑨𝑨 ∶ 𝝁𝝁 ≤ 𝟏𝟏𝟏𝟏𝟎𝟎𝟏𝟏𝟏𝟏, 𝑯𝑯𝑨𝑨 ∶ 𝝁𝝁 > 𝟏𝟏𝟏𝟏𝟎𝟎𝟏𝟏𝟏𝟏

 그 모평균이 170cm보다 작다고 할 수 있는지 알아보려고 할 경우 의 가설은 다음과 같다.

𝑯𝑯𝟎𝟎 ∶ 𝝁𝝁 ≥ 𝟏𝟏𝟏𝟏𝟎𝟎𝟏𝟏𝟏𝟏, 𝑯𝑯𝑨𝑨 ∶ 𝝁𝝁 < 𝟏𝟏𝟏𝟏𝟎𝟎𝟏𝟏𝟏𝟏

2. 가설검정의 개념

(9)

양측검정은 표본의 산술평균이 가정 한 모집단의 산술평균과 같은가 다 른가를 판정하는 경우

 양측검정(two-tailed test)

가설설정 규칙

단측검정은 표본의 산술평균이 모평 균 값보다 큰지 또는 작은지 검정하 고자 하는 경우

 단측검정(one-tailed test)

① 귀무가설은 모수를 특정한 값으로 표시한다.

예: 𝑯𝑯𝟎𝟎 ∶ 𝝁𝝁 = 𝟏𝟏𝟏𝟏𝟎𝟎𝟏𝟏𝟏𝟏, 𝑯𝑯𝟎𝟎 ∶ 𝝁𝝁 ≤ 𝟏𝟏𝟏𝟏𝟎𝟎𝟏𝟏𝟏𝟏, 𝑯𝑯𝟎𝟎 ∶ 𝝁𝝁 ≥ 𝟏𝟏𝟏𝟏𝟎𝟎𝟏𝟏𝟏𝟏

② 대립가설은 귀무가설에서 지적한 모수의 값이 아닌 어떤 영역으로 나타내 는데, 양쪽을 고려하는 양측검정과 한쪽만 고려하는 단측검정이 있다. 예:

𝑯𝑯𝑨𝑨 ∶ 𝝁𝝁 ≠ 𝟏𝟏𝟏𝟏𝟎𝟎𝟏𝟏𝟏𝟏(양측검정), 𝑯𝑯𝑨𝑨 ∶ 𝝁𝝁 > 𝟏𝟏𝟏𝟏𝟎𝟎𝟏𝟏𝟏𝟏(단측검정), 𝑯𝑯𝑨𝑨 ∶ 𝝁𝝁 ≤ 𝟏𝟏𝟏𝟏𝟎𝟎𝟏𝟏𝟏𝟏(단측검정)

2. 가설검정의 개념

(10)

검정통계량과 기각역

 검정통계량(test statistic):

어떤 가설이 옳은지 판단에 사용되는 표본의 통계량으로서, 대부분 모수의 추정량을 기초로 함

검정하려는 모수 검정통계량

𝜇𝜇 𝑥𝑥

𝜇𝜇1 − 𝜇𝜇2 𝑥𝑥1 − 𝑥𝑥2

p ̂𝑝𝑝

𝑝𝑝1 − 𝑝𝑝2 𝑝𝑝�1 − �𝑝𝑝2

표 7.1.1 검정모수와 검정통계량

2. 가설검정의 개념

(11)

검정통계량과 기각역

 기각역(rejection

region):

기각역은 귀무가

설이 옳다고 판단할 수 없는 검정통계량의 영역

 기각역과 채택역의 경계: 임 계점(critical point)

2. 가설검정의 개념

(12)

검정오차

 제1종 오류 type Ⅰ error

가설검정에서 발생할 수 있는 오류는

“귀무가설이 참인데 그 가설을 기각하는 경우”, 즉 대립가설을 채택하는 판단의 오류로

𝜶𝜶로 표기

. 𝜶𝜶는 유의수준(significant level)

𝜶𝜶값 𝜶𝜶는 유의수준(level of significance)이라고 불리며, 이는 가설검정 이 유의성검정이라고 불리워지는 점을 반영

𝜶𝜶는 확률로서 “옳은 귀무가설을 기각할 확률” 즉 1종 오류를 범할 수 있 는 확률

 제2종 오류:type Ⅱ error

반대로 “귀무가설이 참이 아닌데 그 가 설을 기각하지 않고 받아들이는 경우”이며

𝜷𝜷로 표기

.

2. 가설검정의 개념

(13)

검정오차

 p값 어떤 검정의 “p값( value)은 귀무가설이 기각될 수 있는 𝜶𝜶의 최소치”

라 정의, 검정통계량이 기각치라고 가정하고 계산된 유의수준을 의미

 일반적으로 정확한 값을 제시하거나 , p<. 𝟎𝟎𝟎𝟎𝟏𝟏, p<. 𝟎𝟎𝟏𝟏또는 p<. 𝟎𝟎𝟎𝟎 등 의 용어를 사용하며 이는, 0.001, 0.01, 0.05의 유의수준에서 귀무가설 을 기각할 수 있음을 말함.

귀무가설(영가설)의 상태

옳음(True) 거짓임(False)

귀무가설을 기각하지 못함 옳은 결정

(신뢰수준 1-𝜶𝜶) 제2종오류(𝜷𝜷)

귀무가설을 기각함 제1종오류(𝜶𝜶) 옳은 결정

(검정력:1-𝜷𝜷)

2. 가설검정의 개념

(14)

가설검정 방법

 ① 귀무가설 를 설정한다.

 ② 유의수준 ( 또는 )를 설정하고 기각역을 정한다.

 ③ 검정통계량을 계산한다.

 ④ 통계적 결정을 한다.

 ⑤ 결론을 내린다.

P값 < 𝜶𝜶 => 𝑯𝑯𝟎𝟎을 기각 P값 > 𝜶𝜶 => 𝑯𝑯𝟎𝟎을 채택

2. 가설검정의 개념

(15)

2. T 검정

(16)

1. T 검정의 개념

 표본이 한 개인 경우와 검정값의 평균을 비교하는 경우 (일표본 t검정)

 두 집단 간의 평균의 차이를 비교하는 분석 (독립표본 t 검정)

- 안전띠 착용 유무에 따른 사망자수는 차이가 있는가?

- 성별에 따라서 스트레스의 정도는 차이가 있는가?

 동일한 집단을 처지 전과 처지 후에 측정하여 평균을 비

교하는 경우, 혹은 짝으로 이루어진 자료의 평균을 비교

하는 경우 (대응표본 t 검정, 짝비교)

(17)

2. T검정을 위한 조건: 정규성, 등분산성

모집단 A 모집단 B

표본 X 표본 Y

정규성 :

등분산 이분산

기본 가정 : 두 모집단의 분포는 정규분포이고 분산은 으로 동일해야 한다.

즉, 위의 등분산 Graph의 형태이다

(18)

3. 단일 모평균에 대한 가설검정

 모평균 는 알고 있으나 모분산 을 모르며, 그 모집단에서 추출 한 표본의 평균 과표본분산 을 아는 경우 표본의 평균과 모집 단의 평균을 비교하고자 검정하 는 경우

t =

𝒙𝒙 − 𝝁𝝁𝒔𝒔

𝒏𝒏

정규분포하는 모집단에서

표본을 추출: 모분산 𝝈𝝈𝟐𝟐을 알고 있을 때

 모평균 와 모분산 를 알고 그 모 집단에서 추출한 표본의 평균 를 알 때 표본의 평균과 모집단 의 평균을 비교 검정하는 경우

Z =

𝒙𝒙 − 𝝁𝝁𝝈𝝈

𝒏𝒏

정규분포하는 모집단에서 표본을 추출:모분산 𝝈𝝈𝟐𝟐 모를 때 (일표본 T검정)

(19)

 모평균 는 알고 있으나 모분산 을 모르며, 그 모집단에서 추출 한 표본의 평균 과표본분산 을 아는 경우 표본의 평균과 모집 단의 평균을 비교하고자 검정하 는 경우

t =

𝒙𝒙 − 𝝁𝝁𝒔𝒔

𝒏𝒏

정규분포하는 모집단에서

표본을 추출: 모분산 𝝈𝝈𝟐𝟐을 알고 있을 때

 모평균 와 모분산 를 알고 그 모 집단에서 추출한 표본의 평균 를 알 때 표본의 평균과 모집단 의 평균을 비교 검정하는 경우

Z =

𝒙𝒙 − 𝝁𝝁𝝈𝝈

𝒏𝒏

정규분포하는 모집단에서 표본을 추출:모분산 𝝈𝝈𝟐𝟐 모를 때 (일표본 T검정)

3. 단일 모평균에 대한 가설검정

(20)

t =

𝒙𝒙 − 𝝁𝝁𝝈𝝈

𝒏𝒏

정규분포하지 않는 모집단에서 표본을 추출:모분산 을 모르는 경우

Z =

𝒙𝒙 − 𝝁𝝁𝒔𝒔

𝒏𝒏

3. 단일 모평균에 대한 가설검정

(21)

3. 단일 모평균 가설 검정 (일표본 T검정]

보기 6.4.4자료를 이용해 미국 여학생의 평균 몸무게가 우리나라 여학생 평균 몸무게 55kg보다 많이 나가는지를 검정해 보자.

 1) [분석] - [평균비교] –

[일표본T검정]을 선택한다.

 2) 분석할 변수를 선택하고 을 눌러 검정변수란으로 옮긴다.

(22)

 3) 검정값에 ‘55’을 입력하고 확인을 누른다.

3. 단일 모평균 가설 검정 (일표본 T검정]

(23)

4) 단일 모평균 가설검정(일표본T검정) 결과를 확인한다.

검정값은 55이다(. 즉 표본의 자료가 한국 여학생 몸무게 55kg보다 몸무게가 많이 나가는지 검정하는 것이다.

낮은 유의확률 값(일반적으로 0.05보다 작을 때)은 미국여학생과

한국여학생의 몸무게가 차이가 있는 것으로 볼 수 있지만, 이 검정에서는 유의확률이 0.146이므로 유의한 차이가 없는 것으로 나타났다.

차이의 95% 신뢰구간은 0을 포함하지 않아야 유의한 차이가 있다.

본 결과에서는 0을 포함하는 것으로 나타나 유의한 차이가 없는 것으로 나타났다.

3. 단일 모평균 가설 검정 (일표본 T검정]

(24)

́𝒕𝒕 = 𝒙𝒙𝟏𝟏− 𝒙𝒙𝟐𝟐 − 𝝁𝝁𝟏𝟏− 𝝁𝝁𝟐𝟐

𝒔𝒔𝟐𝟐𝟏𝟏

𝒏𝒏𝟏𝟏 +𝒔𝒔𝟐𝟐𝟐𝟐𝒏𝒏𝟐𝟐

́𝒕𝒕

𝝈𝝈𝟐𝟐 = 𝒘𝒘𝟏𝟏𝒕𝒕𝟏𝟏 + 𝒘𝒘𝟐𝟐𝒕𝒕𝟐𝟐 𝒘𝒘𝟏𝟏 + 𝒘𝒘𝟐𝟐 𝒘𝒘𝟏𝟏 = 𝒔𝒔𝟐𝟐𝟏𝟏

𝒏𝒏𝟏𝟏 𝒘𝒘𝟐𝟐 = 𝒔𝒔𝟐𝟐𝟐𝟐 𝒏𝒏𝟏𝟏 𝒕𝒕𝟏𝟏 = 𝒕𝒕 𝟏𝟏−𝝈𝝈𝟐𝟐 𝒏𝒏𝟏𝟏 − 𝟏𝟏 𝒕𝒕𝟐𝟐 = 𝒕𝒕 𝟏𝟏−𝝈𝝈𝟐𝟐 (𝒏𝒏𝟐𝟐 − 𝟏𝟏)

(1) 두 모분산이 동일한 경우

𝒔𝒔𝟐𝟐𝒑𝒑 = 𝒏𝒏𝟏𝟏 − 𝟏𝟏 𝒔𝒔𝟐𝟐𝟏𝟏 + (𝒏𝒏𝟐𝟐 − 𝟏𝟏)𝒔𝒔𝟐𝟐𝟐𝟐 𝒏𝒏𝟏𝟏 − 𝟏𝟏 + (𝒏𝒏𝟐𝟐 − 𝟏𝟏)

T =

𝒙𝒙𝟏𝟏 − 𝒙𝒙𝟐𝟐 − 𝝁𝝁𝟏𝟏 − 𝝁𝝁𝟐𝟐

𝒔𝒔𝟐𝟐𝒑𝒑

𝒏𝒏𝟏𝟏 + 𝒔𝒔𝟐𝟐𝒑𝒑𝒏𝒏𝟐𝟐 (𝐝𝐝𝐝𝐝 = 𝒏𝒏𝟏𝟏 + 𝒏𝒏𝟐𝟐 − 𝟐𝟐)

(2) 정규분포하는 모집단에서 표본을 추출하였을 경우:모분산 을 모르며 동일하지 않을 때

정규분포하는 모집단에서 표본을 추출: 모분산 을 모르는 경우(독립표본 t-검정)

4. 두 모평균 차이에 대한 가설검정

참조

관련 문서