1001944 제 7장. 가설검정 과목명 : 보건통계학 담당교수 : 손애리 교수
이 강의록은 저작권법에 의해 보호받는 저작물로써 저작권자의 허락 없이
저작재산권 일체(복제권, 배포권, 대여권, 공연권, 공중전송권, 전시권, 2차적저작물작성권)를 침해시 저작권법에 의거 처벌받을 수 있습니다.
1001944
보건통계학 7장
가설검정
손 애 리
1. 가설검정의 개념
3. 독립표본 T 검정
가설검정
목 차
2. T 검정
4. 대응표본 T 검정
5. 모집단 비율의 검정
1. 가설검정의 개념
1. 가설검정
연구가설(research hypothesis)
통계적 가설(statistical hypothesis)
가설검정(hypothesis test): 가설검정은 통계적 가설의 타 당성을 검정하는 것으로 표본의 분포나 자료로부터 그 표 본이 추출된 모집단에 관하여 사전에 설정된 통계적 가설 이 사실인지 아닌지 타당성을 판정하는 과정
2. 가설검정의 개념
가설
대립가설(alternative hypothesis):
대립가설은 귀무가설에 대 립되는 개념으로 새로운 예상이나 주장을 하고자 설정하는 모집단의 모수에 관한 가설로 가설을 채택할 것을 전제로 한 가설𝑯𝑯
𝑨𝑨혹은 𝑯𝑯
𝟏𝟏으로 표기 귀무가설(null hypothesis):
귀무가설 혹은 영가설은 가설을 무 효화(nullifying)하기 위해 설정하는 모수의 값이라는 의미에서 붙여진 것이며 가설을 기각할 것을 전제로 한 가설𝑯𝑯
𝟎𝟎로 표기 통계적 가설(statistical hypothesis):
서술적 가설을 기호나 숫 자로 표현한 가설2. 가설검정의 개념
통계적 가설의 예
어느 모집단의 성인 남성 키의 평균이 170cm가 아니라고 할 수 있 는가? 그 때 귀무가설 는 다음과 같이 설정한다.
𝑯𝑯𝟎𝟎 ∶ 𝝁𝝁 = 𝟏𝟏𝟏𝟏𝟎𝟎𝟏𝟏𝟏𝟏
이때 대립가설 는 다음과 같이 표시된다.
𝑯𝑯𝟎𝟎 ∶ 𝝁𝝁 ≠ 𝟏𝟏𝟏𝟏𝟎𝟎𝟏𝟏𝟏𝟏
만일 모평균이 170cm보다 크다고 할 수 있는지 알아보려고 할 경 우 귀무가설과 대립가설은 다음과 같다.
𝑯𝑯𝑨𝑨 ∶ 𝝁𝝁 ≤ 𝟏𝟏𝟏𝟏𝟎𝟎𝟏𝟏𝟏𝟏, 𝑯𝑯𝑨𝑨 ∶ 𝝁𝝁 > 𝟏𝟏𝟏𝟏𝟎𝟎𝟏𝟏𝟏𝟏
그 모평균이 170cm보다 작다고 할 수 있는지 알아보려고 할 경우 의 가설은 다음과 같다.
𝑯𝑯𝟎𝟎 ∶ 𝝁𝝁 ≥ 𝟏𝟏𝟏𝟏𝟎𝟎𝟏𝟏𝟏𝟏, 𝑯𝑯𝑨𝑨 ∶ 𝝁𝝁 < 𝟏𝟏𝟏𝟏𝟎𝟎𝟏𝟏𝟏𝟏
2. 가설검정의 개념
양측검정은 표본의 산술평균이 가정 한 모집단의 산술평균과 같은가 다 른가를 판정하는 경우
양측검정(two-tailed test)
가설설정 규칙
단측검정은 표본의 산술평균이 모평 균 값보다 큰지 또는 작은지 검정하 고자 하는 경우
단측검정(one-tailed test)
① 귀무가설은 모수를 특정한 값으로 표시한다.
예: 𝑯𝑯𝟎𝟎 ∶ 𝝁𝝁 = 𝟏𝟏𝟏𝟏𝟎𝟎𝟏𝟏𝟏𝟏, 𝑯𝑯𝟎𝟎 ∶ 𝝁𝝁 ≤ 𝟏𝟏𝟏𝟏𝟎𝟎𝟏𝟏𝟏𝟏, 𝑯𝑯𝟎𝟎 ∶ 𝝁𝝁 ≥ 𝟏𝟏𝟏𝟏𝟎𝟎𝟏𝟏𝟏𝟏
② 대립가설은 귀무가설에서 지적한 모수의 값이 아닌 어떤 영역으로 나타내 는데, 양쪽을 고려하는 양측검정과 한쪽만 고려하는 단측검정이 있다. 예:
𝑯𝑯𝑨𝑨 ∶ 𝝁𝝁 ≠ 𝟏𝟏𝟏𝟏𝟎𝟎𝟏𝟏𝟏𝟏(양측검정), 𝑯𝑯𝑨𝑨 ∶ 𝝁𝝁 > 𝟏𝟏𝟏𝟏𝟎𝟎𝟏𝟏𝟏𝟏(단측검정), 𝑯𝑯𝑨𝑨 ∶ 𝝁𝝁 ≤ 𝟏𝟏𝟏𝟏𝟎𝟎𝟏𝟏𝟏𝟏(단측검정)
2. 가설검정의 개념
검정통계량과 기각역
검정통계량(test statistic):
어떤 가설이 옳은지 판단에 사용되는 표본의 통계량으로서, 대부분 모수의 추정량을 기초로 함검정하려는 모수 검정통계량
𝜇𝜇 𝑥𝑥
𝜇𝜇1 − 𝜇𝜇2 𝑥𝑥1 − 𝑥𝑥2
p ̂𝑝𝑝
𝑝𝑝1 − 𝑝𝑝2 𝑝𝑝�1 − �𝑝𝑝2
표 7.1.1 검정모수와 검정통계량
2. 가설검정의 개념
검정통계량과 기각역
기각역(rejection
region):
기각역은 귀무가설이 옳다고 판단할 수 없는 검정통계량의 영역
기각역과 채택역의 경계: 임 계점(critical point)
2. 가설검정의 개념
검정오차
제1종 오류 : type Ⅰ error
가설검정에서 발생할 수 있는 오류는“귀무가설이 참인데 그 가설을 기각하는 경우”, 즉 대립가설을 채택하는 판단의 오류로
𝜶𝜶로 표기
. 𝜶𝜶는 유의수준(significant level) 𝜶𝜶값 𝜶𝜶는 유의수준(level of significance)이라고 불리며, 이는 가설검정 이 유의성검정이라고 불리워지는 점을 반영
𝜶𝜶는 확률로서 “옳은 귀무가설을 기각할 확률” 즉 1종 오류를 범할 수 있 는 확률
제2종 오류:type Ⅱ error
반대로 “귀무가설이 참이 아닌데 그 가 설을 기각하지 않고 받아들이는 경우”이며𝜷𝜷로 표기
.2. 가설검정의 개념
검정오차
p값 어떤 검정의 “p값( value)은 귀무가설이 기각될 수 있는 𝜶𝜶의 최소치”
라 정의, 검정통계량이 기각치라고 가정하고 계산된 유의수준을 의미
일반적으로 정확한 값을 제시하거나 , p<. 𝟎𝟎𝟎𝟎𝟏𝟏, p<. 𝟎𝟎𝟏𝟏또는 p<. 𝟎𝟎𝟎𝟎 등 의 용어를 사용하며 이는, 0.001, 0.01, 0.05의 유의수준에서 귀무가설 을 기각할 수 있음을 말함.
귀무가설(영가설)의 상태
옳음(True) 거짓임(False)
귀무가설을 기각하지 못함 옳은 결정
(신뢰수준 1-𝜶𝜶) 제2종오류(𝜷𝜷)
귀무가설을 기각함 제1종오류(𝜶𝜶) 옳은 결정
(검정력:1-𝜷𝜷)
2. 가설검정의 개념
가설검정 방법
① 귀무가설 를 설정한다.
② 유의수준 ( 또는 )를 설정하고 기각역을 정한다.
③ 검정통계량을 계산한다.
④ 통계적 결정을 한다.
⑤ 결론을 내린다.
P값 < 𝜶𝜶 => 𝑯𝑯𝟎𝟎을 기각 P값 > 𝜶𝜶 => 𝑯𝑯𝟎𝟎을 채택
2. 가설검정의 개념
2. T 검정
1. T 검정의 개념
표본이 한 개인 경우와 검정값의 평균을 비교하는 경우 (일표본 t검정)
두 집단 간의 평균의 차이를 비교하는 분석 (독립표본 t 검정)
- 안전띠 착용 유무에 따른 사망자수는 차이가 있는가?
- 성별에 따라서 스트레스의 정도는 차이가 있는가?
동일한 집단을 처지 전과 처지 후에 측정하여 평균을 비
교하는 경우, 혹은 짝으로 이루어진 자료의 평균을 비교
하는 경우 (대응표본 t 검정, 짝비교)
2. T검정을 위한 조건: 정규성, 등분산성
모집단 A 모집단 B
표본 X 표본 Y
정규성 :
등분산 이분산
기본 가정 : 두 모집단의 분포는 정규분포이고 분산은 으로 동일해야 한다.
즉, 위의 등분산 Graph의 형태이다
3. 단일 모평균에 대한 가설검정
모평균 는 알고 있으나 모분산 을 모르며, 그 모집단에서 추출 한 표본의 평균 과표본분산 을 아는 경우 표본의 평균과 모집 단의 평균을 비교하고자 검정하 는 경우
t =
𝒙𝒙 − 𝝁𝝁𝒔𝒔𝒏𝒏
정규분포하는 모집단에서
표본을 추출: 모분산 𝝈𝝈𝟐𝟐을 알고 있을 때
모평균 와 모분산 를 알고 그 모 집단에서 추출한 표본의 평균 를 알 때 표본의 평균과 모집단 의 평균을 비교 검정하는 경우
Z =
𝒙𝒙 − 𝝁𝝁𝝈𝝈𝒏𝒏
정규분포하는 모집단에서 표본을 추출:모분산 𝝈𝝈𝟐𝟐을 모를 때 (일표본 T검정)
모평균 는 알고 있으나 모분산 을 모르며, 그 모집단에서 추출 한 표본의 평균 과표본분산 을 아는 경우 표본의 평균과 모집 단의 평균을 비교하고자 검정하 는 경우
t =
𝒙𝒙 − 𝝁𝝁𝒔𝒔𝒏𝒏
정규분포하는 모집단에서
표본을 추출: 모분산 𝝈𝝈𝟐𝟐을 알고 있을 때
모평균 와 모분산 를 알고 그 모 집단에서 추출한 표본의 평균 를 알 때 표본의 평균과 모집단 의 평균을 비교 검정하는 경우
Z =
𝒙𝒙 − 𝝁𝝁𝝈𝝈𝒏𝒏
정규분포하는 모집단에서 표본을 추출:모분산 𝝈𝝈𝟐𝟐을 모를 때 (일표본 T검정)
3. 단일 모평균에 대한 가설검정
t =
𝒙𝒙 − 𝝁𝝁𝝈𝝈𝒏𝒏
정규분포하지 않는 모집단에서 표본을 추출:모분산 을 모르는 경우
Z =
𝒙𝒙 − 𝝁𝝁𝒔𝒔𝒏𝒏
3. 단일 모평균에 대한 가설검정
3. 단일 모평균 가설 검정 (일표본 T검정]
보기 6.4.4자료를 이용해 미국 여학생의 평균 몸무게가 우리나라 여학생 평균 몸무게 55kg보다 많이 나가는지를 검정해 보자.
1) [분석] - [평균비교] –
[일표본T검정]을 선택한다.
2) 분석할 변수를 선택하고 을 눌러 검정변수란으로 옮긴다.
3) 검정값에 ‘55’을 입력하고 확인을 누른다.
3. 단일 모평균 가설 검정 (일표본 T검정]
4) 단일 모평균 가설검정(일표본T검정) 결과를 확인한다.
검정값은 55이다(. 즉 표본의 자료가 한국 여학생 몸무게 55kg보다 몸무게가 많이 나가는지 검정하는 것이다.
낮은 유의확률 값(일반적으로 0.05보다 작을 때)은 미국여학생과
한국여학생의 몸무게가 차이가 있는 것으로 볼 수 있지만, 이 검정에서는 유의확률이 0.146이므로 유의한 차이가 없는 것으로 나타났다.
차이의 95% 신뢰구간은 0을 포함하지 않아야 유의한 차이가 있다.
본 결과에서는 0을 포함하는 것으로 나타나 유의한 차이가 없는 것으로 나타났다.
3. 단일 모평균 가설 검정 (일표본 T검정]
́𝒕𝒕 = 𝒙𝒙𝟏𝟏− 𝒙𝒙𝟐𝟐 − 𝝁𝝁𝟏𝟏− 𝝁𝝁𝟐𝟐
𝒔𝒔𝟐𝟐𝟏𝟏
𝒏𝒏𝟏𝟏 +𝒔𝒔𝟐𝟐𝟐𝟐𝒏𝒏𝟐𝟐
́𝒕𝒕
𝝈𝝈𝟐𝟐 = 𝒘𝒘𝟏𝟏𝒕𝒕𝟏𝟏 + 𝒘𝒘𝟐𝟐𝒕𝒕𝟐𝟐 𝒘𝒘𝟏𝟏 + 𝒘𝒘𝟐𝟐 𝒘𝒘𝟏𝟏 = 𝒔𝒔𝟐𝟐𝟏𝟏
𝒏𝒏𝟏𝟏 𝒘𝒘𝟐𝟐 = 𝒔𝒔𝟐𝟐𝟐𝟐 𝒏𝒏𝟏𝟏 𝒕𝒕𝟏𝟏 = 𝒕𝒕 𝟏𝟏−𝝈𝝈𝟐𝟐 𝒏𝒏𝟏𝟏 − 𝟏𝟏 𝒕𝒕𝟐𝟐 = 𝒕𝒕 𝟏𝟏−𝝈𝝈𝟐𝟐 (𝒏𝒏𝟐𝟐 − 𝟏𝟏)
(1) 두 모분산이 동일한 경우
𝒔𝒔𝟐𝟐𝒑𝒑 = 𝒏𝒏𝟏𝟏 − 𝟏𝟏 𝒔𝒔𝟐𝟐𝟏𝟏 + (𝒏𝒏𝟐𝟐 − 𝟏𝟏)𝒔𝒔𝟐𝟐𝟐𝟐 𝒏𝒏𝟏𝟏 − 𝟏𝟏 + (𝒏𝒏𝟐𝟐 − 𝟏𝟏)
T =
𝒙𝒙𝟏𝟏 − 𝒙𝒙𝟐𝟐 − 𝝁𝝁𝟏𝟏 − 𝝁𝝁𝟐𝟐𝒔𝒔𝟐𝟐𝒑𝒑
𝒏𝒏𝟏𝟏 + 𝒔𝒔𝟐𝟐𝒑𝒑𝒏𝒏𝟐𝟐 (𝐝𝐝𝐝𝐝 = 𝒏𝒏𝟏𝟏 + 𝒏𝒏𝟐𝟐 − 𝟐𝟐)
(2) 정규분포하는 모집단에서 표본을 추출하였을 경우:모분산 을 모르며 동일하지 않을 때
정규분포하는 모집단에서 표본을 추출: 모분산 을 모르는 경우(독립표본 t-검정)