• 통계조사를 통해서 종종 두 그룹 또는 그 이상의 집단을 대상으로 비교를 행하게 된다. 이와 같 은 두 집단 간의 비교문제에서 가장 널리 사용되는 방법은 두 집단의 t-검증이다.
< 통계적 가설검증의 절차>
(1) 귀무가설을 서술한다.
일반적으로 귀무가설(null-hypothesis)은 두 집단의 평균에서 차이가 없다 등으로 서술됨
<사례> 연구문제(research hypothesis) : A학교와 B학교 사이의 시험성적에 차이가 있는가?
→ 귀무가설 : A학교와 B학교 사이의 시험성적에 차이가 없다.
*만약 평균에 차이가 없는 것으로 검증되었으면 “귀무가설을 기각시키지 못했다”로 표현한다. 만약 에 두 집단의 모평균 차이에 대한 가설검증에서 귀무가설이 기각되었으면 차이가 있다고 한다.
(2) 통계적 검증의 유의수준(significance level)을 정한다.
유의수준은 가설검증이 시행되기 전에 결정함
유의수준은 귀무가설이 옳은데도 불구하고 기각될 확률을 의미
일반적으로 유의수준 0.05, 0.01등으로 작은 값이 이용됨 (3) 검증통계량(test statistics)의 값을 구한다.
검증통계량의 값과 기각역(rejection region)을 비교하여 귀무가설의 기각 여부 결정
오늘날 검증방법은 통계패키지로 계산한 p값을 이용하여 실행함
“계산된 p값이 유의수준보다 작으면 귀무가설 기각”
* 조사데이터가 한쪽으로 치우쳐진 형태이거나 이상값이 있어서 정규분포를 따른다고 가정할 수 없
• T-검증을 적용하기 위해서는 조사 데이터가 정규분포(normal distribution) 를 만족해야 한다.
• 먼저 일표본 검증문제에서 t-검증을 적용하기 위해서는 조사 데이터가 정규 분포를 따라야 한다. 조사 데이터가 정규분포를 따르는가를 살펴보기 위해 서는 조사 데이터에 대한 히스토그램(histogram)이나 줄기-잎 그림(stem-leaf chart)을 그려서 살펴보거나, 통계패키지에서 제공하는 정규 확률도표 를 이용할 수 있다.
• 만약 조사 데이터가 한쪽으로 치우쳐진 형태이거나 이상치가 있어서 정규분
포를 따른다고 가정할 수 없다면 비 모수적 방법을 적용하는 것을 검토해야
한다. 비 모수적 방법은 관측된 데이터의 부호에 대해서 가정을 하지 않고
통계적 추론을 한다.
*T-검증 사례
① 서울시의 어느 구는 이 지역의 가구당 평균 소득액이 서울시 전체 평균 소득액과의 차이 를 검증하는 경우 → 한 표본 t-검증
② 어떤 다이어트 프로그램에 참여하기 전과 후의 체중변화를 살펴보는 경우 → 대응비교 t-검증
③ 성인 대상으로 하는 독서 성향 조사 결과를 분석하여 남자와 여자의 독서량에 차이가 있 는가를 검증하는 경우 → 독립표본 t-검증
** 대응비교(pairwise comparison)의 문제는 같은 조사대상자에게서 대개 두 차례에 걸쳐서 관측하여 모평균 차이의 유무를 확인하게 된다.
• 대응 비교의 문제는 같은 조사대상자에게서 대개 두 차례에 걸쳐서 관측하여 모평균 차이 의 유무를 확인하게 된다. 이 경우에도 분석에 필요한 가정은 두 변수가 모두 정규분포를 따라야 한다는 점이다. 만약 정규분포를 따르지 않는 다면 비 모수적 방법인 월콕슨 부호 순위 검증(Wilcoxon signed-ranks test)을 이용하는 것이 바람직하다.
• 세 번째 검증(독립표본 t-검증)에 대한 기본적인 가정도 마찬가지로 관측 값들이 정규 분 포를 따른다는 것이다. 이 경우에는 두 집단의 분산이 동일하다고 가정할 수 있는 경우와 서로 다른 경우로 구분되어 검증통계량에 약간의 차이가 있다. 만약 조사 데이터가 정규분 포를 만족하지 못하거나 이상치가 있는 경우에는 비 모수적 검증법인 월콕슨 순위합검