t-검증 - 제9장 조사데이터의 분석

• 통계조사를 통해서 종종 두 그룹 또는 그 이상의 집단을 대상으로 비교를 행하게 된다. 이와 같 은 두 집단 간의 비교문제에서 가장 널리 사용되는 방법은 두 집단의 t-검증이다.

< 통계적 가설검증의 절차>

(1) 귀무가설을 서술한다.

 일반적으로 귀무가설(null-hypothesis)은 두 집단의 평균에서 차이가 없다 등으로 서술됨

 <사례> 연구문제(research hypothesis) : A학교와 B학교 사이의 시험성적에 차이가 있는가?

→ 귀무가설 : A학교와 B학교 사이의 시험성적에 차이가 없다.

*만약 평균에 차이가 없는 것으로 검증되었으면 “귀무가설을 기각시키지 못했다”로 표현한다. 만약 에 두 집단의 모평균 차이에 대한 가설검증에서 귀무가설이 기각되었으면 차이가 있다고 한다.

(2) 통계적 검증의 유의수준(significance level)을 정한다.

유의수준은 가설검증이 시행되기 전에 결정함

유의수준은 귀무가설이 옳은데도 불구하고 기각될 확률을 의미

일반적으로 유의수준 0.05, 0.01등으로 작은 값이 이용됨 (3) 검증통계량(test statistics)의 값을 구한다.

 검증통계량의 값과 기각역(rejection region)을 비교하여 귀무가설의 기각 여부 결정

 오늘날 검증방법은 통계패키지로 계산한 p값을 이용하여 실행함

“계산된 p값이 유의수준보다 작으면 귀무가설 기각”

* 조사데이터가 한쪽으로 치우쳐진 형태이거나 이상값이 있어서 정규분포를 따른다고 가정할 수 없

• T-검증을 적용하기 위해서는 조사 데이터가 정규분포(normal distribution) 를 만족해야 한다.

• 먼저 일표본 검증문제에서 t-검증을 적용하기 위해서는 조사 데이터가 정규 분포를 따라야 한다. 조사 데이터가 정규분포를 따르는가를 살펴보기 위해 서는 조사 데이터에 대한 히스토그램(histogram)이나 줄기-잎 그림(stem-leaf chart)을 그려서 살펴보거나, 통계패키지에서 제공하는 정규 확률도표 를 이용할 수 있다.

• 만약 조사 데이터가 한쪽으로 치우쳐진 형태이거나 이상치가 있어서 정규분

포를 따른다고 가정할 수 없다면 비 모수적 방법을 적용하는 것을 검토해야

한다. 비 모수적 방법은 관측된 데이터의 부호에 대해서 가정을 하지 않고

통계적 추론을 한다.

*T-검증 사례

① 서울시의 어느 구는 이 지역의 가구당 평균 소득액이 서울시 전체 평균 소득액과의 차이 를 검증하는 경우 → 한 표본 t-검증

② 어떤 다이어트 프로그램에 참여하기 전과 후의 체중변화를 살펴보는 경우 → 대응비교 t-검증

③ 성인 대상으로 하는 독서 성향 조사 결과를 분석하여 남자와 여자의 독서량에 차이가 있 는가를 검증하는 경우 → 독립표본 t-검증

** 대응비교(pairwise comparison)의 문제는 같은 조사대상자에게서 대개 두 차례에 걸쳐서 관측하여 모평균 차이의 유무를 확인하게 된다.

• 대응 비교의 문제는 같은 조사대상자에게서 대개 두 차례에 걸쳐서 관측하여 모평균 차이 의 유무를 확인하게 된다. 이 경우에도 분석에 필요한 가정은 두 변수가 모두 정규분포를 따라야 한다는 점이다. 만약 정규분포를 따르지 않는 다면 비 모수적 방법인 월콕슨 부호 순위 검증(Wilcoxon signed-ranks test)을 이용하는 것이 바람직하다.

• 세 번째 검증(독립표본 t-검증)에 대한 기본적인 가정도 마찬가지로 관측 값들이 정규 분 포를 따른다는 것이다. 이 경우에는 두 집단의 분산이 동일하다고 가정할 수 있는 경우와 서로 다른 경우로 구분되어 검증통계량에 약간의 차이가 있다. 만약 조사 데이터가 정규분 포를 만족하지 못하거나 이상치가 있는 경우에는 비 모수적 검증법인 월콕슨 순위합검

문서에서 제9장 조사데이터의 분석 (페이지 36-39)