소비자연구방법
.7주차. 분산분석
-일원분산분석-
들어가며
분산분석은 분산의 원인이 어디에 있는가를 알아보는 통계적 방법으로 3개 이상 집단 간의 평균차이를 분석하는 방법
분산분석의 독립변수는 명목/서열척도, 종속변수는 등간/비율척도일 때 사용
분산분석을 위한 기본 가정
-종속변수가 연속변수이어야 한다.
-각각의 모집단들은 정규분포이어야 한다.
-각각의 모집단의 분포는 서로 독립적이다.
-각각의 모집단들의 분산이 같아야 한다.
분산분석(ANOVA)의 개념
들어가며
분산분석의 원리
-집단 간 평균들이 서로 다름을 집단 간 분산과 집단 내 분산을 이용하여 비교하여 판단함 -집단 내 분산 대비 집단 간 분산 비율이 클수록 집단 평균이 서로 다르다고 할 수 있음
-분산분석은 집단 간 분산이 집단 내 분산에 비해 몇 배나 더 큰가를 나타내는 F분포(F통계량) 값으로 집단 간 평균의 차이가 통계적으로 유의한지를 검정
*F분포(F통계량): 독립적인 카이 자승치(chi-square)들을 각각의 해당 자유도로 나눈 비율
분산분석의 종류
-종속변수 1개: 단일변량 분산분석
-일원분산분석: 독립변수 1개 -이원분산분석 : 독립변수 2개 -종속변수 2개: 다변량 분산분석
분산분석(ANOVA)의 개념
01. 일원분산분석
분산분석을 이해하기 위해서는 편차에 대한 이해가 선행되어야 함
편차: 평균값으로부터 떨어진 거리 -총편차=집단내편차+집단간편차
편차들의 제곱을 변화량 혹은 변동량 혹은 분산이라고 함
분산의 구성
전체 분산
①
연구에 참여한 모든 대상들의 총편차를 제곱하여 더한 값을 의미하며 전체변화량 혹은 전체편차 제곱합이라고도 함
집단내분산
②
편차의 성격이 집단 내의 개인 차이 혹은 오차에 의한 것을 의미
각 집단의 평균값에서 각각의 개별 측정값들이 얼마나 떨어져 있는가를 나타냄
SST = SSW = SSB
01. 일원분산분석
분산의 구성
집단간분산
③
개인의 총편차가 집단간편차와 집단내편차의 합일 때 집단효과에 대한 집단간편차의 제곱합을 의미
01. 일원분산분석
평균분산과 계산
① 자유도
평균분산을 산출하기 위해서는 집단내분산과 집단간분산을 자유도로 나누어야 함 -집단내 자유도 = 전체 샘플수 – 집단수 = N - J
-집단간 자유도 = 집단수 – 1 = J - 1 -전체 자유도 = 전체 샘플수 – 1 = N - 1
집단내 평균분산
②
집단 내의 편차제곱 평균값인 MSW는 집단 내 평균분산으로 집단내 분산을 자유도(N-J)로 나눈 값과 같음
01. 일원분산분석
평균분산과 계산
집단간 평균분산
③
집단 간의 편차제곱 평균값인 MSB는 집단 간 평균분산으로 집단간 분산을 집단수에서 1을 뺀 집단 간 자유도로 나눈 값
01. 일원분산분석
F통계값과 분산분석표
① F통계값
F값은 개개의 표본 I가 동일집단 j내에서 편차가 작을수록, 즉 값의 다양성이 적을수록 커지게 되며, 각 집단 j의 평균값이 전체 평균값과 차이가 클수록 커지게 됨
이 때 F값은 자승합들의 비율이므로 언제나 양수이고 1하인 경우는 매우 드물게 됨
01. 일원분산분석
F통계값과 분산분석표
분산분석표
②
분산 제곱합
SS
자유도 df
평균제곱
MS F
집단간
between groups J-1
집단내
within groups N-J
전체 total
N-1 (위 두 셀의 합)
01. 일원분산분석
사후분석(추후비교분석)
일원분산분석에서의 귀무가설(영가설)은 비교집단 간들의 모집단의 평균이 차이가 없음을 나타냄
따라서 귀무가설(영가설)이 기각되었다면 비교집단들의 모집단 평균이 차이가 있음을 의미함
but. 일원분산분석의 F검정을 통해서는 어느 집단 간에 차이가 있는가를 알 수 없음
따라서 집단 간의 평균값에 차이가 있다면 어떤 집단에서 차이가 나는가를 찾아내기 위해 사후비교분석 (추후비교분석)을 수행함
사후비교분석(추후비교분석)에는 투키(Tukey), 던칸(Duncan), 쉐페(Scheffe’), 뉴만-큘(Newman-Keuls) 등이 있으며, 주로 던칸과 쉐페방법이 가장 널리 쓰임
투키(Tukey)방법
①
비교집단 중에서 두 집단씩의 평균값을 모두 짝비교하게 되는데, 투키검증은 집단 간에 표본수가 동일할 경우를 전제로 하는 가장 보수적인 방법
투키분석에 의한 검정통계량은 Q값으로 나타남
01. 일원분산분석
사후분석(추후비교분석) 투키(Tukey)/크래머(Kramer)방법
②
투키 방법과는 약간 다르게 집단 간의 샘플 크기가 동일하지 않을 때 사용되는 방법으로 투키분석을 위한 Q값 산출에서 분자를 약간 수정한 Q값을 검정 통계량으로 사용함
쉐페(Scheffe’)방법
③
단순히 짝비교를 하지 않고 어떤 집단과 다른 여러 개의 집단을 합성하여 비교하는 방법을 복합비교라고 하는데 쉐페 방법이 여기에 해당함(사례수가 다를 때 적용)
쉐페분석을 위한 검정통계량은 F값으로 함
던칸(Duncan)방법
④
집단을 분리시키려는 성격이 가장 강한 분석방법
사후분석방법 선택에는 절대적인 기준은 없음
집단을 분리시키는 정도의 높낮이를 연구자의 판단에 의해 선택하여 사용하면 됨
SPSS 프로그램을 사용한 일원분산분석방법 예시 및 결과
일원분산분석 수행과정 : [분석(A)] → [평균비교(M)] → [일원분산분석(O)…] → 클릭
귀무가설(H0 ) : 4가지 교육프로그램에 따른 판매실적은 동일하다
연구가설(H1) : 4가지 교육프로그램에 따른 판매실적은 차이가 있을 것이다.
가설의 설정
①
② 분석
SPSS 프로그램을 사용한 일원분산분석방법 예시 및 결과
일원분산분석 수행과정 : [분석(A)] → [평균비교(M)] → [일원분산분석(O)…] → 클릭
② 분석
SPSS 프로그램을 사용한 일원분산분석방법 예시 및 결과
일원분산분석 수행과정 : [분석(A)] → [평균비교(M)] → [일원분산분석(O)…] → 클릭
② 분석
SPSS 프로그램을 사용한 일원분산분석방법 예시 및 결과
일원분산분석 수행과정 : [분석(A)] → [평균비교(M)] → [일원분산분석(O)…] → 클릭
② 분석
SPSS 프로그램을 사용한 일원분산분석방법 예시 및 결과
일원분산분석 수행과정 : [분석(A)] → [평균비교(M)] → [일원분산분석(O)…] → 클릭
② 분석
SPSS 프로그램을 사용한 일원분산분석방법 예시 및 결과
일원분산분석 결과
③
분산의 동질성 검정
-분산분석은 각 모집단의 분산이 같다는 가정하에 실시되는데, 동질성에 대한 검증 결과, 유의수준이 .330으로 귀무가설을 기각하지 못하기 때문에 등분산 가정에 문제는 없는 것으로 나타남
F검정
-분산분석표에서 F=3.771, 유의수준=.028(p<.05)로 유의한 것으로 나타남
-따라서 귀무가설(H0)은 기각되고, 연구가설(H1)이 채택되어
‘교육프로그램에 따른 매출실적은 차이가 있을 것이다’가 지지됨
SPSS 프로그램을 사용한 일원분산분석방법 예시 및 결과
일원분산분석 결과(사후분석)
③
사후분석
-사후 집단간 비교를 위해 던칸과 쉐페의 방법으로 살펴봄
-두 사후분석 방법 모두 프로그램 C와 D간의 차이가 있는 것으로 나타나는데, 즉 판매실적은 프로그램D가 높은 것으로 나타난 반면, 프로그램 C가 가장 낮은 것으로 나타남