커뮤니케이션 측정과 통계 분석
9주차 : SPSS 통계분석 1
강사 : 이정기
Contents
T검증
ANOVA
요인분석
T검증
T검증(t-test)이란?
두 집단 간의 평균 차이를 확인하기 위해 사용됨 크게 독립표본 t검증과 대응표본 t검증으로 구분됨
논문이나 보고서에서 주로 활용되는 t검증은 독립표본 t검증
1) 독립표본 t검증(Independent Samples T Test) :
비교 집단이 상호독립적 모집단으로 추출된 것이어야 함 서로 다른 두 집단 사이의 평균 차이를 확인할 때 사용 변인의 경우 명목 척도가 대부분임
예) 성별(남, 녀), 세대(10대, 20대)미디어 이용자와 비이용자
예) 성별에 따라 이정기 선생의 수업 만족도에는 어떤 차이가 있는가?
2) 대응표본 t검증(Paired Samples T Test) :
동일표본에서 두 변인간 차이가 있는지 분석할 경우 사용
예) 수강생들의 통계 실력은 수업 이전과 이후에 어떤 차이가 있는가?
즉, 종속변인이 2개 있어야 함, 사전/사후 검사
T검증
T검증(t-test) 실습
연구문제 : 성별에 따라 스마트폰 중독 점수에는 어떠한 차이가 있는가?
T검증시 고려해야 할 점
1) 기통통계 분석 : 평균과 표준편차를 통해 집단의 크기 가시적 비교 2) 등분산 가정 여부
: 등분산이 가정되어야 함(예컨대 권투에서의 체급)
: 등분산이 가정되지 않을 경우 보정을 한 후 다시 비교한다고 생각하면 됨 : Levene의 등분산 가정을 통해 유의확률이 p>.05일 경우
등분산의 영가설, 즉 “두 집단의 분산에는 차이가 없을 것이다(동일하다)”가 지지됨, 즉 두 분산에는 차이가 없음. 등분산임.
3) P값, 유의도
: 최종 유의도 검증을 통해 집단간 차이가 통계적으로 유의미한 것인지 확인해야 함
T검증
T검증(t-test) 실습
연구문제 : 성별에 따라 스마트폰 중독 점수에는 어떠한 차이가 있는가?
독립표본 t검증 방법: SPSS Analyze – Compare Means – Independent Samples T-Test –
Grouping Variable에 비교 집단 투입(1, 2) – Test Variable에 종속변인 중독 투입 – OK
Group Statistics
성별 N Mean Std. Deviation Std. Error Mean
중독점수 남자 540 42.6556 14.17018 .60979
여자 770 45.5805 14.46998 .52146
Independent Samples Test Levene's Test for
Equality of Variances t-test for Equality of Means
F Sig. t df
Sig. (2- tailed)
Mean Difference
Std. Error Difference
95% Confidence Interval of the
Difference
Lower Upper
중독점수 Equal variances
assumed .430 .512 -3.632 1308 .000 -2.92496 .80531 -4.50479 -1.34513
Equal variances not
assumed -3.646 1175.106 .000 -2.92496 .80235 -4.49916 -1.35077
T검증
T검증(t-test) 실습
연구문제 : 성별에 따라 스마트폰 중독 점수에는 어떠한 차이가 있는가?
해석 : 1) 남성의 평균 중독 점수는 42.65(SD=14.17), 여성의 평균 중독 점수는 45.58(SD=14.47)으로 나타났다. 즉 여성의 중독 점수가 표면적으로 높다.
다만, 이러한 차이에 통계적 유의성이 있는지 t검증을 통해 확인하였다.
Group Statistics
성별 N Mean Std. Deviation Std. Error Mean
중독점수 남자 540 42.6556 14.17018 .60979
여자 770 45.5805 14.46998 .52146
T검증
T검증(t-test) 실습
연구문제 : 성별에 따라 스마트폰 중독 점수에는 어떠한 차이가 있는가?
해석 2: 본격적 t검증에 앞서 두 집단 간의 등분산이 가정되는지 Levene’s Test를 수행했다.
그 결과 F값은 .430, p=.512로 p>.05보다 큰 것으로 확인되었다.
여기에서 영가설은 ‘두 집단은 분산이 동일하다(차이가 없다)‘이다.
따라서 영가설은 영가설은 지지되는 것, 즉 등분산임(Equal variances assumed) 위 쪽 t를 확인해야 함.
팁! : p<.05 일 경우 이분산 아래쪽 표를, p>.05 일 경우 등분산 위쪽 표를 해석함
Independent Samples Test Levene's Test for
Equality of Variances t-test for Equality of Means
F Sig. t df
Sig. (2- tailed)
Mean Difference
Std. Error Difference
95% Confidence Interval of the
Difference
Lower Upper
중독점수 Equal variances
assumed .430 .512 -3.632 1308 .000 -2.92496 .80531 -4.50479 -1.34513
Equal variances not
assumed -3.646 1175.106 .000 -2.92496 .80235 -4.49916 -1.35077
T검증
T검증(t-test) 실습
연구문제 : 성별에 따라 스마트폰 중독 점수에는 어떠한 차이가 있는가?
해석 3: 등분산 검증 결과 두 집단의 분산은 같지 않다. 따라서 t값은 -3.646이고, DF는
1175.106이다. 유의도는 .000으로 p<.001보다 작은 것으로 나타났다. 따라서 t검증의 0가설,
“성별에 따른 스마트폰 중독 점수에는 차이가 없다”이 기각된다. 두 집단 간에는 유의미한 차이가 있는 것이다. 즉 여성은 남성에 비해 스마트폰 중독 점수가 유의미하게 높다라는 점을 확인할 수 있다.
Independent Samples Test Levene's Test for
Equality of Variances t-test for Equality of Means
F Sig. t df
Sig. (2- tailed)
Mean Difference
Std. Error Difference
95% Confidence Interval of the
Difference
Lower Upper
중독점수 Equal variances
assumed .430 .512 -3.632 1308 .000 -2.92496 .80531 -4.50479 -1.34513
Equal variances not
assumed -3.646 1175.106 .000 -2.92496 .80235 -4.49916 -1.35077
ANOVA
ANOVA(Analysis of Variance, 변량분석, 분산분석, F검증)
모집단의 하위 집단간(3집단 이상) 표본 평균 차이가 통계적으로 의미가 있는지 알아보는 통계 기법, 3집단 이상의 평균 차이 검증에 활용됨
ANOVA의 기본 가정
1) 분포의 정상성 : 모든 집단의 정규 분포에 있어야 함
2) 측정: 모든 집단의 측정치는 모두 독립적으로 측정되어야 함
3) 등간척도 이상의 측정 수준 : 종속변인의 경우 최소 등간척도 이상이어야 함
ANOVA를 위한 연구문제, 가설
1) 학교급(초, 중, 고등학교)에 따른 스마트폰 중독에는 어떠한 차이가 있는가?
2) 학교급(초, 중, 고등학교)에 따른 스마트폰 중독에는 차이가 있을 것이다
ANOVA
ANOVA(Analysis of Variance, 변량분석, 분산분석)
그렇다면, T검증과 ANOVA에는 어떠한 차이가 있을까요?
ANOVA의 종류
1) One Way ANOVA(일원 변량분석)
: 독립변인이 1개이나 독립변인을 구성하는 집단이 3개 이상일 경우 예) 독립변인: 학교급, 집단 : 초, 중, 고
2) Two Way ANOVA(이원 변량분석)
: 독립변인이 2개이나 독립변인을 구성하는 집단이 2개 이상일 경우
예) 성별(남, 여)과 연령(10대, 20대)에 따른 스마트폰 중독 점수에는 어떠한 차이가 있는가?
사회조사분석사 2급에서 요구하는 ANOVA는 One Way ANOVA
ANOVA
One Way ANOVA 실습
연구문제 : 학교급(초, 중, 고)에 따라 스마트폰 중독 점수에는 어떠한 차이가 있는가?
Onw Way ANOVA검증 방법: SPSS Analyze – Compare Means –One-Way ANOVA-Factor에 독립변인 투입 –Dependent List에 종속변인 중독 투입 – Option클릭(Descriptive 체크)-
Continue-OK Descriptives 중독점수
N Mean
Std.
Deviation
Std.
Error
95% Confidence Interval for Mean
Minimum Maximum Lower
Bound
Upper Bound
초 459 40.8824 14.77751 .68976 39.5269 42.2378 20.00 100.00
중 453 47.2252 13.87819 .65205 45.9437 48.5066 21.00 92.00
고 398 45.1583 13.77775 .69062 43.8006 46.5160 20.00 93.00
Total 1310 44.3748 14.41386 .39824 43.5936 45.1561 20.00 100.00 ANOVA
중독점수
Sum of Squares df Mean Square F Sig.
Between Groups 9523.261 2 4761.630 23.714 .000
Within Groups 262433.708 1307 200.791
Total 271956.969 1309
ANOVA
One Way ANOVA 실습
연구문제 : 학교급(초, 중, 고)에 따라 스마트폰 중독 점수에는 어떠한 차이가 있는가?
해석 : 1) 초, 중, 고등학생의 스마트폰 중독 점수를 확인한 결과 초등학생의 스마트폰 중독 평균 점수는 40.88점(SD=14.78), 중학생의 스마트폰 중독 평균 점수는 47.23점(SD=13.88), 고등학생의 스마트폰 평균 중독 점수는 44.37점(SD=14.41)으로 나타났다. 즉 중학생의 스마트폰 중독 점수가 가장 높고, 초등학생의 스마트폰 중독 점수가 가장 낮았다.
Descriptives 중독점수
N Mean
Std.
Deviation
Std.
Error
95% Confidence Interval for Mean
Minimum Maximum Lower
Bound
Upper Bound
초 459 40.8824 14.77751 .68976 39.5269 42.2378 20.00 100.00
중 453 47.2252 13.87819 .65205 45.9437 48.5066 21.00 92.00
고 398 45.1583 13.77775 .69062 43.8006 46.5160 20.00 93.00
ANOVA
One Way ANOVA 실습
연구문제 : 학교급(초, 중, 고)에 따라 스마트폰 중독 점수에는 어떠한 차이가 있는가?
해석 : 2) 학교급에 따른 스마트폰 중독 점수에 통계적으로 유의미한 차이가 있는지 확인하기 위해 ANOVA를 수행하였다. 그 결과 F값은 23.714, 유의도는 .000으로 나타났다. 이는 p<.001보다 낮은 것으로 영가설 기각, 연구가설이 지지되는 결과이다. 따라서 학교급에 따른 스마트폰 중독 점수의 차이는 통계적으로 유의미한 것으로 나타났다.
영가설: 학교급에 따라 스마트폰 중독 점수에는 차이가 없을 것이다 연구가설: 학교급에 따라 스마트폰 중독 점수에는 차이가 있을 것이다
ANOVA 중독점수
Sum of Squares df Mean Square F Sig.
Between Groups 9523.261 2 4761.630 23.714 .000
Within Groups 262433.708 1307 200.791
Total 271956.969 1309
ANOVA
One Way ANOVA 실습
연구문제 : 학교급(초, 중, 고)에 따라 스마트폰 중독 점수에는 어떠한 차이가 있는가?
해석 : 즉, 초, 중, 고등학생 집단에 따라 스마트폰 중독 점수에는 차이가 있다는 것이다. 다만, 이 경우 초, 중, 고등학생 집단의 차이 중 어떠한 차이에 근거하여 집단간 차이가 유의미한지 확인할 필요가 있다. 3집단간 유의미한 차이가 발견될 경우 사후검증(Post Hoc)을
수행한다. 사후검증 방법에는 Tukey , Scheffe 등이 주로 쓰이는데, 결과 상의 차이는 크지 않다. 그 결과를 보면, 3집단 간의 차이는 초<중, 고 의 차이라는 점을 확인할 수
있다. Multiple Comparisons
중독점수 Tukey HSD
(I) 학교별 (J) 학교별
Mean
Difference (I-J) Std. Error Sig.
95% Confidence Interval Lower Bound Upper Bound
초 중 -6.34281* .93846 .000 -8.5448 -4.1408
고 -4.27594* .97054 .000 -6.5532 -1.9987
중 초 6.34281* .93846 .000 4.1408 8.5448
고 2.06687 .97352 .086 -.2174 4.3511
요인분석
요인분석이란?
측정 항목들 사이의 상관관계를 이용하여 여러 항목으로 측정된 자료를 유사한 소수의 차원으로 묶어 축소시키는 것
목적
1) 정보량의 축소
2) 추가적 분석의 경제성
3) 연구자가 알지 못했던 변인들 사이에 내재된 특정 구조를 발견하기 위함
요인분석을 활용하는 경우
1) 변인을 구성하는 측정 도구의 타당성 검증 2) 이용과 충족 이론 등의 이용동기 파악 3) 다양한 구성 항목의 내재 구조 확인
요인분석
요인분석이란?
측정 항목들 사이의 상관관계를 이용하여 여러 항목으로 측정된 자료를 유사한 소수의 차원으로 묶어 축소시키는 것
측정 기준(조건)
1) 분석이 가능한 척도는 등간척도 이상이어야 함
2) 주인자 적재치 0.6 이상 부인자 적재치 0.4 이하(상관관계 기준) 3) 아이겐값(eigen value)가 1이상이어야 함
4) 동일 요인은 최소 2개 이상의 항목으로 구성되어야 함
요인분석
예)
연구문제. 청소년들의 스마트폰 이용동기는 어떠한가?
스마트폰 이용동기 측정문항 13개 문항
1) 대화를 위해 2) 연락을 위해 3) 약속을 잡기 위해 4) 일을 해결하기 위해 5) 학습대화를 위해 6) 시간보내기 위해 7) 무료함 해결 위해 8) 재미있어서
9) 세련되어 보이려고 10) 유행에 따르기 위해 11) 일정확인 위해 12) 정보습득 위해 13) 일과활용 위해
요인분석
예) 연구문제. 청소년들의 스마트폰 이용동기는 어떠한가?
스마트폰 이용동기 측정문항 13개 문항
1) 대화를 위해 2) 연락을 위해 3) 약속을 잡기 위해 4) 일을 해결하기 위해 5) 학습대화를 위해 6) 시간보내기 위해 7) 무료함 해결 위해 8) 재미있어서
9) 세련되어 보이려고 10) 유행에 따르기 위해 11) 일정확인 위해 12) 정보습득 위해 13) 일과활용 위해
SPSS Analyze-Data Reduction-Factor-Variables에 모든 동기 항목 투입-Rotation에 Varimax-
요인분석
예) 연구문제. 청소년들의 스마트폰 이용동기는 어떠한가?
스마트폰 이용동기 측정문항 13개 문항
SPSS Analyze-Data Reduction-Factor-Variables에 모든 동기 항목 투입-Rotation에 Varimax- Option에 sorted by size-OK
요인분석 결과 해석
13개 항목에 대한 요인분석 결과 요인1 일과활용-정보습득-일정 요인2 무료함해결-대화-시간보내기 요인3 세련-유행
19
Rotated Component Matrixa Component
1 2 3
일과활용 .732 -.015 .242
정보습득 .727 .154 .165 일정 .691 .209 .150 학습대화 .505 .109 .073
일해결 .480 .427 -.061
약속 .435 .428 -.219
무료함해결 .085 .747 .330
대화 .165 .702 -.159
시간보냄 .232 .649 .237
재미 -.061 .618 .476
연락 .357 .450 -.183
세련 .177 .068 .864
요인분석
예) 연구문제. 청소년들의 스마트폰 이용동기는 어떠한가?
스마트폰 이용동기 측정문항 13개 문항
13개 항목에 대한 요인분석 결과 요인1 일과활용-정보습득-일정 요인2 무료함해결-대화-시간보내기 요인3 세련-유행
으로 구성됨
각 항목에 대한 신뢰도 분석 결과 .60이상이면 요인분석 결과를 확정함
요인1은 정보성 동기 요인2는 오락 동기
요인3은 과시 동기 등으로 명명 후
Rotated Component Matrixa Component
1 2 3
일과활용 .732 -.015 .242
정보습득 .727 .154 .165 일정 .691 .209 .150 학습대화 .505 .109 .073
일해결 .480 .427 -.061
약속 .435 .428 -.219
무료함해결 .085 .747 .330
대화 .165 .702 -.159
시간보냄 .232 .649 .237
재미 -.061 .618 .476
연락 .357 .450 -.183
세련 .177 .068 .864 유행 .237 .029 .840
요인분석
예) 연구문제. 청소년들의 스마트폰 이용동기는 어떠한가?
스마트폰 이용동기 측정문항 13개 문항
요인1 일과활용-정보습득-일정, 정보성 동기 요인2 무료함해결-대화-시간보내기, 오락 동기 요인3 세련-유행, 과시 동기
COMPUTE 정보성동기=(일과활용 + 정보습득 + 일정)/3.
EXECUTE.
COMPUTE 오락동기=(무료함해결 + 대화 + 시간보냄)/3.
EXECUTE.
COMPUTE 과시동기=(세련 + 유행)/2.
EXECUTE.
Statistics
정보성동기 오락동기 과시동기
N Valid 1308 1311 1312
Missing 8 5 4
Mean 2.9159 3.2522 1.8144
Std. Deviation .91873 .85928 .86748
복습
성별에 따라 스마트폰 정보성 동기에 차이가 있는지 확인하시오.
학교급(초, 중, 도)에 따른 스마트폰 오락 동기에 차이가 있는지 확인하시오.
다음 시간 예고
SPSS 통계분석 2 1) 상관관계 분석 2) 회귀분석