커뮤니케이션 측정과 통계 분석
10주차 : SPSS 통계분석 2
강사 : 이정기
Contents
상관관계분석
회귀분석
상관관계 분석
상관관계(Correlation Analysis) 분석이란?
: 등간척도나 비율척도로 측정된 두 개 이상의 변인 사이의 관계를 분석하는 통계기법 한 변인이 변동함에 따라 다른 변인이 변동하는 것과 같은 변동의 연관성을 측정 변동의 크기의 정도와 방향을 상관관계라고 칭함
상관계수는?
: 상관계수는 변인간 관계의 정도와 방향을 하나의 수치로 요약해 주는 지수임, r로 표기함 변인 간의 관계의 정도는 0과 1사이의 절대값으로 나타남, 상관계수는 -1~0, 0~1 사이의 값 0에 가까울수록 상관관계는 낮고, 1에 가까울수록 상관관계는 높음
: 0은 상관관계가 전혀 없는 것, 1은 완전 상관(절대 상관) 보통 0.6 이상이면, 높은 상관관계
0.4~0.6이면 중간 상관관계
0.4 미만이면 낮은 상관관계로 봄
상관관계 분석
변인 관계의 방향성은 + -로 표현하게 됨
: 한 변인이 증가시 다른 변인도 증가하는 경우 + : 한 변인이 증가시 다른 변인이 감소하는 경우 –
즉, +는 정적 상관관계, -는 부적 상관관계
해석
1) 자살의도와 충동성의 상관관계 r=.70, p<.01 이다 2) 자살의도와 충동성의 상관관계 r=-.70, p>.05이다 3) 신문 이용량과 SNS 이용량의 상관관계 r=-.30, p<.05 4) 신문 이용량과 SNS 이용량의 상관관계 r=.30, p>.05
주의
상관관계는 인과관계가 아님, 따라서 종속변인, 독립변인 간의 구분이 필요하지 않음
연구문제의 표현
A와 B의 관계는 어떠한가? A와 B는 어떠한 상관관계를 가지는가?
상관관계 분석
SPSS Analyze – Correlate – Bivariate – variables에 검증하고자 하는 변인 투입(2개 이상)-OK
연구문제. 스마트폰 이용량과 중독 점수에는 어떠한 상관관계가 있는가?
영가설. 스마트폰 이용량과 중독 사이에는 상관관계가 없을 것이다.
연구가설. 스마트폰 이용량과 중독 사이에는 상관관계가 있을 것이다.
해석 : 스마트폰 이용량과 중독사이의 상관계수 r=.165로 나타났고, p<.01로 나타나 영가설은 기각, 연구가설이 지지되었다. 즉 스마트폰 이용량과 중독 사이에는 약한 상관관계가 있는 것으로 나타났다. Correlations
이용량 중독점수
이용량 Pearson Correlation 1 .165**
Sig. (2-tailed) .000
N 1284 1278
중독점수 Pearson Correlation .165** 1
Sig. (2-tailed) .000
N 1278 1310
**. Correlation is significant at the 0.01 level (2-tailed).
회귀분석
회귀분석(Regression Analysis)
정의 : 등간척도 또는 비율척도로 측정된 하나 내지 둘 이상의 독립변인이 등간척도 또는 비율척도로 측정된 하나의 종속변인에 미치는 영향력을 분석하는 통계기법
즉, 상관관계는 변인간 상호관계의 분석, 회귀분석은 변인간 영향 관계의 분석 종류 : 단순 회귀분석, 다중 회귀분석, 위계적 회귀분석, 로지스틱 회귀분석 등
1) 단순 회귀분석 : 한 개의 독립변인이 한 개의 종속변인에 미치는 영향 분석 2) 다중 회귀분석 : 둘 이상의 독립변인이 한 개의 종속변인에 미치는 영향 분석
3) 위계적 회귀분석 : 여러 개의 독립변인을 속성별로 구분하고, 전 속성이 통제되었을 때 순수한 후속 변인의 설명력을 확인하기 위한 분석 기법
4) 로지스틱 회귀분석 : 종속변인이 연속 변인이 아닐 때 활용
예) 정치심리 변인이 투표 유무(1: 투표함, 2: 투표 안함)에 미치는 영향 연구문제의 표현 : A는 B에 어떠한 영향을 미치는가?
연구가설의 표현 : A는 B에 정적 영향을 미치는가?
회귀분석
회귀분석(Regression Analysis)
회귀분석 공식 : y = a(상수) +bx(독립변인 1) + cx(독립변인 2) + e(오차) 회귀분석시 팁 :
1) R² = 설명력, 독립변인이 종속변인을 설명하는 크기, 1이면 100%를 설명하는 것 예) R² =.38, R² =-.38, R² =1
2) 베타값 (β) = 회귀계수, 회귀분석의 개별 독립변인이 종속변인에 미치는 영향력
1에 가까울수록 설명력이 크다. 독립변인 중 베타값이 큰 것이 설명력이 큰 것
분석 SPSS Analyze-Regression-Lenear-Independent에 독립변인 투입(1개 이상)-Dependent에 종속변인 투입(1개)-Method에 Enter/Stepwise 선택(일반적으로 진입 방식 선택)-OK
1) Enter: 진입방식 : 모든 변인을 한 번에 넣어 회귀분석을 하는 방법
2) Stepwise : 단계방식 : 통계적 유의도가 낮은 독립변인은 제거하고 회귀식을 얻는 방식 : 각각의 단계마다 변수들을 유의도에 따라 진입과 탈락을 지정하는 방식
단순 회귀분석
연구문제. 스마트폰 사용기간은 스마트폰 중독에 어떠한 영향을 미치는가?
연구가설. 스마트폰 사용기간은 스마트폰 중독에 정적인 영향을 미칠 것이다.
해석 : 스마트폰 사용기간이 중독에 미치는 영향을 확인하기 위한 단순회귀분석을 수행했다. 그 결과 이 모델의 F값은 35.571이고, 유의도는 .000으로 통계적으로 유의한 모델이라는 점을 확인했다. 스마트폰 사용기간은 중독에 유의미한 영향을 미쳤다 (β=.17, p<.001). 스마트폰 사용기간은 중독의 2.7%를 설명했다.
Model Summary
Model R R Square
Adjusted R Square
Std. Error of the Estimate
1 .165a .027 .026 14.18770
a. Predictors: (Constant), 사용기간
단순 회귀분석
영가설 : 스마트폰 사용기간은 스마트폰 중독에 영향을 미치지 않을 것이다.
연구가설 : 스마트폰 사용기간은 스마트폰 중독에 영향을 미칠 것이다.
검증에 따른 회귀식 :
스마트폰 중독 = 41.019 + 0.165(사용기간) + e
다중 회귀분석
다중 회귀분석(Enter 방식)의 예
연구문제. 스마트폰 이용동기는 스마트폰 중독에 어떠한 영향을 미치는가?
해석 : 스마트폰 이용동기가 중독에 미치는 영향을 확인하기 위해 Enter 방식의 다중회귀분석을 수행했다. 그 결과 회귀모델의 F값은 202.667이고, p<.001보다 작아 유의미한 모델인 것으로
확인되었다. 한편, 과시동기 (β=.40, p<.001), 오락동기 (β=.35, p<.001)의 순으로 중독에 영향을 미쳤고, 정보성 동기는 중독에 영향을 미치지 않았다. 설명량은 32%였다.
Model Summary
Model R R Square
Adjusted R Square
Std. Error of the Estimate
1 .566a .320 .318 11.91797
a. Predictors: (Constant), 과시동기, 오락동기, 정보성동기
ANOVAb
Model
Sum of
Squares df
Mean
Square F Sig.
1 Regression 86359.505 3 28786.502 202.667 .000a Residual 183513.217 1292 142.038
Total 269872.721 1295
Coefficientsa
Model
Unstandardized Coefficients
Standardized Coefficients
t Sig.
B Std. Error Beta
1 (Constant) 15.381 1.454 10.577 .000
정보성동기 -.588 .403 -.037 -1.461 .144
오락동기 5.867 .421 .350 13.931 .000
다중 회귀분석
영가설 : 스마트폰 이용동기는 스마트폰 중독에 영향을 미치지 않을 것이다.
연구가설 : 스마트폰 이용동기는 스마트폰 중독에 영향을 미칠 것이다.
검증에 따른 회귀식 :
스마트폰 중독 = 15.381 + 0.35(오락동기) +0.386(과시동기) + e
위계적 회귀분석
위계적 회귀분석(Enter 방식)의 예
연구문제. 스마트폰 이용량, 과시 동기는 스마트폰 중독에 어떠한 영향을 미치는가?
해석 : 스마트폰 이용량, 과시 동기가 중독에 미치는 영향을 확인하기 위해 Enter 방식의 위계적 회귀분석을 수행했다. 1단계에는 이용량, 2단계에는 과시 동기를 투입했다. 그 결과 1단계, 2단계 모델 모두 통계적으로 유의미한 것으로 나타났다. 1단계에 투입된 사용기간
(β=.16, p<.001)은 중독에 정적인 영향을 미쳤고, 설명량은 2.7%였다. 2단계에 투입된 과시 동기 (β=.44, p<.001)는 중독에 정적인 영향을 미쳤다. 과시 동기는 중독에 19.3%의 추가적 설명력을 나타냈다.
위계적 회귀분석
위계적 회귀분석(Enter 방식)의 예
연구문제. 스마트폰 이용량, 과시 동기는 스마트폰 중독에 어떠한 영향을 미치는가?
Model Summary
Model R R Square
Adjusted R Square
Std. Error of the Estimate
1 .164a .027 .026 14.19543
2 .470b .220 .219 12.70980
a. Predictors: (Constant), 사용기간
b. Predictors: (Constant), 사용기간, 과시동기
ANOVAc
Model
Sum of
Squares df
Mean
Square F Sig.
1 Regression 7076.145 1 7076.145 35.116 .000a
Residual 256522.683 1273 201.510
Total 263598.828 1274
2 Regression 58121.085 2 29060.543 179.898 .000b Residual 205477.743 1272 161.539
Total 263598.828 1274
Coefficientsa
Model
Unstandardized Coefficients
Standardized Coefficients
t Sig.
B Std. Error Beta
1 (Constant) 41.012 .705 58.182 .000
사용기간 .117 .020 .164 5.926 .000
2 (Constant) 28.733 .936 30.709 .000
사용기간 .082 .018 .114 4.580 .000
과시동기 7.368 .414 .443 17.776 .000
a. Dependent Variable: 중독점수
위계적 회귀분석
위계적 회귀분석(Enter 방식)의 예 : 가정 1
Model Summary
Model R R Square
Adjusted R Square
Std. Error of the Estimate
1 .164a .027 .026 14.19543
2 .470b .220 .219 12.70980
a. Predictors: (Constant), 사용기간
b. Predictors: (Constant), 사용기간, 과시동기
ANOVAc
Model
Sum of
Squares df
Mean
Square F Sig.
1 Regression 7076.145 1 7076.145 35.116 .000a
Residual 256522.683 1273 201.510
Total 263598.828 1274
2 Regression 58121.085 2 29060.543 179.898 .000b Residual 205477.743 1272 161.539
Total 263598.828 1274
Coefficientsa
Model
Unstandardized Coefficients
Standardized Coefficients
t Sig.
B Std. Error Beta
1 (Constant) 41.012 .705 58.182 .000
사용기간 .117 .020 .164 5.926 .000
2 (Constant) 28.733 .936 30.709 .000
사용기간 .082 .018 .114 4.580 .100
과시동기 7.368 .414 .443 17.776 .000
위계적 회귀분석
위계적 회귀분석(Enter 방식)의 예 : 가정 2
Model Summary
Model R R Square
Adjusted R Square
Std. Error of the Estimate
1 .164a .027 .026 14.19543
2 .470b .220 .219 12.70980
a. Predictors: (Constant), 사용기간
b. Predictors: (Constant), 사용기간, 과시동기
ANOVAc
Model
Sum of
Squares df
Mean
Square F Sig.
1 Regression 7076.145 1 7076.145 35.116 .100a
Residual 256522.683 1273 201.510
Total 263598.828 1274
2 Regression 58121.085 2 29060.543 179.898 .100b Residual 205477.743 1272 161.539
Total 263598.828 1274
Coefficientsa
Model
Unstandardized Coefficients
Standardized Coefficients
t Sig.
B Std. Error Beta
1 (Constant) 41.012 .705 58.182 .000
사용기간 .117 .020 .164 5.926 .000
2 (Constant) 28.733 .936 30.709 .000
사용기간 .082 .018 .114 4.580 .100
과시동기 7.368 .414 .443 17.776 .000
a. Dependent Variable: 중독점수
복습
상관관계 분석과 회귀분석의 차이점은?
T검증, ANOVA와 상관관계 분석, 회귀분석의 차이점은?
단순, 다중, 위계적 회귀분석의 정의, 차이점은?