기초특강
<SPSS >
강사 주 석 진 박사 학기: ( 3 ) 여섯째주
< >
상관관계분석의 논리 14.
가 상관관계의 목적.
상관관계분석의 기본적인 목적은 변수간의 관계성을 파악하는 것이다. 변수관계의 관계성 정도는 관계성의 ‘강도 라’ 할 수 있다. 보통 상관은 상관계수 로 표시되는데 상관계수 가 크다는 것은 두변수가 (correlation coeffcient : r) r
강한 관계성을 가지고 있다는 의미이다.
상관관계분석은 변수간 관계성의 정도를 나타내지만 관계성의 방향을 함께 설명한 다 상관계수 는. r -1.0에서 +1.0까지의 범위를 갖는다.(-1.0<r<+1.0)
상관계분석은 본질적으로 상관의 문제(X Y)↔ 이며 예측의 문제(X Y, Y X)→ → 는 아니 다 예측의 문제는 회귀분석의 주된 목적이다. .
나 상관관계의 해석.
일반적으로 모수통계에서 사용되는 상관계수 r는 피어슨의 적률상관(Pearson's 을 말한다 상관계수 은 결경계수
product moment correlation) . r 로 해석된다.
상관계수 r = .3806
= .1448 결졍계수 설명력,
다 상관계수의 종류.
상관계수는 단순상관계수(zero order correlation coefficient), 다중상관계수 부분상관계수
(multiple correlation coefficient), (part correlation
순수 편 상관계수 의 가지로 나
coefficient), ( ) (partial correlation coefficient) 4 뉜다.
단순상관계수는 두 변인 사이의 관계를 1:1로 산출해 주고 다중 상관계수는 하나의 변인과 다른 둘 이상의 변인 사이의 관계를 1: 다( )多 로 산출해준다. 그리고 부분
실과 학업 성취도
인지적 영 역
14.48%
상관계수는 분석에 투입될 독립변인에 다른 독립변인들이 미치는 영향을 제거한 상 태에서 종속, 독립 두 변인을 1:1로 투입하여 산출하고 순수 편( ) 상관계수는 다른 독립변인들이 분석에 투입할 독립, 종속변인 모두에 미칠 수 있는 영향을 제거한 상태에서 종속 독립 두 변인을, 1:1로 투입하여 상출하는 상관계수를 말한다. 따라 서 순수 상관계수의 절대값은 항상 부분 상관계수의 절대값보다 크거나 같다.
상관계수에 대한 이해를 돕기 위해 단순, 부분, 순수상관의 관계를 벤다이어그램으 로 표현해보면 다음과 같다.
다 상관관계분석의 기본가정.
분포의 정상성 다른 모수통계와 마찬가지로 변수들의 분포가 정상분포하여야
- :
한다. 정상성에 대한 가정은 집단의 크기가 충분히 클 대 중심극한정리에 의해 만 족될 수 있다.
단순상관계수
① A1 <---> A2 ①은 A1:A7=1:1 다중상관계수
② A1 <---> A3,A7 ②은 두 독립변인 동시투입
부분상관계수
③
A7
A2 A3
A1
은 A2,A3이 A7에
③
미치는 영향제거
순수상관계수
④
A7
A2 A3
A1 분석
통제 통제
통제 통제
은 A2,A3이 A1,A7에
④
미치는 영향제거
독립변인 에 의해서② 설명되는 종속변인①
독립변인 ③에 의해서 설명되는 종속변인①의
변량 단순상관(zero order
correlation coefficient)
부분상관(part correlation
coefficient)
순 수 상 관 ( p a r t i a l
correlation coefficient)
통제 통제
분석
A
B D
C E
F
G
종속변인
①
(A+D+E+F)
독립변인
②
(B+D+E+G)
독립변인
③
(C+E+F+G)
독립된 측정 모든 집단의 측정치는 모두 독립적으로 측정되어야 한다
- :
등간척도 이상의 측정 피어슨 적률상관을 산출하기 위해 변수들은 최소한 등간
- :
척도 이상으로 측정되어야 한다.
라 상관관계분석의. SPSS 따라하기 가설검증단계의 단계 PRE_STEP :
연구가설 가정의 분리수거와 쓰레기오염에 대한 태도수준은 상관이 있을 것이
- :
다.
영가설
- () : = 0 -> 두 변수는 상관이 없다. 대립가설
- () : ≠ 0 검증통계치 값
- : r
기각역 유의수준 의 설정 양방검증 - ( ) : t< .05( )
결과해석 -
결론 -
의 대화상자 열기 STEP1 : Correlation
먼저 SPSS프로그램을 구동하여 데이터 파일을 연다. 그 다음 분석(Analysis)에 가 서 Correlate -> Bivariate..를 선택한다.
분석할 변수의 선택 TEP 2 :
를 클릭하면 상관관계분석을 위한 대화상자가 열린다
Bivariate .
에는 왼쪽의 변수목록에서 분석할 변수를 선택하여 이동시킨다 상관계수
Variables .
분석에서는 디폴트로 Pearson의 적률상관 r를 산출하도록 되어 있으며, 다른 상관 계수도 산출된다.
Correlation Coefficients
디폴트로 의 적률상관 를 산출한다
Pearson : Pearson r .
①
켄달의 타우계수를 산출하며 순위자료에 대한 상관을 구하 Kendall's tau-b : ,
②
는 데 사용된다. Kendall의 타우()는 순위의 일관성을 측정한다. 스피어만의 순위상관계수
Spearman :
③ 를 산출한다. 역시 서열이나 순위자료에
대한 상관을 구하는데 사용한다.
Test of Significance
양방검증을 수행한다 Two-tailed : .
①
일방검증을 수행한다 One-tailed : .
②
Flag siginificant correlations
이를 선택함으로써 결과표에 유의미한 상관이 있는 경우 표시가 된다* .
옵션의 지정 STEP 3 :
의 대화상자에서 옵션버튼을 선택하며 다음과 같은 옵션 대 Bivariate Correlation
화상자가 열린다.
Statistics
지정된 변수의 평균과 표준편차 산출 Means and standard deviations :
①
변수쌍의 교적편차와 공변량의 산 Cross-product deviations and covariances :
② 출
Missing Values
해당 분석에서 누락치를 제외하고 분석 Exclude cases analysis by analysis :
①
모든 분석에서 누락치를 제외하고 분석 Exclude cases listwise :
②
의 결과물 산출 STEP 4 : Correlations
해석 : 가정의 분리수거와 쓰레기오염에 대한 태도수준은 상관이 있을 것이다. 위의 결과를 보면 가정의 분리수거와 쓰레기오염에 대한 지식수준은 통계적을 유의 미한 상관을 보이지 않았다(r=.162, p<.01) 즉, 가정의 분리수거와 쓰레기 오염에 대한 태도수준은 = 로 약 %의 상관을 갖는 것으로 나타났으며 정적인 관계성 을 갖고 있다. 즉, 쓰리기오염에 대한 태도수준이 높을수로 가정의 분리수거수준이 높은 것으로 해석된다.
마 상관관계분석을 위한 팁. 여러 변수의 상관관계분석 TIP 1 :
위와 같이 두변수의 상관은 직관적으로 이해하기 쉽지만 대부분 조사에서 많은 변 수들이 사용되기 때문에 여러 변수를 동시에 분석하는 것이 더 효율적이다.
통제변수의 사용 부분상관
TIP 2 : -
일반적인 상관계수(r)는 모든 변수들의 상호영향력 관계를 포함한다. 그래서 이러 한 상관을 zero-order 상관이라고 부른다. 그러나 만일 특정변수의 효과를 통제한 상태에서 변수간의 상관을 구하고자 한다면 부분상관계수를 구해야 한다.
부분상관계수를 산출하기 위해서는 메뉴의 Analyze->Correlate->Partial를 선택해 야 한다. (회귀분석에서도 가능하다. Analyze->Regression->Linear에서 Statistics 클릭한 후 Part and partial correlations를 체크해주면 단순상관계수, 부분상관계 수 순수상관계수 모두가 산출된다, .)
양류상관계수 의 산출 TIP 3 : (point-biserial correlation coefficients)
자주 사용되지는 않지만 경우에 따라 유목변수와 연수변수의 상관을 구하고자 하는 경우가 있다. 대부분 인구통계적 특성을 많이 사용하는 조사에서 직관적으로 성별 과 소득 학력과 소득같은 변수들의 상관을 알고자 할 때 양류상관계수를 사용하게, 된다 양류상관계수는 자주 사용되지 않기 때문에. Analyze -> Scale ->Reliability
를 선택한다 Analysis .
그 다음 Reliability Analysis의 대화상자에서 Items항목에 분석할 변수를 지정하 고 Model항목에서 Guttman은 선택한다.
그리고 Statistics버튼을 눌러 Inter-Item에서 Correlation을 선택한다.
성별과 가정의 분리수거의 양류상관계수는 -.002이다. 유의수준이 표시되지 않으므 로 직관적으로 상관을 파악해야 하는데 대략.30이상이면 상관이 있는 것으로 본다. 여기에서는 상관관계가 낮으로 해석을 생략한다.
사실, 성별과 가정의 분리수거의 관련성을 분석하고자 한다면 t검증이 더 적합하 다. 다만 여기서는 유목변수와 등간척도 이상의 데이터의 상관을 분석하는 방법을 설명하기 위한 것으로 생각하면 된다.