상관분석과 공간적 자기상관
지리통계 8강
최재헌 교수
상관관계의 개념
• 두 변수 사이에 관계를 분석하는 방법
• 영향을 받는 변수를 종속변수, 영향을 미치는 변수를 독립변수 또는 설명변수라고 하며, 두 변수들이 얼마 나 밀접하게 관계를 가지는지 분석하는 것
• 두 변수간의 인과관계를 파악할 수 없다.
• 두 변수가 공통으로 변화하는 부분이 많으면 상관성이 높아짐
• 상관관계는 상관계수(correlation coefficient)로 파악
• -1에서 +1까지의 범위
• R 값이 0.6이상이면 강한 상관관계, 0.2 이하면 약한
상관관계
상관관계의 종류
• 단순 상관관계(simple correlation): 두 변 수간의 상관관계
• 중다 상관관계(multiple correlation): 하나 의 종속변수와 두 개 이상의 설명변수 간 의 관계
• 부분 상관관계(partial correlation): 다른 변
수들과의 상관관계를 배제하고 순수하게
두 변수간의 상관 관계를 나타내는 것
피어슨 상관관계
(Pearson’s product moment correlation)
• 등간척도와 비율척도 변수들간의 관계 분석
• 정규분포를 가정하는 모수검정방법
• 공분산(covariance)의 개념 이용. 분산은 한 변수의 평균 에 대한 각 측정치의 편자제곱을 의미하는데, 공분산은 두 변수들의 각각의 평균에 대한 편차의 곱을 의미,
• 공분산은 각 변수들의 평균치로부터 편차를 서로 곱한 것의 평균값
상관계수의 산출 공식
• 측정단위에 따른 영향을 통제하기 위해 각각의 표준편차 로 나누어주어야 함
• 상관계수는 공분산을 두 변수의 표준편차로 나눈 것
스페어만의 순위상관계수 (Spearman’s rank correlation)
• 서열척도 측정 변수들간의 상관관계 분석
• 각 변수들을 서열화하여 순위 결정, 같은 순위를 가진 사 례수가 둘 이상일 경우 평균 순위로 대체하고 상관계수 를 산출
d : 두 변수간의 순위의 차이