제 7장 상관분석
[ 제2부 기술 통계학 ]
목 차
1. 개념 2. 목적
3. 기본 가정 및 고려할 점 4. 단순상관분석
5. 특수상관계수
6. 상관분석의 제한점
실험
1. 상관분석이란?
변인 간의 관련성을 경험적으로 분석하는 것
변인 간의 상호 관련성의 정도를 밝혀 보려는 것
두 변인 간의 선형적인 관계를 알아보는 것 : 정적 상관 / 부적 상관
1. 상관분석의 개념
2. 많이 사용되는 상관통계치 실험
연속변인 : Person-r(적률상관계수)
비연속변인 : Phi계수, 양류상관계수, Spearman – r
3. 상관관계의 종류
단순상관, 다중상관관계, 편상관관계
1. 상관분석의 개념
실험
- 목적
변인 간의 관계를 규명함으로써 주위 현상을 이해하고 해석함.
상관분석의 결과를 인과관계 확인을 위한 실험연구의 가설로 사용할 수 있음.
두 변인 사이에 충분한 관계가 있을 때 한 변인의 측정치에서 다른 변인의 측정치를 예측함.
2. 상관분석의 목적
실험
선형성 / 등분산성(동변량성) / 두 변인의 정규분포성 / 무선독립표본의 측정치 자료의 통합 및 절단 유무 / 사례 수(n의 크기) / 극단치의 유무
3. 기본가정 및 고려할 점
실험
두 변인(준거변인, 예언 변인) 사이의 상관관계를 알아보는 것
산포도 / 공변량 / 적률상관계수 / 결정계수 / 이관계수
4. 단순상관분석
실험
1. 산포도
4. 단순상관분석
2. 공변량(공분산) 실험
두 변인 X와 Y가 함께 평균 와 로부터 얼마나 퍼져 있는가를 나타냄
정적 상관 이면 +, 부적 상관이면 –
두 변인 간의 선형관계의 방향을 파악할 수 있음
4. 단순상관분석
X Y
n xy n
Y Y
X
S XY ( X )( )
실험
3. 적률상관계수(Person의 r)
두 변인 모두 연속 변인 (등간/비율 척도) 일 때, 선형성을 가정할 수 있을 때 사용
r = X와 Y의 교적의 평균
-1.0 ≤ r ≤ 1.0 의 값으로 표준화된 지수
4. 단순상관분석
2 2
y x
y
r
xyx
2 2
2
2
( ) ( )
) )(
(
Y Y
n X
X n
Y X
Y X
r
xyn
실험
3. 적률상관계수(Person의 r)
4. 단순상관분석
학생 X
(지각횟수)
Y
(컴퓨터게임 시간) X² Y² XY
A 4 2 16 4 8
B 5 3 25 9 15
C 2 1 4 1 2
D 7 4 49 16 28
E 9 5 81 25 45
F 3 2 9 4 6
G 1 1 1 1 1
H 7 3 49 9 21
I 10 5 100 25 50
J 6 4 36 16 24
합계 54 30 370 110 200
9596 .
0 30
110 10 54
370 10
30 54 200 10
) (
) (
) )(
(
2 2
2 2
2
2
Y Y
n X
X n
Y X
Y X
r
xyn
<표 7-1>
3. 적률상관계수(Person의 r) 실험
-1.0 ≤ r ≤ 1.0 의 값으로 표준화된 지수
4. 단순상관분석
실험
4. 결정계수
r²
예언변인이 준거변인을 설명할 수 있는 비율
r= .80 ⇒ r²=.64 ⇒ ‘Y분산의 64%를 X가 설명할 수 있다’라고 해석
4. 단순상관분석
실험
5. 이관계수(k)
한 변인에서 다른 변인을 예측할 때 생기는 오차의 정도
0 ≤ k ≤ 1
4. 단순상관분석
1 r 2
k
실험
척도치가 서열변인과 서열변인인 경우 : Spearman의 등위상관계수
척도치가 명명변인과 등간변인인 경우 : 양류상관계수, 양분상관계수
척도치가 명명변인과 명명변인인 경우 : Phi(ø)계수
5. 특수상관계수
실험
1. Spearman의 등위상관계수 (r s )
두 변인 모두가 서열 척도 또는 연속 변인을 서열 변인으로 변환 한 경우
두 변인에 등위를 각각 부여하고 등위차를 이용하여 상관계수를 계산
같은 등위가 있을 경우, 등위의 값을 평균하여 사용
극단적 분포일 때도 사용
5. 특수상관계수
n n
r d
3
2
6 1
1
실험
5. 특수상관계수
9515 10 .
10
8 1 6
1 6
3 32
1
n n
r d
학생 X
(지각횟수)
Y
(컴퓨터게임 시간) X 등위 Y 등위 di di2
A 4 2 7 7.5 -.5 .25
B 5 3 6 5.5 .5 .25
C 2 1 9 9.5 -.5 .25
D 7 4 3.5 3.5 0 0
E 9 5 2 1.5 .5 .25
F 3 2 8 7.5 .5 .25
G 1 1 10 9.5 .5 .25
H 7 3 3.5 5.5 -2 4
I 10 5 1 1.5 -.5 .25
J 6 4 5 3.5 1.5 2.25
합계 54 30 8
<표7-2>
실험
Person의 적률상관계수
Spearman의 등위상관계수
** 연속적인 측정치를 서열변인으로 변환할 때는 원래의 자료가 지니고 있는 정보를 상실하므로 등위차 상관계수가 일반적으로 낮아지는 경향이 있다.
5. 특수상관계수
9515 10 .
10 8 1 6
1 6
3 32
1
n n
r d
9596 .
0 30
110 10 54
370 10
30 54 200 10
) (
) (
) )(
(
2 2
2 2
2
2
Y Y
n X
X n
Y X
Y X
r
xyn
실험
2. 양류상관계수 (r pb )
이분변인인 명명척도와 등간/비율척도로 측정된 연속변인 간의 상관 정도를 추정할 때 사용
5. 특수상관계수
S pq Y r Y
y
0 1
S Y Y
y
q p
0
1 : 이분변인X가 1인 대상자의 평균점수 : 이분변인X가 0인 대상자의 평균점수 : 이분변인X가 1인 대상자의 비율 : 이분변인X가 0인 대상자의 비율 : 연속변인Y의 표준편차
실험
5. 특수상관계수
54 . 4 . 0 6 . 56 0
. 13
65 80
0 1
r
S pq Y r Y
y
S Y Y
y
q p
0
1 : 이분변인X가 1인 대상자의 평균점수 = 80 : 이분변인X가 0인 대상자의 평균점수 = 65 : 이분변인X가 1인 대상자의 비율 = .6 : 이분변인X가 0인 대상자의 비율 =.4 : 연속변인Y의 표준편차 =
학생 남녀 성별 수학성취도
A 1 70
B 0 80
C 1 90
D 1 80
E 0 50
56 . ) 13 ( 2
N Y Y
<표7-3>
실험
3. 양분상관계수 (r b )
한 변인이 연속변인이지만 이분변인으로 간주하고, 나머지 변인은 연속 변인일 때
입학시험의 결과를 합격자/불합격자로 구분하는 경우
5. 특수상관계수
)
0
(
1
y pq S
Y r Y
y
y q p
S Y Y
y 0
1 : 이분변인X가 1인 대상자의 평균점수 : 이분변인X가 0인 대상자의 평균점수 : 이분변인X가 1인 대상자의 비율 : 이분변인X가 0인 대상자의 비율 : 연속변인Y의 표준편차
: p와 q 두 부분으로 나누는 정규곡선의 수직좌표
실험
4. Phi(ø)계수
두 변인이 모두 이분화된 명명척도일 때
5. 특수상관계수
X=0 찬성 X=1 반대
Y=0 남 a 25 b 25
Y=1 여 c 30 d 20
<표7-5>
<표7-6>
1 45 .
55 50
50
500 750
) )(
)(
)(
(
d b
c a
d c
b a
ad
bc
실험
상관계수가 얻어진 집단에 한정되는 것으로, 일반화되는 것은 아니다.
상관계수를 어떻게 해석할 것인지에 대한 절대적 기준은 없다. 연구자가 결정할 일!
상관관계 ≠ 인과관계