• 검색 결과가 없습니다.

제 7장 상관분석

N/A
N/A
Protected

Academic year: 2022

Share "제 7장 상관분석"

Copied!
23
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

제 7장 상관분석

[ 제2부 기술 통계학 ]

(2)

목 차

1. 개념 2. 목적

3. 기본 가정 및 고려할 점 4. 단순상관분석

5. 특수상관계수

6. 상관분석의 제한점

(3)

실험

1. 상관분석이란?

 변인 간의 관련성을 경험적으로 분석하는 것

 변인 간의 상호 관련성의 정도를 밝혀 보려는 것

 두 변인 간의 선형적인 관계를 알아보는 것 : 정적 상관 / 부적 상관

1. 상관분석의 개념

(4)

2. 많이 사용되는 상관통계치 실험

 연속변인 : Person-r(적률상관계수)

 비연속변인 : Phi계수, 양류상관계수, Spearman – r

3. 상관관계의 종류

 단순상관, 다중상관관계, 편상관관계

1. 상관분석의 개념

(5)

실험

- 목적

 변인 간의 관계를 규명함으로써 주위 현상을 이해하고 해석함.

 상관분석의 결과를 인과관계 확인을 위한 실험연구의 가설로 사용할 수 있음.

 두 변인 사이에 충분한 관계가 있을 때 한 변인의 측정치에서 다른 변인의 측정치를 예측함.

2. 상관분석의 목적

(6)

실험

선형성 / 등분산성(동변량성) / 두 변인의 정규분포성 / 무선독립표본의 측정치 자료의 통합 및 절단 유무 / 사례 수(n의 크기) / 극단치의 유무

3. 기본가정 및 고려할 점

(7)

실험

 두 변인(준거변인, 예언 변인) 사이의 상관관계를 알아보는 것

 산포도 / 공변량 / 적률상관계수 / 결정계수 / 이관계수

4. 단순상관분석

(8)

실험

1. 산포도

4. 단순상관분석

(9)

2. 공변량(공분산) 실험

 두 변인 X와 Y가 함께 평균 와 로부터 얼마나 퍼져 있는가를 나타냄

 정적 상관 이면 +, 부적 상관이면 –

 두 변인 간의 선형관계의 방향을 파악할 수 있음

4. 단순상관분석

X Y

n xy n

Y Y

X

S XY ( X )( )

(10)

실험

3. 적률상관계수(Person의 r)

 두 변인 모두 연속 변인 (등간/비율 척도) 일 때, 선형성을 가정할 수 있을 때 사용

 r = X와 Y의 교적의 평균

 -1.0 ≤ r ≤ 1.0 의 값으로 표준화된 지수

4. 단순상관분석

2 2

y x

y

r

xy

x

2 2

2

2

( ) ( )

) )(

(

   

 

Y Y

n X

X n

Y X

Y X

r

xy

n

(11)

실험

3. 적률상관계수(Person의 r)

4. 단순상관분석

학생 X

(지각횟수)

Y

(컴퓨터게임 시간) XY

A 4 2 16 4 8

B 5 3 25 9 15

C 2 1 4 1 2

D 7 4 49 16 28

E 9 5 81 25 45

F 3 2 9 4 6

G 1 1 1 1 1

H 7 3 49 9 21

I 10 5 100 25 50

J 6 4 36 16 24

합계 54 30 370 110 200

9596 .

0 30

110 10 54

370 10

30 54 200 10

) (

) (

) )(

(

2 2

2 2

2

2

 

 

   

Y Y

n X

X n

Y X

Y X

r

xy

n

<표 7-1>

(12)

3. 적률상관계수(Person의 r) 실험

-1.0 ≤ r ≤ 1.0 의 값으로 표준화된 지수

4. 단순상관분석

(13)

실험

4. 결정계수

 r²

 예언변인이 준거변인을 설명할 수 있는 비율

 r= .80 ⇒ r²=.64 ⇒ ‘Y분산의 64%를 X가 설명할 수 있다’라고 해석

4. 단순상관분석

(14)

실험

5. 이관계수(k)

 한 변인에서 다른 변인을 예측할 때 생기는 오차의 정도

 0 ≤ k ≤ 1

4. 단순상관분석

1 r 2

k  

(15)

실험

 척도치가 서열변인과 서열변인인 경우 : Spearman의 등위상관계수

 척도치가 명명변인과 등간변인인 경우 : 양류상관계수, 양분상관계수

 척도치가 명명변인과 명명변인인 경우 : Phi(ø)계수

5. 특수상관계수

(16)

실험

1. Spearman의 등위상관계수 (r s )

 두 변인 모두가 서열 척도 또는 연속 변인을 서열 변인으로 변환 한 경우

 두 변인에 등위를 각각 부여하고 등위차를 이용하여 상관계수를 계산

 같은 등위가 있을 경우, 등위의 값을 평균하여 사용

 극단적 분포일 때도 사용

5. 특수상관계수

n n

r d

 

 

3

2

6 1

1

(17)

실험

5. 특수상관계수

9515 10 .

10

8 1 6

1 6

3 3

2

1

 

 

 

n n

r d

학생 X

(지각횟수)

Y

(컴퓨터게임 시간) X 등위 Y 등위 di di2

A 4 2 7 7.5 -.5 .25

B 5 3 6 5.5 .5 .25

C 2 1 9 9.5 -.5 .25

D 7 4 3.5 3.5 0 0

E 9 5 2 1.5 .5 .25

F 3 2 8 7.5 .5 .25

G 1 1 10 9.5 .5 .25

H 7 3 3.5 5.5 -2 4

I 10 5 1 1.5 -.5 .25

J 6 4 5 3.5 1.5 2.25

합계 54 30 8

<표7-2>

(18)

실험

 Person의 적률상관계수

 Spearman의 등위상관계수

** 연속적인 측정치를 서열변인으로 변환할 때는 원래의 자료가 지니고 있는 정보를 상실하므로 등위차 상관계수가 일반적으로 낮아지는 경향이 있다.

5. 특수상관계수

9515 10 .

10 8 1 6

1 6

3 3

2

1

 

 

 

n n

r d

9596 .

0 30

110 10 54

370 10

30 54 200 10

) (

) (

) )(

(

2 2

2 2

2

2

 

 

   

Y Y

n X

X n

Y X

Y X

r

xy

n

(19)

실험

2. 양류상관계수 (r pb )

 이분변인인 명명척도와 등간/비율척도로 측정된 연속변인 간의 상관 정도를 추정할 때 사용

5. 특수상관계수

S pq Y r Y

y

0 1

S Y Y

y

q p

0

1 : 이분변인X가 1인 대상자의 평균점수 : 이분변인X가 0인 대상자의 평균점수 : 이분변인X가 1인 대상자의 비율 : 이분변인X가 0인 대상자의 비율 : 연속변인Y의 표준편차

(20)

실험

5. 특수상관계수

54 . 4 . 0 6 . 56 0

. 13

65 80

0 1

 

 

r

S pq Y r Y

y

S Y Y

y

q p

0

1 : 이분변인X가 1인 대상자의 평균점수 = 80 : 이분변인X가 0인 대상자의 평균점수 = 65 : 이분변인X가 1인 대상자의 비율 = .6 : 이분변인X가 0인 대상자의 비율 =.4 : 연속변인Y의 표준편차 =

학생 남녀 성별 수학성취도

A 1 70

B 0 80

C 1 90

D 1 80

E 0 50

56 . ) 13 ( 2

 

N Y Y

<표7-3>

(21)

실험

3. 양분상관계수 (r b )

 한 변인이 연속변인이지만 이분변인으로 간주하고, 나머지 변인은 연속 변인일 때

 입학시험의 결과를 합격자/불합격자로 구분하는 경우

5. 특수상관계수

)

0

(

1

y pq S

Y r Y

y

 

y q p

S Y Y

y 0

1 : 이분변인X가 1인 대상자의 평균점수 : 이분변인X가 0인 대상자의 평균점수 : 이분변인X가 1인 대상자의 비율 : 이분변인X가 0인 대상자의 비율 : 연속변인Y의 표준편차

: p와 q 두 부분으로 나누는 정규곡선의 수직좌표

(22)

실험

4. Phi(ø)계수

 두 변인이 모두 이분화된 명명척도일 때

5. 특수상관계수

X=0 찬성 X=1 반대

Y=0 남 a 25 b 25

Y=1 여 c 30 d 20

<표7-5>

<표7-6>

1 45 .

55 50

50

500 750

) )(

)(

)(

( 

 

 

d b

c a

d c

b a

ad

bc

(23)

실험

 상관계수가 얻어진 집단에 한정되는 것으로, 일반화되는 것은 아니다.

 상관계수를 어떻게 해석할 것인지에 대한 절대적 기준은 없다. 연구자가 결정할 일!

 상관관계 ≠ 인과관계

6. 상관분석의 제한점

참조

관련 문서

·S로 지정된 스케일링 변환할 데이터가 스케일 정보의 Source Data의 범위를 벗어난 경우 Destnation Data의 최대 또는

사회 건강 행복

이러한 개념을 일반화시켜 서 특정 시간 t 에서의 기울기를 순시 주파수(instantaneous

마케팅 과목 수강 /평점 3.75이상 마케팅 학회 발표.

 백분위수는 가장 작은 값부터 가장 큰 값 사이에 자료가 어떻게 퍼져 있는지에 대한 정보를 제공한다..  대학의

정보 중복의 해소(avoid repetition of information) -&gt; 분해하면 자동으로 해결2.

 지면에 충분히 여백을 두어야 한다...  문항 형식이

사전접근 판매제시를 보다 효과적으로 하기 위해 고객에 대한 추가적인 정보를 받는다. 판매사원은 자신의 소개와 아울러 회사의