• 검색 결과가 없습니다.

상관분석

N/A
N/A
Protected

Academic year: 2022

Share "상관분석"

Copied!
27
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

상관분석

교재 pp.235~250

(2)

오늘 배울

내용은

• 두 변수의 연관성

– 두 변수 간에 관련이 있다 – 두 변수가 서로 독립이다

• 연관성의 측도는

– 공분산

– 상관계수

(3)

연관성의 예 1

• 키와 몸무게

몸무게

170 70

60 80

180 160

키 : 170 몸무게 :

65

산점도散點圖 scatter plot

(4)

• 키와 몸무게

몸무게

170 70

60 80

180 160

키가 크면

몸무게도 크다

양의 상관

연관성의

예 1

(5)

• 흡연량과 기대수명

흡연량 기대수명

20 60

50 70

30 10

흡연 : 20 기대수명 :

55

연관성 의

예 2

(6)

• 흡연량과 기대수명

흡연량 기대수명

20 60

50 70

30 10

흡연량이 많으면 기대수명이 적다

음의 상관

연관성 의

예 2

(7)

• IQ 와 통계학 점수

IQ 통계학

120 80

70 90

140 100

IQ 와 통계학

성적은 관계 없다

상관 무

연관성 의

예 3

(8)

정리하면

• 연관성은

• 양의 연관성

– 하나가 커지면 다른 하나도 커진다

– 하나가 작아지면 다른 하나도 작아진다

• 음의 연관성

– 하나가 작아지면 다른 하나는 커진다 – 하나가 커지면 다른 하나는 작아진다

• 무상관

(9)

연관성의 측도

공분산

(Covariance)

(10)

공분산 ? 공동 분산

?

• X 의 분산은 ?

• Y 의 분산은 ?

• X, Y 의 공분산은 ?

) 2

( )

( X E X X

Var   

) 2

( )

( Y E Y Y Var   

) )(

( )

,

( X Y E X X Y Y

COV     

(11)

공분산의 의미

X Y

170 70

60 80

180 160

(+) (+) (--) (--)

양의 상관

(+) × (+) = (+)

(-) × (-) = (+)

) )(

( X   X Y   Y

(12)

X Y

170 70

60 80

180 160

양의 상관

의 값이 커진다

공분산의 의미

) )(

( X X Y Y

E    

(13)

X Y

170 70

60 80

180 160

(+) (-) (-) (+)

음의 상관

(-) × (+) = (-)

(+) × (-) = (-)

공분산의 의미

) )(

( X   X Y   Y

(14)

X Y

170 70

60 80

180 160

음의 상관

의 값이 작아진다

공분산의 의미

) )(

( X X Y Y

E    

(15)

공분산은

• 양의 상관이면 크고

• 음의 상관이면 작고

• 무상관이면 0 에 가깝다

• 크다 , 작다의 의미는 ??

?

(16)

무조건 공분산이 크다고 연관성이 높은가 ?

• 단위 , 범위에 영향을 받는다

• 표준화 시켜줄 필요

 

      

<그림 6-10> 연관성과 공분산의 크기

(17)

궁극적인

연관성의 측도

상관계수 相關係數

(Correlation Coefficient)

(18)

상관계수

• 모상관계수 : X, Y 의 공분산을 각각 의 편차로 나누어 준다

피어슨 상관계 수

• 표본상관계수

� − � ¿2

¿

� − � ¿2

¿¿

¿

¿

¿ � ( � − � ) ( )

¿

 

�= ¿

 

 1 − �−2 2 � (�−2)

Y X

Y X Y COV

X

Corr  

) , ) (

,

( 

  

 

2

2 ( )

) (

) )(

(

Y Y

X X

Y Y

X

r X

(19)

상관계수 의

범위

• -1 에서 1 사이의 값

• 최대값은 X 와 X 의 상관계수

• 최소값은 X 와 -X 의 상관계 수

X X

X -X

  

 

2

2

( )

) (

) )(

(

Y Y

X X

Y Y

X r X

) 1 (

) (

) )(

(

2

2

 

  

X X

X X

X X

X r X

) 1 (

) (

) )(

(

2

2  

 

  

X X

X X

X X

X

r X

(20)
(21)

예제 6.1 p.246

• 언어점수 (X) 와 수학점수 (Y)

• 8 명을 조사

• 표본상관계수를 구하시오

(22)

상관계수 의 한계

• 상관계수는 만능이 아니다

• 수학적 관계이지 속성의 관계는 아니다

– 언어성적과 수학성적 – 아이스크림과 범죄율

• 선형관계의 측도이다

– 곡선관계는 찾아내지 못한다

• 자료분석의 초기단계

Ice Cream 살인

X Y

(23)

참고 1

(24)
(25)

상위 20%

하위 20% 불평등도

소득 5 분위 배

참고 2

(26)

불평등도

좋음 나쁨

낮음 높음

(27)

한 학기 수고하셨습니다

참조

관련 문서

연령과 혈중 콜레스테롤 수치, 수축기 혈압, 체질량 지수가 어떤 상관관계를 갖는지 SPSS 프로그램을 이용 하여 실습해보도록 하자.. 보고자 하는 변수를

** 연속적인 측정치를 서열변인으로 변환할 때는 원래의 자료가 지니고 있는 정보를 상실하므로 등위차 상관계수가

뒤에는 혈관이 확장되어 있는 상태여서 뜨거운 물에 자극을 받으면 자칫 혈관이 터져 뇌졸중 등을 일으키기 쉽다... 상해의

• 주관적인 인지적 평가와 그에 따른 대처양식에

물의 위생학적

웰빙시대의 맞춤운동과 건강...

‘법원이 외부의 영향이나 간섭을 받지 않아야 하며, 법관 은 헌법과 법률에 따라 공정하게 판결을 내려야 한다.. / 특정한 경우를 제외한 모든

금리의 상승속도가 너무 빠르면 지수 조정폭도 커져 은행주 주가도 부정 적 영향을 받겠지만 지수 박스권 정도의 상황이라면 은행주 주가가 시장을 아웃퍼폼할