• 검색 결과가 없습니다.

9장. 상관분석상관분석

N/A
N/A
Protected

Academic year: 2022

Share "9장. 상관분석상관분석"

Copied!
39
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

9장. 상관분석

(2)

1. 상관의 개념과 목적을 알아본다.

2. 산포도를 알아본다.

3. 상관계수(적률상관계수)를 알아본다.

4. 상관분석을 알아본다.

제 9장 상관분석

[학습목표]

(3)

제 9장 상관분석 1. 상관

1. 상관

·상관(correlation)은 변수 간의 상관관계이다.

·상관분석은 변수 간의 관계 등을 통계적으로 설명한다.

·한 변수가 변할 때 다른 변수가 어떻게 변하는가에 대해 설명한다.

·두 변수가 동시에 변하는 것을 상관이 있다고 한다.

·상관은 일반적으로 인과관계와 다르다. 인과관계는 원인과 결과가 명확하다.

·상관관계는 인과관계로 해석해서는 안 되고 상호관계(interaction)로 해석해야 한다.

(4)

제 9장 상관분석 2. 산포도

2. 산포도

·산포도(scatter plot)란 각 변수의 값을 나타내는 점을 찍어 두 변수 간의 관계를 파악할 수 있는 도표이다.

·한 변수가 아니라 두 변수의 관계를 알아보기 위하여 X축에 한 변수, Y축에 다른 변수를 설정한다.

·산포도를 다음과 같이 그릴 수 있다.

부적 상관일 때 정적 상관일 때

(5)

제 9장 상관분석 3. 상관계수(적률상관계수)

3. 상관계수(적률상관계수)

·상관계수(correlation coefficient)란 변수 간의 관계가 어느 정도 되어 있는지를 나타내는 지수이다.

·하나의 변수가 변해감에 따라 다른 변수의 변하는 정도를 나타내는 지수이다.

·두 변수가 동시에 변하는 정도를 나타내는 지수이다.

·상관계수는 정적이든 부적이든 공분산의 양과 비례한다.

(6)

제 9장 상관분석 3. 상관계수(적률상관계수)

공분산에 관한 수식

·공분산의 절댓값이 크면 상관이 높을 것이라고 예측한다.

·상관계수는 – 1.0 ~ 0 ~ + 1.0 의 범위를 갖고 있다.

·완벽한 정적 관계는 + 1.0이다.

·모수치에 의한 상관계수는 (rho), 통계치에 의한 상관계수는 r로 표현한다.

(7)

제 9장 상관분석 3. 상관계수(적률상관계수)

상관분석에 관한 수식(피어슨의 적률상관계수)

(8)

제 9장 상관분석 3. 상관계수(적률상관계수)

·정적(+)인 관계는 정적 상관관계(positive correlation), 부적(-)인 관계는 부적 상관관계 (negative correlation)라고 한다.

상관계수의 범위 상관관계의 해석

± .00 ~ .20 거의 희박한 상관

± .20 ~ .40 낮은 상관

± .40 ~ .60 비교적 높은 상관

± .60 ~ .80 높은 상관

± .80 ~ 1.00 매우 높은 상관 상관계수 값에 따른 상관관계의 해석

(9)

제 9장 상관분석 4. 상관분석

4. 상관분석 1) 가정

·상관계수는 두 변수의 관계가 선형성(linearity)을 만족시켜야 한다.

·두 변수의 상관관계를 연구할 때 상관계수만으로 해석하면 문제가 된다.

·곡선형 관계를 지니고 있는 두 변수의 관계는 상관계수에 의하면 매우 낮은 상관이나 거의 0의 상관을 갖는다.

·그렇다고 두 변수는 관계가 없다고 단정 짓는 것은 모순이다.

⑴ 선형성

선형관계일때

선형관계를 유지하지 못할 때

선형성이 존재하지 않는다면 자료 변화의 경향성에 비추어 세밀한 해석이 필요하다.

(10)

제 9장 상관분석 4. 상관분석

⑵ 등분산성

·상관계수는 등분산성(homoscedastic)을 만족시켜야 한다.

·등분산성이란 X변수가 변해갈 때 Y변수의 흩어진 정도가 거의 같은 정도를 유지하는 것이다.

⑶ 이상점

·이상점(outlier) 유무를 확인해야 한다.

·이상점이란 X변수와 Y변수의 두 변수가 갖는 값의 경향성이 있으나 그와 같은 경향에서 매우 동떨 어진 값이며 이로 인해 상관계수는 매우 낮아진다.

·이상점의 존재와 이상점의 자료가 의미가 있는지 고려해야 한다.

·그 이상점이 연구의 특성상 중요한 자료라고 해석된다면 그 이상점을 제거하는 것은 타당하지 않다.

·그러나 그 이상점이 연구의 특성상 의미 없는 자료라고 판단된다면 제거 후 상관계수를 계산하는 것이 좋다.

(11)

제 9장 상관분석 4. 상관분석

2) 가설설정

태도 변인들인 감사, 겸손, 공정성, 낙관성, 시민정신, 용서, 자기조절 간의 통계적으로 유의미한 상관이 있을 것이다.

·연구가설

: 태도 변인들인 감사, 겸손, 공정성, 낙관성, 시민정신, 용서, 자기조절 간의 통계적으로 유의미한 상관이 없을 것이다.

: 태도 변인들인 감사, 겸손, 공정성, 낙관성, 시민정신, 용서, 자기조절 간의 통계적으로 유의미한 상관이 있을 것이다.

·H0 (영가설)

·H1 (대립가설)

통계검증방법 : 상관분석

유의수준 :

p

< .05(양방검증) 가설검증을 위한 진위판단을 실시

상관분석에 관한 가설설정

(12)

제 9장 상관분석 4. 상관분석

3) spss 실행

※ 분석과정

분석  상관분석  이변량 상관(B)

·태도 변인들인 감사, 겸손, 공정성, 낙관성, 시민정신, 용서, 자기조절 간의 상관관계를 분석한다.

(13)

Statistical Package for Social Science 사회 과학 통계 패키지

[통 계 실 습]

상관분석

Colleration

(14)

1

제 9장 상관분석 4. 상관분석

(15)

2

제 9장 상관분석 4. 상관분석

·[변수(V)]에 태도 변인인 감사, 겸손, 공정성, 낙관성, 시민정신, 용서, 자기조절을 넣는다.

·[상관계수]에서 Pearson에 체크되어 있는지 확인한 후 [확인]을 클릭한다.

(16)

Statistical Package for Social Science 사회 과학 통계 패키지

SPSS program 활용

(17)

제 9장 상관분석 4. 상관분석

4) 분석 결과

·상관관계 분석결과 상관관계표를 구체적으로 살펴보기 위해 이 표를 더블클릭한다.

(18)

제 9장 상관분석 4. 상관분석

·마우스의 오른쪽 버튼을 클릭하여 [피벗 트레이(P)]를 찾아 클릭한다.

(19)

제 9장 상관분석 4. 상관분석

·[피벗 트레이(P)]창이 활성화 되면 창 안에 있는 변수의 위치를 다음과 같이 변경한다.

·상관관계표가 다음의 결과표와 같이 정렬되어 제시된다.

(20)

제 9장 상관분석 4. 상관분석

·각 변인들 간의 상관관계 계수와 유의확률 값을 확인한다.

(21)

제 9장 상관분석

1 2 3 4 5 6 7

1. 감사 -

2. 겸손 .50*** -

3. 공정성 .64*** .67*** -

4. 낙관성 .77*** .43*** .62*** -

5. 시민정신 .70*** .65*** .78*** .68*** -

6. 용서 .55*** .65*** .64*** .54*** .64*** -

7. 자기조절 .55*** .69*** .68*** .57*** .72*** .59*** -

***

p

< .001

5) 결과 보고서 작성

4. 상관분석

표 11.2 태도 변인들에 대한 상관행렬

표11.2은 태도 변인들에 대한 상관행렬표이다. 태도 변인들 간의 상관은 정적 상관관계를 보였다. 이들의 상관계수 는 전체적으로 .43에서 .78로 유의수준 p < .001에서 통계적으로 검증되었다. 가장 높은 정적 상관을 보인 변인은 공정성과 시민정신으로 상관계수는 .78(p < .001)이었다. 다음으로는 감사와 낙관성으로 상관계수는 .77(p < .001) 이었다. 가장 낮은 정적 상관을 보인 변인은 겸손과 낙관성으로 상관계수는 .43(p < .001)이었다.

(22)

제 9장 상관분석 5. 기타 상관계수

5. 기타 상관계수

1) 등위상관계수(rank correlation coefficient)

·X변수, Y변수 모두가 연속변수가 아닌 서열척도에 의한 비연속변수일 경우 Spearman의 등위상관계수 를 사용한다.

2) 양류상관계수(point-biserial correlation coefficient)

·독립변수는 질적 변수(명명척도), 종속변수는 연속변수일 때, 양류상관계수를 사용한다.

3) 양분상관계수(biserial correlation coefficient)

·두 변수 다 연속적인 양적 변수이나 연구자가 독립변수를 어떤 특정 점수에 의하여 양분하여 가성적인 질적 점수로 변환한 후 가상적으로 양분된 독립변수와 종속변수(연속적인 양적 변수)일 때, 양분상관계수 를 사용한다.

4) Φ계수(phi coefficient)

·독립변수와 종속변수 모두 명명척도에 의하여 이분화 된 질적 변수일 때, Φ계수를 사용한다.

(23)

10장. 회귀분석

(24)

1. 회귀분석의 개념과 목적을 알아본다.

2. 회귀분석을 알아본다.

제 10장 회귀분석

[학습목표]

(25)

1. 회귀분석 1. 회귀분석

제 10장 회귀분석

1) 회귀선(regression line)

·회귀선은 산포도에 있는 모든 점이 자료를 대표하는 직선 쪽으로 회귀하기 때문이다.

·회귀선은 직선과 똑같은 속성을 가지므로 기울기와 절편으로 표시한다.

·즉, 회귀선은 X와 Y의 수학적인 함수관계로 설명할 수 있다.

·두 변수를 대표하는 회귀선은 와 인 점을 지나고 많은 점을 적절히 대변해야 한다.

(26)

·자료를 가장 잘 대표하는 회귀선은 이 0이거나 최숫값을 때이다.

1. 회귀분석

제 10장 회귀분석

2) 최소자승법(least square method)

·회귀선의 기본원리는 X값에 따라 Y값이 변할 때 X값을 회귀등식에 대입하여 나타난 기대되는 값과 Y값의 차이를 가장 작게 하는 것이다.

·기대되는 값을 라고 할 때 값을 최소화해야 한다.

·이 원리와 같이 은 0이므로 제곱하여 더한 의 값을 최소화하는 회귀등식을 구하여야 한다..

(27)

2. 모형

2. 모형

제 10장 회귀분석

·회귀분석은 하나의 독립변수와 종속변수 간의 선형적 관계를 가정하는 것으로써 다음과 같이 표현된다.

회귀분석에 관한 수식

(28)

3. 단순회귀분석

제 10장 회귀분석

3. 단순회귀분석 1) 가정과 기본원리

·단순회귀분석은 하나의 독립변수가 하나의 종속변수의 값을 예측하는지 분석하는 통계방법이다.

·이 방법은 상관계수를 기초로 하고 있다.

·회귀분석은 기본적으로 독립변수는 양적변수이고 종속변수 또한 양적변수이어야 한다.

·그러나 독립변수가 질적이고 종속변수가 양적일 때 독립변수인 질적 변수를 더미 변수로 전환하여 분석을 할 수 있다.

(29)

3. 단순회귀분석

제 10장 회귀분석

2) 가설설정

단순회귀분석에 관한 가설설정

·연구가설

스트레스가 삶의 의미에 부적인 영향을 미칠 것이다.

: 스트레스가 삶의 의미에 부적인 영향을 미치지 않을 것이다.

: 스트레스가 삶의 의미에 부적인 영향을 미칠 것이다.

·H1 (대립가설)

·H0 (영가설)

통계검증방법 : 단순회귀분석

유의수준 :

p

< .05(양방검증) 가설검증을 위한 진위판단을 실시

(30)

3. 단순회귀분석

제 10장 회귀분석

3) spss 실행

스트레스가 삶의 의미에 미치는 영향을 분석하기 위해 단순회귀분석을 실시한다

※ 분석과정

분석  회귀분석  선형(L)

(31)

Statistical Package for Social Science 사회 과학 통계 패키지

[통 계 실 습]

회귀분석

regression

(32)

3. 단순회귀분석

제 10장 회귀분석

1

(33)

3. 단순회귀분석

제 10장 회귀분석

2

·[종속변수(D)]에 삶의의미를 넣고 [독립변수(I)]에 스트레스를 넣는다.

(34)

3. 단순회귀분석

제 10장 회귀분석

3

(35)

3. 단순회귀분석

제 10장 회귀분석

3

·[기본적으로 체크되어 있는 추정값(E)과 모형 적합(M)을 확인하고 R제곱 변화량(S)에 체크한 후 [계속(C)]을 클릭한다.

(36)

Statistical Package for Social Science 사회 과학 통계 패키지

SPSS program 활용

(37)

3. 단순회귀분석

제 10장 회귀분석

4) 분석 결과

·모형1의 R, R 제곱, 수정된 R 제곱 값과 통계량 변화량의 유의확률 값을 확인한다.

스트레스는 R 제곱, 즉 결정계수는 .045으로 삶의 의미 변화량의 4.5%를 설명해준다.

이 때 회귀모형은 유의수준

p

< .001에서 통계적으로 유의하다.

(38)

3. 단순회귀분석

제 10장 회귀분석

·스트레스가 투입된 최종 모형은

F

= 46.573(

p

< .001)이므로 통계적으로 유의미한 결과가 검증되었다.

·스트레스가 삶의 의미에 미치는 영향을 확인한 결과

t

= -6.824(

p

< .001)이므로 통계적으로

(39)

3. 단순회귀분석

제 10장 회귀분석

독립변수

비표준화 계수

표준화계수

t

유의확률

B 표준오차

스트레스 -.15 .02 -.21 - 6.82 .000

***

P

< .001 표12.1 삶의 의미에 대한 단순회귀분석 결과

스트레스가 삶의 의미에 미치는 영향을 알아보기 위하여 단순회귀분석을 실시하였다.

삶의 의미에 대한 단순회귀분석 결과는 표 12.1과 같다. 이 결과를 토대로 영가설인 ‘스 트레스는 삶의 의미에 영향을 미치지 않을 것이다.’를 기각하고 대립가설인 ‘스트레스는 삶의 의미에 영향을 미칠 것이다.’를 채택하였다.

스트레스는 삶의 의미에

t

= -6.82,

p

< .001에서 통계적으로 유의미하게 영향을 미치고 있었다. 스트레스가 삶의 의미에 4.5%로 영향을 미친다고 결론을 내릴 수 있다.

참조

관련 문서