• 검색 결과가 없습니다.

Factor Analysis

N/A
N/A
Protected

Academic year: 2022

Share "Factor Analysis"

Copied!
37
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

Factor Analysis

요인분석

(2)

Review

• regression

X1

X2 X3 X4 X5 X6 X7 X8

Y

X9

Too many indepen- dent vari- ables

X1 X2 X3 X4 X5 X6 X7 X8

Y

X9

Explain Y with small factors

F1

F2

F3

(3)

• Factor Analysis

X1 X2 X3 X4 X5 X6 X7 X8 X9

Y Explain X

with unob- servable

factors

F1

F2

F3

(4)

요인분석의

EFA

목적은 ?

• 변수축소의 방법

• 독립변수의 수를 정리하고 싶을 때

• 과다한 변수는 해석의 어려움

• 독립변수를 구성하는 공통요인을 발견

• 내가 원하는 개념을 조작적 정의에 의한 변수로 측정하였을 때

• 변수가 어떠한 구성 ( 내재하는 속성 ) 으로 이루어져 있는가

• 우리가 관측할 수 없는 요인을 정량화

• 요인점수로 요인을 추정하여

• 구조방정식모형 (SEM), 회귀분석 , 분산분석 등 차후 분석이 가능하다

(5)

요인과 변수

Factor and v ariable

• 변수 = 우리가 관측가능한 값

• 요인 = 관측 불가능하지만 해석가능한 값

• 개념적 정의 ( 요인 ) 와 조작적 정의 ( 변수 )

• 입사시 업무능력을 대학성적과 공인영어성적으로 측정

• 요인을 변수를 이용해 측정

• 행복요인은 인간관계 , 긍정적 태도 , 성취감 변수 등으로 측정

• 만족도요인은 가격 , 성능 , 디자인 , AS, 브랜드 만족도 변수 등 으로 측정

• 궁극적인 분석목표

• 변수 ? 요인 ?

A ⇒ B A ⇒ B

(6)

요인과

변수의 예

• 변수는 요인들로 이루어져 있다

• 수학성적 = 계산력 + 논리력 + 언어해독력 + 창의력 + 기타요인

• 국어성적 = 계산력 + 논리력 + 언어해독력 + 창의력 + 기타요인

• 100m 기록 = 순발력 + 지구력 + 근력 + 기타요인

• 마라톤기록 = 순발력 + 지구력 + 근력 + 기타요인

• 변수는 여러 ( 공통 ) 요인으로 이루어져 있 다

• 그 구성비 ( 영향력 ) 가 다를 뿐

(7)

변수는

어떤 요인으로 이루어져 있는 가

• 공통요인 + 특별요인

• 우리는 어디에 관심을 갖는가 ?

• 공통요인

• 모든 변수를 설명하는데 유용한 요인

• 자료에 대한 다양한 해석 가능

• 특별요인

• 그 변수에만 특별히 존재하기 때문에 오차와 같이 취급

• 해석 불가능

(8)

공통요인 (Common Factor) 의 모형

• 독립변수 (종속변수는 없음 )

• X1: 영어성적

• X2: 수학성적

• 공통요인 ( 인자 , factor)

• F1, F2

• 모형

X1( 영어성적 )=0.9F1+0.2F2

X2( 수학성적 )=0.3F1+0.8F2

• 독립변수

( 종속변수는 없음 )

• X1,X2, …,Xp

• 공통요인 ( 인자 , factor)

• F1, F2,…, Fm

1=�1+11 1+�12 2+⋯+�1 +1  

2=�2+�21 1+�22 2+⋯+�2 +2  

=�+

�1

1+��2

2+⋯+���

+

 

⋮ ⋮

 

X

는 측정가능 (observable)

F

는 측정 불가능

그래서 F 에 대한 해석이 필요

(9)

X1 X2 X3 X4 X5 X6 X7 X8

F1

F2 X1

X2 X3 X4 X5 X6 X7 X8

F1

F2

변수를 가장 잘 설명하는 요인의 선택 변수를 가장 잘 설명하는 요인의 선택

변수와 공통요인 관계도

변수와 공통요인 관계도

(10)

예 1> 6 과목 성적 ( 변수 ) 에서 공통요인을 찾는다

• 상관계수 행렬 (correlation Matrix)

국어

(Literature)

영어

(English)

국사

(History)

산수

(Arithmetics )

대수

(Algebra)

기하

(Geometry)

국어 1

영어 .439 1

국사 .410 .351 1

산수 .288 .354 .164 1

대수 .329 .320 .190 .595 1

기하 .248 .329 .181 .470 .464 1

(11)

출력결과

• 고유값이 1 이상인 요인이 2 개 , 이들은 문리적요인과 수리적요인으로 판 단된다 (naming)

변수 요인적재값

F1 F2

Comunali- ties X1( 국어 )

X2( 영어 ) X3( 국사 ) X4( 물리 ) X5( 대수 ) X6( 기하 )

0.23 0.76 0.35 0.66 0.00 0.82 0.83 0.15 0.81 0.18 0.74 0.15

0.63 0.56 0.67 0.72 0.69 0.59 고유값

누적분산

2.73 1.13 45.6%

64.4%

6 개의 변수가

2 개의 요인으로 축소 X1

X2 X3 X4 X5 X6

F2

F1

X1=0.23F1+0.76F2 두 요인에 의해서

설명되는 정보의 양

(12)

요인

적재값의 유도

• 각 변수들을 공통요인으로 되도록 많이 설명하 도록 유도한다 .

• 변수들의 정보양 = 공분산행렬

• 각변수들의 정보양을 표준화

• 즉 , 변수들의 상관행렬을 이용

• 상관행렬의 고유값 (eigen value) 과 고유벡터 (eigen vector)

• 고유값은 공통요인의 변수를 설명하는 양

• 고유벡터는 요인적재값의 추정값

(13)

How much information a variable have?

�= ( 1

� 121

1

1 2�2

⋯ � ⋯ � 1

12

)

 

정보 =1

각 변수는 1 의 정보 의 양을 갖고 있다

X 변수의 정보의 양 =1 F 요인의 정보의 양 > 1 F1 요인의 정보의 양 =

 

F2 요인의 정보의 양 =

 

(14)

몇 개의

요인을 선택하는가

• 고유값은 각 요인이 설명하는 정보의 양

• 예 : 변수는 5 개 , 요인이 F1,F2,F3 일 때

• 각 요인의 고유값이 각각 2, 1.5, 0.8 라면

• 3 개 요인에 의해 설명되는 정보의 양은 (2+1.5+0.8)/5=86%

• 즉 5 개의 변수가 갖고있는 정보의 86% 를 세 개 의 요인에 의해 설명할 수 있다

• 각 요인이 설명하는 비율은 40%, 30%,16% 라 할 수 있다 .

• 그런데 원래 한 변수의 정보의 양이 1 인데 1 미 만의 정보를 갖는 요인을 사용하는건 불합리

• 즉 고유값이 1 이상인 요인만 선택한다 .

(15)

출력결과

2 개의 요 인 선택

요인회전

(16)

예 2> 라면 선택시 중요하게 생각하는 요인

• 고려하는 변수 (Variables)

• 맛

• 향

• 적당한 양

• 충분한 영양

• 적절한 가격

• 유명한 브랜드

• 새로운 제품

• 주변사람들의 추천

F1, F2, F3 ???

(17)
(18)
(19)

Nam-

ing?

(20)

F1 F2

X1

X2 X3

X4 X5

F1*

F2*

X1

X2 X3

X4 X5 베리맥스회전

직교회전 ? 참고 :

• 해석이 용이하도록 회전

• 두개의 요인이 서로 독립적이

라는 가정은 유지

(21)

• Check 1

문항수와 표본수

• 한 요인에 최소 5 개의 변수가 포함되도록 설계한다

• 최소 표본수는 50 개 이상인데 변수수의 5 배 표본수가 필요한데 일반적으로는 변수수의 10 배가 권장 된다

• Check 2

요인분석 가정 만족하는지 검정

• 요인이 존재한다고 볼 수 있는지를 검정

• 바틀렛의 구형성 검정 (Bartlett’s Sphericity test) : 상관계수행렬이 단위행렬인가를 검정하므로 ( 단위 행렬이면 변수들간의 상관관계 없음 ) p<0.05 이어야 함

• Kaiser-Meyer-Olkin (KMO) Test : Measure of sampling adequacy 는 전체분산 ( 정보 ) 중에 요인이 갖는 분산의 비율이므로 0.5 이상이 되어야함 . 표본수 , 변수수 , 상관계수의 평균에 따라 증가함

Exploratory Factor analysis (EFA) summary

0: �=

(

10⋮ ⋮ ⋱ ⋮0 010⋯ 100

)

 

(22)

• Check 3

인자의 수 결정

• 고유값이 1 이상인 요인만 선택

• 사전연구에 의해 결정된 인자의 수로 결정

• 누적 분산 ( 설명 ) 양이 60% 이상이 되도록 선택

• Scree 도표에 의해 고유값이 완만하게 감소하기 직전 요인까지 선택 ( 참고 1)

• Check 4

요인회전방법의 결정 ( 참고 2)

• 직교회전법 : 가장 널리 사용되는 방법 , 변수수를 줄이거나 차후에 결과를 다른 분석에 사용하고자 할 때

• 사각회전법 : 요인간 종속이 현실적이므로 이론적으로 의미 있는 요인을 선택하고자 할 때

• Check 5

적재값의 유도 ( 참고 3)

• 주성분방법 (principal component method) 보다는 주축요인방법 (principal axis factoring) 을 더 추천

• 주성분은 자료의 100% 분산을 요인이 가져간다는 가정으로 유도 (BUT, 커뮤날리티가 70% 내외 )

Exploratory Factor analysis (EFA) summary

(23)

• Check 6

요인 적재값의 해석

• 높은 적재값이 한 요인에만 걸려있어야함 (± 0.5 이상 , 최소 ± 0.3)

• 두 요인에 높은 적재값을 가지면 그 변수는 지우도록 함

• 커뮤날리티가 50% 이상인 변수만 남김 , 누적 분산 ( 설명 ) 양이 60% 이상

• Check 7

요인의 추정값으로 합산척도의 사용

• 크론바흐 알파가 0.7 이상 ( 또는 0.6)

• 수렴타당도와 판별타당도를 평가

• 위 값을 만족할 때 요인이 포함된 변수들의 합으로 요인을 대체할 수 있다

• 한 변수만으로 대체하거나 요인점수를 사용하는 것의 절충안으로 확장성이 좋음

Exploratory Factor analysis (EFA) summary

(24)

참고 1: SCREE TEST CRITERION 에 의한 요인수 결정

참고 1: SCREE TEST CRITERION 에 의한 요인수 결정

• 일반적인 요인수 결정방법은 고 유값이 1 이상인 경우만 선택

• 스크리 검정법은 고유값의 감소 형태로 결정

• 요인수에 따라 고유값은 감소하 는데 어느 순간부터 감소하는 기 울기가 완만해지면 그 전의 요인 수까지 선택

• 우측의 그림에서 고유값 1 기준 으로는 2 개의 요인이 선택

• 스크리 기준으로는 4 번째부터 고유값의 변화가 거의 없으므로

요인수는 3 으로 선택 요인수

1 2 3 4 5 6 7

1 2 3 4

스크리 도표

(25)

참고 2: 직교회전 ? 사각회전 ? 참고 2: 직교회전 ? 사각회전 ?

OBLIQUE ROTATION METHODS (

사각회전 )

직교회전은 요인들 간의 독립성을 가정하나 사각회전은 요인들 간의 연관성을 가정한다 . SPSS 는 OBLIMIN 과 PRO- MAX 방법을 제공한다 . 직교회전에 비해 요인 간의 관계를 가정할 수 있다면 이 방법을 고려하는 것이 좋다 . PROMAX 방법은 먼저 직교회전을 한 뒤 요인 간의 상관관계를 고려해주는 절충형 방법이다 . 해석이 더 용이하며 Maximum Likelihood 추정방법과 결과가 유사하며 요인 간 상관계수를 구할 수 있다는 장점이 있다

F1*

F2*

X1 X2 X3

XX45 X6

Varimax

F1**

F2**

X1 X2 X3

XX45 X6

Promax

(26)

참고

• 앞선 방법은 EFA

• EFA 는 SPSS 에서 실행

• 새로운 요인을 추출하고 할 때 사용

• 다음 예제는 CFA

• CFA 는 AMOS 에서 실행

• 이론으로 정해진 모형이 적절한지 확인할 때 사용

(27)

요인분석 (factor analysis) 의 종류 요인분석 (factor analysis) 의 종류

- 탐색적요인분석 (EFA: Exploratory Factor Analy- sis)

• 새로운 요인을 추출하고 할 때 사용

• EFA 는 SPSS 에서 실행

- 탐색적요인분석 (EFA: Exploratory Factor Analy- sis)

• 새로운 요인을 추출하고 할 때 사용

• EFA 는 SPSS 에서 실행

- 확인적요인분석 (CFA: Confirmatory Factor Analy- sis)

• 이론으로 정해진 모형이 적절한지 확인할 때 사용

• CFA 는 AMOS 에서 실행

- 확인적요인분석 (CFA: Confirmatory Factor Analy- sis)

• 이론으로 정해진 모형이 적절한지 확인할 때 사용

• CFA 는 AMOS 에서 실행 X1

X2 X3 X4 X5 X6 X7 X8 X9

F1 F2 F3

F1 F2 F3

X1 X2 X3 X4 X5 X6 X7 X8 X9

(28)
(29)

Example

사용하기 쉽기 때문에 가지고 다닐 수 있으니까

사용법을 배우기 쉽기에 사용법을 빨리 배웠기에 시간을 절약 해 주니까 효율성을 증진시켜 주니까

유용하기 때문에 사람들에게 질투심 사용해야한다고 생각 비슷한 사람들이 사용

사용 할 것으로 기대

편리성 Perceived Ease of Use

유용성 Perceived Usefulness

Social Rela-관계성 tionship

(30)

Measurements 평균 표준편차

A-1. 스마트폰 앱은 사용하기 쉽기 때문에 3.59 1.019

A-2. 가지고 다닐 수 있으니까 4.11 0.880

A-3. 스마트폰 앱 사용법을 배우는 게 나에게 쉽기 때문에 3.54 1.022 A-4. 나는 스마트폰 앱 사용법을 빨리 배웠기 때문에 3.41 1.026 B-1. 스마트폰 앱을 사용하는 것이 나의 시간을 절약해 주니까 3.51 1.036 B-2. 스마트폰 앱 사용은 나의 효율성을 증진시켜주니까 3.78 1.027

B-3. 스마트폰 앱은 나에게 유용하기 때문에 3.93 0.921

C-1. 그것을 가진 사람들에게 질투심이 드니까 1.95 1.019

C-2. 내게 중요한 사람들이 내가 스마트폰 앱을 사용해야 한다고 생각하니까 2.17 1.091 C-3. 나와 비슷한 사람들이 그것을 사용할 것 같아서 2.35 1.113 C-4. 내가 존경하는 사람들이 내가 그것을 사용할 것으로 기대하니까 2.04 1.029

11 개의 변수가 3 개의 요인이 되기를 기대함

(31)

회전된 성분행렬 a

성분

1 2

A-3. 스마트폰 앱 사용법을 배우는 게 나에게 쉽기 때문에 0.847 0.102

B-3. 스마트폰 앱은 나에게 유용하기 때문에 0.803 0.033

B-2. 스마트폰 앱 사용은 나의 효율성을 증진시켜주니까 0.786 0.073 B-1. 스마트폰 앱을 사용하는 것이 나의 시간을 절약해 주니까 0.785 0.171 A-4. 나는 스마트폰 앱 사용법을 빨리 배웠기 때문에 0.782 0.189

A-1. 스마트폰 앱은 사용하기 쉽기 때문에 0.768 0.254

A-2. 가지고 다닐 수 있으니까 0.763 0.078

C-2. 내게 중요한 사람들이 내가 스마트폰 앱을 사용해야 한다고 생각하 니까

0.141 0.903 C-4. 내가 존경하는 사람들이 내가 그것을 사용할 것으로 기대하니까 0.079 0.894

C-1. 그것을 가진 사람들에게 질투심이 드니까 0.120 0.866

C-3. 나와 비슷한 사람들이 그것을 사용할 것 같아서 0.196 0.842

그러나2 개의 요인만 추출됨

EFA: Exploratory Factor Analysis by SPSS

(32)

방법 1: 요인수 지정

(33)

회전된 성분행렬 a

성분

1 2 3

C-2. 내게 중요한 사람들이 내가 스마트폰 앱을 사용해야 한다고 생각하니까 0.901 0.139 0.069 C-4. 내가 존경하는 사람들이 내가 그것을 사용할 것으로 기대하니까 0.895 0.064 0.060

C-1. 그것을 가진 사람들에게 질투심이 드니까 0.860 0.166 0.006

C-3. 나와 비슷한 사람들이 그것을 사용할 것 같아서 0.846 0.106 0.189 A-4. 나는 스마트폰 앱 사용법을 빨리 배웠기 때문에 0.160 0.851 0.219 A-3. 스마트폰 앱 사용법을 배우는 게 나에게 쉽기 때문에 0.078 0.822 0.349

A-1. 스마트폰 앱은 사용하기 쉽기 때문에 0.230 0.787 0.272

A-2. 가지고 다닐 수 있으니까 0.063 0.666 0.400

B-2. 스마트폰 앱 사용은 나의 효율성을 증진시켜주니까 0.090 0.282 0.871

B-3. 스마트폰 앱은 나에게 유용하기 때문에 0.044 0.368 0.798

B-1. 스마트폰 앱을 사용하는 것이 나의 시간을 절약해 주니까 0.176 0.432 0.700

다행히 원하던 3 개의 요인이 추출됨 . 그러나 이는 흔하지 않은 경우

(34)

CFA: Confirmatory Factor Analysis by AMOS

사용하기 쉽기 때문에 가지고 다닐 수 있으니까

사용법을 배우기 쉽기에 사용법을 빨리 배웠기에 시간을 절약 해 주니까 효율성을 증진시켜 주니까

유용하기 때문에 사람들에게 질투심 사용해야한다고 생각 비슷한 사람들이 사용

사용 할 것으로 기대

편리성 Perceived Ease of Use

Perceived 유용성 Usefulness

Social Rela-관계성 tionship

(35)

참고 >

• This table shows two tests that indicate the suitability of your data for structure detection. The

Kaiser-Meyer-Olkin Measure of Sampling Adequacy is a statistic that indicates the proport

ion of variance in your variables that might be caused by underlying factors. High values (clos e to 1.0) generally indicate that a factor analysis may be useful with your data. If the value is l ess than 0.50, the results of the factor analysis probably won't be very useful.

• Bartlett's test of sphericity tests the hypothesis that your correlation matrix is an identity mat rix, which would indicate that your variables are unrelated and therefore unsuitable for structu re detection. Small values (less than 0.05) of the significance level indicate that a factor analys is may be useful with your data.

(36)

참고 > 신뢰도

• Cronbach's alpha is the

most common measure o

f internal consistency ("r

eliability"). It is most co

mmonly used when you

have multiple Likert que

stions in a survey/questi

onnaire that form a scale

and you wish to determi

ne if the scale is reliable.

(37)

참조

관련 문서

· 작물이 건강하면 해충피해를 덜 받지만 해충이 한번 생기기 시작하면 아주 빨리 퍼지기 때문에 빨리 응급조치를 해주어야 한다..

∙크리프 현상은 콘크리트가 압축을 받으면 압축응력을 전달하는 겔입자 사이의 흡착수층 이 얇게 되려는 현상 때문에 생기며, 처음에는 이러한 흡착수층 두께의 변화가

- 인자 모형은 관찰값들을 인자들로 표현한 것이며, 이와는 반대로 인자를 관찰값들로 표현한 것을 인 자점수라 한다

◈ 제품에 대한 생산자의 책임을 구매 이후단계까지 확장하는 환경 정책적 접근으로 정의되는 생산자책임재활용제도(Extended Producer Responsibility, EPR)는

The correct typing results for the DNA samples are listed in Table 1 for all STR loci in the Powerplex 16 multiplexes.(Table 1.) The multiplex typing results based on the

T : 솔방울 단면을 관찰하기 위해 공작기기를 사용법을 익히고 직접 절단하 는 과정과 학교에 비치된 고급기자재(SEM, GCMS)를 활용하여 표면 관찰, 실편의 겉면과 속면의

동남아 지역에서 고수풀이 필수 향신료로 사용되는 것은 온화한 기후 때문에 기승을 부리는 모기 등 해충을 쫓는 데 유용하기 때문이라고 한다.. 수정과를 만드는

이들 설문지는 SPSS 통계패키지를 이용하여 통계분석을 하였는데, 분석방법은 빈도분석(frequency analysis)을 비롯하여 요인 분석(factor