요인분석 - 신뢰도 분석 및 요인분석

5.1 신뢰도 분석 및 요인분석

5.1.2 요인분석

요인분석은 변수들의 상호 관련성을 소수의 요인(factor)으로 추출하여 전체변수들의 공통요인을 찾아내 각 변수가 받는 영향의 정도와 그 집단의 특성을 규명하는 통계분 석방법이다. 즉, 실제 결과를 초래하게 되는 요인을 찾아냄으로써 목표로 하는 명제를 설명하는 다변량 통계분석방법이다.

요인분석의 목적은 여러 개의 변수들에 내제된 정보를 이용하여 보다 적은 수의 요 인으로 압축, 요약하는 데 있다. 일반적인 요인분석의 목적은 다음과 같다. 첫째, 변수 들을 축소한다. 여러 개의 관련 있는 변수들이 하나의 요인으로 묶임으로써 많은 변수 들이 적은 수의 요인으로 줄어들게 된다. 둘째, 불필요한 변수들을 제거한다. 요인에 포함되지 않거나 포함되더라도 중요도가 낮은 변수를 찾을 수 있으므로 불필요한 변수 가 제거된다. 셋째, 변수들의 특성을 파악한다. 관련된 변수들이 묶여 요인을 이루고 이들 요인들은 상호 독립적인 특성을 가지게 되므로 변수들의 특성을 알 수 있다. 넷 째, 측정항목의 타당성(validity)을 평가할 수 있다. 하나의 특성을 측정하기 위해 관측 된 변수들은 하나의 요인으로 묶여진다. 따라서, 이와 같은 특성을 이용하여 묶이지 않 은 변수는 다른 특성을 가진다고 판단한다. 이것으로 그 특성의 측정항목이 타당한가 를 평가할 수 있다.

요인분석의 절차는, 첫째, 모든 변수들 사이의 상관행렬을 구하고, 둘째, 회전하지 않 은 각각의 요인을 추출한다. 셋째, 보다 나은 해석을 위해 요인들을 회전시키고, 넷째, 회전된 요인과 관계있는 요인 부하량이 큰 변수의 내용에 근거하여 요인에 이름을 부 여한다. 이처럼 요인분석은 잠재적 특성을 측정하기 위하여 검사를 실시하거나 변수를 측정하여 그들 간 상관계수를 구하면 서로 상관계수가 높은 변수들끼리 모여서 작은 수의 변수집단인 요인으로 구분된다. 요인분석은 목적에 따라 탐색적 요인분석 (exploratory factor analysis)과 확인적 요인분석(confirmatory factor analysis)으로 나 눌 수 있다. 탐색적 요인분석은 이제까지 요인과 변수 간의 관계가 이론상으로 확립되 어 있지 않거나 논리적으로 체계화되지 않은 상태에서 주로 사용하며, 확인적 요인분 석은 변인들 간의 기존 관계를 가설로 설정하고 요인분석을 통하여 그 관계를 입증하 는 데 사용한다⁴⁸⁾.

탐색적 요인분석은 이론적인 근거가 없기 때문에 모든 측정변수가 모든 요인으로부

48) 김춘경, 이수연, 이윤주, 정종진, 최웅용, “상담학 사전”. 학지사. 2016

터 영향을 받는다고 가정하고, 이를 바탕으로 어떤 요인과 상관관계가 높은 측정변수 (다른 요인과는 상관관계가 낮아야 함)들을 하나의 요인으로 추출하여 변수를 축약한 다. 그래서 탐색적 요인분석은 이론적 배경이나 선행연구에 근거하기보다는 데이터가 보여주는 결과 자체를 그대로 받아들이게 되므로 이론 생성과정(theory generating procedure)에 가깝고, 데이터 지향적(data driven)인 성격을 띤다고 할 수 있다⁴⁹⁾⁵⁰⁾.

구조방정식 모형은 논리적인 영향 관계를 고려하여 잠재변수들 사이의 관계인 구조 모형을 잘 설정해야 한다. 구조 모형을 설정하기에 앞서 잠재변수들을 설정해야 한다.

Hair et al. (2006)에 따르면, 잠재변수는 이전 연구의 이론을 바탕으로 설정하거나 요 인의 구조를 가정하지 않은 탐색적 요인분석을 통해 설정함을 알 수 있다. 본 연구에 서는 건물의 속성에 관한 외생잠재변수를 탐색적 요인분석을 통해 설정했으며, SPSS 24를 사용하여 진행되었다.

SPSS 24에서는 가장 먼저 요인분석의 모형에 대한 적합도 검정 결과인 KMO(Kaiser-Meyer-Olkin)의 MSA(Measure of Sampling Adequacy)와 Bartlett의 구 형성 검정 결과가 제시된다. KMO의 MSA는 변수들 간의 편상관계수가 얼마나 작은 지를 확인하는 방법이며, KMO의 해석기준은 일반적으로 0.5 이상이면 수용할 수 있으 며, 0.7 이상은 약간 좋음, 0.9 이상은 아주 이상적인 것으로 해석된다.⁵¹⁾ Bartlett의 구 형성 검정은 변수들이 모두 상관관계가 없다는 귀무가설과 하나라도 상관관계가 있다 는 대립가설을 설정하여 대립가설이 채택되는지를 파악하여 확인한다. 이는 변수들 간 의 상관관계가 있음을 확인하여 통계적으로 유의한 경우 요인분석을 시도해 볼 가치가 있음을 나타낸다.

또한, 요인분석의 결과를 제공함에 있어서 요인적재량(factor loading)과 공통성 (communality) 그리고 요인의 고유치 등을 명확하게 효율적으로 정리할 필요가 있다.

공통성은 변수에 포함된 요인들에 의해 설명되는 비율을 의미한다. 일반적으로 공통성 의 값은 0.5 미만이면 모든 변수를 충분히 설명할 수 없음을 의미한다⁵²⁾. 고유값은 변 49) Stapleton, C. D. (1997). Basic concepts and procedures of confirmatory factor analysis.

Paper presented at the annual meeting of the Southwest Educational Research Association, Austin, TX, January, pp.23-25.

50) Van Prooijen, J. -W., and Van der Kloot, W. A. (2001). Confirmatory analysis of exploratively obtained factor structures, Educational and Psychological Measurement, 61(5), pp. 777-791.

51) Kaiser, H. F. (1974). An index of factorial simplicity, Psychometrika, 39(1), pp. 31-36.

52) Enders, C. K., and Bandalos, D. (2001). The relative performance of full information maximum likelihood estimation for missing data in structural equation models, Structural Equation Modeling, 8(3), pp. 460-59.

수의 분산이 어떤 요인에 의해 어느 정도 표현되는지를 나타내주는 비율이며, 먼저 추 출된 요인의 고유값은 항상 다음에 추출되는 요인의 고유값보다 크다. 요인적재량은 요인과 각 변수 간의 상관관계의 정도를 나타낸다. 따라서 각 변수들의 요인적재량이 가장 높은 요인에 속하게 된다. 많은 학자들은 요인적재량의 크기에 대해 0.3-0.7에 이 르기까지 다양한 의견을 제시하였으며⁵³⁾⁵⁴⁾, 본 연구에서는 요인적재량의 기준을 0.5로 설정하였다.

본 연구에서는 가장 많이 사용되는 주성분분석 방법을 사용하여 산출된 고유값과 스 크리도표(scree plot) 결과 등을 참고하여 요인의 수를 정하였다. 이때 고유값 기준은 1 로 설정하였다. 또한, 요인의 해석을 단순화하는 방법으로써 가장 많이 사용되는 베리 멕스(Varimax) 회전방식을 적용하였으며 수렴을 위한 최대 반복 횟수는 SPSS 24의 기본값인 25로 설정하였다. 본 연구의 요인분석 결과는 다음과 같다.

Variables Factor loading of component Cumulative percent of variance explained(%)

1 2 3 4

C5 0.858 -0.064 0.243 0.068

22.235 C6 0.773 -0.014 -0.506 -0.030

C8 -0.606 -0.300 0.058 0.119 C10 -0.595 -0.336 -0.021 0.196 C2 0.081 0.750 -0.086 -0.263

41.036 C7 -0.064 -0.739 0.282 0.069

C4 0.230 0.720 0.224 0.256

C3 0.032 -0.121 0.931 -0.023 54.283 C9 0.062 0.029 0.010 0.865

66.970 C1 0.318 0.174 0.026 -0.567

KMO =.540, Bartlett = 124.177, df(degree of freedom) = 45, p = .000 표 5.2 Initial exploratory factor analysis

요인분석을 실시할 때, 요인이 구성하고 있는 변수들 간의 상관관계가 높아야 한다 는 집중타당도와 이 변수들이 다른 요인과는 상관관계가 낮아야 한다는 판별타당도를 고려해야 한다. 집중타당도의 경우에는 요인적재량이 0.5 미만일 경우 집중타당도가 저

53) Kline, P. (1994). An easy guide to factor analysis. London: Routledge.

54) MacCallum, R. C., Widaman, K., Zhang, S., and Hong, S. (1999). Sample size in factor analysis, Psychological Methods, 4(1), pp. 84-99.

해된다고 판단할 수 있다. 판별타당도의 경우에는 교차요인적재량(cross factor loading)이 0.4 이상일 경우 판별타당도가 저해된다고 판단할 수 있다. 이러한 기준을 만족하지 못하는 변수를 정제하여 새로운 요인을 추출한다⁵⁵⁾. 표 5.2에서 볼 수 있듯 이, 본 연구에서 처음 실시한 요인분석 결과 C6이 교차요인적재량이 –0.506으로 나타 나 판별타당도를 해치는 것으로 나타났다. 따라서 변수 C6을 제거하였다. 본 연구에서 는 이러한 변수정제과정을 한번 더 거쳐 변수 C4를 추가로 제거하여, 총 C6과 C4가 제거되었다.

변수정제과정을 통해 최종적인 요인분석 결과는 다음과 같다. 먼저 표 5..3은 공통성 값을 나타내며 모든 값이 0.5 이상으로 나타나 변수가 요인들에 의해서 잘 설명됨을 알 수 있다. 공통성 값은 주성분분석법에 의해 추출된 요인이 각 변수를 설명하는 비 율이 나타나 있다.

Variables Communality

Initial Extraction

C1 1 0.559

C2 1 0.523

C3 1 0.530

C5 1 0.715

C7 1 0.712

C8 1 0.523

C9 1 0.641

C10 1 0.592

Extraction method : Principal component analysis 표 5.3 Result of communality

55) 강태훈, 조혜영, 오민아 (2013), 교육 연구에서의 탐색적 요인분석 사용 실태에 관한 조사연구, 한 국교육방법학회 교육방법연구, 제 25권 3호, pp. 521-541

표 5.4는 고유값 기준인 1보다 큰 결과만 제시한 것으로, 베리멕스 방법을 적용했을 때 재계산된 설명력(%분산), 누적설명력(%누적분산)을 포함한다. 세 요인의 설명력은 59.931%로 나타났다. 각 외생변수는 각각 23.955%(CG1), 19.995%(CG2), 15.981%(CG3) 의 분산을 설명했다. 건물의 속성에 관한 외생잠재변수는 CG1(Characteristic Group 1), CG2(Characteristic Group 2), CG3(Characteristic Group 3)로 정의했다. 예를 들어, 잠재변수 CG2는 3개의 관측변수인 “shape of building(C7, factor loading = .774)”,

“longitude(C2, factor loading : -.572), “purpose of use(C3, factor loading : .691)”로 구성된다. 요인분석 결과의 적합성 검토 결과, KMO값은 .616으로 수용할 만한 수준이 며, Bartlett의 구형성 검정을 통해 ^^(p)<.05의 기준에 만족하는지 확인하여 변수들 간의 상관관계가 있다고 나타났다.

Variables

Characteristics of the building

(observed variables)

Factor loading

Percent of variance explained

(%)

Cumulative percent of

variance explained

(%)

Components (exogenous

latent variables)

C5 Area of

remodeling -.777

23.955 23.955 Characteristics group 1 C10 Types of facade .730

C8 Shape of roof .687

C7 Shape of

building .774

19.995 43.950 Characteristics group 2 C3 Purpose of use .691

C2 Longitude -.572

C9 Direction of

building -.795

15.981 59.931 Characteristics group 3

C1 Latitude .697

KMO =.616, Bartlett = 59.393, df(degree of freedom) = 28, p = .000 표 5.4 Final exploratory factor analysis

다음으로 나타나는 스크리도표는 앞의 요인별 고유값을 꺾은 선 그래프로 제시한 결 과이다. 붉은선은 고유값 기준인 1을 나타내며, 붉은선을 기준으로 위에 나타나 있는 세 성분이 본 연구의 외생잠재변수에 해당하는 CG1, CG2, CG3를 의미한다. 스크리도 표는 요인 수를 결정하는 시각적 결과물로서, 고유값을 표현한 것에 불과하고, 또한 꺾 이는 정도가 크다 혹은 작다는 판단은 주관적이므로 보조적인 지표로 활용된다(그림 5.1 참고).

그림 5.1 Scree plot

문서에서 저작자표시 (페이지 58-64)