잠재계층분석방법론 - 제 4 장 분석방법 - 복지인식 유형화 및 영향요인 분석

제 4 장 분석방법

3. 잠재계층분석방법론

50 복지인식 유형화 및 영향요인 분석

제4장 분석방법 51

probability)을 추정할 수 있다.

  _ _ _  

  





__    _ _

__    _ _

………… (4.3)

이때 _는 관측된 데이터로 잠재집단을 구분하는데 활용되는 변수를 의미한다. 본 연구에서는 정부의 사회정책의 8가지 부문에 대한 설문 문 항을 이용하여 잠재집단을 구분하기 때문에, 8가지 지표를 포함하는 벡 터를 의미한다. _는 잠재집단이 구분되는데 영향을 주는 공변량 (Covariates)들을 포함하는 벡터를 의미한다. 본 연구에서는 나이, 성별, 거주지여 등 인구사회학적 요인, 건강상태, 만성질환 여부 등 건강관련 요인, 정부의 지원 서비스 이용 경험 등의 설명변수들을 의미하고 있다.

_은 잠재집단 r에 속한다는 조건하에 계산된 조건부 확률이다. 사후확률 (Posterior probability)은 베이즈 공식에 따라 사전확률과 조건부 확률 의 곱으로 계산할 수 있다. 잠재집단분석에서는 일반적으로 EM 알고리즘 (Expectation-Maximization Algorithm)을 이용한 최대우도법 (Maximum likelihood estimation) 이용하여 모수를 추정한다. 이러한 추정법을 이용할 때에는 몇 가지 주의해야할 사항이 있다. 초기값을 주고 업데이트 하는 과정을 반복하는 방법에서는 초기값에 따라 우도함수의 최대값(Global maximum of likelihood function)을 찾지 못하고 국 부해(Local maximum)로 수렴할 가능성이 있다. 즉, 알고리즘 시작 시 사전확률에 대한 초기값을 어떻게 주느냐에 따라서 최적해를 찾을 수 있 을지, 없을지가 결정된다는 의미이다. 따라서 안정적인 최적 모형추정을 위해서는 초기값을 바꿔가며 반복적으로 추정해야 한다. 다양한 초기값

52 복지인식 유형화 및 영향요인 분석

을 적용해가며 최적의 추정치를 찾는 최적의 초기값을 찾을 수 있다. 본 연구에서는 Uebersax(2000)를 참고하여 1,000개의 초기값 세트를 넣었 다. 또한 수렴기준도 1×10^-10로 설정하여 일반적인 수렴기준(1×10^-7)보 다 엄격하게 적용하여 분석하였다.

이러한 추정 과정 이전에 잠재집단 분석 시 가장 먼저 결정해는 하는 것은 잠재집단의 수를 결정하는 것이다. 잠재집단의 수를 결정하는 통계 적 기준으로는 잠재집단의 수를 증가시키면서 비교하는 우도비 카이제곱 검정법, 모형의 적합도와 추정된 모수의 수를 고려하는 AIC(Akaike Information criterion), BIC(Bayesian Information criterion) 등 정보지수 비교법, 분류된 집단의 질을 평가하는 엔트로피지수(Entropy) 방법 등이 있다. 본 분석에서는 보편적으로 많이 사용되는 정보지수 비교 법을 이용하여 최적 잠재집단의 수를 결정하였다(Nylund, K. L., Asparouhov, T., & Muthén, B. O., 2007). AIC와 BIC의 기본적인 아 이디어는 우도(Likelihood)를 가장 크게 하는 동시에 변수의 수는 최소 한으로 하는 최적의 모델을 찾는 것이다.

     

     log

-2는 모형의 적합도를 의미한다. 는 모형내에서 추정 해야하는 파라미터의 수를 나타낸다. 일반적으로 변수의 수를 늘리면 적 합도는 향상된다. 불필요한 변수의 추가를 막기 위하여 변수의 수가 증가 할수록 패널티를 적용하여 모델의 품질을 평가하는 것이다. 패널티를 적 용하는 방법이 AIC의 경우 , BIC의 경우 log 이다. 패널티가 일정 하다면 우도값이 커질수록 좋은 모형이라고 할 수 있다. 즉 변수를 추가

제4장 분석방법 53

하더라도 AIC 및 BIC 값이 작아진다면 변수를 추가하는 모형이 더 적절 하다고 판단 할 수 있다. 추가적으로 BIC가 AIC 보다 좀 더 보수적인 기 준이라고 할 수 있다. BIC의 패널티 항에 관측치의 수가 반영되어 변수의 하나의 증가가 모형 전체의 적합도에 미치는 영향이 AIC 비해 상대적으 로 크다고 할 수 있다. 잠재집단의 수를 1개부터 하나씩 늘려가며 잠재계 층분석을 수행하고, AIC 및 BIC를 계산하여 비교하였다. 잠재 집단의 수 가 증가함에 따라 점차 AIC와 BIC가 낮아져 점차 모형의 설명력이 증가 한다. 그러나 일정 잠재집단의 개수가 넘어서는 순간 AIC와 BIC가 다시 높아지거나 더 이상의 설명력 개선이 나타나지 않는 지점이 나타난다. 이 때의 잠재집단의 개수를 최적 잠재집단의 수로 간주할 수 있다.

문서에서 복지인식 유형화 및 영향요인 분석 (페이지 58-61)