• 검색 결과가 없습니다.

다변량 분석(판별분석 및 나무분석) 활용 선행 연구

판별모형(discriminant model)은 경영분야에서 활발하게 활용되어 왔으 며, 대표적인 사례가 기업 부실이나 파산 예측 모형이다. 기업의 재무상태, 거래신뢰도, 일반사항, 신용등급 등 다양한 정보를 종합적으로 고려해 예측 모형을 만드는데 판별분석이 활용된 것이다. 성웅현(2006)은 기술지향적 중 소벤처기업의 기술력평가 정보를 바탕으로 벤처중소기업의 파산예측모형으 로 선형 판별모형과 로지스틱 판별모형을 활용해 파산을 예측할 수 있는 모 형을 제시했다. 모집단에 대하여 다변량 정규분포를 가정하여 분석한 결과에 따르면 선형판별모형이 로지스틱 판별모형보다 예측력이 다소 우월한 것으 로 나타났다. 성웅현(2007)에서도 역시 판별분석을 활용해서 중소기업의 부 실을 예측하는 최적 모형을 연구하였는데, 기술신용보증기금의 기술력 평가 자료를 활용했으며, 평가항목도 자원, 기술성, 시장성, 사업성 등 지표를 확 대했다. 특히 확실범주와 유보범주로 구분할 수 있는 경계값을 설정하여 예 측력을 높이기도 했다.

성웅현 외(2009)는 단순 이분형 판별분석을 떠나 여러 범주에 대한 판별 분석을 활용했는데, 지식재산 투자와 관리가 기업의 무형자산 가치 범주들을

이 연구는 단순 무작위 추출된 90개 기업을 대상으로 매출액 대비 연구개발

정상군으로, 8-15점은 우울군으로 구분하였다. 예측변수(독립변수)는 문헌 고찰을 통해 전체 변수 중 노인의 우울과 관련된 변수들을 선별하였다. 선별 된 변수는 일반적 특성 관련 변수 6개, 가족 및 사회적 관계 관련 변수 4개, 경제 상태 관련 변수 3개, 건강상태 관련 변수 9개, 건강행태 관련 변수 12 개, 기능상태 관련 변수 9개, 여가 및 사회활동 관련 변수 3개, 노후생활 및 삶의 질 관련 변수 3개, 생활환경 관련 변수 4개로 총 53개의 변수가 초기 입력변수(initial input variables)로 선택되었다(박명화 외 2013). 분석은 SPSS Clementine 12.0 프로그램(현 모델러)을 활용했다. 분석 결과는 <그 림 5>와 같았으며, 삶의 만족도가 가장 큰 영향을 주고 있었다.

자료: 박명화 외 2013

<그림 5> 의사결정나무 분석법을 활용한 우울 노인의 특성 분석 사례

의사결정나무 분석은 다른 분석과 같이 활용되는 경우도 많은데, 조광현 외(2011)는 의사결정나무 생성 시, 입력 변수에 대한 매개 관계를 파악하여 나무 생성에 불필요한 입력 변수를 제거하는 방법을 제시하고 그 효율성을 파악하기 위하여 실제 자료에 적용하기도 했다. 연구 결과에 따르면 논문에 서 제시하는 다중매개연관성규칙을 이용한 의사결정나무모형 생성의 방법이

모형의 정확도는 거의 동일(실제로는 다소 감소)하면서 불필요한 가지를 생 성하지 않으므로 효율적이라고 할 수 있다고 주장했다. 또한 김수진 외 (2013)는 로지스틱 회귀분석과 의사결정나무 분석을 동시에 활용하여 대도 시 주민의 우울에 영향을 주는 요인을 예측하고 비교하는 연구를 진행했다.

연구대상은 462명이었으며, 통계 프로그램은 SPSS 18.0을 활용했다. 연구 결과, 로지스틱 회귀분석과 의사결정나무 분석에서 공통적으로 나타난 우울 예측요인은 사회부적응, 주관적 신체증상 및 가족 지지이었으며, 전체 분류 정확도는 로지스틱 회귀분석은 82.0%, 의사결정나무 분석은 80.5%이었다.

저자들은 연구 결과 민감성과 분류 정확도와 더 높게 나타난 로지스틱 회귀 분석 방법이 지역 주민의 우울 예측 모형을 구축하는데 더 유용한 자료로 사용될 수 있으리라 주장했다.

이와 같이 의사결정나무 분석은 데이터마이닝 기법 중의 하나인 의사결정 나무 분석법은 각 자료 내에 존재하는 관계와 규칙을 탐색하고 찾아내어 모 형화하는 분석기법으로, 선형성(linearity), 정규성(normality) 및 등분산성 (equal variance) 가정 등이 필요 없는 비모수적인 방법이다(Choi et al., 2002). 또한 의사결정나무 분석법은 분류와 예측을 위한 효과적인 방법으로 분석대상을 몇 개의 소집단으로 분류하는 규칙을 나무구조로 만들어 이를 새로운 대상에 적용함으로써 해당 특성을 예측하는 분석 방법으로 이해하기 쉬운 규칙을 생성시켜 주고 예측이 쉬워 보건의료관련 데이터의 분석에 유 용 한 도구로 사용되고 있다(Bae et al., 2004, 박명화 외 2013).

제 4 장 다변량 분석을 통한 영향 요인 도출