• 검색 결과가 없습니다.

데이터 마이닝을 이용한 인지기능저하 예측모형 개발

1.모형 비교

본 연구의 인지기능저하 예측 모형의 최적의 모형을 얻기 위해서는 여러 모형을 비교·평가해야 하고,이를 통해 하나의 모형이 선택되면 선택된 모형이 다른 모형에 비해 우수함을 입증해야 한다.또한 선택된 최적의 모형이 같은 모 집단 내의 다른 데이터에 적용하는 경우 얼마나 안정적인 결과를 제공하는가에 대한 일반화의 가능성에 대한 고찰이 필요하다.

가.LiftChart,%Response,%capturedResponse

본 연구의 모형 평가를 위한 지표는 LiftChart,%Response,%captured Response의 지표를 이용하여 모형을 평가하였다.이 지표들은 모형을 평가하기 좋은 도표로 전체 데이터를 10%씩 활성화 확률 또는 점수값으로 제시하고 있다.

Lift값은 모델을 적용했을 경우와 모델을 적용하지 않았을 경우의 대비 효 과를 의미하는 비율이라고 할 수 있겠다.이는 십분위분석표에서 상위 분위 등급 에서의 Lift가 매우 크고 하위 분위 등급으로 갈수록 Lift가 급격히 감소하면 이 는 모형의 예측력이 적절하다는 것을 나타내며,만약 십분위 등급에 관계없이 Lift에 별 차이가 없게 되면 이는 모형의 예측력이 적절하지 않다는 것을 나타낸 다.

%Response은 각 분위 등급 내에서 범주 1(인지기능저하인 대상자)의 빈도 와 등급 내 관찰치의 빈도의 비를 나타내므로,이는 목표변수 내에서 범주 1(인 지기능저하인 대상자)의 점유율을 각 분위 등급에 대해 구한 값이라고 해석할 수 있다.

%CapturedResponse값은 예측모형 도입 시 얻을 수 있는 효과로,모델이 제시한 인지기능저하 대상자가 실제 추가적으로 인지기능저하인 대상자를 포함 하는 비율이라고 할 수 있다.

본 연구의 모델링 데이터 세트(Modeling dataset)의 모형 평가의 결과는 Table 7과 같다.의사결정나무분석의 경우 인지기능저하의 위험이 높은 상위 10% 분위에 등급을 관리할 경우 무작위로 대상자를 선정하여 관리하는 것보다 약 6.5배 높은 인지기능예측 효과를 보이며,인지기능저하의 위험이 높은 상위 10%의 대상자들이 인지기능저하로 감소하는 것을 감소하지 못하도록하는 것이 전체 대상자의 약 64.6%의 대상자들이 인지기능저하를 감소하는 효과를 본다고 할 수 있다.회귀분석의 경우 인지기능저하의 위험이 높은 상위 10% 분위에 등 급을 관리할 경우 무작위로 대상자를 선정하여 관리하는 것보다 약 5.1배 높은 인지기능예측 효과를 보이며,인지기능저하의 위험이 높은 상위 10%의 대상자들 이 인지기능저하로 감소하는 것을 감소하지 못하도록하는 것이 전체 대상자의 약 50.8%의 대상자들이 인지기능저하를 감소하는 효과를 본다고 할 수 있다.

Regression DecisionTree

Lift RR CCR Lift RR CCR

10% 5.1 37.8 50.8 6.5 48.1 64.6 20% 1.7 12.6 67.8 2.2 16.3 86.6 30% 1.4 10.1 81.4 1.1 8.5 98.0 40% 0.7 5.0 88.1 0.2 1.5 100.0 50% 0.2 1.3 89.8 0.0 0.0 100.0

*RR:ResponseRate,CCR:CumulativeCapturedResponseRate

Table7.Evaluation ofthemodeling dataset

(%)

나.ROC(ReceiverOperation Characteristic)Curve

Fig.13.ROC Curveofthemodeling dataset

Regression DecisionTree

Modeling 82.8 92.0

Table8.Evaluation ofAreaundertheROC curve(AUC)

(%)

EvaluationCriteria TrainingDataset Lift DecisionTree>Regression CCR DecisionTree>Regression RR DecisionTree>Regression AUC DecisionTree>Regression

*RR:ResponseRate,CCR:CumulativeCapturedResponseRate,AUC:AreaundertheROC curve

Table9.Comparison oftheprediction models

2.모형 선정

가.최종 모형 선정

본 연구의 인지기능저하 예측모형을 위해 데이터 마이닝의 회귀분석, 의 사결정나무분석 중 최적의 모형을 선정을 위한 결과는 Table9와 같다.

우선 AUC(AreaundertheROC curve)의 결과는 의사결정나무분석방법이 가장 최적의 모형이었다. Lift, CCR(Cumulative Captured Response Rate), RR(ResponseRate)의 결과 또한 의사결정나무분석의 결과가 가장 최적의 모형 이었다.각 평가지표에서 전반적으로 높은 예측력을 보인 의사결정나무분석방법 을 인지기능저하 예측모형을 위한 최적의 모형으로 선정하였다.

나.의사결정나무분석방법을 통한 인지기능저하 예측모형의 분류표

본 연구의 인지기능저하의 실제 범주와 모형에 의해 예측된 분류범주 사이 의 관계를 나타내는 분류표는 Table10과 같다.

분류표의 결과는 절단값별 모델링 예측값,정분류율(CorrectClassification Rate),오분류율(Misclassification Rate),양성 예측도(Positivepredictivevalue), 음성 예측도(Negativepredictivevalue)를 보여주고 있다.절단값을 0.2점으로 한 경우 정분류율은 실제 인지기능저하인 값을 인지기능으로 분리 하거나 정상을 정상으로 분리하는 모형의 능력을 의미하며 이는 90.8%,오분류율은 실제로는 인지기능저하인 대상자를 정상으로 정상인 대상자를 인지기능저하로 잘못 예측 하는 모형의 능력을 의미하며 이는 9.2%이다.민감도는 인지기능저하에 이환된 것으로 알려진 사람 중 인지기능저하의 결과일 가능성으로 이는 69.5%이다.특 이도는 인지기능저하가 없는 것으로 알려진 대상자에서 인지기능저하일 않을 가 능성으로 이는 92.5%이다.양성 예측도는 인지기능저하로 예측된 대상자 중 실 제 인지기능저하인 대상자일 가능성은 42.7%이다.또한 음성 예측도는 인지기능 저하로 예측 되지 않은 대상자 중 실제 인지기능저하가 아닐 가능성은 97.4%이 다.절단값이 0.2점인 경우가 가장 최적의 모형 적합지를 보이고 있다.

Cutoff

Fig.14.Cognitivedeclineprediction model:decision treeanalysis

다.의사결정나무분석의 결과

본 연구의 의사결정나무분석의 결과는 Fig.14.와 같다.전체 데이터 중 인 지기능저하의 대상자는 7.4%였다.노드의 끝마디가 9개인 나무 구조이다.의사결 정나무분석의 분류규칙을 보면 기저선의 인지기능,가족 수,신체활동,일년전에 비해 주관적 기억력,성별이 중요한 변수로 보였다.

의사결정나무분석의 분류결과의 규칙을 정리하면 다음과 같이 9개의 규칙 으로 정리된다.

1)기저선의 인지기능 점수가 20.5점 이상인 대상자에서 인지기능저하일 확 률이 1.7%로 전체 대상자의 인지기능저하의 확률 7.4%보다 낮게 측정되었다.

2)기저선의 인지기능점수가 17.5점 이상이고 20.5점 미만인 대상자에서 2.5 명 미만의 가족과 살고 있는 대상자들에서 인지기능 저하의 확률이 3.2%로 낮아

지는 경향을 보였다.

3.Testdataset을 이용한 예측력 Table11.Homogeneity analysisbetween modeling andtestdatasets

(N(%)orM±SD)

나.인지기능저하 예측모형을 적용한 개별 인지기능저하 예측 점수

정규 교육을 받은 대상자와 정규 교육을 받지 않은 대상자로 구분한 결과는 Fig.

18과 같다.정규 교육을 받지 않은 대상자의 모형에 의한 인지기능저하율이 0∼

20%인 대상자의 9.9%가 실제 인지기능저하를 보였으며,51%이상인 대상자의 46.6%가 실제 인지기능저하를 보였으며,교육을 받은 대상자의 모형에 의한 인지 기능저하 예측 확률이 0∼20%인 대상자의 5.7%가 실제 인지기능저하를 나타냈으 며,인지기능저하 예측 확률이 51% 이상인 대상자의 32.1%가 실제 인지기능저하 를 보였다.

Fig.15.Cognitivedeclinerate according tocognitivedecline predictedscore

Fig.16.Cognitivedeclinerate according tocognitivedecline predictedscoreby sex

Fig.17.Cognitivedeclinerate according tocognitivedecline predictedscoreby age

Fig.18.Cognitivedeclinerate according tocognitivedecline predictedscoreby education

I V.고찰

본 연구에서 사용된 광주치매‧경도인지장애연구는 지역사회 노인을 대상으 로 경도인지장애 및 치매의 예측인자를 확인하고자 실시한 코호트 연구를 이용 하여 인지기능저하를 정의하고,초기에 인지기능 장애를 가지고 있지 않은 지역 사회 노인의 인지기능저하율을 파악하여 이에 영향을 주는 관련 요인을 예측하 는 인지기능저하 예측 모형을 개발하였다.

관련 문서