• 검색 결과가 없습니다.

○ 사례분석 과정에서 이상치 정의를 위한 상수는 공통적으로 ̍3 ̍을 적용하였으며, 각 이상치 탐색 방법의 왜도 변화에 따른 이상치 비율의 변화를 비교함

- 대부분의 이상치 탐색 방법들은 대칭분포를 가정하기 때문에 왜도가 0을 벗어나는 분포에서는 하단 이상치를 탐지하지 않음

- 표준화 점수를 활용한 방법은 이상치의 비율이 10%를 넘지 않으며, 다른 이상치 탐 색 방법들에 비해 왜도에 따른 이상치 비율의 변화가 크지 않음

- 수정된 표준화 점수를 활용한 이상치 방법은 분포에 따른 이상치 정의 비율 변화가 크게 나타나 강건한 이상치 탐색 방법으로는 적절하지 않음. 또한, 이상치 비율이 10%를 넘는 경우가 많이 나타나 이상치 탐색 목적이 자료의 안정성인 경우 정보의 손실이 많아 적절하지 않은 방법으로 판단됨

- 사분위수범위, 준사분위수범위를 활용한 이상치 탐색 방법은 유사한 결과를 보이며, 표준화 점수를 활용한 이상치 탐색 방법보다 많은 이상치를 정의함

www.hira.or.kr

43

[그림 15] 이상치 탐색 방법의 왜도에 따른 이상치 비율

○ 각 이상치 탐색 방법을 적용하여 정의된 이상치를 제외하여 이상치 제외 전과 평균 차이를 확인함

- 왜도가 0~1인 질병군 그룹에서 이상치 제외 전·후에 따른 진료비 평균 차이가 가장 적게 나타남

- 왜도가 1을 초과하는 질병군의 경우, 이상치가 많이 제외되는 방법일수록 이상치 제외 전의 진료비 평균과 차이가 크게 나타남

44

건강보험심사평가원 왜도 이상치 제외 전

진료비 평균

이상치 제외 후 진료비 평균 표준화 점수 수정된

표준화 점수 사분위수범위 준사분위수 범위 0~1미만 7,366,315원 7,289,805원 7,230,243원 7,350,942원 7,301,726원 1~2미만 8,967,899원 8,672,269원 8,190,356원 8,786,997원 8,868,488원 2~3미만 7,004,063원 6,638,336원 6,143,489원 6,619,600원 6,726,631원 3~4미만 5,548,872원 5,126,984원 4,648,340원 5,035,707원 5,122,128원 4~5미만 4,525,045원 4,198,016원 3,823,012원 4,082,323원 4,148,721원 5이상 2,450,188원 2,242,610원 1,981,116원 2,147,534원 2,180,912원

<표 13> 이상치 제외 전·후에 따른 이상치 탐색 방법별 진료비 평균

○ 각 이상치 탐색 방법을 적용하여 정의된 이상치를 제외하여 이상치 제외 전과 평균 차이에 대한 통계적 검정(t-test)를 수행함

- 왜도가 커질수록 이상치 제외 전의 진료비 평균과 차이가 나타나는 질병군의 비율이 증가함

- 왜도가 0~1미만인 질병군에서 수정된 표준화 점수를 활용한 방법이 진료비 평균 차이가 나타나는 질병군이 가장 많고, 사분위수범위를 활용한 방법이 가장 적게 나타남 - 사분위수범위와 준사분위수범위를 활용한 방법은 표준화 점수 방법에 비해 많은

이상치를 정의하나 평균 차이를 나타낸 질병군은 표준화 점수 방법과 유사하거나 적음 - 자료의 안정성을 위해 이상치를 탐색하는 경우에는 최소한의 정보 손실로 참값에

가까워지는 방법이 가장 합리적임

- 대칭인 분포에서, 최소한의 이상치 정의로 진료비 평균 차이를 보이는 방법인 표준화 점수를 활용하는 방법이 합리적인 방법으로 판단됨

www.hira.or.kr

45

관련 문서