제2절 방법론 - 건강보험 노인의료비의 효율적 관리방안

위의 [그림 4-1~3]이 보여주듯이 의료이용데이터의 도수분포는 대체 적으로 정규분포를 하지 않으며 왼쪽으로 상당히 편향된 분포를 보이고 있다. 특히 “0” 관측값이 상당한 도수를 차지하고 있음을 볼 수 있다.

이러한 경우에는 일반적인 회귀분석모델은 정확한 예측값을 추정할 수 없고, 예측치의 오류를 피할 수 없다.

또한, 외래의 경우는 [그림 4-1]이 보여주듯이 빈번한 0관측값 이후에 도수분포의 편향성이 다소 줄어들고 있다. 한편 [그림 2-2]의 입내원일 수와 [그림 4-3]의 응급의료서비스이용은 분포의 편향성이 0관측값 이후 에 많이 줄어들지는 않고 있다.

이러한 도수분포를 보이는 분석데이터의 독특성을 감안해서 분석하였 다. 먼저 다음과 같이 2-파트 계량모델 (Two-part model)을 이용하여 외래방문일수를 분석하였다.

파트 1: P r   _ __ __ __ _ [1]

파트 2: ^{ln }^^^^{ } __ __ __ __ _ [2]

식 [1]과 식 [2]에서 는 횡단면 식별인덱스로 개인 가구원을 나타낸 다. 는 종속변수로써 외래 의료이용량을 나타낸다. 은 만성질 환개수로 분석모델의 주요 설명변수중 하나이다. ^는 그 외의 모든 설 명변수를 포함하는 벡터(vector)로써 앞에서 설명한 것과 같이 인구 · 사회적 변수인 연령구간 변수, 성별, 혼인상태, 학력 및 의료보장형태, 장애유무, 경제활동유무, 연간 총 가구소득을 포함한다.

은 지역고정효과로써 모델에 포함된 설명변수들 이외의 의료이용량 의 영향을 줄 수 있는 지역고유의 요소들 중 연구대상기간인 2008년과

2009년 사이에 쉽게 변하지 않는 모든 요소들을 통제한다. 16개 지역 중 서울을 제외한 15개 지역변수(부산, 대구, 인천, 광주, 대전, 울산, 경 기, 강원, 충북, 충남, 전북, 전남, 경북, 경남, 제주)를 포함하였다.

또한, 2008년과 2009연간의 의료이용의 차이를 설명해주는 관측되지 않은 요소들을 통제하기 위해서는 관측치가 2009년 값임을 나타내주는 시간고정효과 를 모델에 포함하였다.

2-단계 계량모델의 첫 번째 단계인 식 [1]은 설명변수들이 외래의료서 비스이용에 영향을 주었는지 아닌지의 여부를 평가한다. 설명변수의 예 측값은 반탄력성, 즉 퍼센티지 포인트(percentage point)의 해석을 갖게 된다. 예를 들어 만성질환수의 예측값이 0.10일 경우에 만성질환수가 1 개만큼 증가할 때 의료이용의 확률이 10퍼센티지 포인트만큼 증가한다 고 해석할 수 있다. 식 [1]은 linear probability model(LPM)을 이용하 여 분석하였다.

모델의 두 번째 단계인 식 [2]는 1단계를 조건부로 한 의료이용횟수 또는 빈도를 평가한다. 즉, 개인 노인이 1단계에서 의료이용을 했을 경 우에만 한해서 의료서비스를 이용한 횟수를 추정한다. 파트 2에서도 의 료이용데이터가 왼쪽으로 편향된 분포를 포이고 있어서 로그값을 취하여 정규분포에 가깝도록 유도하였고, ordinary least squares(OLS) 예측값 을 계산하였다. 따라서, 식 [2]의 설명변수의 예측값은 파트 1단계에서 처럼 반탄력성의 의미를 갖는다.

입내원일수의 분석에는 다음과 같은 허들모델(hurdle model)을 이용 하였다.

파트 1: P r   _ __ __ __ __ _ [3]

파트 2:^^^^^{ } exp__ __ __ __ _exp_

[4]

식 [3]은 위의 식 [1]과 동일하며 파트 2의 식 [4]는 negative binomial(NB) 모델이다. 식 [4]에서는 위의 식 [2]에서처럼 반탄력성을 이용해 결과를 해석하였다. NB모델에서는 설명변수들이 외래의료이용횟 수에 미치는 영향을 퍼센트(%) 변화로 계산하였다. 예를 들어, 만성질환 수가 외래의료 이용횟수를 몇 퍼센트만큼 증가(또는 감소)시키는지를 계 산하기 위해서  ×^exp× 의 식을 사용하였다. 의 값은 1 로 정하여서 만성질환수 1개 증가에 따른 외래의료 이용횟수 퍼센트 변 화량의 “한계효과 (marginal effect)”를 계산했다.

적합한 모델의 선정을 위해서는 치밀한 진단이 필요하다. 예를 들어 입내원일수 결정요인을 분석함에 있어서 NB모델을 전체 데이터에 적용 할 수도 있으나 데이터 상에 0관측값이 상당히 많은 점을 감안해야한다.

[그림 4-5]는 입내원일수에 대하여 실제 데이터상의 관측된 값과 NB 모델을 이용한 예측값을 비교하여 보여준다. NB모델이 0관측값을 지나 치게 많이 추정하고 있음을 볼 수 있으며 식 [3]과 [4]를 이용한 허들모 델이 더욱 정확한 예측을 가능하게 하였다.

〔그림 4-5〕입내원일수 데이터 관측값과 NB모델 예측값의 비교

응급의료이용량의 분석에는 다음과 같이 NB모델을 추정하였다.

_ exp__ __ __ __ _exp_ [5]

위의 식 [4]에서처럼  ×^exp× 을 이용하여 만성질환 수가 응급의료이용횟수에 주는 영향을 퍼센티지로 계산하였다.

또한, 가구원 고정효과인 를 다음과 같이 통제하여 추가분석을 하였 다. 아래의 식 [6]-[10]이 보여주듯이 개인이질성 (individual heterogeneity)을 통제하여 모델에 포함되지 않은 노인가구원 고유의 요 소들 중 의료이용행태에 장기적으로 영향을 주는 요인들을 통제함으로 써, 다른 주요 설명변수 예측값을 추정하는데 있어 오류를 줄이고자 시 도하였다.

아래에서처럼 외래의 경우 식 [6]-[7]을 이용하여 고정효과 2단계모델 을 추정하였고, 입원은 식 [8]-[9]처럼 고정효과 허들모델을, 응급 의료

서비스는 고정효과 NB모델인 식 [10]을 추정하였다.

P r   _  __ __ __ __ _ _ [6]

ln    _  __ __ __ __ _ _ [7]

P r   _  __ __ __ __ _ _ [8]

 _ exp__ __ __ __ _ _exp_[9]

_ exp__ __ __ __ _ _exp_ [10]

위의 계량식에서 는 횡단면 식별인덱스로 가구원이며 는 종단면 시 계열 인덱스로 데이터 관측년도(2008또는 2009년)를 나타낸다.

문서에서 건강보험 노인의료비의 효율적 관리방안 (페이지 101-105)