II. 건강위해행동과 의료비 지출
3. 실증분석
본 연구에 사용한 자료는 건강보험공단에서 제공한 표본코호트 데이터 2011~2013년이다. 동 데이터는 자격, 진료, 건강검진, 요양기관 자료로 구성 되어 있고 2002년부터 2013년까지 공개되어 있다. 본 연구에서 관심 있는 건강위해행동(흡연, 음주, 비만) 변수는 건강검진 DB에서 제시하고 있는데, 검진제도의 개편으로 2009년 문진 항목에 변화가 있었기 때문에 변수의 일 관성을 위해 2009년 검진 자료부터 사용하였다. 그러나 이후 흡연, 음주, 비 만에 기인한 질병의 의료비 지출을 분리할 때, 관련 질병으로 인한 약제비 지출을 연결하는 키코드가 2011년부터만 사용가능하다. 따라서 먼저 2011년 부터 2013년까지 3개년도 데이터를 사용하여 단기 분석을 실시하고, 자료의
제약조건을 최대한 완화하여 2002년부터 2013년까지 12개년도 데이터를 사 용하여 강건성 분석 및 상호작용 분석을 시행하였다.
검진자료에 포함된 표본은 일반건강검진 대상자와 생애전환기 건강검진 대상자로 구성된다. 일반건강검진 대상자는 지역 세대주와 만 40세 이상의 세대원, 직장가입자와 만 40세 이상의 피부양자이며, 검진주기는 2년이다. 다 만 직장가입자 중 비사무직은 매년 검진을 받도록 되어있다. 생애전환기 검 진 대상자는 만 40세와 만 66세 대상자이다. 검진자료는 해당년도 수검자에 대한 1차 일반건강검진 및 생애전환기 건강진단 주요 결과 및 문진응답 자료 로 데이터를 생성한다. 검진자료를 중심으로 자격과 진료 자료를 병합하여, 각 관측치마다 흡연, 음주, 비만 행태뿐만 아니라 연간 진료비 지출, 건강위 해행동이 주요 유발하는 질병의 진료비 지출 등을 추출하여 연계하였다.
구분 2002~2008년 2009~2013년
흡연상태 ○ ○
흡연기간 객관식 문항 ○
주관식 문항 ○
흡연량 객관식 문항 ○
주관식 문항 ○
음주습관 객관식 문항 ○
주관식 문항 ○
음주량 객관식 문항 ○
주관식 문항 ○
신체활동
1회 운동횟수 ○
신체활동
걷기 ○
중등도 ○
격렬한 운동 ○
자료: 국민건강보험공단 빅데이터운영실,“표본코호트DB 사용자 매뉴얼,”p. 21.
<표 Ⅱ-11> 건강보험 표본코호트 데이터의 건강위해행동 변수 변화
우리의 관심 변수는 건강위해행동인 흡연, 음주, 비만에 관한 변수이다.
흡연은 흡연상태(피우지 않는다, 과거에 피웠으나 지금은 끊었다, 현재도 피
운다), 흡연기간(년), 하루 흡연량(개피) 정보를 제공한다. 흡연은 흡연 여부 도 중요하지만 흡연량과 흡연기간도 매우 중요한 정보이기 때문에, 본 장에 서는 생애흡연량을 변수로 사용할 것이다. 음주는 일주일에 음주하는 횟수 (0~7일)와 1회 음주량(잔) 정보를 제공한다. 흡연과 마찬가지로 음주는 음주 여부 혹은 고위험음주 여부보다는 일주일 음주량(음주횟수☓1회 음주량)을 변수로 사용하였다. 비만과 관련해서는 체중과 신장 변수가 있어 BMI를 계 산할 수 있고, 허리둘레 정보도 제공한다. 국제 기준에 따르면 BMI가 25~30 사이일 때는 과체중, 30 이상일 때 비만으로 정의한다. 그러나 한국비만학 회에서는 한국인의 체질을 고려하여 BMI가 23~25에서 과체중, 25 이상에서 비만으로 정의한다. 본문에서는 국제적인 기준에 따라 BMI가 25 이상인 경 우를 과체중 및 비만으로 정의하기로 한다. 실증분석에는 과체중 및 비만 더미 변수(BMI가 25보다 크면 1)를 포함하였다. 그리고 비만과 밀접한 관련 이 있는 신체활동(운동) 정보를 제공하는데, 1주일에 20분 이상 격렬한 운동 을 하는 횟수, 30분 이상 중간강도 운동 횟수, 총 30분 이상 걷기운동 횟수 를 질문하고 있다. 검진자료는 또한 본인의 병력(뇌졸중, 심장병, 고혈압, 당 뇨, 고지혈증, 폐결액, 암 등 기타질환)에 대한 정보와 가족력에 대한 정보 를 포함한다. 여기서 고지혈증이나 당뇨는 비만과 밀접한 관련이 있다.
나. 추정모형
건강위해행동의 의료비 지출에 대한 분석은 세 가지 모형을 사용하여 추 정하였다. 먼저 출발 모형은 OLS 모형(모형 ①)이다. 이때 의료비 지출은 다수의 0의 값을 갖는 skewed distribution을 나타내므로 로그값을 취해 종 속변수로 사용하였다. 그러나 로그를 취한 의료비 지출은 계수의 해석을 위 해 재환산이 필요하고 이분산성의 영향을 배제할 수 없다는 한계가 있으므 로, 이를 극복하기 위해 2단계 모형(2-part model, 2PM)을 사용(모형 ②)하 였다. 2PM 모형의 첫 번째 파트에서는 의료서비스 이용 여부(의료비 지출 발생 여부)를 종속변수로 하는 로짓 모형을 추정하고, 두 번째 파트에서는 의료비 지출이 발생한 관측치만을 대상으로 즉, 의료비 지출이 0보다 큰 값
을 갖는 사람들만을 대상으로 generalized linear regression model을 추정한 다. 이때 통상적으로 의료비 지출은 로그 함수에 감마 링크 형태를 사용한 다. 2PM 모형은 첫 번째 파트와 두 번째 파트의 결정이 독립적이라는 것을 전제로 하는데, 의료비 지출의 경우 병의원 방문 여부를 의미하는 첫 번째 파트는 환자 본인이 결정하는 데 반해, 병원 방문 후 의료 이용량을 의미하 는 두 번째 파트는 의사가 결정하게 되는 principle-agent model을 따르므로 동 가정을 만족시킨다. 마지막으로 모형 ③은 종속변수인 의료비 지출 수준 에 따라 건강위해행동이 의료비 지출에 미치는 영향이 다른지 분석하기 위 해 quantile regression을 사용하였다.
다. 기초통계량
2011~2013년 검진자료의 총관측치는 680,309개인데, 이 중 20세 미만 유 아 및 청소년 관측치(1433개)과 의료급여자(6185개), 저체중(24,913개)을 제 외하고 흡연 등 누락변수가 있는 경우(2845개)를 제외하여 분석에 사용한 관측치 수는 644,936개이다. 분석대상을 20세 이상, 건강보험 가입자, 정상 체중과 비만인 사람으로 한정한 이유는 다음과 같다. 첫째, 흡연과 음주는 법적으로 20세 미만에게 허용되지 않는 항목이기 때문에 유아 및 청소년을 분석대상에서 제외하였다. 둘째, 건강보험과 의료급여 간에 환자부담 비율 이 달라 의료 이용과 의료비 지출 행태가 확연히 다르기 때문에 의료급여자 를 제외하였다. 셋째, 저체중은 비만과 반대로 다른 형태의 질병 유병률이 높고 의료비 지출을 상승시킬 수 있는 여지가 있기 때문에, 비만과 정상체 중의 의료비 지출을 비교하기 위해 저체중은 제외하였다. 이렇게 표본을 구 성하면 매년 약 20만명의 관측치가 있으며 이 중 같은 사람이 3년 내내 포 함되어 있기도 하지만 대부분은 repeated cross section 형태로서 조사 대상 이 매년 달라진다. 2011년부터 2013년까지 3년 내내 매년 포함되는 패널 관 측치는 56,348명이다.
연도별 흡연율, 고위험 음주율, 과체중과 비만율을 살펴보기 위해 흡연자 는 현재 흡연자와 과거 흡연자 비율, 고위험 음주자는 일주일에 2회 이상
남성 7잔, 여성 5잔 이상 음주를 하는 사람의 비율, 비만은 BMI가 25 이상 인 사람의 비율로 정의하였다. 흡연율은 2011년~2013년 24%를 유지하고 있 고, 고위험 음주율은 16~17%이며, 과체중 이상 비만율은 34%를 나타내고 있다.
연도 빈도 비율 현재
흡연율
과거 흡연율
고위험 음주율
과체중 &
비만율
2011 213,817 33.15 0.24 0.16 0.16 0.34
2012 218,548 33.89 0.24 0.16 0.15 0.34
2013 212,571 32.96 0.24 0.17 0.15 0.34
총계 644,936 100
자료: 국민건강보험공단 표본코호트 데이터(2011~2013)을 활용하여 저자 작성
<표 Ⅱ-12> 검진 DB의 구성
(단위: 명, %)
<표 Ⅱ-13>에서는 분석대상의 연령그룹과 소득분위 빈도를 살펴보았다.
연령은 5세 단위로 제공되며, 소득분위는 건강보험료에 기반하여 10분위로 구분하여 제공된다. 가장 최근 연도인 2013년을 살펴보면 65세 미만은 85%, 65세 이상은 15%로 구성된다. 분석대상에서 빈도가 높은 연령대는 40대와 50대(51%)이고, 20~30대는 빈도가 낮은 편이다. 연령 그룹 중 가장 빈도가 높은 연령대는 40~44세로 14.66%를 차지하고, 빈도가 가장 낮은 연령대는 85세 이상으로 0.30%를 차지한다. 소득분위는 8~10분위 고소득층이 40% 이 상을 차지하고, 1~4분위 저소득층은 29%로 비중이 높지 않다. 소득 9분위의 빈도가 13.84%로 가장 높고, 소득 1분위의 비중은 6.80%로 가장 낮다. 이는 고소득층이 저소득층에 비해 건강검진을 할 확률이 높은 것을 시사하는데, 일반적인 소득분포와 상이한 모습을 보여 향후 검진자료의 대표성에 대한 고찰이 필요할 것으로 보인다.
<표 Ⅱ-14>에서는 연도별로 비건강행동(흡연, 음주, 비만)과 건강행동(비 흡연, 비음주, 정상체중) 간의 의료비 지출(환자본인부담금, 보험급여비, 진 료비 총액4))을 비교해 보았다. 2013년 기준 비건강행동의 환자 본인부담금
지출을 비교해보면, 비만이 32만 9,609원으로 가장 높고 흡연이 24만 4,276 원, 고위험 음주가 22만 1,905원으로 낮아진다. 우리의 가설은 흡연자가 비흡 연자보다, 고위험 음주자가 저위험 음주 및 비음주자보다, 비만자가 정상체 중보다 의료비 지출이 높다는 것이다. 그러나 기초통계량을 통해 살펴본 결 과, 비만의 경우에만 정상체중보다 의료비 지출이 높게 나타나고, 흡연과 음 주는 비흡연과 비음주보다 의료비 지출이 낮게 나타나는 현상을 발견하였다.
연령그룹 소득분위
빈도 비중 빈도 비중
20~24세 4,502 2.12 1 14,457 6.8
25~29세 12,854 6.05 2 14,476 6.81
30~34세 19,100 8.99 3 16,303 7.67
35~39세 16,704 7.86 4 16,680 7.85
40~44세 31,158 14.66 5 19,066 8.97
45~49세 24,704 11.62 6 21,947 10.32
50~54세 30,552 14.37 7 24,194 11.38
55~59세 22,186 10.44 8 26,889 12.65
60~64세 18,837 8.86 9 29,416 13.84
65~69세 11,680 5.49 10 29,143 13.71
70~74세 12,217 5.75
75~79세 4,919 2.31
80~84세 2,510 1.18
85세 이상 648 0.3
합계 212,571 100 합계 212,571 100 자료: 국민건강보험공단 표본코호트 데이터(2011~2013)을 활용하여 저자 작성
<표 Ⅱ-13> 2013년 연령그룹 및 소득그룹의 분포
(단위: 명, %)
4) 환자가 질병 등으로 병의원을 이용하였을 때 비용이 발생하는데 이는 급여와 비급여로 구분할 수 있다. 급여는 건강보험에서 커버되는 항목으로 환자 본인부담금과 보험자부담 금(건강보험 급여비지출을 의미하며 민간보험을 포함하지 않음)으로 구분되고 이를 합쳐 진료비 총액이라고 정의한다. 반면 비급여는 건강보험에서 커버되지 않는 항목(예, 비타 민 주사)으로 환자가 전액 자부담하며, 우리가 사용한 건강보험 표본코호트 자료에서는
4) 환자가 질병 등으로 병의원을 이용하였을 때 비용이 발생하는데 이는 급여와 비급여로 구분할 수 있다. 급여는 건강보험에서 커버되는 항목으로 환자 본인부담금과 보험자부담 금(건강보험 급여비지출을 의미하며 민간보험을 포함하지 않음)으로 구분되고 이를 합쳐 진료비 총액이라고 정의한다. 반면 비급여는 건강보험에서 커버되지 않는 항목(예, 비타 민 주사)으로 환자가 전액 자부담하며, 우리가 사용한 건강보험 표본코호트 자료에서는