• 검색 결과가 없습니다.

Ⅳ. 공공기관 생성 건강정보 활용의 문제점: 사용 경험을 중심으로

1. 이차자료 연계의 필요성

가. 청구자료의 한계

건강보험심사평가원에서 수집하는 자료는 진료비 청구를 목적으로 요양기 관에서 작성하는 청구서를 기반으로 한다. 그렇기 때문에 심사 시 조정을 당하지 않기 위해 진단명과 상병명이 불일치 하는 경우가 발생할 수 있으 며 청구서 상에 수집하는 항목이 없거나, 요양기관에서 진료비 청구 시 반 드시 작성해야 하는 항목이 아니면 정확하지 않거나 누락되는 값이 있다.

연구자들이 경험적으로 느끼는 건강보험심사평가원의 청구자료의 한계에는 대략 8가지가 있는데, ‘사망자료 파악의 어려움’, ‘수진자 주소지 정보 부 재’, ‘5년치 자료만 제공’, ‘미필수 항목의 부재’, ‘비급여 자료 부재’ ,‘진료 와 청구정보의 불일치’, ‘희귀질환 정보의 제한’, ‘샘플 바이어스 발생’이 있 다. 이 중 (1)부터 (6)까지는 일반적인 대용량 청구자료와 표본데이터셋이 공통적으로 적용되는 사항이며, (7)에서 (8)은 1년 단위의 표본데이터셋인 전체환자표본, 입원환자표본, 노인환자표본, 소아청소년환자표본에 국한된 사항이다.

1) 사망자료 파악의 어려움

요양기관에서 건강보험심사평가원으로 급여 지급을 위해 제출하는 청구서 상에는 진료결과를 입력하는 란이 있다. 그러나 청구심사에 반드시 필요한 항목이 아니고 누락되더라도 특별한 제제가 없기 때문에 정확하지 않거나 공란으로 제출되는 경우가 다수이다. 환자의 사망여부뿐만 아니라 사망을 하게 된 사인에 대한 신뢰할 만한 정보가 건강보험 청구서 상으로는 수집 되지 않고 있다.

“입력란에 null값인 것도 있고 값이 있는 것도 있는데, 예를 들어, 100명이 입원해서 진료결과 사망이라고 되어 있는게 10명이더라 도 null값이 있기 때문에 100명이 와서 10명이 사망했다고 분명 하게 말 할 수 없지요.”

“응급의료에 대한 연구를 하는데 누가봐도 사망자료가 필요해요.

응급실에 와서 몇 명이 사망했는지를 봐야하는데 우리자료에는 그게 없어요. 그러니까 파악이 안되죠.”

“만성질환자면 계속 약을 먹거나 치료를 받아야하는데 더 이상 치 료 기록이 없다. 그러면 사망했을 것이다. 이렇게 유추할 수는 있 는 거죠. 그래도 연구자 입장에서는 찝찝하잖아요? 내눈으로 확 인한게 아니니까.”

2) 수진자 주소지 정보 부재

건강보험체계 내에서 구매자로서의 역할을 수행하는 건강보험심사평가원 이 요양기관에서 환자에게 치료 행위를 하고 그에 따른 비용을 청구하는 청구서를 제출하면 그것을 심사해서 적정급여를 산출하여 건강보험공단에 제공하고, 공단은 이를 받아 요양기관에 치료 행위에 따른 적절한 급여를 보상하게 된다.

따라서 건강보험심사평가원에 제출되는 자료에는 요양기관의 주소지 정 보는 있으나 개별 환자의 주소지 정보는 제공되고 있지 않다. 그렇기 때문 에 지역별 의료이용 실태 등 지역에 따른 차이를 보고자 하는 연구를 수행 하기 위해서는 추가적인 수진자의 지역 정보가 요구되게 된다.

연구에서 지역적 특색을 보기위한 방법으로 주소지 정보가 필요하다. 그러 므로 주소지 정보를 받을 수 없는 경우 청구자료 명세서일반내역에서 확인 할 수 있는 요양기관 소재지 정보를 이용하여 환자의 의료이용 지역을 대

상자의 소재지로 인식하여 지역을 추정하는 등 사람의 주소지 정보를 이용 하기 위한 다른 방법이 고안되고 있다.

“행안부에 환자 주소지 정보가 있어요. 공단에도 있고, 응급의료연 구였는데 환자들의 주거지 정보가 있어야 지역별로 환자들의 이 용 패턴을 볼 수 있어요.”

“주소지 정보가 필요하죠. 근데 없으니까 편법으로 최근 3개월내 그 사람이 이용한 병원이 등록된 지역을 그 사람의 주소지 정보 로 하는거죠. 요양기관 주소정보는 있으니까.”

3) 5년치 기록만 제공

연구에 이용하는 자료원의 깊이를 더하기 위해서는 변수의 종류나 양 보다 는 요인과 결과의 상관관계 및 변화의 추세를 파악할 수 있는 장기 코호트 를 구축해서 지속적으로 추적관찰 연구를 수행할 수 있도록 하는 것이 중 요하다. 그런데 건강보험심사평가원에서 이차자료로 제공하는 건강보험청 구자료는 최대 5년치만 보유가 가능하므로 깊이 있는 시계열 연구를 수행 하는데 제한이 있을 수 밖에 없다.

건강보험공단의 경우 연구자료를 구축하기 위한 방법으로 15년치 코호트 를 구성하였는데, 일반적으로 10년 미만의 자료를 이용해서는 시간에 의한 변화를 측적하기가 어렵다는 것이 공통된 의견이었다.

“공단에는 15년치인가? 정보를 구축했다고 들었어요. 우리는 법으 로 정한건지 5년치 자료밖에 없으니까 시계열 연구를 할 수가 없 어요. 5년 가지고는 할 수가 없으니까.”

4) 미필수 항목 부재

청구자료의 자료원이 되는 급여명세서의 모든 항목에 대해 기재가 강제되 지 않고, 요양기관에서는 제공한 의료서비스에 대한 요양급여를 받기 위한 목적으로 명세서를 제출한다. 그렇기 때문에 인력의 부족 및 노력과 시간 등의 문제로 급여를 받는데 반드시 필요한 정보가 아니면 누락하는 경우가 발생한다.

“심평원 청구자료의 경우 청구를 위한 목적이다 보니 돈(요양급여) 을 받는데 반드시 필요한 정보는 잘 기입이 되어있는 반면 돈을 받는데 중요하지 않은 부분은 누락되는 경우가 있어요. 강제력이 없기 때문에.”

5) 비급여 자료 부재

의료비는 본인부담금, 건강보험급여로 구성되는데 의료비를 구성하는 각 각의 항목도 의미 있게 사용되지만 전체 의료비의 규모를 파악해야 하는 경우가 있다. 그러나 청구자료는 의료비 중 건강보험(의료급여 포함)으로 지급받을 수 있는 부분에 관한 의료기록이기 때문에 전체 의료비를 파악하 는데 한계가 있을 수 있다.

“연구를 하다보면 전체 의료비를 파악해야 하는 경우가 있는데 청 구자료에는 급여를 받기 위한 것만 청구되기 때문에 비급여 치료 나 약제에 대한 정보는 없어요. 청구요양급여비용 총액만 알 수 있죠. ”

6) 진료와 청구정보의 불일치

자료의 신뢰도 측면에서 가장 빈번하게 문제가 되는 것이 의료기관의 진단 명과 실제 급여를 청구할 때 기재하는 상병명의 불일치이다. 모든 환자에 대해 진단과 치료법이 일원화 되어 있는 것이 아니며 환자의 상태를 알아보 기 위해 환자의 상병으로 건강보험이 적용되지 않는 검사를 시행해야하는

경우, 심사에서 조정을 당하지 않기 위해 실제 환자에게는 없는 상병을 부 상병으로 기재하거나 환자의 상병보다 중한 상병으로 업코딩을 하는 경우가 발생한다. 이 경우 동일한 질병군에서도 상병명의 변화가 있을 수 있다.

그 외에도 하나의 청구서 상에 여러 진료과의 진료기록이 기재된 경우 명 세서일반내역에서 확인할 수 있는 진료과 정보는 급여 청구를 신청한 진료 과의 정보만 있을 수 있어 동일한 진단명 내에서도 어느 진료과별 치료 현 황을 확인해야 하는 경우 일부 누락된 진료과 정보로 정확한 의미를 제공 하기 어려울 수 있다.

“3차(의료기관)로 넘어오면 청구하는 사람이 따로 있어요. 근데 이 청구하는 사람은 사실 의료행위에는 별로 관심이 없어요. 그러니 까 이 사람의 상병이나 그런거 보다는 내가 심평원에 청구를 해서 돈을 받아야 하는 입장이잖아요? 그러니까 최대한 (제공한 의료서 비스에 대한) 돈을 다 받을 수 있게 주상병명과 부상병명을 바꾸 거나, upcoding을 하기도 하죠.”

“진료과도 두 개를 본 경우에도 명세서 상에는 한 개(진료비 청구 를 신청한)과만 기재되어 있어요. ”

7) 희귀질환 질병 정보의 제한

희귀질환자는 전체 국민이 가진 상병 중에 차지하는 비율이 작고 그렇게 때문에 전국민 자료라고 할지라도 그 case가 많지 않다. 이에 더해 표본자 료의 경우 모집단의 특성을 대변할 수 있는 확률상의 표본이기 때문에 표본 안에 원하는 희귀질환자의 정보가 얼마나 포함이 될지는 알 수 없게 된다.

특히나 연령별 지역별로 층화하여 발생이나 의료이용의 특성을 알아보려 고 하는 경우 층화된 각 요인별 특성이 충분히 들어나지 않는 경우가 발생 할 수 있다.

“심평원에서 자료를 CD로 만들어서 외부에 파는 환자 샘플자료가 있는데, 외부 연구자 중에 실제로 그 CD를 사서 연구하신 분이 계시는데 굉장히 희귀한질환 같은 경우에는 아애 빈도가 없는 경 우도 있고, 그런 경우에는 연구를 할 수가 없죠.”

“연구자가 필요한거는 이 희귀한 질병을 가진 사람들의 자료인데, 이거(환자표본자료)는 샘플자료니까 이 희귀한 질병이 몇 개 없 는거예요. 10대, 20대, 30대 이렇게 나누어 보면 각 연령대별로 하 나씩 정도 밖에 없는거예요.”

8) 샘플 바이어스 발생

모든 통계적인 샘플에는 바이어스가 발생할 수 있다. 표본자료 또한 전체 의 특성이 반영될 수 있는 일부집단을 추출해 내는 것이기 때문에 추출된 자료가 전체의 특성을 대변한다는 것은 확률에 의한 것일 뿐 일부 차이가 발생할 가능성은 상존한다.

“샘플자료이기 때문에 아무리 랜덤하게 뽑아도 바이스는 생기거든 요. 우리가 통계학에 나오는 추정을 보면 95% 신뢰수준을 따르기

“샘플자료이기 때문에 아무리 랜덤하게 뽑아도 바이스는 생기거든 요. 우리가 통계학에 나오는 추정을 보면 95% 신뢰수준을 따르기

관련 문서