• 검색 결과가 없습니다.

HIRA 빅데이터 브리프 제2권2호

N/A
N/A
Protected

Academic year: 2021

Share "HIRA 빅데이터 브리프 제2권2호"

Copied!
58
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

H

I

R

A

빅 데 이 터

H I R A B i g D a t a B r i e f

(2)

보건의료 빅데이터 동향 _

03

1. 인공지능 의료영상 진단모형 연구 경험과 활성화 방안 _ 05 2. 보건의료 빅데이터 관련 주요 기사_ 20

HIRA 빅데이터 분석 사례 _

25

1. 보건의료빅데이터를 이용한 폐동맥 고혈압 환자 연구_ 27 2. 한국에서의 단장증후군 환자의 유병률 및 질병부담_ 34 3. 아세트아미노펜이 급성 A형간염 환자의 임상경과에 미치는 영향_ 38

HIRA 빅데이터 분석 가이드 _

43

'HIRA 빅데이터 분석 가이드' 란? _ 45 HIRA 빅데이터 분석 - 입원 에피소드 구축 _ 46

(3)
(4)
(5)

보건의료 빅데이터 동향에서는

국내외 빅데이터 관련 기술 개발, 활용 등

최신 동향과 주요 언론 기사를 소개하고 있습니다.

보건의료

빅데이터

동향

(6)

인공지능 의료영상 진단모형 연구 경험과

활성화 방안

김정훈 교수 분당서울대학교병원

1. 들어가는 말

ICT 기술은 통신 기술의 발달, 멀티미디어 처리 기술 발전, 빅데이터의 처리 능력 향상을 거듭하면서 점차 복잡화, 지능화된 기술로 진화하고 있으며, 뇌 과학ㆍ뇌 의학 기반 기술 발전에 힘입어 인공지능(Artificial Intelligence)기술 혁신을 촉발함 인공지능 기술을 통해 인간의 능력을 넘어서는 수준의 데이터를 처리할 수 있게 되었고, 보다 정확하고 효율적인 의사결정이 가능해짐에 따라 최근 주목받기 시작함 의료영상 분야에서는 다양한 진단기기를 이용하는 환자 수 증가에 비해 부족한 의료 인력 문제, 인간의 부정확한 판독 및 의사 간(혹은 동일 의사) 판독 편차 등으로 인한 오진 문제를 해결하기 위하여 인공지능 알고리즘의 적용 방법이 활발하게 연구되고 있음 실제 최근 연구에서는 흉부 X-ray 영상에서 폐암을 놓치는 80% 이상의 원인이 뼈가 겹치고 가려져서 발생한다고 발표함1) 또한 의료데이터가 점점 복잡해짐에 따라, 기존의 연구 접근방식으로는 의료영상을 컨트롤하는 것이 어렵다는 문제의 해결을 위하여 인공지능 알고리즘들이 활발하게 적용되고 있음

(7)

6

2. 국내외 인공지능 헬스케어 동향

2.1 국외 동향

미국은 인공지능 R&D 정책을 범 정부차원에서 추진 중이며, 정밀의료 추진 계획을 통하여 인공지능을 활용한 개인 맞춤형 의료 혁신에 집중하고 있음 자료원: CBInsight [그림 1] 미국 헬스케어 내 인공지능 연간 자금 추이(2011년~2015년) 미국의 인공지능 관련 기업들은 자체적으로 기술을 개발하고 다양한 스타트업 기업을 인수하여, 헬스케어 분야의 인공지능 선도 기업으로 입지를 다지고자 함 구글은 혈당측정기, 노화방지 치료제, 유전자 분석, 건강관리 플랫폼 등 헬스케어 관련 기술 개발을 통해, 평소 건강상태와 적절한 대응법을 제공하는 인공지능을 선보일 것으로 전망 마이크로소프트는 인공지능을 이용한 암 치료법 개발에 착수하여, 암을 디지털 프로그램으로 변환해 디버그 하는 방법으로 개별 환자별 맞춤형 치료법을 제공할 계획임 애플은 최근 환자, 가족, 간병인, 의사, 간호사가 치료 계획을 공유하고, 복약 상황 등을 모니터링 하여 효과적으로 환자의 치료를 돕는 소프트웨어를 개발함

(8)

유럽은 의료정보 기술 플랫폼 구축 및 유전체 분석을 강화한 정밀의료 제공을 추진하고 있으며, 앞으로 인공지능 기술을 적극 활용할 계획임2)

2013년 인간두뇌 프로젝트(Human Brain Project)를 발표하고 2023년까지 10년동안 1.8조원을 투자하여 두뇌 분야를 중심으로 인공지능 헬스케어 산업발전을 견인할 의료정보 기술 플랫폼 구축을 목표로 하고 있음 캐나다 토론토대 연구팀은 알츠하이머 증세를 조기에 진단할 수 있는 인공지능 로봇 ‘루드비히(Ludwig)’을 공개함 ‘루드비히’는 키 2피트(약 61cm)의 AI로봇으로 요양원, 은퇴자 시설에 있는 노인들과 대화를 통해 알츠하이머 치매 징후를 찾아낼 수 있도록 개발됨 [그림 2] 알츠하이머 증세를 조기에 진단할 수 있는 인공지능 로봇 ‘루드비히’

(9)

8 일본정부는 인공지능이 의료수준을 높이고 인력부족 현상을 완화시킬 것으로 예상하여, 인공지능 개발과 의료기관의 관련 설비 투자를 적극 지원하고 있음 실제로 도쿄대 의과학연구소에서는 미국 IBM의 AI 슈퍼컴퓨터 ‘왓슨’을 활용하여, 2015년 7월부터 2016년 3월까지 암 환자 54명 중 41명의 진단 및 치료 방향 결정에 도움을 받는 등 긍정적 결과를 도출함3)

2.2 국내 동향

뷰노(Vuno)는 컴퓨터단층촬영(CT), 자기공명영상(MRI) 등 의료영상과 진단자료를 분석해 환자의 폐 질환 여부를 스스로 판단하는 솔루션을 개발함 성 조숙증 여부를 진단하는 골연령 판독 프로그램을 개발하고, 미만성 폐질환 데이터를 분석하여 전문의 판단에 도움을 주는 시스템을 연구 중 임

[그림 3] 뷰노의 폐질환 여부 솔루션 VUNO-MED™ Lung Quant (vuno company profile)

루닛(Lunit)은 인공지능 영상인식 기술을 이용하여 가슴과 유방 엑스레이 사진에서 폐질환과 유방암을 진단하는 기술을 개발하고 있음

딥러닝 알고리즘을 기반으로 흉부 X-ray와 유방촬영술 영상을 감별ㆍ진단하여, 육안으로 판독하기 어려운 부분의 종양의 위치, 크기, 종양 내 변형된 세포 및 특이조직을 검출하고자 함

(10)

[그림 4] AI기반 의료영상 진단 시스템 루닛 인사이트 (https://lunit.io/)

제이엘케이인스펙션은 수많은 임상 자료를 바탕으로 기계학습(Machine Learning)과 딥러닝(Deep Learning) 기술을 적용한 인공지능 기반의 뇌경색 MR 영상진단 시스템을 개발하였음

(11)

10

OBS Korea는 클라우드 기반의 인공지능 PACS 플랫폼 기술을 바탕으로 의료영상을 수집, 레이블링, 딥러닝 학습 및 분석, 검증을 위한 기술을 개발하였음 척추질환 엑스레이, 관절염 CT, 치과 파노라마 엑스레이 영상, 뇌동맥류 MR 영상 등 다양한 의료 영상에 딥러닝 기술을 적용하여, 질환의 크기와 위치를 자동으로 검출하는 영상 진단 기술을 개발 중임 마이다스아이티와 삼성서울병원은 MR 영상을 분석하여 치매위험지수를 산출하는 프로그램인 ‘인브레인(inbrain)’을 개발함 뇌 MR 영상을 입력하면 3D로 복원하고 기능별로 영역을 분할한 뒤 사진을 정량적으로 측정하며, 숙련된 전문가가 몇 시간씩 투자해야 하는 `정량적 분석` 결과를 일반인도 알기 쉬운 `치매위험지수`로 보여주는 것이 특징임(2018. 4. 11. 매일경제) [그림 6] 인브레인 프로그램 화면 (https://inbrain.co.kr-매뉴얼북)

(12)

3. 의료영상에서의 인공지능 활용

의료분야 데이터는 영상 데이터, 생체 데이터, 진단 데이터 등이 있으며, 최근 연구에서는 의료영상 데이터에서 영상 상 조직의 정상 여부, 종양의 양ㆍ음성 여부 판단을 위한 인공지능 연구가 활발히 진행되고 있음

3.1 의료영상에서의 인공지능 적용을 위한 비지도 학습

비지도 학습은 의료영상에서의 인공지능 알고리즘을 적용하기 위하여 장기의 해부학적 및 영상에서의 특징, 병소의 특징을 고려하여 적당한 방법을 선택하거나 조합하여 데이터의 특징만으로 학습하는 방법임 별도의 레이블링(병변 위치와 종류 등 표기) 과정이 필요없고 데이터의 입력만 있어, 정답이 없는 데이터를 학습시키는 인공지능 방법임 훈련용 데이터를 통해 함수를 추론할 수 없으며, 컴퓨터 스스로 분류하고 의미있는 값을 추출해야 함 비지도 학습기반의 인공지능 시스템 연구 사례4) 5) 유방영상에서 컴퓨터 보조진단 시스템을 도입할 경우, 영상의학과 의사 단독으로 판독하는 경우보다 약 5~12% 정도 검출률이 향상됨 유 방 영 상 에 서 가 장 많 이 사 용 되 는 방 식 은 유 방 촬 영 술 ( m a m m o g ra p h y ) 이 며 , 유방촬영영상에서 보이는 미세석회화(micro-calcification)의 군집은 유방암의 중요한 지표이므로 이를 자동 분별하는 연구가 활발히 진행 중임6)

(13)

12 (Wernick, Miles N., et al. "Machine learning in medical imaging." IEEE signal processing magazine 27.4 (2010): 25-38)

[그림 7] 유방촬영영상에서의 미세석회화 자동분류 결과

흉부영상에서 자동분류 기반 컴퓨터 보조진단시스템의 이용은 의료진간의 판독 편차 문제를 극복하고, 정량적으로 재현 가능한 판독 결과를 도출한다는 점에서 활발히 연구가 진행되고 있음7)

미만성 간질성 폐질환(Diffuse Interstitial lung disease)의 고해상 CT 영상 판독 시, 영상에서 확산된 음영 패턴의 복잡도와 변화 때문에 판독이 난해함. 따라서 평균, 분산, 공기밀도, 결절 성분 등의 패턴을 기본으로 인공신경망을 적용한 관심영역 기반 컴퓨터 보조 진단 시스템을 도입하여 판독의 정확도를 향상시키고 있음

(14)

[그림 8] 고해상 CT 영상에서의 정상 및 미만성 간질성 폐질환

3.2 의료영상에서의 인공지능을 위한 지도 학습 및 레이블링

지도 학습은 훈련 데이터로부터 하나의 함수를 유추하기 위한 방법으로, 관측치마다 정답 레이블링이 수행된 데이터셋으로 모델을 학습시키는 방법임 지도 학습기반의 인공지능 진단시스템은 해당 진단의 전문가가 진행한 정확한 레이블링 데이터가 필요함. 그러나 레이블링은 많은 노력과 시간이 소요되어, 해당 진단의 의료영상 전문가가 레이블링한 양질의 데이터를 얻기는 어려움 양질의 데이터란 레이블링이 잘 되어 있는 데이터로 양도 중요하지만, 정확도가 가장 중요한 요소임 (a) 정상 폐 (b) 간유리 불투명도 (c) 경화성 음영 (d) 망상 음영 (e) 폐기종 (f) 벌집모양 음영

(15)

14 인공지능 머신러닝은 내부 알고리즘 특성상 왜 output이 출력되었는지 설명하기 힘들고, 의료영역에서도 진단 결과에 따라 치료법이 달라지므로 레이블링의 정확도가 중요함 뇌동맥 영상에서 학습데이터를 이용한 인공지능 진단 시스템 연구 한국정보화진흥원의 지원으로 건강보험심사평가원과 분당서울대병원은 2017년에 인공지능을 활용한 뇌동맥류 진단 연구를 진행함 뇌동맥류 질환은 인구 10만명 당 2천 ~ 5천명에게 발생하며 응급 상황 시 30%가 병원 도착 전 사망하는 질환으로, 인공지능 기반의 영상 분석 모델을 이용하면 진단소견 보완과 사전선별(pre-screening) 등 뇌동맥류 진단분야에 큰 도움이 될 것으로 예상됨 인공지능 뇌동맥류 진단을 위해 공개된 레이블링 데이터가 없으므로 분당서울대병원의 뇌 MRA 영상 데이터 세트를 수집하여 레이블링을 위한 제반사항을 준비함 MRA 영상 데이터 세트는 정상 데이터와 뇌동맥류 질환이 있는 비정상 데이터를 구분하여 수집되었으며, 추후 인공지능 학습을 고려하여 뇌 MRA 영상 전문가가 제안하는 조건의 비정상 데이터를 추출함 뇌 MRA 영상 전문가는 레이블링 툴을 이용하여 수집된 비정상 데이터에서 뇌동맥류가 발생한 부분의 레이블링을 수행하며, 정확한 레이블링을 위하여 레이블링 검증 시 해당 영상에 대한 임상적 소견 및 결과를 참조하여 검증

(16)

[그림 9] 뇌 MRA 영상의 레이블링

3차원 MRA 영상의 특성을 고려하여 Convolutional Neural Network 와 3D U-Net을 적용하여 인공지능 뇌동맥류 진단을 위한 학습과 학습모델 검증을 수행함

(17)

16 [그림 10] 인공지능 시스템 구현을 위한 학습 및 테스트 의료영상데이터 레이블링 및 표준 데이터 변환을 통하여 통합 의료영상 분석 데이터베이스를 구축하였으며, 의료영상정보를 분석ㆍ진단하기 위한 인공지능 판독 기술 개발 및 기반을 마련함 레이블링 데이터를 공개함으로써 의료영상 데이터 분석 및 인공지능 분석 결과의 민간 활용 지원체계 수립

(18)

4. 의료영상에서의 인공지능 전망

인공지능 헬스케어의 활성화는 정밀한 치료를 제공하고 합리적인 비용으로 의료서비스의 질적 수준을 향상시킬 수 있으며, 환자 및 일반 국민 측면에서는 데이터 기반의 최적화된 의료건강 관리 서비스가 제공됨으로 의료비 부담 경감 및 치료에 긍정적인 영향을 줄 수 있음

4.1 인공지능 기술개발을 위한 오픈플랫폼 및 오픈데이터 필요

의료인공지능의 1차적 검증이 폐쇄형 단일 기관 검증에서 오픈형 데이터셋 오픈 경쟁 기반으로 변화하고 있음 Camelyon16 대회에서는 총 270장의 병리 슬라이드가 학습용으로 공개되고, 이를 학습하여 만든 모델로 130장의 슬라이드를 판독해야 함. 2016년 대회에서는 하버드 대학의 Andrew Beck 교수 팀이 우승했음 이와 같이 인공지능 시스템의 검증은 데이터를 오픈하여 세계 여러 그룹 연구자에게 공개하고 대회를 열어 더 좋은 결과를 얻는 방향으로 진행되고 있음 의료데이터를 외부기관에서 활용하기 위하여 의료데이터 소유권의 문제, 개인정보 보호법 등 법적, 제도적 문제를 해결한 학습용 공공 의료데이터의 수집이 필요함 의료영상 인공지능을 구현하는 기업들의 연구 활성화를 위하여 의료기관에서 의료영상 전문가가 진행한 레이블링 데이터 세트를 확보하여 학습데이터를 오픈하는 것이 앞으로 고려되어야 함

4.2 의료영상 인공지능을 위한 미래 이슈

우리나라는 각 기관별 방대한 영상 데이터가 구축되어 있으나 기관 간 연계와 공유가 미흡한 실정임. 따라서 기관 간 데이터 연계 및 활용을 위한 의료정보 활용 가이드 라인의 제시가 필요함

(19)

18 의료분야 인공지능은 의학과 인공지능 기술에 대한 전문성이 모두 필요하므로 기업과 병원 간 협업이 필요함. 따라서 기업과 병원 간 협력하는 방식의 열린 자세가 필요하며, 조직 차원에서 구조적인 지원이 뒷받침 되어야 함 인공지능 기술이 의료 분야의 주된 선진기술이 될 것이므로 향후 사회적 수용성을 위한 논의와 공감대 형성이 필요하며 관련 법률 및 제도에 대한 논의가 요구됨

5. 결언

4차 산업혁명 시대의 도래로 의료분야의 인공지능을 활용한 연구와 개발이 지속적으로 출현될 것으로 예상됨 이에 따라 4차 산업혁명 시대와 인공지능 시스템 및 인공지능을 위한 데이터 수집의 역할은 매우 중요해짐 인공지능을 위한 양질의 빅데이터 확보가 의료분야 인공지능 활성화의 중요한 부분이며 국가 차원의 데이터 통합 및 공동 활용 방안이 필요함 국내 의료 인공지능 기술이 개발ㆍ연구되어 활발한 활용이 이루어지기 위해서 아직 미흡한 규정과 법률의 개선이 필요함 의료분야의 인공지능 기술 활성화 및 상용화를 위하여 인공지능의 판단이나 결과의 책임, 사용자 보호, 환자 안전 등 관련 범위에 대한 심도있는 논의가 필요함 데이터 확보와 임상시험 등이 가능한 병원 중심의 클러스터 활용이 필요하며, 추가로 다양한 분야의 헬스케어 인공지능 기업의 역량 확보가 우선시 되어야 함 인공지능을 활용한 헬스케어 분야의 질 향상, 비용 절감의 데이터화된 지표 효과를 제시함으로써 신기술에 대한 참여를 유도해야 함

(20)

참고자료

[1] Shah, Priya Kumar, et al. "Missed non-small cell lung cancer: radiographic findings of potentially resectable lesions evident only in retrospect." Radiology 226.1 (2003): 235-241. [2] 인공지능 헬스케어 국내외 동향 및 활성화 방향, 정보통신기술진흥센터 주간기술동향 2018.1.24,

김문구, 박종현, 오지선

[3] 인공지능을 활용한 헬스케어 R&D 현황, 생명공학연구센터 BioNwatch 2015

[4] 의료영상에서의 인공지능 연구 동향, 한국과학기술원 장용준, 정보통신기술진흥센터 기획시리즈, 14-25

[5] Sajda P. Machine learning for detection and diagnosis of disease. Annu Rev Biomed Eng. 2006; 8; 537-65

[6] Wernick MN. Machine Learning in Medical Imaging. IEEE Signal Processing Magazine 2010; 27; 25-38

[7] Doi K. Current status and future potential of computer-aided diagnosis in medical imaging. The British Journal of Radiology 78; 2005; S3-S19

(21)

20

보건의료 빅데이터 관련 주요 기사

AI가 뇌 지도 분석해...혈액 한방울로 치매 유전자 검출도 (매일경제, 2018. 4. 11.) - 치매는 아직 근본적인 치료제가 없고, 긴 시간동안 서서히 진행되기 때문에 조기 진단이 가장 중요함 - AI를 활용하여 뇌 영상(MR) 분석, 혈액 분석으로 치매를 조기 진단할 수 있는 여러 프로그램들이 활용ㆍ개발 중임 한ㆍ중 국립암센터, 내달 9일 암 정복 학술교류 포럼 개최 (청년의사, 2018. 4. 10.) - 한국과 중국 국립암센터는 오는 5월 9일 서울 강남구 코엑스에서 ‘한중 암 정복을 위한 학술교류 포럼(Forum for Korea-China Collaboration on Cancer Control)’을 개최함

- 양국 국립암센터는 포럼을 통해 암 진단, 치료법 개발, 암 빅데이터 등의 성과와 현황을 공유하고 앞으로의 협력 방안을 모색할 예정임

(22)

유영민 장관 “공공데이터, 상업목적 개방해야” (메디칼타임즈, 2018. 4. 6.) - 과학기술정보통신부는 6일 서울 동자동 CJ올리브네트웍스 사옥에서 데이터 전문기업들과 함께 ‘데이터산업 혁신성장 방안 간담회’를 개최 - 유영민 과기정통부 장관은 “정부는 공공기관이 보유한 공공데이터를 상업적 목적으로도 활용할 수 있도록 공개해야 하는 방향을 세우고 어떤 것을 우선 순위로 할지에 대해 이해관계가 얽혀 있어 균형적으로 속도감 있게 추진해 데이터산업이 활성화되도록 힘껏 돕겠다”고 밝힘 4차 산업혁명 핵심기술과 지식재산 정책토론회 개최 (인더스트리뉴스, 2018. 4. 5.) - 국회 산업통상자원위원회 김규환 의원과 어기구 의원, 특허청이 공동으로 주최하고 지식재산연구원이 주관하는 ‘4차 산업혁명 핵심기술과 지식재산’ 정책토론회가 개최됨 - 정책토론회를 주최한 김규환 의원은 “인공지능·빅데이터와 같은 핵심기술은 산업경쟁력을 좌우하고 경제 저성장의 돌파구가 될 것”이라며 “4차 산업핵심기술과 관련된 지식재산권이 더욱 많이 창출 될 수 있도록 국민적 관심이 필요하다”고 강조함

(23)

22 빅데이터 활용해 국내 임상시험 경쟁력 높인다 (매일경제, 2018. 3. 28.) - 서울대병원과 한국임상시험산업본부(이하 KoNECT)는 서울대병원에서 ‘임상시험 활성화를 위한 보건의료 빅데이터 자원 활용’에 관한 업무협약을 체결함 - 협약에 따라 양 기관은 △보건의료 빅데이터 등의 연구자원 활용 △연구활동 및 네트워크 강화 △임상시험 인력양성을 위한 교육 및 학술활동 △글로벌 신약개발과 임상시험 유치를 위한 자문 및 대외활동 등에 협력 예정임 보건의료 융합산업 육성 첫발, 정부 실태조사 착수 (전자신문, 2018. 3. 26.) - 한국보건산업진흥원은 올 연말까지 국내 보건의료 융합신산업 실태조사를 한다고 26일 밝힘 - 4차 산업혁명 등 융합 패러다임 대응이 목적으로, 보건의료 융합신산업 정의와 요소기술, 구현 모델, 국내외 시장 규모 등을 체계적으로 확보하고, 특히 정밀의료, 스마트 헬스케어, 첨단 신약 개발 등 국가 차원에서 투자하는 영역을 중심으로 조사할 예정임

(24)

서울대학교병원, 암 정밀의료 플랫폼 ‘사이앱스’ 도입 (한국경제, 2018. 3. 21.) - 서울대병원은 바이오 빅데이터를 이용한 첨단의학을 발전시키고자 지난해 정밀의료센터를 개소한데 이어 올 1월 암 정밀의료 플랫폼 ‘사이앱스(Syapse)’를 국내 최초로 도입함 - 사이앱스는 유전체 분석기술을 활용해 효과적인 암 치료 의사결정을 내릴 수 있게 하는 강력한 플랫폼으로, 이를 통해 서울대병원은 근거중심의 새로운 암 정밀 치료의 기준을 제시할 것으로 기대됨 한국전자통신연구원-SCL, 공동 연구 협약 체결 (청년의사, 2018. 3. 19.) - 한국전자통신연구원(이하 ETRI)과 SCL(재단법인 서울의과학연구소)은 의료 정보통신(ICT)기술 분야 연구활성화를 위한 업무협약을 체결 - 협약을 통해 양 기관은 바이오의료기술 (BMT)과 정보전자통신기술(IT)을 활용해 질병 진단에 필요한 첨단 기술 및 제품 개발을 수행할 예정임

(25)

24 심평원 늘어나는 심사물량..인공지능 심사효율화 나선다 (메디파나뉴스, 2018. 3. 19.) - 최근 인구 및 질병구조의 변화에 따라 의료이용량이 증가하는 것은 물론 건강보험 보장성 강화 정책 등으로 심사물량이 폭증하는 실정 - 이에 심평원은 연구용역을 통해 급격하게 변화하는 보건의료 환경을 상시적으로 반영할 수 있는 전문심사 선정 체계를 마련할 예정임

(26)
(27)

HIRA 빅데이터 분석 사례에서는

HIRA 빅데이터를 활용한 주요 이슈 분석, 연구 결과 등

다양한 활용 사례를 소개하고 있습니다.

HIRA

빅데이터

분석 사례

(28)

보건의료빅데이터를 이용한 폐동맥 고혈압 환자 연구

연구책임자 연구실무자 분석지원 장혁재 교수 송신정 신서희 주임연구원 연세대학교 의과대학 연세대학교 의과대학 건강보험심사평가원 ※ ‘2017년 HIRA 빅데이터 분석 협업과제’ 사례

1. 분석 배경

폐동맥 고혈압(PAH)은 폐혈관인 폐동맥, 폐모세혈관, 폐정맥에 생기는 고혈압으로, 진단 후 평균 생존 기간이 3년에 불과한 치명적인 질환임 폐동맥 고혈압은 진행 속도가 빠르고, 몸 안에 기구를 삽입하여 혈압을 측정하여야 하기 때문에 진단이 어려움 하지만 환자가 적은 희귀질환으로 잘 알려져 있지 않고, 확실한 치료 약물과 표준 치료 지침도 없는 상황임 해외의 경우 치료 행태에 관한 연구와 특정 약제 투약에 따른 사망률, 병적 상태, 개선 정도에 대한 연구가 있음 하지만 국내에서는 약제 사용행태에 대한 조사가 있기는 하나 그에 따른 장기적인 예후나 환자의 치료 결과는 없는 실정임 본 연구에서는 심사평가원의 청구자료를 활용하여 한국에서의 폐동맥 고혈압 환자의 역학 및 예후를 조사하고자 함

(29)

28

2. 분석 방법과 내용

자료원: 2007년 ~ 2016년 건강보험심사평가원 청구자료 대상: 2008년 1월 1일 이후 폐동맥 고혈압으로 진단받은 환자 분석방법: ① 폐동맥 고혈압 환자의 특성 및 합병증 파악 ② 폐동맥 고혈압 환자 생존 분석(병인, 연령별) ③ 폐동맥 고혈압 환자의 약물 요법 분석 [그림 1] 폐동맥 고혈압 환자 정의 및 추출 과정 ICD 코드 기준 I27.0, I27.2 PAH 관련 약물 처방 여부 '08년 이후 새로 진단받은 환자 PAH 관련 약제 처방이 없는 환자 진단코드가 있는 환자 N=14,255 '08년 이후 발생 환자 N=1,307 '07년 처방기록이 있는 환자 약제처방이 있는 환자 N=5,034

(30)

3. 분석 결과

폐동맥 고혈압 환자 1,307명의 평균 연령은 44(± 13)세였으며, 이 중 여성은 906명(69.3%)임. 주된 합병증은 고혈압 392명(30.0%), 부정맥 81명(6.2%) 임 폐동맥 고혈압 환자 1,307명 중 674명(51.6%)은 ‘특발성(원인불명) 폐동맥 고혈압(IPAH)’, 633명(48.4%)는 ‘다른 질환과 관련 있는 폐동맥 고혈압(APAH)’이었음 ‘다른 질환과 관련 있는 폐동맥 고혈압(APAH)’ 환자 633명 중 ‘선천성심장질환 관련(APAH-CHD)’은 337명(53.2%), ‘결합조직질환 관련(APAH-CTD)’은 296명(46.8%) 임 [표 1] 전체 폐동맥 고혈압 환자와 병인에 따라 모든 환자군의 특성 및 합병증 All patient IPAH APAH P-value

환자, N(%) 1,307(100.0) 674(51.6) 633(48.4) 나이 44±13 48±12 41±12 <0.001 여성, N(%) 906 (69.3) 409 (60.7) 497 (78.5) <.0001 합병증 고혈압, N(%) 392 (30.0) 285 (42.3) 107 (16.9) <.0001 당뇨, N(%) 76 (5.8) 55 (8.2) 21 (3.3) 0.0002 만성콩팥질환, N(%) 32 (2.5) 22 (3.3) 10 (1.6) 0.0489 간경화, N(%) 17 (1.3) 15 (2.2) 2 (0.3) 0.0023 부정맥, N(%) 81 (6.2) 46 (6.8) 35 (5.5) 0.3316 갑상선 질환, N(%) 52 (4.0) 29 (4.3) 23 (3.6) 0.5362 일과성허혈성사 혹은 뇌졸중, N(%) 29 (2.2) 19 (2.8) 10 (1.6) 0.1285

(31)

30 연구기간(’08년~’16년)동안 발생한 1,307건의 사례 중 평균 1.9년의 추적관찰 기간동안 581건(44.4%)의 사망이 발생함 폐동맥 고혈압 환자의 평균(± SD) 추적관찰 기간은 1.9(± 1.5)년이었으며, 1년 후 85%, 2년 후 63%, 3년 후 56%의 생존율을 보임 [그림 3] 폐동맥 고혈압 환자의 누적 생존 곡선. 1년, 2년 및 3년 추정 생존율 폐동맥 고혈압(PAH)의 병인에 따른 예후를 보면 특발성 폐동맥 고혈압(IPAH)이 가장 높은 사망률을 보임

(32)

[그림 4] 병인에 따른 폐동맥 고혈압 환자의 누적 생존 곡선

55세 미만 연령층의 1년, 2년, 3년 생존율은 82%, 72%, 64%로 55세 이상 연령층의 생존율(1년 62%, 2년 44%, 3년 35%) 보다 높음

(33)

32 폐동맥 고혈압 환자의 약물 요법 분포를 보면 80.1% 환자가 폐동맥 고혈압 관련 표적 치료를 받는 것으로 나타났으며 단일 요법이 61.7%, 복합 요법 18.4%으로 나타남 [표 2] 폐동맥 고혈압 환자에서 약물 단일 요법 및 복합 요법의 분포 All patients (N=1307) IPAH group (N=674) APAH group (N=633) P-value

No. of patients receiving

PAH specific treatment, (%) 1047 (80.1) 471 (69.9) 576 (91.0) <0.001 Single therapy, N, (%) 807 (61.7) 397 (58.9) 410 (64.8) Bosentan, N 408 121 287 <0.001 Beraprost, N 284 219 65 Sildenafil, N 58 25 33 Ambrisentan, N 36 20 16 Macitentan, N 15 8 7 Iloprost, N 6 4 2 Combination therapy, N, (%) 240 (18.4) 74 (11.0) 166 (26.2) <0.001 Bosentan-Beraprost, N 79 13 66 Bosentan-Sildenafil, N 43 8 35 Macitetan-Sildenafil, N 43 19 24 Bosentan-Sildenafil-Beraprost, N 17 3 14 Macitetan-Sildenafil-Beraprost, N 14 7 7 Ambrisentan-Beraprost, N 10 8 2 Ambrisentna-Sildenafil, N 7 3 4 Sildenafil-Beraprost, N 5 3 2 Macitetan-Beraprost, N 5 2 3 Bosentan-Iloprost, N 5 2 3 Ambrisentan-Iloprost, N 4 4 0 Ambrisentan-Sildenafil-Beraprost, N 4 1 3 Bosentan-Sildenafil-Iloprost, N 3 0 3 Ambrisentan-Sildenafil-Iloprost, N 1 1 0 No. of patients not receiving any

(34)

4. 결론

2008년 ~ 2016년 동안 폐동맥 고혈압 환자는 총 1,307명이 확인되었으며, 여성이 69.3%를 차지함

폐동맥 고혈압(PAH)의 가장 흔한 병인은 특발성(IPAH)이었으며, 다른 질환과 관련된 경우(APAH)에는 선천성 심질환관련(APAH-CHD), 결합조직질환(APAH-CTD)이 많았음

추적 관찰 결과, 폐동맥 고혈압 환자의 평균 추시 기간은 1.9년이었으며, 추정 생존율은 1년 85%, 2년 63%, 3년 56%로 나타남

(35)

34

한국에서의 단장증후군 환자의 유병률 및 질병부담

연구책임자 연구실무자 분석지원 이태희 교수 조연경 박기찬 주임연구원 순천향대학교병원 서울대학교 보건대학원 건강보험심사평가원 ※ ‘2017년 HIRA 빅데이터 분석 협업과제’ 사례

1. 분석 배경

단장증후군은 선천적 또는 수술 등의 원인으로 인해 소장의 길이가 본래의 절반 이하이며, 역할을 제대로 하지 못해 소화, 영양분 흡수에 문제가 발생하는 질환임 장기간 치료(입원 등), 합병증 관리, 질병으로 인한 경제활동 불가(실업) 등으로 환자 및 가족에게 발생하는 경제적 부담이 큰 편임 단장증후군에 대한 유병률은 거의 알려져 있지 않음. 가정영양을 하는 유병률 데이터로 추정하였을 때, 유럽지역에서 백만 명 당 5~20명 정도였으며, 만성장부전은 극희귀질환으로 2013년 Orphanet List of rare diseases에 포함되었음

한국에서도 단장증후군 및 그로 인한 장부전은 극희귀질환에 속할 것으로 예상되나, 한국에서의 단장증후군에 대한 선행연구가 없어 단장증후군의 정보 파악을 위한 연구가 필요함

(36)

2. 분석 방법과 내용

자료원: 2008년 ~ 2016년 건강보험심사평가원 청구자료 대상: 연구기간 동안 K91.2(수술 후 흡수장애)와 K91.8(단장증후군) 진단코드가 있는 인원 중 진단코드 발생일 이전에 기저질환 코드, 소장관련 수술 코드가 확인된 환자 분석방법: 단장증후군의 조작적 정의를 통한 유병률 및 발생률 산출, 각 조작적 정의에 따른 입원 및 외래 환자수를 파악하여 질병 부담(직접비) 산출

3. 분석 내용

성별, 연령과 경정맥영양의존기간의 정의※ 에 따라 환자를 구분해보면 조금씩 차이는 있지만, 남성이 여성보다 많음 ※ 정맥을 통해 영양분을 공급하는 방법으로 수술 후 의존기간이 6주 이상인 경우 ‘확실한 단장증후군(Definite)’, 6주 미만인 경우 ‘단장증후군 의증군(probable)’으로 정의 소아는 ‘확실한 단장증후군’, 성인은 ‘단장증후군 의증군’ 환자가 더 많았음 [표 1] 소아 및 성인 단장증후군에서의 인구동태학적 평가 (단위: 세, 명) 항목 ’08년~’16년 단장증후군 소아 (18세 미만) 성인(18세 이상) Definite Probable Definite Probable Mean age±s.d. 1.6±3.7 4.0±5.2 55.8±13.5 57.3±14.2

Age range 0.2~17 0.2~16 18~86 18~92 Male 72 (55.0%) 29 (65.9%) 243 (58.1%) 594 (61.6%) Female 59 (45.0%) 15 (34.1%) 175 (41.9%) 370 (38.4%)

(37)

36

[표 2] 소아 및 성인에서의 단장증후군 연도별 발생률

(단위: 명/100만 명)

연도 소 아 (18세 미만) 성 인 (18세 이상) 전 체

Definite Probable Total Definite Probable Total Definite Probable Total 2008 0.24 0.12 0.36 0.97 2.10 3.07 1.21 2.22 3.43 2009 0.30 0.10 0.40 1.08 2.03 3.11 1.39 2.13 3.52 2010 0.32 0.08 0.40 0.85 2.55 3.40 1.17 2.63 3.80 2011 0.35 0.06 0.41 0.85 2.17 3.02 1.20 2.23 3.43 2012 0.26 0.10 0.35 1.10 2.28 3.38 1.35 2.37 3.73 2013 0.35 0.12 0.47 1.10 2.15 3.25 1.45 2.27 3.72 2014 0.27 0.18 0.31 0.88 2.30 3.18 1.15 2.47 3.62 2015 0.27 0.04 0.31 0.93 1.92 2.85 1.20 1.96 3.16 2016 0.21 0.08 0.29 0.48 1.49 1.97 0.70 1.57 2.26 ’08년 유병률은 100만 명당 3.43명이었으나, 유병인구가 지속적으로 증가해 ’16년 유병률은 100만 명당 22.79명으로 증가하였음 소아는 ’08년 0.36명 → ’16년 2.94명으로, 성인은 ’08년 3.07명 → ’16년 19.85명으로 증가하여 성인의 유병률이 더 크게 증가함 [표 3] 소아 및 성인에서의 단장증후군 연도별 유병률 (단위: 명/100만 명) 연도 소 아 (18세 미만) 성 인(18세 이상) 전 체

Definite Probable Total Definite Probable Total Definite Probable Total 2008 0.24 0.12 0.36 0.97 2.10 3.07 1.21 2.22 3.43 2009 0.50 0.22 0.72 2.03 4.08 6.11 2.53 4.30 6.83 2010 0.81 0.30 1.11 2.77 6.35 9.13 3.58 6.65 10.23 2011 1.10 0.35 1.46 3.45 8.28 11.73 4.55 8.63 13.19 2012 1.26 0.45 1.71 4.26 10.01 14.27 5.52 10.46 15.98 2013 1.54 0.55 2.09 4.83 11.36 16.19 6.37 11.91 18.28 2014 1.79 0.72 2.79 5.22 12.99 18.22 7.01 13.72 20.73 2015 2.04 0.76 2.79 5.63 13.97 19.60 7.67 14.73 22.40 2016 2.13 0.81 2.94 5.40 14.45 19.85 7.52 15.26 22.79

(38)

단장증후군의 질병 부담을 보면 수술 후 1년 차 단장증후군 환자 1명의 직접비용은 ‘확실한 단장증후군’ 환자의 경우 약 6,500만원, ‘단장증후군 의증군’ 환자의 경우 약 2,700만원 정도로 질병 부담이 매우 높음 ‘확실한 단장증후군’ 환자 1명의 수술 후 1년 차 입원 비용은 소아의 경우 74,612,783원, 성인의 경우 60,795,929원 임 수술 후 시간이 지날수록 직접비용이 줄어들기는 하지만, 수술 후 5년 이후에도 1,000만원 이상의 질병 부담이 발생하여, 기본 질병 부담 정도가 매우 큰 편으로 생각됨

4. 결론

한국에서의 단장증후군 발생률은 100만 명당 3.5명 정도로 극희귀질환이나, 유병률은 ’08년부터 ’16년까지 지속적으로 증가함 수술 후 1년 차에는 질병 부담이 매우 높으며, 시간이 지날수록 질병 부담이 감소하지만 기본 질병 부담 정도가 매우 큰 편임 단장증후군은 희귀질환이지만 발병 이후에는 계속 질병을 보유하게 되고 질병 부담이 큰 만큼 제도나 정책적으로 관심이 필요함

(39)

38

아세트아미노펜이 급성 A형간염 환자의

임상경과에 미치는 영향

연구책임자 연구실무자 분석지원 김진욱 교수 정정화 박기찬 주임연구원 분당서울대학교병원 분당서울대학교병원 건강보험심사평가원 ※ ‘2017년 HIRA 빅데이터 분석 협업과제’ 사례

1. 분석 배경

급성 A형간염은 A형간염바이러스에 의해 발생하며, 발열, 근육통 및 관절통, 구역 및 구토 등의 증상이 나타남 급성 A형간염은 대개 발병 후 2개월 이내 회복되지만 드물게 급성 신부전, 담낭염, 췌장염 등의 합병증이 동반되거나, 전격성 간염으로 진행되어 사망하는 경우도 있음 아세트아미노펜은 흔히 쓰이는 해열진통제로 부작용이 없는 편이지만, 과다 복용할 경우 간손상을 일으켜 혼수상태, 사망에 이를 수도 있음 아세트아미노펜은 상용량을 복용할 경우 체내의 글루타티온에 의해 무독성 포합물로 전환되어 문제가 없으나, 과다 복용할 경우에는 포합되지 못한 아세트아미노펜이 다량의 독성물질(NAPQI)로 존재하면서 간독성을 유발하게 됨 급성 A형간염은 글루타티온 부족 상황을 초래하여 아세트아미노펜을 과다 복용한 상태와 유사한(아세트아미노펜 독성이 유발될 수 있는) 환경을 조성함 급성 A형간염 초기 발열과 복부 불편감 등의 증상을 감기 증상으로 오인하여 해열진통제인 아세트아미노펜을 복용하는 경우가 있음 그러나 이러한 경우에 상용량의 아세트아미노펜이 간기능과 급성 A형간염의 자연경과에 미치는 영향은 아직까지 알려진 바가 없음

(40)

본 연구에서는 국가수준 청구자료를 이용하여 급성 A형간염의 중증 합병증(입원, 혈액투석, 간성뇌증, 간이식)의 발생양상과 예측인자를 조사함. 특히, 아세트아미노펜의 투약이 중증 합병증 발생에 미치는 위험도를 분석하고자 함

2. 분석 방법과 내용

자료원: 2008년~2016년 건강보험 청구자료 대상: 2008년부터 2016년까지 급성A형간염으로 병원, 의원, 보건소 진료를 3회 이상 받은 만 18세 이상의 외래 또는 입원 환자 ※ 청구자료 기준 주/부상병 ICD-10 진단코드 B15가 3회 이상 청구되었으며, 급성 A형간염의 진단검사(HAV IgG, 청구코드 C4862 또는 C7584)가 1회 이상 청구된 환자

분석방법: 동반 상병, 중증 경과, 아세트아미노펜 투여 관련성 분석

3. 분석 결과

’08년 1월 1일부터 ’16년 12월 31일까지 급성 A형간염으로 43,500명이 진료를 받았으며, 평균 연령은 33.9세, 남성 환자는 61% 임 급성 A형간염 환자 중 84.5%의 환자가 입원 치료를 받았으며, 평균 입원 기간은 약 12일 임 급성 A형간염 환자 중 26.4%의 환자가 아세트아미노펜을, 11.4%의 환자가 비스테로이드 소염진통제를 처방받았으며, 5.4%는 두 가지 약물을 동시에 처방받음

(41)

40 [표 1] A형간염의 중증 경과 발병률 변수 산출결과 총 대상환자수 (n=43,500) 연령, 세 (평균±표준편차) 33.9±9.6 ≥ 50 세 (명,%) 2,669(6.1) 성별, 남성/여성 (명, %) 26,391(60.7) / 17,109(39.3) 치료 경과 외래방문 횟수 (평균±표준편차) 7.9±10.1 입원치료 환자수 (명, %) 36,755(84.5%) 입원 기간, 일 (평균±표준편차) 11.8±10.7 Acetaminophen 처방 (명,%) 11,481(26.4%) 환자 1인당 평균 처방일수 3.9±5.2 비스테로이드 소염진통제 처방 (명,%) 4,983(11.5) 환자 1인당 평균 처방일수 6.2±12.7 투석 시행 (명,%) 418(1.0) 기계호흡 시행 (명,%) 178(0.4) 간성뇌증 발생 (명,%) 109(0.3) 뇌부종 발생 (명,%) 131(0.3) 간이식 시행 (명,%) 55(0.1) 질병에 의한 중증 합병증을 간성뇌증, 뇌부종이나 급성신부전 발생, 또는 기계호흡이나 간이식수술 시행으로 정의(n=593)하여 급성 A형간염 환자에서 중증 합병증 발생의 예측 분석 결과, 기저 간질환, 당뇨, 고혈압, 만성콩팥병을 진단받은 환자와 해열진통제 처방환자의 중증 합병증 발생이 높은 것으로 나타남 단변량 분석 및 다변량 분석의 경우, 50세 이상 연령, 남성, 기저 간질환 환자 및 당뇨, 고혈압과 같은 동반질환자(비만 제외)에서 위험성이 높게 관찰되었음 아세트아미노펜과 NSAIDs의 해열진통제 처방환자는 약물처방력이 없는 환자에 비해 중증 합병증의 발생이 각각 5.7, 2.9배 이상 높음

(42)

[표 2] A형간염 중증 경과 예측모델 변수

단변량 분석 다변량 분석

Odds ratio (95% CI) P-value Odds ratio (95% CI) P-value

나이 < 50세 (n=40,831) ≥50세 (n=2,669) 1.00 2.32 (1.82, 2.96) <.001 1.00 1.18 (1.18, 1.19) <.001 성별 여성 (n=17,109) 남성 (n=26,391) 1.00 2.06 (1.70, 2.49) <.001 1.00 1.74 (1.74, 1.75) <.001 기저 간질환 없음 (n=39,979) 있음 (n=3,521) 1.00 2.43 (1.96, 3.01) <.001 1.00 1.50 (1.49, 1.50) <.001 만성B형간염 없음 (n=41,866) 있음 (n=1,634) 1.00 2.73 (2.07, 3.61) <.001 만성C형간염 없음 (n=42,714) 있음 (n=796) 1.00 1.82 (1.15, 2.89) 0.011 알코올성간질환 없음 (n=42,344) 있음 (n=1,156) 1.00 1.22 (0.77, 1.93) 0.405 간경변증 없음 (n=42,985) 있음 (n=515) 1.00 7.03 (5.09, 9.71) <0.001 비만 없음 (n=43,479) 있음 (n=21) 1.00 0.001 (0.01, 99.99) 0.971 당뇨병 없음 (n=40,734) 있음 (n=2,766) 1.00 6.19 (5.16, 7.43) <.001 1.00 3.18 (3.17, 3.19) <.001 고혈압 없음 (n=41,951) 있음 (n=1,549) 1.00 5.37 (4.28, 6.73) <.001 1.00 1.89 (1.88, 1.91) <.001 만성신장질환 없음 (n=43,357) 있음 (n=143) 1.00 25.86 (17.56, 38.06) <0.001 1.00 - <.001 만성폐쇄성폐질환 없음 (n=41,666) 있음 (n=1,834) 1.00 2.02 (1.51, 2.74) <0.001 1.00 1.03 (1.02, 1.03) <.001 약물 처방력 없음 (n=29,383) 1.00 NSAIDs (n=2,636) 4.06 (2.95,5.58) 0.005 2.90 (2.88, 2.92) <.001 APAP (n=11,481) 7.20 (5.95, 8.72) <.001 5.66 (5.63, 5.69) <.001

(43)

42

4. 결론

급성 A형간염 환자에서 NSAIDs 및 APAP의 처방력은 모두 위중한 경과를 예측하는 지표임

기저 질환으로 간 질환이 있거나, 당뇨병, 고혈압 환자의 경우 급성 A형간염의 중증 합병증의 위험이 더욱 높으므로 예방접종을 적극적으로 시행하여야 함 급성 A형간염 발생 시 비스테로이드성 소염진통제 및 아세트아미노펜 처방자의 경과에 대한 적극적인 모니터링이 필요함 하지만 아세트아미노펜은 일반의약품으로 환자가 별도의 처방없이 복용할 수 있어, 관리상의 한계가 있을 수 있음

(44)
(45)

HIRA 빅데이터 분석 가이드는

HIRA 빅데이터 이용방법과 구조 등을 소개하고,

대표적인 분석 방법을 안내하여 연구자들이

HIRA 빅데이터를 보다 쉽게 활용할 수 있도록 지원합니다.

HIRA

빅데이터

분석 가이드

(46)

'HIRA 빅데이터 분석 가이드' 란?

본 분석가이드는 건강보험심사평가원의 데이터를 활용을 원하는 연구자들에게 도움이 되고자 작성되었습니다. 심평원 데이터를 처음 접하거나, 익숙치 않은 분들도 연구에 자유롭게 활용할 수 있도록 자세하고 쉽게 설명하고자 합니다. 이번 호에서는 입원 에피소드 구축에 대한 설명을 담고 있으며, 다음 호에서는 동반질환 분석에 대해 소개할 예정입니다. [표 1] HIRA 빅데이터 분석 가이드 계획(2018년) 주 제 2018년 1분기 (제2권 1호) HIRA 보건의료 빅데이터 소개 2018년 2분기 (제2권 2호) 입원 에피소드 구축 2018년 3분기 (제2권 3호) 동반질환 분석 2018년 4분기 (제2권 4호) 대조군 설정

(47)

46

HIRA 빅데이터 분석 - 입원 에피소드 구축

※ 참고: 건강보험 청구자료 분석 매뉴얼(2017, 건강보험심사평가원)

1. 에피소드의 정의

보건의료 에피소드(Health care episode)란 ‘건강 문제의 시작 시점부터 완료 시점까지’를 하나의 사건으로 묶은 것으로, Hornbrook 등(1985)1) 에 의해 소개됨 건강 문제란 특정 질병·질환의 진행, 건강관리 문제, 치료 과정 등을 의미하며, 각각 하나의 에피소드로 구분할 수 있음 실제 건강 문제를 인과관계로 규명하기에는 어려움이 있어 시작과 끝을 정의하기 불분명함 따라서 대안으로 요양기관에서 의료 서비스를 받기 시작한 시점부터 종료된 시점까지를 진료 에피소드(Episode of Care)로 정의하였음 [그림 1] 보건의료 에피소드의 종류(Hornbrook 등, 1985) 환자가 요양기관에서 진료를 받는 경우 진료내역이 명세서 상에 기록되므로 진료를 개시한 날짜와 종료한 날짜를 확인할 수 있음 우리나라는 건강보험 제도 기반하에 전 국민의 진료내역이 건강보험심사평가원에 청구되므로, 이를 활용하여 진료 에피소드를 정의할 수 있음

1) Hornbrook MC, Hurtado AV, Johnson RE. Health Care Episodes: Definition, Measurement and Use. Med Care Rev 1985; 42(2):163-218.

(48)

2. 청구자료 분석 시 에피소드 구축의 필요성

건강보험 청구자료는「요양급여비용 청구방법, 심사청구서ㆍ명세서서식 및 작성요령」(보건복지부 고시)에 따라 요양기관이 심사평가원으로 청구한 명세서를 청구건 단위로 누적한 자료임 따라서 환자 단위 분석을 시도할 시, 청구건 단위 명세서를 동일 수진자 기준으로 정렬ㆍ통합할 필요가 있음 입원의 경우 동일 수진자에 대한 입원진료기간의 요양급여내역을 동일한 명세서에 통합하여 작성하는 것이 원칙이나, 아래와 같은 ‘분리 청구’의 경우가 발생할 수 있음 입원 기간 중 월이 달라질 경우 월별로 구분하여 청구 30일을 초과하여 입원진료를 하는 경우 월단위로 분리하여 청구 입원 ‘분리 청구’의 경우, 동일 수진자 한 건의 입원사례에서 여러 건의 명세서가 발생할 수 있게 되므로, 이를 통합하기 위해 입원 에피소드 구축이 필요함 1. 일반 청구 2. 분리 청구 ※ 는 실제 입원 날짜, 는 실제 퇴원 날짜 임 [그림 2] 일반 청구와 분리 청구 명세서 비교 ※ 위의 분리 청구 사례 외에도, 다양한 경우로 인해 에피소드 구축이 필요한 경우가 있을 수 있으므로 청구형태를

(49)

48

3. 입원 에피소드 구축 과정

입원 에피소드는 명세서 테이블에 있는 수진자개인식별대체키, 요양기관식별대체키, 요양개시일자, 요양종료일자를 기준으로 정렬한 뒤, ‘기준 입원 명세서’와 ‘다음 입원 명세서’를 비교하는 과정을 통해 구축함 ※ 용어 정의 1. 기준 입원 명세서: 에피소드 구축 시 기준이 되는 명세서로 동일 환자, 동일 요양기관에서 발생한 명세서 중 요양개시일자가 가장 빠른 명세서 2. 다음 입원 명세서: ‘기준 입원 명세서’와 환자, 요양기관이 동일하며, 요양개시일자가 ‘기준 입원 명세서’의 요양종료일자와 연속(1일 이내)되는 명세서 ex) ‘기준 입원 명세서’  ‘다음 입원 명세서’  (‘다음 입원 명세서’) … 본 가이드에서는 요양개시ㆍ종료일자를 이용하여 연속되는 명세서들을 하나의 에피소드로 구축하는 과정을 소개함 ① 자료 정렬 동일 환자, 동일 요양기관별로 묶고, 연속되는 명세서를 파악하기 위해 요양개시일자, 요양종료 일자별로 정렬함

/*[1단계] 환자 고유 식별자(pat_hpin), 요양기관기호(ykiho), 요양개시일자(recu_fr_dd), 요양 종료일자(recu_to_dd)를 기준으로 정렬*/

proc sort data=temp1; by pat_hpin ykiho recu_fr_dd recu_to_dd; run;

(50)

② 변수 생성 에피소드별로 구분하기 위해 필요한 변수를 생성하고, 생성된 변수를 사용하여 에피소드별로 날짜, 비용 계산 심사평가원의 날짜변수(요양개시ㆍ종료일자)는 문자형식으로 되어있어 날짜형식으로 변환하여 명세서간 간격을 구함 에피소드 구분자를 생성하고, 이를 기준으로 날짜, 비용(누적합)을 계산함 /*[2단계] 입원 청구자료에 에피소드 구분자 생성*/ data temp2; set temp1;

by pat_hpin ykiho;

format start_date end_date start_date2 end_date2 yymmdd10.;

/*문자형식을 날짜형식으로 변환: 요양개시일자(start_date), 요양종료일자(end_date)*/

start_date = input(recu_fr_dd, yymmdd8.); end_date = input(recu_to_dd, yymmdd8.);

/*retain 변수 생성: 요양개시일자(start_date2), 요양종료일자(end_date2), 비용 합계(tot_amt), 에피소드 구분자(eps)*/

retain start_date2 0 end_date2 0 tot_amt 0 eps 0;

/*에피소드 구분자(번호) 부여*/

/*요양기관기호가 다른 경우에는 다른 에피소드로 정의하고, 일자와 비용을 retain변수에 업데이트함*/

if first.ykiho then do;

eps+1; start_date2=start_date; end_date2=end_date; tot_amt=amt; end;

/*동일 요양기관이고 청구건 간격이 1일 이내인 경우, 동일 에피소드로 정의함.

에피소드 내에서 요양개시일자의 최솟값과 요양종료일자의 최댓값을 retain 변수에 업데이트함. 비용을 누적합산하여 retain 변수에 업데이트함*/

else if start_date-end_date2<=1 then do;

eps=eps; start_date2=min(start_date, start_date2); end_date2=max(end_date, end_date2); tot_amt+amt; end;

/*동일 요양기관이면서 청구건 간격이 1일을 초과하는 경우에는 다른 에피소드로 정의함. 일자와 금액을 retain 변수에 업데이트함*/

(51)

50 ※ 1. 2번 에피소드는 1번 에피소드와 환자가 동일(a)하고, 날짜가 연속(2. 28. - 3. 1.)되지만, 요양 기관(1번: aa, 2번: bb)이 다르므로 다른 에피소드로 정의 2. 3번 에피소드는 2번 에피소드와 환자, 요양기관이 동일(a, bb)하지만, 날짜가 연속되지 않아 다른 에피소 드로 정의

(52)

③ 에피소드 단위의 자료 생성

동일 에피소드의 경우 마지막 경우만 선택하여 중복되는 값 제거

/*[3단계] 에피소드 단위의 분석자료 생성*/

proc sort data=temp2; by pat_hpin ykiho eps; run;

data temp3; set temp2(drop=start_date end_date); by pat_hpin ykiho eps ; if last.eps; run;

4. 맺음말

건강보험 청구자료를 분석할 때는 입원 자료의 청구 특성을 이해한 뒤 에피소드 단위로 분석하여야 보다 의미있는 결과를 얻을 수 있음 에피소드를 구축하지 않고 분석할 경우에는 분리 청구, 요양기관기호 변경 등의 상황으로 인해 입원건수, 입원기간, 비용 등이 과대ㆍ과소 산출될 수 있음 본 가이드에서는 청구건 간 간격을 고려하여 입원 에피소드를 구축하는 방법을 설명하고 있지만, 연구자의 판단에 따라 다양한 구축 방법들이 설계될 수 있음 특정 상병, 청구건 간 간격, 진찰료 청구 여부, 동일 요양기관 정의 등 여러 사항들을 고려하여 연구 성격에 맞는 에피소드를 구축하여야 함

(53)

52

tip 입원 에피소드 구축 시 주의할 점

1. 특정 상병 동일한 입원이지만 입원 중 다른 질환(합병증, 전이 등)을 진료받을 경우 다른 주상병이 기재된 명세서가 포함될 수 있음 다른 상병이 기재된 명세서를 포함한 에피소드를 구축할 것인지, 특정 상병의 명세서만으로 구축할 것인지 판단해야 함 3. 재입원 여부 연속되는 입원을 재입원으로 정의할 경우 별도의 확인이 필요함 재입원의 경우 진찰료(초진, 재진)가 청구되므로 진료내역에서 진찰료 청구여부를 확인한 후 에피소드 구축 2. 청구건 간 간격 ‘기준 입원 명세서’와 ‘다음 입원 명세서’가 연속되지 않고, 입원 형태에 따라 중복, 포함되는 등 다양한 경우가 발생할 수도 있음 연속되는 입원 형태의 경우 청구건 간 간격을 0 또는 1일로 설정하여 에피소드를 구축하지만, 아래와 같은 다른 형태의 명세서가 존재할 수 있으므로 사전에 고려할 필요가 있음 4. 동일 요양기관의 요양기호 변경 여부 실제로 동일한 요양기관이지만 행정상의 이유(요양기관 종별, 대표자, 소재지 등의 변동)로 요양기관 기호가 변경되는 경우가 있음 명세서 건 입원 기간 기준 청구건 다음 청구건 명세서 건 입원 기간 기준 청구건 다음 청구건 기준 청구건 다음 청구건 명세서 건 입원 기간 다음 청구건 기준 청구건 명세서 건 입원 기간 다음 청구건 기준 청구건 명세서 건 입원 기간

(54)

HIRA 보건의료 빅데이터 이용 안내

‘보건의료빅데이터개방시스템(opendata.hira.or.kr)’에서는 여러 가지 형태의 빅데이터 서비스가 제공되고 있으며, 용도에 따라 적합한 서비스 선택ㆍ이용이 가능함 구 분 내 용 원시자료(raw data) 분석 지원 서비스 연구자 및 산업체가 원하는 맞춤형 원시데이터 분석이 가능하도록 방문 또는 원격 접속으로 빅데이터분석시스템 활용 Open API 실시간 제공 서비스 민간기업, 프로그램 개발자, 인터넷 이용자를 대상으로 손쉽게 직접 응용 프로그램과 서비스를 개발할 수 있도록 병원ㆍ약국 정보 서비스 등 보건의료데이터 지원 환자표본 DB 제공 서비스 연구자의 필요에 따라 환자표본 데이터 등 총 4개의 DB데이터셋을 생성ㆍ제공하여 연구 및 R&D사업에 활용하도록 지원 HIRA 보건의료 빅데이터 이용 절차(원격 접속) ※ 자세한 내용은 ‘보건의료빅데이터개방시스템(opendata.hira.or.kr)’에 접속 후 ‘의료빅데이터’ - ‘빅데이터 분석 이용 안내’ 참고 이용 신청 서류 제출 수수료 납입 자료 분석 결과활용 통보

(55)
(56)
(57)

빅 데 이 터

2018년 5월 김승택 [26465] 강원도 원주시 혁신로 60 전 화 1644-2000 홈 페 이 지 www.hira.or.kr 디자인·기획 (사)한국근로장애인진흥회 다원디자인프린팅

(58)

참조

관련 문서

●○● 첨부1 미래전망 참여 전문가 명단. 첨부1 미래전망 참여

인공지능을 통한 예술 작품의 생성 과정을 설명할

인터넷전문은행은 간편결제 및 비대면 인증 등 기존의 은행이 제공하지 못했던 금융 서비스를 제공할 것이라는 기대가 높지만 아직까지는 인공지능, 빅데이터,

Random Forests는 과학계는 물론 산업계에서도 많이 사용되는 Machine Learning 알고리즘으로, 매우 우수한 성능을 보여주는 알고리즘 중에 하나입니다.. Random

공법에 따라 건물의 열손실 및 결로의 가능성 등이 달라지므로 실의 용도와 재료에 따른 적절한 선택이 필요하다.. 단열이 잘 되지 않는 경우 생길 수 있는

가압기 수위와 압력 변수를 예측하기 위해서 차원 축소 알고리즘 중 하나인 Principal Component Analysis(PCA), 인공지능 방법인 Long Short-Term Memory(LSTM),

- 전문가 초빙 연수를 통해 인공지능스피커인 AI메이커스 스피커를 다루는 방법을 알게 되 었으며 인공지능 원리를 터득하였다.. - 인공지능,

1차시 수업에서는 생활 속에서 분류가 필요함을 알고 생물을 사람의 편의에 따라 분류할 경우 사람에 따라 분류 결과가 달라지므로 생물 고유의 특징을