• 검색 결과가 없습니다.

HIRA 빅데이터 브리프 제2권1호

N/A
N/A
Protected

Academic year: 2021

Share "HIRA 빅데이터 브리프 제2권1호"

Copied!
68
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

H

I

R

A

빅 데 이 터

H I R A B i g D a t a B r i e f

(2)

보건의료 빅데이터 동향 _

03

1. 보건의료 빅데이터의 GIS 활용 _ 05 2. 보건의료 빅데이터 관련 주요 기사 _ 25

HIRA 빅데이터 분석 사례 _

29

1. 다운증후군 환자의 합병증 발생과 관리 현황 분석 _ 31 2. 미세먼지 농도와 관련 질환 건강보험 청구액의 상관관계 분석 _ 36 3. 최근 8년간 항우울제 처방양상 변화 _ 41 4. 빅데이터 분석 방법(Shrinkage Methods)을 이용한 한국인의 골다공증에 연관된 질병 현황 _ 49

HIRA 빅데이터 분석 가이드 _

55

분석 가이드란? _ 57 HIRA 보건의료 빅데이터 소개 _ 58

(3)
(4)
(5)

보건의료 빅데이터 동향에서는 국내외 빅데이터 관련 기술 개발,

활용 등 최신 동향을 소개합니다.

보건의료

빅데이터

동향

(6)

보건의료 빅데이터의 GIS 활용

이광수 교수 연세대학교 보건과학대학

1. 들어가는 말

보건의료분야에서 생성되는 빅데이터는 지리정보시스템(Geographic Information System, GIS) 및 공간정보와의 융합이 진행되고 있고, 이를 통하여 데이터의 처리, 분석, 해석에 있어서 새로운 시각과 활용 가능성을 제시하고 있음 공간정보란 국가공간정보 기본법 제2조에 의하면 ‘지상·지하·수상·수중 등 공간상에 존재하는 자연적 또는 인공적인 객체에 대한 위치정보 및 이와 관련된 공간적 인지 및 의사결정 에 필요한 정보’로 정의하고 있음 지리정보시스템(GIS)이란 ① 공간정보를 디지털화하고, 컴퓨터상에서 각종 자료를 효과적으로 수집, 저장, 검색, 갱신, 분석, 시각화하는 도구로서, ② 공간적 위치정보를 시각화하는 지도(map)와 공간이 가지고 있는 속성정보(문자, 숫자)를 연결하는 시스템이며, ③ 위치(location)에 관한 정보를 다루는 정보시스템임. 지리정보시스템은 의료뿐만 아니라, 경제, 산업, 환경 등 다양한 분야에서 널리 활용되고 있음 보건의료분야에서도 청구데이터와 같은 속성자료와 더불어 이용 가능한 의료기관 및 환자 주소 등과 같은 공간정보의 종류가 확대되고 있음. 의료서비스시장의 특징은 환자의 의료서비스의 이용이 일정 지역 안에서 많은 부분이 발생한다는 것이며, 지역에 따른 의료이용, 건강수준의 차이가 발생하고 있음. 이러한 추세속에서 GIS는 보건의료빅데이터 활용의 새로운 가치 창출에 기여할 것임

(7)

2. 국내 공간정보산업 현황

2012년 제정된 공간정보산업 특수분류는 공간정보 제조, 유통, 출판 및 서비스, 기술서비스, 연구개발, 관련 협회 및 단체 등 6개 분야의 24개 세부업종으로 분류하고 있음. 2016년 공간정보산업조사에 의하면 공간정보 관련 사업체는 4,533개사였으며, 매출액은 7조 9,549억 원으로 조사되었음(공간정보산업진흥원, 2016) 업종별로 공간정보 관련 기술 서비스업의 사업체수가 3,053개사(67.35%)로 가장 많았고, 출판 및 정보서비스업 사업체수가 895개사(19.74%), 공간정보 관련 도매업 사업체수가 406(9.00%)의 순이었음. 공간정보 관련 매출액 구성은 공간정보 관련 기술 서비스업(50.4%), 출판 및 정보서비스업(29.7%), 공간정보 관련 도매업(12.8%) 순으로 조사되었음 종사자수, 매출액 측면에서 국내 전체 산업 대비 약 0.1 ~ 0.3%의 규모를 가지는 작은 산업이기는 하지만, 산업의 성장률은 타 분야에 비해 높음. 2015년 보건 및 방범 활용 분야의 국제시장 규모는 69억 8,000만 달러(약 8조, 3,700억원)이며, 활용 용도별 공간정보 활용시장 중 2번째로 규모가 큼 공간정보의 활용과 공간정보산업의 발전을 위해 공공기관에서 각종 서비스들이 만들어 지고 있으며, 이를 통해 정보의 활용과 다양한 산업·기술과의 융합을 목표로 하고 있음 공공기관이 다양한 공간정보를 개발, 보유하고 있으며, 정보의 유통과 활용을 촉진하기 위하여 포털을 구축하고 정보 활용을 유도하고 있음 정부는 국가공간정보통합서비스(www.nsdi.go.kr)를 구축한 후, 공공기관에서 만들어진 다양한 공간정보(국가공간정보통합체계, 공간빅데이터, 부동산종합공부시스템, 한국토지정보시스템, 국가공간정보유통시스템, 지적재조사시스템, 공간정보사업 공유 및 관리시스템, 국토공간계획지원체계, 온나라부동산포털, 공간정보오픈플랫폼)의 연계와 통합을 통하여 대국민 서비스를 위한 체계를 구축하였음 통계청은 통계지리정보서비스(SGIS)를 구축하고 있으며, 국민들에게 통계주제도, 대화형 통계지도, 분석지도 등을 서비스하고 있음

(8)

3. 보건의료 빅데이터의 GIS 적용 동향

3.1 국외 사례

전세계 전염병 현황을 나타내는 ‘HealthMap’

‘HealthMap’은 보스턴 아동병원(Boston Children’s Hospital), 소프트웨어 개발자, 역학자(epidemiologist)들이 제작한 웹사이트이며, 구글맵을 기반으로 전염병의 발생을 모니터링하고 공중보건의 위험요소에 대해 실시간 감시체계를 보여주는 지리정보를 제공하고 있음

ProMED mail, WHO(World Health Organization)등 을 통해 전세계의 전염병에 대한 정보가 실시간으로 업데이트 되고 있으며, 이러한 정보는 ‘Healthmap’ 웹페이지에서 지도형태로 무료로 제공하고 있음

또한 ‘HealthMap’은 모바일 어플리케이션인 ‘Outbreaks Near Me’를 통해서도 이용가능하며, 사용자의 위치정보를 이용해 사용자가 위치한 지역의 질병상태에 대해 실시간으로 정보를 제공하고 있음

(9)

Flu의 관리를 위한 미국의 ‘Flu Near You’, ‘HealthMap Vaccine Finder’

'Flu Near You'는 주로 미국의 Flu발생 현황에 대한 정보를 제공하기 위해 ‘American Public Health Association’, ‘Skoll Globbal Therats Fund’, ‘HealthMap’의 협력을 통해 제작되었음 ‘HealthMap’과 독립적인 홈페이지를 통해 제공되고 있으며, 'flunearyou.org'에서 무료로

정보를 제공하고 있음

‘Flu Near You’는 참여형 감시 체계로 Flu 증상이 있는 환자들이 직접 자신의 증상을 등록하고, 1주일마다 데이터를 합산하여 Flu 증상이 다수 보고된 지역을 지도로 시각화하여 제공하고 있음

(10)

‘HealthMap Vaccine Finder’는 백신을 제공하는 지역에 대한 정보를 제공하기 위해 ‘HealthMap’과 ‘Boston Children’s Hospital’, ‘Harvard Medical School’에서 운영하고 있음 백신에 대한 환자의 접근성을 높이기 위한 목적으로, 미국 각 지역의 clinic, 약국, CDC(Center

for Disease Control and Prevention) 등 건강 관련 기관과 협력을 통해 각종 질병의 백신공급자 위치를 제공하고 있음

(11)

CMS(Centers for Medicare & Medicaid Services)의 시각화된 메디케어 정보 제공

CMS는 Data.CMS.gov 홈페이지에서 ‘The Mapping Medicare Disparities Tool(The MMD Tool)’, ‘Market Saturation and Utilization’ 등 보건의료분야의 interactive map을 제공하고 있음 ‘The MMD tool’은 현재 유행하고 있는 질병, 비용, 55가지 특정만성질환에 대한 입원, 응급실

이용, 재입원률, 사망률 등에 대한 건강결과에 대한 정보를 시각화한 지도를 제공하고 있음 건강결과에 대한 정보는 구체적으로 1) National, State, County 단위, 2) 성별ㆍ인종ㆍ민족ㆍ

연령별 간, 3) 지역 간 차이, 4) 동일 지역 내의 인종ㆍ민족 간 차이에 대한 지리정보를 제공함

(12)

‘Market Saturation and Utilization’은 특정 의료서비스의 이용자 대비 공급자의 비율로 서비스 공급의 포화정도에 대한 정보를 지도로 제공하고 있음

의료서비스 분야는 Ambulance, Home health, Long-term care hospital 등 14개 서비스로 구분되어 제공되고 있음

[그림 5] CMS의 ‘Market Saturation and Utilization’

CDC의 만성질환, 암 등 주요 질환에 대한 지리정보 제공

CDC NCHHSTP(National Center for HIV/AIDS, Viral Hepatitis, STD, and TB Prevention) AtlasPlus는 HIV, AIDS, 간염, 결핵, 간염, 각종 성매개 감염병과 관련된 interactive maps, 그래프 등을 제공하고 있음

(13)

[그림 6] CDC의 ‘NCHHSTP AtlasPlus’

‘Chronic Disease GIS Exchange Map Gallery’에서는 심장질환, 고혈압, 당뇨병 등 주요 만성질환의 유병률, 의료서비스 접근성에 대한 미국 각 지역의 지리정보를 제공하고 있으며, 보건관리자, 지역사회의 장, GIS 사용자, 역학자들의 협력을 통해 제작되고 있음

이를 통해 만성질환의 지리적 불균형 해소, 정책 및 프로그램 개발 등 정책의 가이드를 제시하고자 함

(14)

Diabetes County Data & Maps는 진단된 당뇨병, 비만, 신체활동의 데이터와 추세를 시각화하여 제공하고 있음

이를 통해 지역 주민들이 당뇨병 관리 및 예방을 위한 지역 자원을 활용할 수 있도록 하는데 목적이 있음. 미국의 각 주별, 카운티별 당뇨병 데이터를 수집할 수 있으며, 지역에 대한 비교와 시간 흐름에 따른 추세변화를 확인할 수 있음

[그림 8] CDC의 ‘Diabetes County Data & Maps’

미국 내의 질병 모니터링을 위한 ‘DiseaseMaps Dynamic Map Application’

‘DiseaseMaps Dynamic Map Application’은 USGS(The United States Geological Survey)에서 제작하여 제공하고 있음

West Nile Virus, St. Louis Encephalitis, Eastern & Western Equine Encephalitis, La Crosse Virus, Powassan Virus, Dengue Fever, Chikungunya Virus 등의 질병 정보를 제공함. 또한 사람의 감염뿐만 아니라 모기, 새 등의 매개체의 감염에 대한 정보를 함께 제공하고 있음

(15)

[그림 9] USGS의 ‘DiseaseMaps Dynamic Map Application’ 영국, ‘Health profiles’ 매년 영국 보건부와 보건위생부는 각 지역의 건강수준에 대한 세부 정보를 다양한 지표와 비교 자료를 지도와 함께 제공하고 있음 각 지역, 인구의 건강정보를 일관되고 요약된 형태로 제공하고 있으며, 이와 동시에 비교할 수 있는 정보를 제공하고 있음. 이러한 정보를 이용하여 지역요구평가, 기획, 성과 관리 등에 대한 활동을 수행하고 있음 [그림 10] 영국의 ‘Health profiles’

(16)

캐나다

캐나다 공중보건협회(Canadian Public Health Association)는 지역에서 건강향상과 형평성 달성을 위해 실제로 수행된 활동에 대한 경험, 도구, 교재 정보의 상호 교환을 촉진하기 ‘Frontline Health atlas’ 대화형 플랫폼을 제공하고 있음

캐나다 전국에서 자료가 공유되고 있으며 다양한 건강의 사회적 결정요인에 대하여 다루고 있음. 이러한 활동을 통하여 인구의 건강결정요인과 관련된 정책결정에 영향을 미치고자 하고 있음

[그림 11] Canadian Public Health Association의 ‘Frontline Health atlas’

호주, ‘GRAPHC(The National Centre for Geographic Resources & Analysis in Primary Health Care)’

‘Primary Health Care Research Institute(APHCRI)’내에 설치된 GRAPHC는 지역의 의료자원 및 서비스를 대상으로 하여 적절하고 형평적인 해결방법을 모색하기 위해 만들어 졌음

(17)

이를 위해 지리정보시스템을 이용한 분석방법, 데이터, 웹 기반 플랫폼 등을 제공하고 있으며, primary health care 이슈에 대한 연구수행을 지원하고 있음

대화형 온라인 매핑 기능을 지원하고 있으며, G-Tag시스템은 개인 프라이버시와 기밀을 유지하면서 데이터에 지리적 식별자를 적용하고 있음

(18)

3.2 국내동향

건강보험심사평가원 전 국민 진료정보를 포함한 의약품 처방 및 유통정보 등을 포함된 보건의료 빅데이터개방 시스템을 구축하여 비식별화된 정보 혹은 민감하지 않은 정보를 외부에 제공 의료이용지도(Health Map)를 제공하고 있음. 지역별 의료자원 현황 등을 시각적으로 알기 쉽게 볼 수 있으며, 감염병, 계절성 질환 등의 실시간 확인이 가능함 병원·약국찾기: 병원 및 약국의 위치를 원하는 지역 내에서 찾아주는 기능과 병원 규모별, 특정진료별, 분야별 등 세부 조건에 따라 찾아주는 기능 제공 [그림 13] 건강보험심사평가원의 ‘의료이용지도’

(19)

보건복지부와 국립중앙의료원의 의료이용지도(Health map) 서비스 지역별 의료이용 및 공급 현황 등의 제공을 위한 지도 웹 서비스 수행. 지역 및 공공 의료계획 수립에 대한 정보 수집 및 DB 구축과 분석을 통한 근거 기반의 정책 수립에 활용하기 위함 지역별 의료이용 및 공급 현황 분석을 통한 주제도 분석, 분야별 의료취약지 거점의료기관 배치 시뮬레이션, 지도 위에서 의료기관의 분포 조회 등의 기능 제공 소개 Health Map 분석지표 사용자 설명서 스마트 진단 서비스 공공의료기관 현황 지역현황 지역점유율 통계분석 주제도 분석 지역별 의료이용 유출입 조회 거점의료기관 배치 시뮬레이션 활용사례 의료취약지 도출 공공보건의료계획 수립 지원 의료자원 배치 분석 지역별 지표조회 시군구별 조회 현황조회 의료기관 분포 조회 최단거리 의료기관 조회 분야별 의료취약지 조회 [그림 14] 보건복지부와 국립중앙의료원의 ‘의료이용지도’ 인천시 모기를 매개로 하는 감염병 예방을 위해 IoT(Internet of Things)를 이용한 자동 모기 계측기를 120개 지점을 선정해 운영하고 있음

이를 통해 수집된 모기발생 장소는 ‘Smart GIS Incheon’ 홈페이지를 통해 지역주민들에게 시각화된 정보를 제공하고 있음

(20)

[그림 15] 인천시의 ‘Smart GIS Incheon’ 지방자치단체의 GIS를 활용한 의료시설 정보공개 충청남도 공간정보포털은 2008년 이후 3차원 지리정보시스템을 통해 지역 내 시설물에 대한 지리정보를 제공하고 있음. 그 중 보건의료분야에서는 공공보건의료기관, 약국, 응급의료기관 병·의원의 위치정보를 제공하고 있으며, 지도는 위치정보뿐 아니라 거리측정, 로드뷰 등의 옵션을 추가적으로 제공하고 있음 광주광역시 광산구청 공공데이터 플랫폼인 광산imap은 안전, 의료, 복지 시설 등의 위치정보를 제공하고 있으며, 그 중 의료분야에서는 지역의 병의원, 보건소, 응급의료기관 등의 위치정보를 시각화하여 제공하고 있음 [그림 16] 지방자치단체의 GIS 활용 의료시설 정보 공개 화면 충청남도 공간정보포털에서 제공하는 의료기관 위치정보 광산구청 공공데이터 플랫폼에서 제공하는 우리동네 건강지킴이 서비스

(21)

질병관리본부 방역활동의 효율성을 높이기 위해 방역지리정보시스템을 개발 시스템은 방역차량의 궤적관리, 실시간 감염병 매개체 모니터링, 소독 의무시설 취약지, 감염병 매개체 발생 취약지의 약품 관리 등에 이용되고 있음. 또한 GIS와의 연계를 통해 지역별 감염별 발생현황을 파악할 수 있어 감염병 관리의 효율성을 높일 것으로 예상됨 2015년을 기준으로 ‘방역지리정보시스템’은 전국 255개 보건소 중 17개 보건소에서 활용 중 임 [그림 17] 질병관리본부의 ‘방역지리정보시스템’

3.3 주요 최신연구동향

Alberto Larocca(2016)는 우간다의 말라리아 진단 및 관리를 위한 m-Health를 도입했을 때 효과성이 가장 높은 지역을 GIS를 통해 분석함

또한 말라리아를 관리하는 기존 프로세스를 개선하여 GIS와 통합된 m-Health 기술을 도입한 프로세스를 제시함

GIS와 m-Health를 통합한 기술의 도입은 실시간 데이터 수집을 가능하게 하여 모니터링을 강화할 수 있으며, 이를 통해 효율적인 의사결정이 가능할 것으로 판단

Monaghan AJ at el(2016)은 지카바이러스의 매개체가 되는 Aedes Aegypti mosquito의 계절에 따른 분포를 GIS를 통해 분석하였고, 이를 통해 계절에 따라 지카바이러스의 위험이 높은 지역을 예측하는 모델을 제시함

Network of geographical information system for vector control

(22)

최소영, 이광수(2017)의 분만의료서비스에 대한 접근성 평가

강원도 지역의 읍·면·동에 거주하는 가임기 여성을 대상으로 분만서비스를 제공하는 의료기관에 대한 공간적 접근성을 평가함

공간분석방법 중 네트워크분석(network analysis)방법인 service area analysis와 OD-cost matrix 분석방법을 이용하여 소요시간과 이동거리를 추정함 [그림 18] 분만의료서비스에 대한 접근성 평가 김윤 등(2016)의 환자 의료이용지도(Health map) 구축 연구 건강보험 빅데이터를 활용하여 우리나라의 질환유병별 의료생활권(진료권)을 설정하고, 이를 기반으로 한 지역 간 변이양상을 비교 분석하여 주요 정책 영역별 모니터링 및 자원배치 방안 등 정책적 근거 마련 목적 의료생활권(진료권)별 입원서비스의 의료자원 분포 및 의료이용 변이지표, 일차의료관련 한국형 아틀라스의 개발과 심뇌혈관질환 의료이용과 결과의 지역변이, 5대 암종별 의료공급, 결과의 상관관계를 확인

(23)

[그림 19] 환자 의료이용지도 구축 연구

4. 맺는 말

공간정보와 다양한 보건의료분야 빅데이터의 융복합은 국가보건의료시스템의 성과 향상을 위한 문제 파악 및 의사결정에 주요한 정보를 제공할 수 있음 특히, 지역 간 차이가 존재하고 있는 현실의 구체적 파악 및 위치 정보의 활용은 국가보건 의료 시스템의 개선을 위한 가치있는 정보를 제공할 것임. 현재 급격하게 발전하고 있는 인공지능, 모바일, 사물인터넷 등과 같은 기술과의 융합은 이러한 발전 양상을 강화할 것임 공간정보와 보건의료 빅데이터의 융복합을 위하여 다음의 과제에 대한 고민이 필요함 첫째, 국가 거버넌스의 구축이 필요함. 보건의료 빅데이터, 지리정보시스템, 공간정보는 기관 별로 수집, 관리, 운영되고 있으며 상호 연계와 통합이 되어 있지 않음. 이러한 문제의 해결을 위한 법, 제도 등의 정비가 필요하며, 또한 빅데이터 공유 플랫폼의 구축이 필요함 둘째, 보건의료분야에서 생산되는 공간정보의 표준화에 대한 준비가 필요함. 타 산업분야의 경우 공간정보가 다양하게 생산됨에 따라 활용상 어려움이 있으므로 표준화를 미리 준비하는 것이 필요함. 이를 통하여 기관간 데이터의 상호교환이나 중복투자로 인한 문제를 방지할 수 있음

(24)

셋째, 공간정보의 이용서비스에 대한 접근성 개선이 필요함. 보건의료분야의 경우 개인정보보호법에 의해 공공기관이 보유하고 있는 공간정보에 대한 접근과 활용이 매우 제한적임. 현재 상황에서 법 개정이 이루어지기 전에는 개선의 여지가 많지 않지만, 사용자의 요구도를 고려하여 필요로 하는 정보에 대한 접근성을 개선할 수 있는 노력이 필요함 보건의료 공간정보 발전을 위한 공공기관의 향후 역할 보건의료분야의 공공기관(건강보험심사평가원, 국민건강보험공단, 국립중앙의료원 등)에서는 기관별로 공간정보를 생성, 관리를 하고 있음. 보건의료관련 공간정보가 가지는 민감성으로 인하여 자료관리에 있어서 공공기관의 역할은 계속될 것으로 보임. 이와 더불어 생성된 정보의 공개, 활용 방향, 그리고 통계적 분석과 예측기법 개발에 대한 준비가 필요함 공공기관에서 생성되는 정보는 기관 자체의 업무수행뿐 아니라 각종 연구활동과 민간산업분야의 발전에 있어서 중요한 밑바탕이 됨. 이러한 자료의 특징으로 인하여 보건의료분야 공간정보의 공공적 가치를 제시하고 있으며, 공간정보의 산출과 발전을 위한 지속적인 투자가 필요함 공간정보는 4차 산업혁명에서 사용되는 기술 중의 하나임. 공공기관은 이러한 산업적 측면에서의 발전을 통한 국가 발전에 기여할 수 있도록 보건의료분야에서의 공간정보가 활용될 수 있는 환경을 구축하고 성과가 달성될 수 있도록 하는 역할의 수행이 필요함

(25)

참고문헌

cngis.chungnam.go.kr/ data.cms.gov/mapping-medicare-disparities data.cms.gov/market-saturation flunearyou.org healthmap.or.kr/ imap.gwangsan.go.kr/ opendata.hira.or.kr/home.do vaccinefinder.org/ www.cdc.gov/dhdsp/maps/gisx/resources/public-health-maps.html www.healthmap.org/print_materials/brochure.pdf www.kpanews.co.kr/article/show.asp?idx=83626&table=column&category=E www.nsdi.go.kr www.ppm.or.kr/contents/contentsView.do?MENUID=A01020103 www.sphinfo.com/report-see-and-predict/

Alberto Larocca et al. Malaria diagnosis and mapping with m-Health and geographic information systems(GIS): evidence from Uganda. Malaria Jounal, 2016, 15(1): 520

Darthmouth Medical School Center for the Evaluative Clinical Sciences, The Dartmouth Atlas of the Health Care, Amer Hospital Pub. 1996.

Monaghan AJ at el. On the Seasonal Occurrence and Abundance of the Zika Virus Vector Mosquito Aedes Aegypti in the Contiguous United States. PLoS Currents, 2016, 16;8. 공간정보산업진흥원. 2016년 공간정보산업조사 보고서,

김윤 등. 건강보험 의료이용지도 구축 연구. 국민건강보험공단, 2016, 서울

신이현, 주영란. Development and Utilization of Vector Control Management System using Geographical Information system. 질병관리본부 주간건강과질병, 2015, 8:52.

최소영, 이광수. 강원도 지역 가임기 여성의 분만서비스 접근성 분석. 보건행정학회지, 2017, 27(3): 229-240

(26)

보건의료 빅데이터 관련 주요 기사

정부, 헬스케어 빅데이터 쇼케이스 구축 (메디컬업저버, 2018. 2. 13.) - 헬스케어 특별위원회는 ‘헬스케어 빅데이터 쇼케이스 구축(가칭)’을 핵심 프로젝트로 선정 - 데이터 공유자 패널로 선정 후 헬스 데이터 활용하고, 민간 주도 비즈니스 모델 검토 정부, ‘바이오·헬스산업' 적극 육성한다…산업 발전전략 발표 (전자신문, 2018. 2. 9.) - 산자부는 9일 간담회에서 '바이오ㆍ헬스산업 발전전략'을 발표 - 병원의 빅데이터를 바탕으로 맞춤형 신약ㆍ의료기기 개발과 혁신적인 헬스케어 서비스 실증을 지원하여 국민건강증진이 목표 AI와 빅데이터의 만남...‘고속 신약개발 플랫폼' 추진 (데일리팜, 2018. 2. 9.) - 과기정통부, 내년 출시목표로 ‘고속 신약개발 플랫폼' 추진 - 국가 연구개발(R&D)사업을 통해 획득한 화합물 정보를 인공지능(AI)에 학습시켜 신약 후보물질 발굴 시간을 단축

(27)

국립암센터, 환자 49만명 자료 담긴 임상연구검색포털 구축 추진 (청년의사, 2018. 2. 8.) - 국립암센터는 제3차 암관리종합계획(2016~2020년)에 따라 암 관리사업과 연구를 위한 공공 보건의료 데이터 구축 - 병리, 영상정보, 수술기록지 등 비정형데이터까지 분석 가능 암, 의사보다 손목시계가 먼저 안다 (조선일보, 2018. 2. 5.) - 노키아는 지난달 24일 스위스 다보스 포럼에서 향후 1~2년 안에 암 조기 진단이 가능한 손목에 차는 웨어러블(착용형) 기기를 내놓겠다고 발표 - 웨어러블 기기는 심박수ㆍ운동량을 측정하던 단순 기능에서 벗어나, 각종 질환의 진단을 간편히 할 수 있도록 발전하고 있음

(28)

내년 EMR 인증제 실시, 신뢰성 확보 기대..참여 여부 관건 (전자신문, 2018. 1. 29.) - 보건복지부는 내년 시행 목표로 EMR 인증제를 준비, 올 하반기 시범사업을 추진함 - 시스템 효율성, 신뢰성 확보와 나아가 전국 단위 의료기관 시스템 표준화까지 가능할 것으로 기대 2018년 주목해야할 ‘전자정부 10대 유망기술’ (전자신문, 2018. 1. 24.) - 행정안전부와 한국정보화진흥원이 2018년에 주목해야 할 전자정부 10대 유망기술을 발표 - ‘대화형 인공지능 플랫폼’, ‘온디맨드 빅데이터’, ‘공공 멀티 드론’ 등 활용 1~2년 내 인공지능(AI)의 도입, 예정된 미래 (전자신문, 2018. 1. 22.) - 국내 IT 전문가를 대상으로 한 AI 준비 현황 조사 결과에 따르면 IT 전문가의 절반 이상이 인공지능을 중요하게 생각 - 선도적인 기업들은 이미 AI를 도입 中

(29)

빅데이터로 국민 민원 분석, 원스톱 서비스 제공한다 (파이낸셜뉴스, 2018. 1. 21.) - 행정안전부 국가정보자원관리원, 빅데이터 공통기반 '혜안'에서 민원 분석의 온라인 자동화로 통합서비스 - 위치기반 분석서비스가 자동화되고, 주소ㆍ좌표 변환 서비스를 제공하여 분석의 편리성 및 효율성 강화

(30)
(31)

HIRA 빅데이터 분석 사례에서는 HIRA 빅데이터를 활용한 주요

이슈 분석, 연구 결과 등 다양한 사례를 수록하고 있습니다.

HIRA

빅데이터

분석 사례

(32)

다운증후군 환자의 합병증 발생과 관리 현황 분석

연구책임자 연구실무자 분석지원 이용주 교수 김남은 이풍훈 주임연구원 한림대학교 강남성심병원 서울대학교 보건대학원 건강보험심사평가원 ※ ‘2017년 HIRA 빅데이터 분석 협업과제’ 사례

1. 분석 배경

다운증후군은 국내의 경우 임산부 800명당 한 명의 빈도로 발생하는 난치성 유전체질환이며, 산모의 나이가 많아질수록 발생확률이 높은 것으로 알려져있음 우리나라는 만혼으로 인한 고령 산모가 증가함에 따라 다운증후군의 발생확률이 높아질 수 있을 것으로 예상됨 다운증후군은 다양한 합병증(갑상선 질환, 선천심장질환 등)을 동반할 수 있으며, 이에 따라 환자에 대한 체계적인 관리가 필요함 현재 관련 연구와 국내 진료지침이 미흡한 실정으로 다운증후군 환자의 건강상태에 대한 연구가 요구됨

2. 분석 방법과 내용

대상: 출생 후 한 번이라도 다운증후군(Q90.9) 진단을 받은 적이 있는 환자 자료원: 2007년~2016년 건강보험 청구자료, 통계청 인구동향조사 분석방법: 다운증후군 발생 현황 파악 및 합병증 중 갑상선 질환의 선별검사 여부와 선천심장질환 유무를 분석

(33)

3. 분석 결과

다운증후군 발생현황

다운증후군 환자의 기대수명이 증가함에 따라 ‘08년~’16년의 전체 다운증후군 환자수는 해마다 증가하는 반면, 1세 미만의 다운증후군 환아의 수는 감소하는 추세임 이는 저출산, 적극적인 산전 진단검사로 인한 조기 발견 등과 같은 다양한 요인의 영향으로 판단됨 [그림 1] 연도별 연령대별 다운증후군 환자 분포 산모의 나이는 ‘07년 30.1세에서 ’15년 31.7세로 매년 증가하는 반면, 출생아 10,000명 중 다운증후군이 있는 환아는 ‘07년 5.6명에서 ’15년 4.6명으로 감소함 다운증후군 발생 확률은 고령 산모에서 높은 것으로 알려져 있지만 고령 산모의 적극적인 산전 진단검사로 태아의 건강문제가 조기 발견되는 등 에 따라, 실제 출생아 중 다운증후군 환아의 출생 빈도는 감소하는 것으로 추정됨

(34)

[그림 2] 10,000명당 다운증후군 발생률과 산모나이평균

다운증후군과 합병증 현황

다운증후군 환자의 경우 선천적으로 갑상선, 심장질환의 빈도가 비다운증후군 인원에 비해 많은 것으로 알려져 있어, 출생 이후기능 검사 등의 관리가 필요함

1) 갑상선질환 - 선별검사 현황

다운증후군 환자의 경우 갑상선 질환의 발생빈도가 높아 출생 시, 이후 매년 갑상선 검사가 필요함 갑상선 기능 검사의 비율 현황을 보기 위해 전체 다운증후군 환자 8,240명의 갑상선 기능 검사(TSH, Free T4) 실시한 비율을 산출함 다운증후군 환자의 연도별 갑상선 기능 검사 실시 비율은 1세 미만에서 가장 크게 증가하였으나, 전체적인 검사 실시 비율은 ‘16년 30% 미만으로 미진한 수준임 1세 미만의 다운증후군 환아의 경우 갑상선 기능 검사 실시 비율이 1.77배(‘08년 44.9% → ’16년 79.4%) 증가하여 80% 정도이며, 그 외의 연령층도 과거에 비해 증가하였지만 50% 미만의 낮은 수준임

(35)

[그림 3] 연령대별 다운증후군 환자의 연도별 갑상선 기능 검사 실시 비율

2) 선천심장질환 - 합병증 현황

다운증후군 환자는 선천심장질환을 가지고 있는 경우가 많음 ‘09년~’13년 출생한 다운증후군 환자 1,153명 대상으로 선천심장질환 유무를 살펴봄 다운증후군 환자 중 선천심장질환을 하나라도 가지고 있는 환자는 751명(65.1%), 하나도 가지고 있지 않은 환자는 402명(34.9%)임 선천심장질환의 여부에 따라 성별, 출생연도, 보험종별로 분류한 결과, 비율은 큰 차이가 없었으며, 통계적으로도 유의한 차이는 없었음 [표 1] 다운증후군 환아 중 선천심장질환 보유 여부에 따른 성별, 출생년도, 보험종별 분포 단위: % 선천심장질환 미보유 환자 (n = 402) 선천심장질환 보유 환자 (n=751) p-값 성별 남성 56.7 53.9 0.37 여성 43.3 46.1 출생연도 2009 24.1 20.9 0.42 2010 16.9 18 2011 19.9 21.2 2012 21.9 19.4 2013 17.2 20.5 보험종류 건강보험 87.1 87.9 0.69 의료급여 12.9 12.1

(36)

단일심장질환을 가지고 있는 환자 중 심방중격결손 환자가 가장 많았으며, 다중심장질환의 경우는 연도별 차이는 있으나 전체적으로 심방중격결손과 심실중격결손을 함께 앓는 환자가 가장 많음 [그림 4] 다운증후군 환아의 출생연도별 선천심장질환 분포

4. 결론

다운증후군 환자의 기대 수명이 증가함에 따라 전체 다운증후군 환자는 증가하고 있음 다운증후군 전체 환자수가 증가함에 따라 다운증후군 환자의 정확한 관리지침이 필요함 저출산ㆍ산전 진단검사 등의 영향으로 1세 미만의 다운증후군 환자는 감소함 다운증후군 환자의 경우 매년 갑상선 기능 검사가 필요하지만 분석결과 실시 비율이 매우 낮은 상태로 개선이 필요함 갑상선 기능 검사의 실시 비율을 높이기 위해 의료진과 다운증후군 환자보호자에 대한 교육이 필요함 다운증후군 환자 중 선천심장질환과 같은 중증 합병증을 동반한 경우가 증가하고 있어, 다운증후군 환자를 적절히 관리하기 위한 가이드라인이 필요함

(37)

미세먼지 농도와 관련 질환 건강보험 청구액의

상관관계 분석

연구책임자 연구실무자 분석지원 김남국 교수 황정은, 우일상 이풍훈 주임연구원 울산대학교 의과대학 서울아산병원 건강보험심사평가원 ※ ‘2017년 HIRA 빅데이터 분석 협업과제’ 사례

1. 분석 배경

미세먼지는 인체의 호흡기, 혈관계, 뇌-혈관 장벽 등 방어시스템을 쉽게 통과하여 염증을 일으키는 등 건강에 영향을 줌 미세먼지가 건강 상태에 주는 영향에 대한 국민적 관심이 높아지고 있음에 따라 미세먼지 농도와 보건의료 비용의 상관관계를 정량적으로 평가하고자 함

2. 분석 방법과 내용

대상: 아래 질환으로 진료를 받은 인원 질환군 KCD code 호흡계통의 질환 J00 - J98, U04 순환계통의 질환 I00 - I99 피부 및 피하조직의 질환 L00 - L99 자료원: 2007년 ~ 2016년 건강보험 청구자료, 국가대기측정망 미세먼지 농도 자료, 통계청 인구조사 자료 분석방법: 지리정보 시스템을 이용한 descriptive study 및 다변량 선형회귀분석

(38)

3. 분석 결과

호흡계통의 질환 단순상관: 호흡계통의 질환 청구액은 미세먼지 농도, 시간 경과와 각각 양의 상관관계를 보임. 전국적으로 미세먼지 농도와 청구액의 단순상관계수는 0.21(p-value 0.02)로 나타났으며, 각 지역별로도 대부분 유사한 결과가 나타남 편상관: 시간 경과를 통제한 미세먼지와 청구액 사이의 편상관계수는 0.59(P < 0.001)로, 시간 경과에 따른 청구액의 증가세를 통제한다면 미세먼지 농도와 청구액은 강한 양의 상관관계를 보임 청구액 예측: 시간 경과에 따른 건강보험 청구액 증가 추세가 유지된다면, 2018년에 미세먼지 농도를 10μg/m3 감축 시 호흡계통의 질환을 주상병 또는 부상병 요인으로 하는 건강보험 청구액은 매일 약 10억 원 감소할 것으로 추정됨

(39)

순환계통의 질환 단순상관: 순환계통의 질환 청구액은 시간 경과와 양의 상관관계, 미세먼지 농도와는 음의 상관관계 보임. 전국적으로 미세먼지 농도와 청구액의 단순 상관계수는 -0.20(P = 0.03)였으며, 각 지역별로 다양한 관계가 나타남 편상관: 시간 경과를 통제한 미세먼지 농도와 일 평균 청구액 사이의 편상관계수는 0.45, P < 0.001로, 시간 경과에 따른 청구액 증가세를 통제할 경우 미세먼지 농도는 청구액과 양의 상관관계를 보임 청구액 예측: 시간 경과에 따른 건강보험 청구액 증가 추세가 유지된다면, 2018년에는 미세먼지 농도를 10μg/m3 감축 시 순환계통의 질환을 주상병 또는 부상병 요인으로 하는 건강보험 청구액이 매일 약 2억 원 감소할 것으로 추정됨

(40)

피부 및 피하조직의 질환 단순상관: 피부 및 피하조직의 질환은 청구액이 시간 경과와 양의 상관관계, 미세먼지 농도와는 음의 상관관계를 보임. 전국적으로 미세먼지 농도와 청구액의 단순 상관계수는 -0.44 (P < 0.001)로 나타났으며, 각 지역별로도 대부분은 음의 상관관계를 보임 편상관: 시간 경과를 통제한 미세먼지 농도와 일 평균 청구액 사이의 편상관계수는 -0.50, P < 0.001로, 시간 경과에 따른 청구액 증가세를 통제할 경우 미세먼지 농도는 청구액과 음의 상관관계를 보임. 이는 높은 미세먼지 농도에 직접적인 건강이득이 있다고 해석하기 보다, 야외 활동 감소 및 자외선 노출 억제 효과 등 미지의 간접적 효과에 의해 역설적인 결과가 나타났다고 보는 것이 타당함

(41)

청구액 예측: 시간 경과에 따른 건강보험 청구액 증가 추세가 유지된다면, 2018년에는 미세먼지 농도를 10μg/m3 감축 시 피부 및 피하조직의 질환을 주상병 또는 부상병 요인으로 하는 건강보험 청구액이 매일 약 9천만 원 증가할 것으로 추정됨

4. 결론

미세먼지 농도와 호흡기 계통의 질환, 순환기 계통의 질환을 각각 주상병 또는 부상병으로 하는 건강보험 청구액 사이에 유의미한 양의 상관관계가 있음 시간의 경과에 따라 청구액이 증가하는 추세를 보정할 경우 미세먼지 농도와 호흡기 계통의 질환 청구액 사이의 편상관계수가 각각 0.59 (P < 0.001), 0.45 (P < 0.001)로 확연한 양의 상관관계를 보임 2018년 기준, 미세먼지 농도를 10μg/m3 감축 시 호흡계통의 질환을 주상병 또는 부상병 요인으로 하는 건강보험 청구액은 매일 약 10억 원, 순환 계통의 질환 청구액은 매일 약 2억 원 씩 감소할 것으로 예측됨 본 연구 결과는 건강보험 빅데이터와 국가대기 측정망 자료를 연계하여 수행할 수 있는 다양한 분석의 한 단면이며, 향후 다양한 통계 방법론 적용, 추가적인 자료원 연계 등을 통해 미세먼지의 국가 경제적 영향을 다층적으로 연구할 수 있음

(42)

최근 8년간 항우울제 처방양상 변화

연구책임자 연구실무자 분석지원 박병주 교수 김선지 선정연 주임연구원 서울대학교 의과대학 서울대학교 의과대학 건강보험심사평가원 ※ ‘2017년 HIRA 빅데이터 분석 협업과제’ 사례

1. 분석 배경

우리나라에서 사용되고 있는 항우울제는 삼환계 항우울제, 선택적세로토닌재흡수억제제, 세로토닌노르에피네프린재흡수억제제, 단가아민산화효소억제제 등 대표적인 4개의 약물군과 그 외의 나머지 약물군인 기타항우울제로 총 5군으로 분류되고 있음 항우울제 사용은 미국에서 꾸준히 증가하고 있으며, 우리나라의 항우울제 사용 규모도 2010년 대비 2014년에 22%나 증가하였음 항우울제는 인적, 지역적, 시간적 특성별로 처방양상에 상당한 변이가 있는 것으로 외국에서 알려져 있음 따라서 우리나라 우울증환자의 항우울제 처방양상을 분석하여, 우울증환자에서 항우울제 처방양상을 확인하고자 함

2. 분석 방법과 내용

대상: 2009년부터 2016년까지 의료기관을 방문하여 주상병으로 우울증을 진단받고 항우울제를 처방받은 전체 환자 자료원: 2009년 ~ 2016년 건강보험 청구자료 분석방법: 국내 우울증환자에서의 계열별, 성분별 항우울제의 처방양상을 확인함

(43)

3. 분석 결과

연구대상자는 2,245,120명, 전체 항우울제 처방은 82,557,411건임

연구대상 2,245,120명 중 여성이 67.03%를 차지하였고, 연령별로는 40세 ~ 59세가 35.82%, 60세 ~ 79세가 26.89%를 차지함

[표 1] 전체 우울증환자의 특성

Characteristics No. of patients %

Gender < .0001 Male 740,170 32.97 Female 1,504,950 67.03 Age (Mean±SD) (46.96±18.88) < .0001 <20 218,077 9.71 20 - 39 569,528 25.37 40 - 59 804,145 35.82 60 - 79 603,737 26.89 ≥ 80 49,633 2.21 Total 2,245,120 100.00 항우울제 처방은 82,557,411건이었고, 그 중 삼환계항우울제가 28.09%, 선택적세로토닌 재흡수억제제 35.55%, 세로토닌노르에피네프린재흡수억제제 6.53%, 단가아민산화효소억제제 0.14%, 기타 항우울제는 29.69%임

(44)

[표 2] 항우울제 계열별 처방양상

Class No. of prescription %

TCA 23,194,113 28.09 SSRI 29,347,548 35.55 SNRI 5,393,159 6.53 MAOI 111,965 0.14 Others 24,510,626 29.69 Total 82,557,411 100.00 트라조돈은 항우울제 처방건 중 18.53%로 가장 많이 처방되는 성분임. 삼환계항우울제인 아미트립틸린 17.23%, 선택적세로토닌재흡수억제제인 에스시탈로프람, 플루옥세틴, 파록세틴이 각각 15.82%, 7.64%, 6.90% 순으로 나타남

(45)

[표3] 항우울제 성분별 처방양상

Class Generic name No. of prescription %

TCA Amitriptyline 14,224,952 17.23 Clomipramine 537,908 0.65 Dothiepin 38,679 0.05 Imipramine 3,330,946 4.03 Nortriptyline 3,776,258 4.57 Quinupramine 1,285,370 1.56 SSRI Citalopram 78,049 0.09 Escitalopram 13,057,458 15.82 Fluoxetine 6,307,046 7.64 Fluvoxamine 785,078 0.95 Paroxetine 5,696,693 6.90 Sertraline 3,423,224 4.15 SNRI Desvenlafaxine 51,321 0.06 Duloxetine 2,228,473 2.70 Milnacipran 549,598 0.67 Venlafaxine 2,563,767 3.11 MAOI Moclobemide 78,344 0.09 Selegiline 33,621 0.04 Others Amoxapine 17,375 0.02 Bupropion 1,361,475 1.65 Hypericiherba 300,618 0.36 Mirtazapine 3,280,527 3.97 Tianeptine 4,253,269 5.15 Trazodone 15,297,362 18.53 Total 82,557,411 100.00

(46)

월별 항우울제 처방은 2009년부터 지속적으로 증가함

[그림 1] 월별 계열별 항우울제 처방양상

삼환계 항우울제는 아미트립틸린이 월별처방건수를 결정하며, 지속적으로 증가하다 2012년부터 감소함

(47)

선택적 세로토닌 재흡수 억제제는 에스시탈로프람이 월별처방건수를 결정하며, 지속적으로 증가함

[그림 3] SSRI 약물군에서 월별 성분별 항우울제 처방양상

세로토닌 노르에피네프린 재흡수 억제제는 지속적으로 증가함

(48)

[그림 5] MAOI 약물군에서 월별 성분별 항우울제 처방양상 기타 항우울제는 트라조돈이 월별처방건수를 결정하며, 증가하는 양상을 보임

(49)

4. 결론

지난 8년 동안 항우울제의 처방량은 증가하고 있으며, 40-59세의 우울증 환자가 많았음 삼환계항우울제의 사용량은 2012년부터 감소하고 있으며, 삼환계항우울제를 제외한 다른 항우울제의 사용량은 증가함 1세대 항우울제인 삼환계항우울제는 이후 출시된 선택적세로토닌재흡수억제제, 세로토닌노프에피네프린재흡수억제제, 기타 항우울제에 비해 비교적 부작용이 많은 것으로 알려져 있어 사용량이 감소하는 것으로 보임 우울증은 장기치료를 요하지만 치료가능성이 높은 질환으로서 우울증환자를 대상으로 적절한 관리가 필요함

(50)

빅데이터 분석 방법(Shrinkage Methods)을 이용한

한국인의 골다공증에 연관된 질병 현황

연구책임자 연구실무자 분석지원 최제용 교수 신승연 신서희 주임연구원 경북대학교 의과대학 경북대학교 의과대학 건강보험심사평가원 ※ ‘2017년 HIRA 빅데이터 분석 협업과제’ 사례

1. 분석 배경

회귀분석(Regression Analysis)은 설명변수를 설정ㆍ활용하여 종속변수를 설명하는 분석 방법으로 보건의료 분야에서도 널리 쓰이는 분석 방법임 하지만 설명변수가 많은 경우 불필요한 부분까지 설명하는 과적합 문제가 발생할 수 있음 축소방법(Shrinkage Methods)을 이용한 회귀분석은 과적합 문제를 해결할 수 있는 장점이 있어 설명변수가 많은 경우 주로 활용함 많은 질환들을 설명변수로 설정하여 연관 질환을 찾는 경우, 축소방법을 이용한 회귀분석을 실시한다면 유의미한 결과가 도출될 것으로 예상됨 골다공증은 큰 증상없이 진행되어 침묵의 병이라 불리는 만큼 진단이 어려워, 빠른 진단을 위해서는 연관 질환에 대한 분석이 필요함 축소방법을 활용하여 골다공증에 연관된 질환들을 연구하여 질병 네트워크를 구축한다면, 골다공증의 빠른 진단과 예방에 도움을 줄 수 있을 것으로 기대

본 연구의 결과를 PDN(Phenotype Disease Network)과 골대사학 기반 Gene Ontology Network 연구의 기초자료로 활용

2. 분석 방법과 내용

(51)

자료원: 2012년~2016년 건강보험 청구자료 분석방법 기간 중 골다공증 환자 1,000명이 추출될 때까지 골다공증을 진단받지 않은 환자를 표본 추출한 후 클렌징 작업 설명변수 개수가 많을 때 유용한 축소방법(Shrinkage Method)을 이용한 회귀분석을 통해 골다공증에 영향을 미치는 질병군 선택 * 종속변수: 골다공증 발생 여부, 설명변수: 질병 유무 및 진료 횟수 * 질병의 개수가 많으므로, 과적합(Over-fitting)을 피하고 최적의 질병 개수 조합을 도출하고자 축소방법을 이용한 회귀분석 수행 * 축소모수 λ는 5 fold-Cross Validation에 의해 결정 [표 1] 축소방법(Shrinkage Method)를 이용한 회귀분석 회귀분석 축소방법(Shrinkage Method)를 이용한 회귀분석 설명변수 수가 많을 경우 과적합※ 문제 발생 ※ 과적합(Over-fitting): 자료의 불필요한 부분(noise)까지 설명하여 부정확한 결과를 도출 불필요한 변수들을 제거하여 과적합을 피할 수 있으며, 설명변수가 수백개일 때도 활용 가능하다는 장점이 있음

RSS(Residual Sum of Square)을 최소화하는 β추정 RSS에 Penalty 조건()을 추가하여 “RSS + Penalty”를 최소화하는 β추정 Penalty는 불필요한 변수들의 추정값을 0에 가깝게 만들어 제거하는 역할 축소(Shrinkage) 정도는 λ에 의해 조절되며, λ가 커질수록 제거하는 변수 많아짐 * λ→0 (축소량 최소): 모든 변수를 추정 * λ→∞ (축소량 최대): 상수항(β0)만 남음     ⋯       ⋯   min

     

      min

     

       

     

(52)

골다공증 환자 981명 비골다공증 환자 21593명 환자 당 질병 유무 상병코드 3자리 (이항 변수) 환자 당 질병 유무 및 방문 횟수 골다공증환자 981명 비골다공증 환자 981명 상병코드 1자리 (명목 변수) 수축 방법 (Shrinkage Method) 선택된 질병 챕터 (ICD-10 기반) 형질 질환 연구 [그림 1] 연구를 위한 작업흐룸도(음영처리 부분이 주된 내용임)

3. 분석 결과

골다공증 환자 981명 중 남성은 69명, 여성은 912명으로 여성의 비율이 크게 높았으며, 평균 연령이 60세 이상으로 고령층에서 많이 발생함 [표 2] 골다공증과 비골다공증 환자수와 평균 연령 성별 환자수 연령(평균±분산) 골다공증 남 69 68.75±10.42 여 912 64.71±10.63 비골다공증 남 11,668 35.03±20.24 여 9,925 33.20±20.17 ICD-10 기준으로 질환을 22개의 범주로 구분하였으며[표 3], 이들 질환 유무를 설명변수로 골다공증 발생 여부를 종속변수로 하여 축소방법을 이용한 회귀분석을 실시함

(53)

[표 3] ICD-10 기준 질환 분류 구분 ICD-10코드 질환명 Ch1 A00-B99 특정 전염병 및 기생충병 Ch2 C00-D48 종양 Ch3 D50-D89 혈액과 조혈 기관의 질병 및 면역 체계 관련 특정 장애 Ch4 E00-E90 내분비, 영양 및 대사 질병 Ch5 F00-F99 정신 및 행동 장애 Ch6 G00-G99 신경 계통의 질병 Ch7 H00-H59 눈과 그에 딸린 기관의 질병 Ch8 H60-H95 귀와 유양돌기 Ch9 I00-I99 순환 계통의 질병 Ch10 J00-J99 호흡기 계통의 질병 Ch11 K00-K93 소화 계통의 질병 Ch12 L00-L99 피부와 피하 조직의 질병 Ch13 M00-M99 근육과 연결 조직의 질병 Ch14 N00-N99 생식, 배설 계통의 질병 Ch15 O00-O99 임신, 출산, 산후 조리 Ch16 P00-P96 출산 전후 기간에 일어나는 어떤 상태 Ch17 Q00-Q99 선천성 기형, 변형, 염색체의 이상 Ch18 R00-R99 다른 곳에서 분류되지 않은 증상, 증세나 임상 또는 연구에서 발견한 비정상 Ch19 S00-T98 상처, 중독과 외부 원인에 의한 것들 Ch20 V01-Y98 질병이나 사망의 외부적 원인 Ch21 Z00-Z99 건강 상태에 영향을 미치는 원인들과, 보건 서비스와의 관계 Ch22 U00-U99 특별 목적을 위한 코드 축소방법을 이용한 회귀분석에서 최적화된 설명변수 개수는 SBC(Schwarz-Bayesian Criterion)를 기준으로 결정하였으며, 설명변수 개수에 따른 SBC 값과 회귀계수 추정값은 [그림 2]와 같음 설명변수가 8개일 때 SBC가 가장 작게 나타났으며(SBC가 작을수록 좋음), 선택된 8개 설명변수는 회귀계수 추정값 크기 순으로 Ch13, Ch9, Ch11, Ch7, Ch4, Ch19, Ch5, Ch18임

(54)

축소단계 (설명변수개수)에 따른 SBC 비교 축소단계 (설명변수개수)에 따른 회귀계수 추정값 경로 [그림 2] 축소단계(설명변수개수)에 따른 SBC, 회귀계수 추정값 경로 선택된 8개 챕터의 계수추정값을 보면 ‘(Ch13)근육과 연결 조직의 질병’이 가장 높은 영향력을 보였으며, ‘(Ch18)다른 곳에서 분류되지 않은 증상, 증세나 임상 또는 연구에서 발견한 비정상’이 포함된 것이 특징임

(55)

[그림 3] 선택된 질환(챕터)의 계수추정값

4. 결론

축소방법(Shrinkage Methods)을 이용한 회귀분석의 수행 결과, ‘근육과 연결 조직의 질병‘의 영향력이 가장 큰 것으로 나타남 골다공증에 미치는 영향이 가장 큰 질환은 ‘근육과 연결 조직의 질병’이었으며, ‘순환 계통의 질병’, ‘소화계통의 질병’ 등 순으로 나타남 다소 당연한 결과이지만, 보건의료 분야에서 동반 질환에 대한 새로운 분석 방법의 적용 가능성을 확인한 것으로 의미가 있음 위 결과는 미국의 골다공증 동반질환 연구결과와 양상은 비슷하나 세부적인 질환은 다르기 때문에, 한국인 특이적인 질환이 존재하는지 더욱 깊은 연구가 필요함

이를 위해 PDN(Phenotype Disease Network)과 골대사학 기반 Gene ontology Network를 맵핑한 추가 연구를 추진하고 있음

분석 환경의 한계로 인해 22개 카테고리로 분석을 실시하였지만 좀 더 세분화된 질병코드를 사용한다면 정확한 결과를 얻을 수 있을 것임

(56)
(57)

HIRA 빅데이터 분석 가이드는 HIRA 빅데이터에 대한 구조를

소개하고, 대표적인 통계 분석 방법을 안내하여 연구자들이 좀 더

쉽게 HIRA 빅데이터를 활용할 수 있도록 지원합니다.

HIRA

빅데이터

분석 가이드

(58)

분석 가이드란?

본 분석가이드는 건강보험심사평가원의 데이터 활용을 원하는 연구자들에게 도움이 되고자 작성되었습니다. 심평원 데이터를 처음 접하거나, 익숙치 않은 분들도 연구에 자유롭게 활용할 수 있도록 최대한 자세하고 쉽게 설명하고자 합니다. 첫 호인 이번 호에서는 HIRA 보건의료 빅데이터에 대한 설명을 담고 있으며, 다음 호 부터 데이터 구축, 실제 활용 예시 등 순차적으로 소개할 예정입니다. [표 1] HIRA 빅데이터 분석 가이드 계획(2018년) 주 제 2018년 1분기 (제2권 1호) HIRA 보건의료 빅데이터 소개 2018년 2분기 (제2권 2호) 에피소드 구축(입원 에피소드 등) 2018년 3분기 (제2권 3호) 동반질환 구축 2018년 4분기 (제2권 4호) 대조군 설정

(59)

HIRA 보건의료 빅데이터 소개

1. HIRA 보건의료 빅데이터 소개

건강보험 청구자료는 요양기관에서 청구한 명세서 심사가 완료된 자료를 데이터 베이스화한 자료임 한 건의 청구명세서를 여러 테이블로 분리하여 저장ㆍ관리하고 있으며, 이들은 연계 변수를 이용하여 테이블간 연계가 가능함 명세서 일반 내역, 진료 내역, 수진자 상병 내역, 원외처방전 상세 내역 등으로 구분하여 저장ㆍ관리되고 있음 [그림 1] 청구명세서 구조

(60)

2. HIRA 보건의료 빅데이터 구조(테이블)

명세서 일반 내역(200 테이블) 환자 기본 정보: 성별, 연령, 보험형태(건강보험, 의료급여 등) 등 상병 정보: 주상병, 제1부상병 진료 정보: 환자 도착경로, 요양개시/종료일자, 입원/외래구분, 요양기관 등 급여 정보: 심사결정요양급여비용총액, 심사결정보험자부담금 등 진료 내역(300 테이블) 요양기관(약국 제외)에서 받은 검사, 시술/수술, 치료재료, 원내 조제 내역 등 수진자 상병 내역(400 테이블) 200테이블의 주상병, 제1부상병을 포함한 환자의 모든 상병 정보 원외처방전 상세 내역(530 테이블) 요양기관(약국 제외)의 원외 처방 내역 명세서일반내역 (200TABLE) 명세서조인키(PK) 서식구분 수진자대체키 수진자 연령 성별 요양기호대체키 요양기관소재지 종별 심결총요양급여비용 내원일수 등 요양기관현황 요양기호대체키 의사수 간호사수 약사수 총병상수 허가병상수 등 진료내역 (300TABLE) 명세서조인키 항목코드 분류코드 일반명코드 총사용량 금액 상병내역 (400TABLE) 명세서조인키 상병 일련번호 상병코드 상병분류코드 진료과목 내과세부전문과목 원외처방내역 (530TABLE) 명세서조인키 항목코드 분류코드 일반명코드 총사용량 금액 [그림 2] 건강보험 청구자료의 주요 테이블 관계도

(61)

3. HIRA 보건의료 빅데이터 변수

명세서 일반 내역(200 테이블) 순번 칼럼명 칼럼 설명 1 명세서조인키 테이블간 연계를 위한 조인키 2 보험자종별구분코드 수진자가 소속된 보험 종류 3 수진자개인식별대체키 수진자 개인 정보를 비식별화한 대체키 4 성별구분 수진자 성별 5 수진자연령 수진자 연령(요양개시일자기준으로 산출) 6 수진자통계연령 수진자 통계 연령(당해 12월 31일 기준으로 산출) 7 요양기관식별대체키 요양기관 정보를 비식별화한 대체키 8 요양기관종별구분코드 요양기관을 종별코드를 기준으로 병상규모에 따라 그룹화하여 분류한 코드 9 지역(시도)코드 요양기관이 위치한 지역 코드 10 서식구분코드 고시된 서식코드를 기준으로 유형별(의과 입원ㆍ의과 외래 등)로 세분화한 코드 11 주상병코드 KCD 분류에 따른 주된 상병기호 12 부상병코드 주된 상병기호 외의 추가 상병기호(제 1부상병까지) 13 진료과목코드 요양기관의 진료과목 코드 14 요양개시일자 수진자가 진료를 받기 시작한 일자, 최초내방일자 15 요양종료일자 수진자가 진료 받기를 종료한 일자 16 최초입원일자 진료를 위하여 최초 내원한 일자(분리청구시 기재) 17 입내원일수 수진자가 진료를 받기위해 요양기관에 내원한 일수(초진+재진), 입원일수 18 요양일수 수진자가 진료받은 총 일수(투약일수 포함) 19 원외처방일수 처방전 발행 내역 중 처방일수의 합계 20 원외처방약제비 처방전 발행 내역 중 처방금액의 합계 21 원외처방전건수 처방전을 발행한 건수 22 심사결정요양급여비용총액 심사결과 수진자 부담 금액과 보험자 부담 금액을 합한 요양급여비용총액 23 심사결정본인부담금 심사결과 수진자 본인이 부담해야 될 금액 24 심사결정보험자부담금 심사결과 보험자가 부담해야 될 금액 25 심사결정100분의100미만 총액 심사결과 100분의 100미만 총금액 26 수술여부 주된 상병명과 관련된 수술의 시행 여부 27 공상구분코드 공무상 상해 구분 28 특정기호구분코드 특정기호구분코드 29 상해외인구분코드 명세서 특정내역 중 특정내역구분코드가 존재하는 경우 해당. 한국표준질병사인분류의 제20장에 의거 상병의 원인에 해당하는 분류기호 중 영문 첫 자리(V, W, X, Y)를 '특정내역기재란(MT001)'에 기재함 30 진료결과구분코드 요양급여비용명세서상 최종 진료일의 환자상태 31 입원도착경로구분코드 병원급이상 입원 환자의 경우 요양기관 도착경로 및 입원경로 32 의료급여종별코드 의료급여종별코드 33 청구형태코드 행위별 청구의 매체구분 및 DRG건에 대한 코드 34 청구구분코드 일반청구 및 보완청구, 추가청구 등 인지를 구분하는 코드 35 심사년월 심사 완료 년월 36 표시과목코드 의원급의 경우 요양기관현황의 표시과목코드, 병원급 이상은 청구된 진료과목코드 기준

(62)

진료 내역(300 테이블) 순번 칼럼명 칼럼 설명 1 명세서조인키 테이블간 연계를 위한 조인키 2 항목코드 명세서 항별 목코드(항코드 + 목코드) 3 분류코드구분 분류코드를 구분하는 구분자 4 분류코드 수가(행위)코드, 약품코드, 재료대코드 등 진료내역코드 5 1회 투여량 1회에 투여한 량 6 1일 투여량 1일 환자에게 투여한 량 7 1일 투여량 또는 실시횟수 1일 투여량 또는 실시횟수 8 총 투여일수 또는 실시횟수 총 투여일수 또는 실시횟수 9 총 사용량 1회 투여량 × 1일 투여량 × 총 투여일수 또는 실시횟수 10 단가 분류코드별 단가 11 금액 단가 × (1일 투여량 또는 실시횟수) × (총투여일수 또는 실시횟수) 12 가산적용금액 가산율을 적용한 금액 13 일반명코드 ‘약제 급여 목록 및 급여 상한금액표’에 기재된 주성분 코드 14 진료예외구분코드 진료예외구분코드 15 1_2구분코드 진료코드의 요양기관 종별 가산율 적용여부를 구분하기 위한 코드 수진자 상병 내역(400 테이블) 순번 칼럼명 칼럼 설명 1 명세서조인키 테이블간 연계를 위한 조인키 2 일련번호 청구명세서 상에 기록된 상병코드 입력 시 일련번호 3 상병코드 KCD분류에 따른 상병코드 4 상병분류구분 상병을 주, 부, 배제상병으로 분류한 코드 5 진료과목코드 요양기관의 진료과목 코드 6 내과세부전문과목 내과 진료과목 중 ‘세부전문의 제도인증 규정(대한의학회)’에 의거 인증받은 세부전문과목을 운영하고 있는 종합병원, 상급종합병원의 경우 진료를 받은 세부전문과목코드

(63)

원외처방전 상세 내역(530 테이블) 순번 칼럼명 칼럼 설명 1 명세서조인키 테이블간 연계를 위한 조인키 2 처방전교부번호 진료기관에서 처방전 발행시 부여한 교부 번호 3 분류코드구분 분류코드를 구분하는 구분자 4 분류코드 수가(행위)코드, 약품코드, 재료대코드 등 진료내역코드 5 1회 투약량 1회에 투약한 량 6 1일 투약횟수 1일 투약횟수 7 총 투약일수 총 투약일수 8 총 사용량 1회 투약량 × 1일 투약량 × 총 투약일수 9 단가 분류코드별 단가 10 금액 단가 × 1일 투약량 × 총 투약일수 11 일반명코드 ‘약제 급여 목록 및 급여 상한금액표’에 기재된 주성분 코드

(64)

4. HIRA 보건의료 빅데이터 이용 안내

HIRA 보건의료 빅데이터 이용 안내 보건의료빅데이터개방시스템(opendata.hira.or.kr)에서는 여러 가지 형태의 빅데이터 서비스가 제공되고 있으며, 용도에 따라 적합한 서비스 선택ㆍ이용이 가능함 구 분 설 명 원시자료(raw data) 분석 지원 서비스 연구자 및 산업체가 원하는 맞춤형 원시데이터 분석이 가능하도록 방문 또는 원격접속으로 빅데이터분석시스템 활용 Open API 실시간 제공 서비스 민간기업, 프로그램 개발자, 인터넷 이용자를 대상으로 손쉽게 직접 응용 프로그램과 서비스를 개발할 수 있도록 병원ㆍ약국 정보 서비스 등 보건의료데이터 지원 환자표본 DB 제공 서비스 연구자의 필요에 따라 환자표본 데이터 등 총 4개의 DB데이터셋을 생성ㆍ제공하여 연구 및 R&D사업에 활용하도록 지원 HIRA 보건의료 빅데이터 이용 절차 자세한 내용은 보건의료빅데이터개방시스템(opendata.hira.or.kr)에 접속 후 ‘의료빅데이터’ - ‘빅데이터 분석 이용 안내’ 참고

(65)
(66)
(67)

빅 데 이 터

2018년 3월 김승택 [26465] 강원도 원주시 혁신로 60 전 화 1644-2000 홈 페 이 지 www.hira.or.kr 디자인·기획 (사)한국근로장애인진흥회 다원디자인프린팅

(68)

참조

관련 문서

국내·외 STEAM 교육 사례 및 자료 분석을 통한 교육 연구 토대 마련 개정2009교육과정 창의적 체험활동 프로그램 주제 제시 및 적용..

본 연구에서는 중요도 및 만족도를 동시에 분석 비교할 수 있는 IPA 분석을 통하 여 퍼스널 트레이닝 센터 선택속성의 지도자에 대한 중요도 및 만족도 인식을

글로벌 에듀테크 시장 및 링글의 현황에 대한 Fact 기반의 다각도 분석을 바탕으로 한 링글의 문제 점 도출 (글로벌 에듀테크 트렌드 관점에서 링글의 문제점,

• 이는 최근 3 년간 전세가격 상승과 매매가격 하락 추 세가 동시에 관찰되는 현상과 일치되는 결과.. • 특히 강북서 지역에서는 Granger

지역 기반의 산학연계 및 공동 연구개발 활성화를 위한 학사구조 개편. 산ᆞ학 연계 기반의 졸업생 연구역량의 담보와

사업수행에 필요한 적정 자본금 규모 분석 및 근거 공동사업자의 경우 지분출자에 대한 적정성 분석 및 근거 현물출자의 적정성 검토 (수익․처분가능성,

터치모니터 현장제어와 PC/모바일을 통한 원격제어 데이터 DB 활용 및 영농일지

이러한 배경에서 미국, 유럽, 일본 등 해외 주요국은, 한편으로 공공정보 이용을 촉진하거나 공공부문 이 직접 빅데이터 기술 개발을 지원하는 방식으로