1. 들어가는 글
●컴퓨터 과학을 이용한 의료 빅데이터(Big data) 분석기법은 의료정보학, 바이오정보학 및 바이오통계분야에서만성질환및난치성질환과유전체(Genomics)등에응용이확산되고있음 ▶이처럼 다양한 임상정보와의 결합을 활용하여 검증이 이루어지는 바이오의학 연구의 성공 여부는이러한기술들에의해생성되는초대용량의의료데이터셋을어떻게해석하느냐에달림 ▶글로벌ICT기술력을주도하고있는메이저기업들(Microsoft,Amazon,Google등)은의료 빅데이터를다루는선두주자임 ●유전체학 기술과 보건정보에 의해 생성된 의료 빅데이터를 효과적으로 분석하고 공유하기 위해서는동일형태의측정가능한구조를이행할필요가있음 ▶바이오의학은특히미래맞춤형의학프로그램에서직면하게될빅데이터분석을성공적으로 해결하는정보과학에적응할필요가있음[1] ▶또한맞춤형의학과컴퓨터지원진단학은만성질환및난치성질환을직접적으로이롭게할수 있다는것을증명하기위해보다많은연구가필요함 ●본 고에서는 전 세계적으로 도입을 추진하고 있는 u-Health, 바이오의학과 ICT 융합 등 보건의료에서빅데이터의영향에대해설명하고자함 ▶아울러국외(미국/싱가포르/캐나다)및국내(질병관리본부/분당서울대병원/한국정보화진흥원 등)의료빅데이터활용사례와전세계적으로도입을추진하고있는u-Health,바이오의학과 ICT융합등보건의료에서빅데이터의영향에대해설명함 ▶또한의료빅데이터급증에따른데이터분석기법,신약개발,빅데이터를활용한의료기기등 맞춤형의학이슈에대해설명하고,이를기반으로전략적/기술적해결과제를제시함보건의료 빅데이터 활용 의료산업 동향
박세환Ph.D. ㈜기술법인엔펌(ENF)전문위원 한국산업기술진흥협회ReSEAT프로그램전문위원2. 보건의료분야에서 빅데이터의 영향
1) 개요
●고령화사회와만성질환유병률증가등으로인해의료비,의료서비스접근성및의료서비스품질 향상을위해전세계적으로ICT와의료기술을접목한u-Health도입을추진하고있으며1),이를 통해다음과같은파급효과를기대하고있음[2] ▶의료진의건강상담및진료등다양한의료서비스를이용할수있으며,개인의건강정보를기록하는 전자의무기록(Electronic Health Record, EHR)을 통해 환자의 건강상태를 실시간으로관찰할수있음 ▶스마트센서를 통해 수집된 환자의 의료ㆍ건강정보를 다양한 형태로 분석ㆍ처리하여 개인의료정보DB에저장하였다가의료진에전송하여활용할수있음 ●이러한u-health서비스를통해생산되는개인의건강정보와관련된의료빅데이터의관리와 활용이빠르게확산되고있음
2) 바이오의학과 ICT 융합
●제3세대및제4세대DNA서열분석으로일컫는새로운서열분석기술들이유전체및전사체 (transcriptomes)분야에서빠르게확산되고있음 ▶반도체와 나노포어(nano-pore)에 기반을 둔 이들 신기술은 대규모의 유전자 서열분석 프로젝트를개발을통해의료빅데이터분석기법에대한해법을제공하고있음[3] ▶이를통해인간유전체와같은어려운문제를해결해가고있으며,바이오의학에서의이러한빅 프로젝트는신약개발및진단검사등을가속화시키고있음 ▶따라서연구자들은대량의개인의료데이터를안전하게다루어야할의무가있음 1)u-Health는의료비절감등사회경제적비용감소효과와공공보건의료서비스와예방관리보건등사회정책적효과를기대할수있는 가장효과적인대안으로주목받고있으며,u-Health서비스는다양한생체정보를수집하기위해스마트센서를이용한네트워크가 필수적임●차세대 DNA 서열분석을 활용하여 임상전문가와 연구자들에게 연구결과를 제공하기 위한
‘ENCODE(Encyclopedia of DNA Elements)’와 이의 단계별 솔루션인 ‘1000 Genomes 프로젝트’가큰기대를갖게하고있음[4][5][6] <표 1> 참조 ▶이프로젝트를통해도출된정보들은유전학계와생물학계에서가장많이인용하고있으며, 유전체에대한전문지식을응용하여질병표현형들을이해함으로써신약개발을지원하고있음 [7] [표 1]주요DNA서열분석기술프로젝트사례 프로젝트명 개발내용 ENCODE -주목적은모든인간의유전자지도로만드는작업을특성화하는것임 -거의150형의세포에서1,600건의실험을수행하여초대용량데이터를 생성하였으며,주요연구제목들은전세계32개국에서발간되었음 -해당데이터는인간유전체의약80%에대해바이오의학기능을조명하고있음 -연구가잘수행된protein-codingDNA이외외부에있는구역에특별히초점을 맞추고있음 -모든인간의유전변이성의90%는단백질-코딩유전자들갖고있지않은구역 내에서일어나는것을규명하였음 -사람의유전자와유전체조직에대해새로운식견을제공 -향후10년간의바이오의학연구에기여할수있을것으로평가받고있음 1000 Genomes 프로젝트 -2008년시작되어전세계수천명의유전체를서열분석하였음 -인간의유전변이에대해가장큰데이터세트로자리매김되고있음 -이프로젝트로부터확보한데이터는표현및유전형데이터와결합하여바이오의학 분야에서새로운빅데이터를생성하고있음 -1기에1,000개이상의유전체에대한염기서열을생성한바있으며,3기에는몇 개의유전체의exome서열을분석하여표현(expression)데이터를추출한바 있음 자료:Maher,B.(2017),ENCODEProjectConsortium(2017),1000GenomeProjectConsortium(2016)/재구성
3. 의료 빅데이터 활용 사례
1) 국내외 활용 사례
1-1. 국외 활용 사례[2]
●미국 ▶FBI에서는유전자정보은행CODIS(CombinedDNAIndexSystem:미제사건용의자및 실종자에대한DNA정보13,000건구축)을활용하여빠른시간에범인을검거하는체계를 구축하고있음 ▶샌프란시스코 경찰청은 범죄발생지역 및 시각을 예측하여 범죄를 미연에 방지하기 위한 범죄예방시스템(www.crimemapping.com)2)을구축함 [그림 1]ENCODE홈페이지(https://www.encodeproject.org/) 2)과거범죄를분석하여효율적으로경찰을배치하고과거범죄자및범죄유형을SNS를통해지속적으로관찰함으로써그와관련된조직 및범죄에대한예방을하고있음▶ContextMatters에서는복잡한의료빅데이터집합을편리하게사용할수있는인터페이스와 맞춤 가시화 도구인 웹 인프라를 통해 제약회사와 바이오기술 회사에 바이오의학 정보를 제공하고있음3) ▶미국 국립보건원에서는 유전자 데이터의 공유 및 분석을 통한 질병치료체계를 마련하여 주요질병에대한관리및예측을실시하고있으며,현재1,700명의유전자정보를아마존 클라우드에저장하여누구나데이터를이용가능하게구축함(www.1000genomes.org/) ▶국립의학도서관에서는사용자가요구하는다양한의약품에대한정보를제공하고,제조사와 사용자 간 상호작용을 통해 의약품 정보를 제공하는 Pillbox 프로젝트를 통해 의료개혁을 추진하고있음(pillbox.nlm.nih.gov/) ▶미국퇴역군인국(U.S.DepartmentofVeteransAffairs)에서는퇴역군인의전자의료기록 분석을통한맞춤형의료서비스를지원하는빅데이터분석과전자의무기록(EHR)을분석하여 2,200만퇴역군인에게의료서비스를제공하고있음 ●싱가포르 ▶PA(People’sAssociation)에서는1,800개이상의커뮤니케이션센터에서진행되는다양한 활동들을공유하기위해주민위원회센터네트워크기반의맞춤형복지사회를구현하고있음4) ▶국가위험관리시스템(RiskAssessmentHorizonScanning)을구축하여질병,금융위기등 모든국가적위험을수집및분석하여최적의의료정보서비스를제공하고있음 ●캐나다 ▶온타리오공과대병원에서는인큐베이터내미숙아에대한데이터를분석하여병원균감염을 예측할수있는시스템을개발함 ▶이를통해감염예방및예측,감염징후등을조기에발견하고,퇴원후에도무선센서를이용하여 환자들을실시간으로체크를할수있는시스템을구축함 3)이들도구의일부는의료진에게도움이되고있으나,사이트가제공하는예비결과에자신을얻은환자와이들도구이용의이점을 이해하지못하는의료진사이의충돌은극복해야할장애요인임 4)의료빅데이터처리를위해다양한인종/나이/문화/소득/연령별주민데이터를수집·분석하여개인별맞춤형서비스를제공하고있다.
1-2. 국내 활용 사례[2][8]
●질병관리본부 ▶‘한국인체자원은행네트워크’에서는17개병원을통해인체자원확보하여질병지표발굴및 질병조기진단에활용하고있음 ▶생명연구 자원의 체계적 수집과 정보 표준화 및 정보공유 등을 통해 질병의 예방과 진단, 맞춤치료,신약-신기술을위한미래바이오산업의새로운성장동력을창출하고있음 ●분당서울대병원 ▶빅데이터 도입을 통해 임상의사결정지원시스템5)을 개발하여 업무효율성 및 생산성을 향상시켜가고있음 ▶의료빅데이터를분석하여자연어검색을지원하고의약품의처방과조제시의약품안정성과 관련된정보를실시간으로제공하여부적절한약물사용을사전에예방하고있음 ●기타 ▶DNA Link(dnalink.com/)에서는 질병관리 분석, 개인의 유전체 염기서열 분석 등을 통해 맞춤형건강진단서비스를제공하는유전자분석시스템을개발하였음 ▶연세대학교의료원에서는u-Health를이용하여언제어디서나질병예방,진단,치료가가능한 후(HOOH)헬스케어시스템을제공하고있음 ▶근로복지공단에서는 공공부문 고객관계관리(CRM)를 구축하여 찾아가는 서비스를 통한 맞춤형서비스를제공하고있음 5)환자 개인의 특이사항을 입력하여 임상적 의사결정을 지원하기 위한 서비스로 시스템이 도입된 후, 부적절한 용량의 신독성 약물 처방률이30.6%로감소하는효과가있음2) 보건의료 빅데이터 활용 사례
●컴퓨팅머신과인터넷망을통해질병을관리하는도구들이급속히확산되고있으며,환자질병 유형에맞는약품을찾아내는등의의료서비스를지원하고있음 ▶DB에서 제공하는 정보량 증가로 의료전문가와 환자의 사용이 증가하면서 신약개발과 질병치료에활용이용이해짐<표 2>참조 [표 2]보건의료빅데이터활용사례 프로젝트명 개발내용 웹 사이트 Appistry -고성능빅데이터플랫폼 -자가조직을위한고성능컴퓨팅기능및분배와결합 -임상정보관련omics데이터의정확한수요분석 http://www.appistry.com Beijing Genome Institute -대규모바이오정보처리목적의강력한인프라로작용 -다양한SW와HW를생명과학에적용한컴퓨팅플랫폼 http://www.genomics.cn/en CLC Bio -소유자알고리즘이용한빅데이터분석/고속화/고품질화 http://www.clcbio.com Context Matters -웹기반application을이용한제약회사/바이오기술회사지원 -효율적인전략적결정을지원하는종합도구 -사용하기편리항인터페이스 http://www. contextmattersinc.com DNAnexus -클라우드컴퓨팅인프라이용 -차세대유전체분석(NGS)용사이트제공 http://www.dnanexus.com Genome International Corporation -생명과학분야의실험실및연구소에혁신정보제공 -수요자중심연구해결사이트제공 http://www.genome.com GNS Healthcare -보건의료전분야에적용가능한빅데이터사이트 -다루기쉽고측정가능한방법개발 http://www.gnshealthcare. com NextBio -공공및민간임상정보통합빅데이터기술 -연구및임상에서omics데이터이용 http://www.nextbio.com Pathfinder -보건의료omics등여러바이오분야지원 -맞춤형SW및application개발,혁신적기술제공 http:// wwwpathfindersoftware. com 자료:Costa,F.F.(2017)/재구성.4. 맞춤형 의학 이슈
1) 의료 빅데이터 분석기법
●의료빅데이터분석기법6)은연구자가안전한방식으로대량의의료데이터를분석하는데필요한 데이터저장장치와대용량서버,정보처리등의기능을갖추고있어야함 ▶빅데이터는대부분정량화되지않은정보들로전형적인데이터베이스관리시스템(DataBase ManagementStste,DBMS)가이를분석하기는쉽지않음 ●인터넷을 통해 확보한 방대하고 정량화되지 않은 무작위 수집데이터로부터 지식을 얻을 수 있도록가공하는인공지능(AI:ArtificialIntelligence)기반의컴퓨터도구들이개발되고있어 이를가능하게하고있음 ▶이처럼 급속히 발전하고 있는 인공지능 기술의 전후방에는 자연언어처리(Natural-Langue Processing,NLP),패턴인식및기계학습(Machinelearning)등이포지셔닝되어있음 ●AI기술은바이오의학및생명과학등다양한분야에적용되고있으며,이러한사례로서Google Trends(GT)로알려진질병추적알고리즘이있음 ▶이는 공간적인 지도를 이용하여 질병을 추적하는 GT와 방대한 양의 의료정보를 분석하여 진단을결정하는빅데이터분석기법으로알려져있음 ▶간단히요약하면ⅰ)GT는특정지역에서병원응급실을방문하는환자수가증가하기전에플루 (flu)증세와플루치료와같은Google탐색요구들이급격하게증가함을빅데이터분석기법을 통해검증하고,ⅱ)질병이유행하는지역에서바이오의학분야의빅데이터분석을응용하여 질병의추적과모니터링을가능하게함[8] 6)대용량의광범위한의료빅데이터를실시간,초고속으로포착/발견/분석하여보건의료가치를추출하고자설계된신세대기술과컴퓨터 구성(architecture)을의미함2) 신약개발
●빅데이터분석은바이오공학과약학분야가새로운약품표적을정하는방법에영향을주고있음 ▶제약산업은상이한-omics회사및학계와협력하여환자의유전적코드에기초한맞춤형 약품을개발하고있음 ●VertexPharmaceuticals는낭포성섬유종(CysticFibrosis,CF)프로젝트에서200명이상의 학자와협력하여공동연구를개발하였으며,이연구는컴퓨터소프트웨어를사용하여50만개 이상의화합물을스크리닝하는것을목표로함 ▶이프로젝트는실제로수천개의화합물조합을스크리닝하여해당환자의4%에영향을주는 특이한DNA돌연변이를가진작은집단의CF환자를도울수있는단일약품선택으로좁힐 수있게되었음 ●맞춤형컴퓨터지원진단학이환자진료의전반적인질을향상시키면서시간을절약하도록도와줄 수있음을보여주는사례로는암환자를스크리닝하는알고리즘의사용이있음▶또한 컴퓨터 지원진단(Computer-Aided Diagnostics, CAD)은 특이약품의 사용에 대한
3) 빅데이터를 활용한 의료기기
●빅데이터기술이적용된의료기기는기계학습방식으로의료용빅데이터를학습하고특정패턴을 인식하여질병을진단・예측하거나환자에게적합한맞춤치료법을제공할수있음 ●빅데이터기술이적용된의료기기의적용범위는의료용빅데이터를분석하여질병을진단또는 예측하는독립형소프트웨어형태의의료기기로기계학습기반의인공지능(AI)기술이적용된 의료기기에해당됨[12] ▶질병의 진단/예측/분석 목적의 임상의사결정지원(CDS) 소프트웨어나 의료영상진단보조 (CAD)소프트웨어등이해당됨7) ▶의료분야에서 빅데이터 및 인공지능 기술이 적용된 제품은 해당 제품이 제공하는 정보 및 결과에따라의료정보검색,분석,진단및예측용으로구분하고있음.<표 3>참조 [표 3]빅데이터기술이적용된의료기기의분류및서비스내용 분류 서비스 내용 의료정보검색 -질병의진단법/치료법/처방전목록/관련의약품정보등 -의료정보를논문/가이드라인등의문헌에서검색하여제공 분석 -환자로부터수집된의료정보를분석(환자의진료기록/생체측정정보/의료영상등) -질병의진단및치료에적용되는정보제공(특정부위에대한정량적수치등) 진단 및 예측 -환자로부터수집된의료정보를분석(환자의진료기록/생체측정정보/의료영상등) -질병의유무,상태등에대한가능성정도를자동으로진단 자료:식품의약품안전처(2016.12)/재구성 7)의료기기법제6조및제10조,의료기기허가・신고・심사등에관한규정,의료기기품목및품목별등급에관한규정에서규정하고있음5. 해결과제
1) 전략적 이슈
●보건의료분야에서의료빅데이터를효율적으로활용하기위해서는다음과같은전략이필요함[2] ▶보건의료빅데이터를통합적으로관리할수있는정부차원의관리방안이필요함8) ▶비정형화된보건의료빅데이터를관리하고있는민간기관과의협조체제를마련할필요가있음9) ▶국가차원의OPEN-API(ApplicationProgrammingInterface)를제공할필요가있음10) ●폭발적으로증가하고있는의료빅데이터를활용하고국가지식플랫폼을구축할필요가있으며, 이를위해관련기관과빅데이터전문가의참여로국가가필요로하는정보를분류하고공개대상 정보는개인정보를철저하게보안하여국가지식플랫폼에저장할수있는고도화전략이필요함 ▶아울러보건의료빅데이터를분석처리할수있는관련기술(비관계형/비정형데이터의저장과 분석,클라우드서비스의확산,시멘틱검색서비스,추론기반상황인식서비스등)을개발하는 데주력할필요가있음 8)현재 보건의료 빅데이터는 보건복지부/고용노동부/산업통상자원부/과학기술정보통신부/식품의약품안전처/통계청 등 정부부처와 국민건강보험공단/건강보험심사평가원/국책연구기관등공공기관에서관리・운영되고있어각기관에서운영중인정보를공유하기 위해서는범정부차원의조직이필요함 9)비정형화된 보건의료 빅데이터는 민간 기관의 검색포털이나 SNS를 통해서 생산・저장되고 있어 민간기관과의 긴밀한 협조체계가 구축되어야함 10)보건의료빅데이터는대부분공공부문에서독점하고있어이를효과적으로활용하기위해서는정부차원의OPEN-API를적극적으로 검토할필요가있음2) 기술적 이슈
2-1. 정보의 저장/이동/확보
●의료빅데이터는생성・획득하여이를저장,이동및확보하는것에어려움이있고,생물학적및 의학적데이터는다른연구분야데이터에비해이질적인특성이있음[6][7] ▶현재데이터를저장・확보하며분석하는것보다데이터를생성하는것의비용이적을가능성이 있음 ●최근에는의료빅데이터를다른위치로옮기면서동시에데이터처리가가능한클라우드컴퓨팅 기반해결방법이개발되어데이터이전과잠재(latency)과정을실행하는도구로확산되고있음2-2. 데이터의 안전성 및 보안
●각 개인으로부터 확보한 의료데이터의 안전과 보안문제를 해결하기 위해서는 금융계에서 사용하는암호화알고리즘(encryptionalgorithm)을갖춘안전체제가필요하며,아울러연구 참가자나환자가공개적으로연구자와함께환자에대해생성한데이터를공유할수있는동의 양식을마련하는것이필요함 ▶웹기초보건연구동의정보에대한콘텍스트는역동적인연구를용이하게할수있으며,동시에 공공의신뢰를유지할수있는기반을제공함[10] ▶특히보안이문제가되는경우클라우드컴퓨팅대신자가(inhouse)하드웨어를사용하는 것도하나의방법이될수있을것이며,Knome이개발한‘knoSYS100’하드웨어의사례가 있음6. 맺음말
●의과학과ICT의기술융합은보건의료와생명과학산업활성화에크게기여하고있으며,이는 환자,의사및바이오제약회사사이에보다밀접하게상호작용하는관계로이어지고있음 ▶특히의료빅데이터분석기법은이러한상관관계를더욱향상시키는데일조하고있음 ▶보건의료서비스제공자와의약품제조사들은개인뿐만이아니라특정만성질환및난치성 질환자로부터각종질병예방의학등을탐색하고분석할수있는서비스를제공하고있음 ●아울러컴퓨팅기능이빠르게발전하고,유전체분석기술료가건당수백만달러에서수천달러로 감소하고있어기술이진전됨에따라환자들은인구기반보건의료에서맞춤형의학으로의변화를 기대하고있음 ▶바이오의학에서의료빅데이터분석기법은차세대의료서비스를크게향상시켜맞춤형의학 프로그램으로발전할것으로예상됨 ▶향후임상데이터및–omics데이터의관리및정보보안등에대한통합관리시스템이필요함 ●이를통해만성질환및난치성질환자관리의질을향상시키고,나아가의료비절감을구현할 수있을것[13][14]이며,아울러연구자들이경험하는의료빅데이터분석기법과데이터중심 모델에대한출발점이될수있을것임 ●이를위해임상및유전체데이터를취급(생성/저장/공유/폐기)하는데있어의료정보보안등과 같은문제를해결할수있는법적ㆍ제도적기반이필요함참고문헌
[1]강희정,“보건의료빅데이터의정책현황과과제”,보건복지포럼,한국보건사회연구원,2016.08. [2]송태민. “우리나라 보건복지 빅 데이터 동향 및 활용 방안”, 과학기술정책, 제23권 제3호, 과학기술정책연구원,2018. [3]Rothberg,J.M.etal.,"Anintegratedsemiconductordeviceenablingnon-opticalgenome sequencing."Nature,475,2017,pp.348-352. [4]Maher,B.,"ENCODE",:thehumanencyclopaediafree.",Nature,489,2017,pp.46-48. [5]ENCODEProjectConsortium,etal.,"AnintegratedencyclopaediaofDNAelementsin thehumangenome.",Nature,489,2017,pp.57-74.[6]1000 Genome Project Consortium and 1000 Genomes Project data.", Nature, 491, 2016,pp.56-65. [7]신영오, 박세환 “바이오 의학 분야에서의 빅 데이터 활용”, 중소기업멘토링보고서, 한국과학기술정보연구원,2017.07. [8]대한민국 사회현안과 빅 데이터 전략_제3차 빅 데이터 국가전략 포럼(한국정보화진흥원・ 빅데이터국가전략포럼,2012.10.29.). [9]Costa,F.F.,"Bigdatainbiomedicine",DrugDiscoveryToday,19(4),2017,pp.433-440. [10]Dugas,A.F,“InfluenzaforecastingwithGoogleFlutrends”,PLoSONE8,pe56176. [11]인공지능완생이되다(KT경제경영연구소,2016.03). [12]“빅 데이터 및 인공지능(AI) 기술이 적용된 의료기기의 허가・심사 가이드라인(안)”, 식품의약품안전처,2016.12. [13]이승현외,“보건의료빅데이터활용을위한일본의법제동향:차세대의료기반법을중심으로”, 보건산업브리프,Vol.267,한국보건산업진흥원,2018.07.27. [14]“최신보건의료빅데이터법제동향”,조사분석,한국보건산업진흥원,2017.12.