1. 들어가는 글
● ●딥러닝(Deep learning)을 필두로 하는 인공지능이 영상 분석, 음성인식 등 다양한 분야에서 우수한성과를보이며,보건의료분야에서도인공지능에대한기대감이높아짐 ● ●실제로의학논문검색엔진인PubMed1)에서인공지능관련키워드로검색되는논문들은그림1과 같이증가하고있음보건의료 분야에서의 인공지능과
기계학습 활용 및 전망
윤덕용교수 아주대학교의료정보학과 [그림 1]연도별인공지능관련키워드를가진논문의수(~2018년)The number of publications
7000 6000 5000 4000 3000 2000 1000 0 1950 1960 1970 1980 1990 2000 2010 2020
● ●하지만 인공지능을 공부하는데 있어서의 높은 학습 장벽 때문에 아직 보건의료 분야의 많은 연구자들은인공지능에대해막연한기대감만을갖고있는경우가많음 ● ●따라서,본고에서는인공지능,기계학습,딥러닝에대한기본적인개념을간단히설명하고,보건 의료분야에서활용된사례와향후전망에대해살펴보고자함
2. 인공지능과 기계학습
[그림 2]인공지능,기계학습,딥러닝간의관계도식도2.1 인공지능
● ●딥러닝이 인공지능 분야의 대표적인 알고리즘으로 자리잡으면서, 딥러닝이 곧 인공지능으로 표현되는경우가많으나,인공지능은훨씬광범위한개념임 ▶전통적인정의에따르면인간의지능을흉내내는모든프로그램을인공지능이라고할수있음2) ● ●현재과학기술로는실제지능의원리에대해서도자세하게밝히지못하고있기때문에,이를 인공적으로만든다는것은불가능함▶따라서지능의원리는따지지않고프로그램의결과가인간의지능과유사한결과를보인다면 인공지능이라고할수있어,의사결정나무,Supportvectormachine,인공신경망등다양한 알고리즘이존재함 ▶예를들어,어떤전문가의경험을바탕으로작성된단순한순서도(flowchart)기반의프로그램도 입력에대한결과반응이인간의반응과유사하다면인공지능이될수있음
2.2 기계학습
● ●기계학습(machinelearning,ML)은인공지능의여러분야중한분야에속함(그림2) ▶기계학습은다양한방법을이용해서데이터에존재하는어떤패턴을찾아가는특징이있어‘학습’ 이라는단어가붙음 ● ●기계학습은비지도학습(unsupervisedlearning),지도학습(supervisedlearning),강화학습 (reinforcementlearning)으로분류됨 ▶비지도학습 : 학습하는 데이터에 특정 그룹에 대한 정보(label) 없이 데이터 내에 존재하는 패턴을찾는방법으로,그림3의좌측데이터를x,y축의값을기반으로하여우측과같이두 그룹으로나눌수있음 [그림 3]비지도학습결과예시▶지도학습:지도학습은학습하는데이터에특정그룹에대한정보(label)가있어주어진정보에 맞춰패턴을찾는방법으로,그룹에대한정보를바탕으로그림3과동일한데이터를분석한다면 결과는그림4와같이달라짐(화살표) ▶강화학습:강화학습은시행착오를겪으며가장높은보상을받는행동의정책을학습하는분야로, 그림5에서오른쪽으로가능행동은+10점의보상,왼쪽으로가는행동은-10점의패널티를 준다면여러번의시행착오를겪은후,오른쪽으로가는행동이좋다는것을학습하게됨 ▶딥러닝:딥러닝은패턴을학습하는방법,즉알고리즘에대한이름으로그림2에서제시된 바와같이비지도학습,지도학습,강화학습에모두사용될수있음.인공신경망알고리즘을 여러겹(깊게)붙여사용하여딥러닝이라고불리움 [그림 5]강화학습결과예시 정책수립 →오른쪽선택 강화학습 경험(행동,보상)
-10
+10
[그림 4]지도학습결과예시3. 인공지능과 데이터
● ●앞서살펴본바와같이,인공지능의개념은매우광범위하지만현재가장주목받고있는분야는 데이터에기반한방법인기계학습이며,그중에서도딥러닝이비지도,지도,강화학습분야에서 가장활발하게사용되고있음 ▶기계학습알고리즘은데이터로부터패턴을학습하여데이터가많을수록좋은성능을보이며, 특히딥러닝기반모델의경우모델의복잡성이높아더많은데이터가필요함 ● ●대부분의산업분야에서정보화가이루어지고,데이터저장에필요한비용이급격하게감소하면서 가용데이터의양이급속하게증가함 ▶2010년대초반,전세계의데이터양은5zettabytes미만이었지만2018년도에는33zettabytes, 2025년도에는175zettabytes에이를것으로예상되고있음3) ● ●데이터의양이급속하게증가하면서특히많은데이터가요구되는딥러닝의성능이월등하게 좋아짐에따라딥러닝에대한기대가커짐 ▶하지만한사람이생산하는수많은정보중병원에서는아주일부만이수집되고있어,보건의료 분야에서충분한데이터가수집되고있는지고민이필요함 [그림 6]데이터와기계학습알고리즘의성능간의관계 Deep learning Most other algorithms Performance Amount of Data[그림 8]아주대학교병원생체신호데이터수집인프라구축현황 ● ●아주대학교 병원에서는 이러한 문제를 해결하기 위해 병원에서 수집이 가능한 데이터이지만, 놓치고있는데이터들을최대한자동적으로수집할수있는인프라확충에노력하고있음 ▶대표적인예로중환자실및수술실에서측정되는생체신호(심전도,연속측정동맥혈압,호흡 등)를파형데이터원본그대로실시간으로수집하는인프라를구축하여운영중 [그림 7]한사람으로부터수집가능한데이터중수집여부에따른분포 Data not recorded
Data recorded outside the hospital Data recorded in the hospital
▶2019년 3월 현재 기준, 약 11,000여명의 환자로부터 생체신호 데이터를 수집하였으며, 수집된모든파형데이터의총길이는약650년에달함
4. 보건의료 분야에서의 활용 사례
4.1 비지도학습 : 의학용어 유사도 계산 사례
● ●의학용어들간의유사도를계산하기위해서는개별용어들을계산가능하도록수치화하는과정이 필요한데,이를위해의학용어들의사용패턴을학습하게하면각개념들을수치화하여표현할 수있음 [그림 10]Med2Vec을이용한의학용어의수치화예시 ▶각의학용어들은사용된기록만있고,어떠한개념인지에대한label은사용되지않았으며, 단순히전자의무기록내에서사용된패턴만을보고학습하였기때문에비지도학습에해당됨 ▶이렇게수치화된개념들은유사한의학용어를추천해주거나,유사한환자들을찾는데활용될 수있음● ●그림 11은 임상시험 대상자를 찾는 프로그램에 응용된 사례로 특정 약물을 검색하면 비슷한 사용 패턴을 보였던 약물들을, 일부 환자군을 선택하면 유사한 환자군들을 추천해줌으로써 분석과정을지원함 ● ●이렇게비지도학습을통해추출된패턴은원본의고차원데이터에서의미있는인자들이추출된 (추상화된)결과이기때문에,지도학습이나강화학습의입력데이터로유용하게사용될수있음
4.2 지도학습 : 중환자실 내 패혈증 발생 예측 모델 개발 사례
● ●본 연구진은 패혈증이 발생한 환자군에서 패혈증이 발생하기 1시간 전의 생체신호 데이터와 패혈증이발생하지않은환자의생체신호데이터를분석하여,패혈증을조기에예측할수있는 모델을개발하였음 [그림 11]Metformin과유사한사용패턴을보이는약물을추천해주는화면[그림 13]패혈증예측모델구조 ▶예측모델의구조는그림13과같이심전도(ECG),맥박파형(PPG),호흡파형(RESPIMP) 데이터를분석한후,패혈증발생에대한예측여부를결과로내도록되어있음 ▶실제임상데이터에적용ㆍ평가하여현재약85%의정확도를확보하였으며,그림14과같이 시간별로특정환자의패혈증발생위험도를계산할수있음
4.3 강화학습 : 패혈증 환자에 대한 승압제 및 수액 치료 전략
수립 사례
● ●최근Naturemedicine지에발표된논문에따르면,중환자실에서치료했던데이터를기반으로 가상의임상환경을마련해두고,그안에서시행착오를경험하며적절한승압제와수액치료를할 수있도록인공지능모델을학습시킴5) ▶그결과,실제의료진의치료정책보다인공지능의치료정책이더많은환자를살릴수있을 것이라고평가됨 [그림 15]Naturemedicine지에소개된AIclinician논문 (https://www.nature.com/articles/s41591-018-0213-5)5. 미래 전망
● ●앞서살펴본내용들을바탕으로보건의료분야의빅데이터에서인공지능및기계학습이적용되는 과정을보면그림16과같음 [그림 16]보건의료빅데이터기반인공지능적용프로세스개요 ▶보건의료 분야에서 기계학습의 적용을 위해서는 의료현장에서 의미 있는 데이터를 정확히, 많이수집하려는노력이필요함 ▶이렇게 수집된 원본 데이터는 매우 고차원이며 복잡하기 때문에 중요한 특징을 추출하는 과정이필요함(비지도학습) ▶이후 질병의 여부 등을 판단하거나 예측모델의 개발을 위해서 질병에 대한 정보가 포함된 데이터학습이필요함(지도학습) ▶또한다양한임상상황에맞는최적의치료전략을수립하는일도중요함(강화학습)● ●현재앞서나열한프로세스의각부분들혹은몇몇부분들이연계된형태의연구들이활발하게 진행되고있음 ▶각 부분의 연구들에서 우수한 연구 성과들이 도출되고 있어, 향후 가까운 미래에서는 모든 프로세스가연계되어궁극적인AIclinician이등장할수있을것으로기대됨 ● ●AIclinician은다음과같은점에서인간보다우수한능력을보여줄것으로예상됨 ▶환자로부터필요한데이터를보다효율적으로수집함 ▶환자로부터수집한데이터를보다적절하게추상화함 ▶정확한진단을먼저내릴수있음 ▶효과적인치료전략을수립할수있음 ▶데이터및문헌을참고하여새로운지식을보다빠르게습득 ● ●따라서보건의료분야에서활용될인공지능기술에대한관심을넘어,향후개발될AIclinician 과의공존방향에대해서도고민이필요함