• 검색 결과가 없습니다.

질병진단 인공지능 개발 동향

N/A
N/A
Protected

Academic year: 2021

Share "질병진단 인공지능 개발 동향"

Copied!
13
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

질병진단 인공지능 개발 동향 김규태 Page 1 / 13 BRIC View 2020-T06

질병진단 인공지능 개발 동향

김 규 태

인하대학교 의과학연구소

E-mail: kimg@inha.ac.kr

요약문 인공지능의 빠른 발전은 다양한 산업분야로의 적용으로 이어지고 있으며, 의료 영역으로 의 확대는 이제 거스를 수 없는 변화이다. 특히, 4차 산업혁명의 핵심 기술들로 정의되는 인 공지능을 비롯한 빅데이터, 클라우딩 기술들의 발전은 인공지능을 기반으로 한 의료진단 영 역에서의 높은 성공 가능성을 시사한다. 본 동향에서는 무분별하게 혼용되는 인공지능의 기 술적 정의에 대한 재고와 함께, 현재 인공지능 기반의 의료 진단에 대한 현 주소와 남아있 는 도전과제들을 알아보고자 한다. 또한, 이들 문제점들을 해결하기 위한 가능한 기술적 방 법의 제시를 통해 제기된 과제들의 해결방법을 알아보고자 한다. 이와 함께, 향후 진행될 관 련 기술개발의 방향을 알아보고, 인공지능기반의 의료 진단이 향상되기 위한 핵심 요소인 빅데이터의 중요성에 대해 논의하고자 한다. Key Words: 인공지능, 기계 학습, 딥러닝, 의료진단, 빅데이터

목 차

1. 서론

1.1. 인공지능 vs 기계 학습 vs 딥러닝

1.2. 국내외 AI 기반 의료 진단

BRIC View 동향리포트

(2)

질병진단 인공지능 개발 동향 김규태 Page 2 / 13

2. 본론

2.1. 인공지능 기반 의료 진단 기술현황

2.2. 인공지능 기반 의료 진단 기술의 미래

2.3. 인공지능 기반 의료 진단의 도전과제 및 해결방안

3. 결론

4. 맺음말

5. 참고문헌

1. 서론

일반적인 인공지능(Artificial Intelligent, AI)은 좁은 의미의 AI 로서, 이는 특정 업무에 특화된 AI 를 가리킨다. 예를 들면, 자동번역, 영상 및 음성인식, 신경망 구조의 개발과 분석 등에 적용되는 AI 기술과 같이 특정 업무에 국한되어 적용되는 대부분의 인공지능 기반의 기술들은 좁은 의미의 AI 라고 할 수 있다. 오늘날 4 차 산업혁명 등의 관련 기술 발달과 함께 AI 가 다양한 분야에 적용되고 있으며, 특히 의학 분야에서의 AI 를 이용한 방법들은 빠른 증가세를 보이고 있다. 의료 인공지능으로 대변되는 AI 기반의 의료서비스는 의료데이터의 보조적인 해석에서부터 질병의 예측 및 진단, 의료영상 해석과 같은 전문 의료영역에 이르기까지 다양한 의료서비스에 적용되고 있으며, 현재 일부 영역에서는 전문 의료인력보다 높은 수행 능력을 보이는 것으로 알려져 있다 [1]. 이러한 결과는 21 세기 딥러닝의 대부로 알려진 제프리 힌튼 교수(캐나다 토론토대학교 & 구글)의 2016 년도 발언과도 일맥상통하는 면이 있다고 하겠다 [2]. 일반적으로 AI 기반의 의료기기는 의료데이터를 분석하여 수행 능력을 향상시키는 소프트웨어와 이를 포함하는 의료기기들을 가리킨다. AI 기반의 의료시스템은 의료 전문인력들과 경쟁 관계로 보는 시각으로 인해 부정적인 견해들이 존재하는 것이 현실이다 [3]. 하지만, 의료분야에서의 AI 활용은 의료 인력들과 경쟁 관계가 아니라 상호 보완관계로 보는 것이 타당하며, 의료종사자들은 현재의 역할이 향후에 소멸되는 것이 아니라 변화할 것이라는 상황을 받아들임으로써 부정적인 시각은 사라질 것으로 보인다. 현재 AI 기반의 의료시스템은 영역(진료과목)에 상관없이 급속히 확대되고 있지만, 진료 행위에 적용될 수준을 보이는 영역은 대략 5 가지 분야(AI 기반 로봇수술 시스템, 가상 간호 보조 시스템, 의료진단 시스템, 의료서비스 관리, 영상 해석)로 요약된다 [4]. 특히, AI 기반의 영상 해석은 의료 진단의 측면에서 가장 핵심적인 기능을 수행하고 있으며, 병리학 관련 다양한 데이터와 함께 AI 기반의 의료진단 기술의 핵심적인 영역이다. 본 보고서에서는 AI 기반의 진단 기술 및 결과와 향후 관련 기술발전 방향 및 남겨진 과제들에 대한 논의를 진행하고, 이들에 대한 해결방법을 모색하고자 한다. 나아가, AI 기반 의료진단 영역에 있어서 가장 핵심적 요소인 빅데이터에 대한 논의도 진행하고자 한다.

(3)

질병진단 인공지능 개발 동향 김규태 Page 3 / 13

1.1. 인공지능 vs 기계 학습 vs 딥러닝

포괄적인 AI 는 기계(컴퓨터)에 의해 구현되는 인간과 유사한 지적 능력을 정의하는 것으로 좁은 의미의 정의에 비해 보다 추상적인 개념을 가진다. 우리가 일반적으로 사용하는 AI 는 이러한 개념적인 정의가 아닌, 앞서 설명된 실질적인 활용을 위한 기술을 가리키며, 세부적인 AI 의 구분은 개념, 기능, 기술(적용 분야)에 따라 다양하다 [그림 1]. 특히, 주요 기술로 자주 언급되는 기계 학습(Machine Learning)은 기술적인 분류의 하나로서 이를 구현하는 하위 알고리즘이 바로 딥러닝(deep learning)이다. 구체적인 정의는 다음과 같다. 기계 학습은 데이터의 측정을 통해 작업을 수행함과 동시에 경험을 통해 성능의 향상을 구현하는 컴퓨터 프로그램의 일종이다 [5]. 이에 반해, 딥러닝은 기계 학습의 일종으로서 기계 학습의 성능향상에 사용되는 알고리즘이 다수의

레이어(layer)들로 구성되어 있다. 이러한 알고리즘의 네트워크는 인공 신경망(neural network)이라고 불리며, 딥러닝을 구현하기 위한 구조적 특성은 인간의 뇌 신경망을 모사한 인공지능 방식이라고 할 수 있다. 하지만, 작업 수행과정에서 사용되는 알고리즘의 구조는 지속해서 연구 및 개발되면서, 성능의 향상을 꾀할 수 있으나, 기계 학습과 딥러닝의 성능을 극대화할 수 있는 가장 핵심적인 요소는 데이터이다. 즉, 양질의 많은 데이터가 높은 수준의 결과를 도출한다고 보는 것이 타당하다 [6]. 그림 1. 인공지능의 구분

1.2. 국내외 AI 기반 의료 진단

앞서 설명된 것처럼, 인공지능의 적용에서 가장 중요한 요소는 데이터이다. 물론, 최근 인공지능의 급속한 성장과 성능 향상은 단일 요소에 의한 것이라고 볼 수는 없다. 2010 년 초반부터 시작된 인공지능 알고리즘, 컴퓨팅, 빅데이터의 융복합에서부터 이론적인 연구성과의 도출 그리고 이러한 아이디어들이 가능할 수 있도록 발달한 컴퓨팅 인프라(클라우드 및 그래픽 처리장치(GPU)) 등이 실현됨으로써 오늘날 인공지능(딥러닝)의 새로운 전성기가 왔다고 할 수 있다 [7]. 하지만, 이 모든 환경이 갖추어지더라도 다량의 양질의 데이터가 수반되지 않는다면 높은 수준의 결과를

(4)

질병진단 인공지능 개발 동향 김규태 Page 4 / 13 기대할 수 없다. 따라서, AI 기반 시스템의 성능 향상은 지속적인 양질의 데이터 생성과 밀접한 관련이 있다. 대형병원은 이러한 AI 기반의 인공지능을 적용하기에 좋은 환경을 가지고 있다. 특히, 환자 개개인에게서 검출되는 다량의 데이터는 AI 알고리즘의 훈련(training)과 이를 통한 성능 향상에 주요한 정보를 제공하게 된다. 우리나라의 AI 기반 의료 진단은 길병원(인천)에서 IBM 의

왓슨(Watson for Oncology)을 실제 임상에 적용하면서 시작되었다 [8]. 이후에 지방의 대형병원들을 중심으로 현재는 8 개의 국내 대형종합병원들이 IBM 의 왓슨을 도입해서 사용하고 있는 것으로 알려져 있다. 2018 년 11 월에는 국내 의료기기법의 개정으로 왓슨이 의료기기로서 허가도 가능해지게 되었다 [8]. 하지만, 세계적으로 다양한 국가(미국, 중국, 인도, 태국 등)에서 사용되는 왓슨은 국내 빅 5 대형병원에서는 왓슨을 위한 유료 베타테스터로 전락한다는 우려 때문에 적극적인 도입이 이루어지지 않고 있다 [9]. 해외에서 개발된 AI 기반 의료진단 시스템에 대응하기 위해 국내에서는 한국형 AI 정밀 의료 서비스 개발을 위한 사업 출범식이 2018 년 4 월 서울아산병원에서 개최되었다 [10]. 이를 통해 정밀한 의료데이터(진단 정보, 영상, 유전체 정보 등)를 이용한 분석을 통해 진단 및 치료 지원과 함께 맞춤형 질환 예측까지도 서비스가 가능할 것으로 기대된다. 이를 위해, 3 년간(2018-2020) 총 357 억 원의 자본이 투입될 예정이며, 이를 통해 8 개의 질환(치매, 뇌전증, 심뇌혈관질환, 전립선암, 대장암, 유방암, 전립선암, 소아 희귀 난치성 유전질환)과 21 개의 체감형 AI 의료 소프트웨어를 개발할 예정에 있다 [10]. 이러한 연구개발은 성능향상을 위한 주요 요소인 고품질의 의료데이터와 밀접한 관련이 있다. 일반 대형병원은 고품질의 의료 데이터가 생성 및 저장되는 장소로서, AI 를 위한 빅데이터의 4 가지 속성인 데이터의 크기(volume), 다양성(variety), 수집속도(velocity), 신뢰도(veracity)의 모든 속성을 가지고 있다. 사용자 중심의 AI 기반의 의료 진단을 위한 연구와 함께, 상품 개발자 중심의 연구개발도 차츰 확대되고 있다. 국내에서는 총 3 개의 업체(뷰노, 제이엘케이인스펙션, 루닛)가 AI 기반 의료기기의 품목 허가가 완료된 상태이며, 모두 영상분석(X-ray 영상, 뇌 MRI)에 관한 제품들로 이루어져 있다 [8]. 이러한 영상 분석에 집중하는 AI 기반의 의료진단 관련 제품은 해외 업체의 제품군에서도 나타난다. 2015 년 통계를 보면, 24 개의 관련 업체 중에 19 개의 업체에서 영상 분석과 관련된 제품개발에 집중하고 있다고 보고되었으며, AI 기반의 이미지 분석과 진단 분야의 회사 자본을 기준으로 본다면 이러한 쏠림 현상은 최근 더욱 심해지고 있다 [11]. 하지만, AI 기반 제품의 진단 부위 및 기능적인 측면에서 볼 때는 국내상황에 비해 높은 다양성을 보인다. 뇌와 척추의 영상 판독 우선순위 조절과 주요 이미지 표시에서부터 각종 암 진단(MRI, CT 영상 기반), 관상동맥 석회화 진단, 심 초음파와 심방성 부정 박동 진단, 뇌졸중 및 뇌출혈 진단, 당뇨 망막 진단, 손목 골절 진단(x-ray 영상기반) 등 국내업체들의 제품군에 비해서 그 적용 범위나 기술은 상대적으로 매우 넓다. 또한, 주요 기업군들(Arterys, Zebra Medical Vision, iCAD, aidoc 등)의 제품들을 보면 딥러닝을 이용한 자동화된 병변 및 결절 분할을 진행하거나 병변 진행 상황의 수치화를 통해 진단을 보다 원활히 하는 제품들이 다수를 이룬다 [11].

(5)

질병진단 인공지능 개발 동향 김규태 Page 5 / 13

2. 본론

2.1. 인공지능 기반 의료 진단 기술현황

AI 기반의 의료 진단용 기술은 크게 3 가지 영역(EMR 및 의료 데이터 AI, 의료 및 병리 영상 AI, 신호 모니터링 AI)으로 구분되어 개발되고 있으며, 딥러닝은 적용되는 인공지능의 가장 핵심적인 기술이다 [12]. 특히, 의료영상 판독은 의료진들의 시간과 노동을 집약적으로 요구하는 작업으로 효율적인 진단 작업을 위해서는 AI 기반의 영상 해석이 매우 유용한 것으로 알려져 있다. 일반적으로 AI 기반의 의료 및 병리 영상에서 도출되는 결과는 분류(classification), 검출(detection), 분할(segmentation)이며, 이중 분류에 의한 결과들은 정밀 진단의 핵심 요소로 사용되므로 가장 많은 기술적인 관심 대상으로 알려져 있다 [13]. 딥러닝의 기술 중에서는 컨볼루션

신경망(convolutional neural network, CNN)을 적용한 영상 분류와 검출이 의료진단에서 많이 이용되어 왔다. 수학적 정의에 따르면, 컨볼루션은 두 개의 함수를 이용한 합성 곱을 나타낸다. 딥러닝에서는 이러한 합성 곱의 특성을 이용하여 입력 데이터(영상)에서 특징 추출 및 가중치의 부여를 다수의 숨겨진 레이어(hidden layer)들을 통해 구현한다. 일반적인 CNN 의 구조(LeNet CNN 구조)에서 나타나듯이, 컨볼루션과 특징(feature) 샘플링을 반복적으로 적용하여 최종 결과값을 도출하는 방법이다 [그림 2]. 위와 같은 전형적인 CNN 의 구조는 각 채널 수의 차이에 의한 컨볼루션 레이어의 개수, Kernel 의 크기 등의 변화를 통해 AlexNet 혹은 ZFNet 와 같은 다양한 형태로 개발되어왔다 [14, 15]. 특히, ZFNet 의 개발은 기본적인 CNN 의 구조에서 각 단계에서 이루어지는 결과들에 대한 수정이 가능한 구조를 만듦으로써 최종 결과에서 나타나는 왜곡된 값들의 개선이 지속해서 이루어지도록 구성이 되어있다 [15]. 이러한 구조적 성능 향상은 복잡한 의료영상을 객관적이고 정확한 진단을 내리는 데 있어서 향상된 결과를 보여주지만, 문제점이 전혀 없는 것은 아니다. 예를 들면, CNN 기반 딥러닝을 이용한 영상 해석은 사용되는 모델에 의한 빠른 학습 속도와 이를 통한 높은 수준의 성과는 장점으로 작용하지만, 빅데이터 수준의 많은 양의 라벨링 된 데이터가 분류작업을 위해서 필요하다는 점이 단점으로 작용한다 [16]. 또한, 영상 분할의 결과에 대한 공간 및 구조적인 일관성 유지가 어렵다. 이러한 기술적인 단점은 분명하지 못한 영상의 윤곽과 알 수 없는 작은 영역 분할 등과 같은 문제점을 야기시킨다. 하지만, 이러한 단점에도 불구하고 CNN 기반의 딥러닝은 2D 의료영상에서 신경 구조의 추출 [17], MRI 영상에서의 전립선 영역 분할 [18], 안저(fundus) 영상을 이용한 시신경 원판(optic disc)과 혈관 분할 [19] 등 다양한 분야에서 사용되고 있다.

(6)

질병진단 인공지능 개발 동향 김규태 Page 6 / 13 그림 2. Convolutional Neural Network (CNN) 구조

최근 이러한 기술적 문제점이 순환 신경망(Recurrent Neural Network, RNN)을 이용하여 개선하려는 시도가 진행되고 있다. 각 레이어에서 추출되는 특징들이 독립적으로 사용되는

CNN 과는 달리 RNN 에서는 이들 특징들을 연결된 레이어들에 의해 공유됨으로써 현재 출력 결과는 이전의 결과에 영향을 받으며 이때 레이어들은 일종의 메모리 역할을 하게 된다 [20, 21]. 이러한 RNN 기반의 딥러닝 기술을 이용한 결과들은 아직 CNN 기반의 딥러닝 기술과 비교했을 때, 월등한 성능적 차이는 보이지 않는다 [22]. 하지만, 안배(optic cup)나 근위 폐정맥(proximal pul-monary veins)의 추출에 있어서는 기존의 기술에 의한 결과와 비교했을 때도 차이가 나지 않을 정도의 수준에까지 이르렀다 [22]. RNN 의 순차적인 학습과 이로 인한 시간에 따른 모델 구축 그리고 다양한 변형 모델의 존재 등은 향후 RNN 기반의 딥러닝 기술의 개발을 기대해 볼 수 있다. 가능한 관련 모델이나 관련 기술을 이용한 접근 방법은 다양하게 시도되어 왔으며, 현재는 기술 개발과 동시에 전문 의료인들과 성능 비교도 딥러닝 기반의 영상 해석 기술에 대한 주요 연구 내용이 되고 있다 [1].

(7)

질병진단 인공지능 개발 동향 김규태 Page 7 / 13 CNN 과 RNN 이외에도, 다양한 딥러닝 기반의 알고리즘의 개발이 이루어지고 있으며, 개발된 알고리즘들은 영상 해석뿐만 아니라 생체신호 모니터링에도 적극 활용되고 있다(신호 모니터링 AI). 생체 신호의 측정을 통해 수집된 데이터를 이용하여 임상적으로 유의미한 신호의 변화 혹은 이들 데이터를 통한 질환의 조기 예측을 주로 수행하고 있다 [12]. 이러한 신호 기반의 예측 방법은 일반적으로 통계 기법을 이용한 특징 추출이 주를 이루어 왔으나, 2010 년대 이후에 이르러서는 딥러닝 기반 알고리즘들의 성능 개선으로 접근 방법에 있어서 많은 변화를 보이고 있다 [23, 24]. 생체신호를 이용한 딥러닝 기반 알고리즘의 적용은 기본적으로 지도식(supervised) 학습을 위주로 이루어지고 있으나, 입력되는 데이터가 전문의료인들에 의한 라벨링이 요구되는 단점이 있다 [24]. 이에 반해, 비지도식(unsupervised)의 경우에는 지도식과 같은 단점은 없으나, 입력되는 시간 관련 데이터의 특성상 장시간의 다변화하는 데이터를 모니터링하는 데 있어서 높은 비효율성을 보인다 [25]. 결국, 생체신호를 이용한 딥러닝 알고리즘의 선택 및 개발은 생체 신호의 특성에 있다고 할 수 있다. 일반적으로 CNN 기반의 알고리즘은 데이터가 가지는 시공간적인 요소들을 다루는데 가장 적합한 것으로 알려져 있다. 따라서, 데이터가 포함하는 특징들로 인해 현재 대부분의 연구는 CNN 기반의 딥러닝을 통해 구현이 되고 있다 [25]. 이외에도, 자연어 기반의 인공지능 의료진단 [26] 및 의료 인공지능의 표준화도 지속적으로 연구되는 주제들이다. 특히, 급속한 발전을 이루고 있는 AI 기반(의료진단) 기술에 대한 표준화 작업은 국제표준화기구(ISO)와 국제전기기술위원회(IEC)의 합동 기술 위원회(Joint Technical Com-mit-tee, JTC)에서 진행되어왔다. 위원회에서는 인공지능 어휘에서부터 인간과 기계 사이의 상호연결, 생체인식, 이미지 처리 및 센서 네트워크와 같은 표준 개발이 진행되고 있다. 2015 년도에 개정된 표준에 따르면, 4 종의 인공지능 용어 표준과 함께 총 31 개의 다른 용어 표준들을 묶어 위원회의 단일 용어표준으로 통합 및 개정하였다 [27]. 이와 함께, 세계보건기구(WHO)와 국제전기통신연합(ITU)은 건강 분야 관련 인공 기술의 적용을 위해 기술의 해석과 설명, 신뢰성 향상, 의료 데이터의 개인정보 보호 문제, 성능 평가에 대한 방법과 절차 등에 대한 표준화를 진행하고 있다 [27].

2.2. 인공지능 기반 의료 진단 기술의 미래

최근 개최된 ‘헬스케어 이노베이션 포럼 2019’에서 미국 싱귤래리티 의대 학장인 다니엘 크래프트 교수는 AI 기반의 의료진단 기술은 향후 한 단계 나아가 예방, 조기진단, 치료 등으로 그 기능을 확대할 것이라고 예상했다 [28]. 하지만, 제시된 기능들을 구현하기 위해서는 AI 기반 핵심적인 기술로 여겨지는 딥러닝에 대한 보다 검증된 결과가 도출되어야 하지만, 현재 AI 기반의 알고리즘들의 기능 향상을 위해 요구되는 추론(reasoning)을 지원하는 기능은 아직도 입증되고 있지 못하다 [29]. 오늘날 딥러닝의 기술은 레이블이 잘 정의된 데이터를 이용한 문제해결에 있어서는 성공적인 결과를 보이고 있으며, 이는 딥러닝 기반의 AI 가 인식 및 분류에 특화되어 있다는 한계점을 보여준다. 따라서, 향후 딥러닝에서는 기본적인 상식과 더불어 변화하는 상황에 대한 처리, 계획의 수립 및 결정 등과 관련된 추론의 기능이 추가되어야 한다 [29]. 수학적인 공식화를 통한 딥러닝 알고리즘에서의 추론 과정의 도입은 이미 연구가 진행되고 있다. 최근 중첩된 이미지들을

(8)

질병진단 인공지능 개발 동향 김규태 Page 8 / 13 이용한 연구에서, 기존 딥러닝을 이용한 방법으로는 해결이 어려운 분류작업이 추론을 통해 해결될 수 있음이 보고되었다 [30]. 또한, 이러한 추론 기술을 바탕으로 한 영상에서의 주요 물체 검출은 다양한 기존 딥러닝 기술 사이의 비교를 통해서도 확인된다. 주요 물체 검출을 위한 벤치마크(benchmark) 데이터 [31]를 이용한 기존 딥러닝 기반의 알고리즘 사이의 비교연구에서 추론이 제외된 알고리즘에 비해 추론을 내포하는 알고리즘에서 보다 더 향상된 성능을 보이는 것으로 나타났다 [32]. 이와 함께, 앞서 그 중요성이 언급되었던 데이터 량은 인공지능의 훈련 및 성능개선을 위한 필수적인 요소이지만, 동시에 효율성을 떨어뜨린다는 한계를 내포하고 있다. 따라서, 미래의 연구들은 소규모의 데이터 출현에 대비한 방향으로 진행될 것으로 기대되며, 이는 비지도 학습에 대한 연구들로 이어질 것으로 기대된다. Baur 와 연구진들에 의해 진행된 뇌의 백질(white matter) 분류실험에서, 연구자들은 지도식 딥러닝 방법과 비지도식 방법, 그리고 이 둘을 혼용하는 방법을 진행하여 그에 따른 결과들을 비교하였다. 연구에서는 단일 방법에 의한 성능에 비해 지도식과 비지도식이 혼합된 방법에서 성능의 개선이 확연히 나타났다 [33]. 하지만, 이러한 성능개선 효과는 기본적으로 다량의 데이터가 존재해야 한다는 전제가 수반이 되어야 하며, 순수한 비지도식 방법에 대한 검증은 아직은 시작단계 머물고 있다. 인간의 뇌가 가장 최적화된 비지도 학습을 수행하는 것을 고려해 볼 때, 인간의 뇌 수준에 이르는 AI 성능을 위해서는, 향후 연구 방향은 비지도 학습에 기반한 추론적 접근방식에 대한 연구개발이 요구되며, 향후 딥러닝 기반의 기술은 완전한 비지도식 학습방법에 기반한 기술개발로 진행될 것으로 예상된다.

2.3. 인공지능 기반 의료 진단의 도전과제 및 해결방안

AI 기반의 의료 진단은 아직도 다양한 문제점들을 내포하고 있으며, 이를 해결하기 위한 연구들은 지속해서 진행되고 있다. 현재의 의료진단 영역에서 인공지능의 대표적인 도전과제는 훈련 데이터의 부족, 약한 표준화, 도출된 진단 결과에 대한 설명의 부재, 희귀질환에 대한 낮은 성능이라고 할 수 있다 [34]. 먼저, 데이터의 부재는 단순히 양적인 부분을 의미하는 것은 아니다. 데이터가 가지는 초기의 정확도, 질병과 관련된 민감도 및 특수성 등이 내포된 데이터의 부족을 의미한다. 이 문제는 AI 기반 의료 진단을 위한 성능향상에 직접적인 영향을 주는 것으로 이를 해결하기 위한 방법은 다각도로 논의되고 있다. 가능한 해결 방법으로 초기 입력 데이터를 처리하는 전달함수(transfer function)에 대한 학습(transfer learning)을 진행함으로써 해결할 수 있다는 연구 결과가 있다 [35]. 하지만, 이러한 접근 방법 또한 빅데이터에 의한 학습이 선행되어야 한다는 한계가 있으며, 완전한 소규모의 데이터를 이용한 학습 방법이라고 보기에는 한계가 있다. 두 번째로 AI 기반의 의료 진단을 위한 검사와 측정 장비들에 대한 표준화 작업이 아직 완성되지 못하고 있다. 앞서 언급된 것처럼, 다양한 세계기구 및 조직들이 표준화를 진행하고 있으나, 기술의 발전속도를 따라가지 못하고, 이로 인한 규제(표준화)와 기술 사이의 격차는 점차 심해지고 있는 실정이다. 국가, 지역, 심지어는 의료기관 사이에서 공통으로 채택되는 표준이 없기 때문에 발생하는 가장 근본적인 문제점은 측정되는 의료 데이터에 대한 일관성의 결여이며,

(9)

질병진단 인공지능 개발 동향 김규태 Page 9 / 13 결국에는 진단의 정확성을 떨어뜨리게 된다. 이러한 문제들은 많은 데이터를 사용하여 학습된 AI 기반의 의료진단 시스템에서 종종 나타난다. 이에 대한 근본적인 해결책은 장비와 기술에 대한 표준화 작업과 적용되는 AI 의 알고리즘의 개발에 대한 연구가 그 대안이 될 수 있다. 하지만, 이에 대한 연구는 아직도 충분치 않은 것이 현실이다. 사용자(전문의료인) 입장에서 볼 때, AI 기반의 의료진단 결과는 납득할 수준의 기술적인 설명이 뒷받침되어야 한다. 하지만, 현재 관련 시스템의 결과에 대한 명쾌한 해석은 이루어지지 않고 있다. 도출된 진단 결과를 기본으로 한 기계와 전문인력 사이의 성능 비교연구는 다각도로 이루어지고 있으나, 정작 각 결과가 어떻게 만들어지고 있는지 알고리즘 내에서의 설명은 매우 제한적이다. 이러한 문제점은 딥러닝 알고리즘 자체가 가지는 한계이지만, 이로 인한 사용자들의 기술 수용에 대한 거부감 상승과 혼란은 피할 수 없다. 따라서, AI 기반의 의료 진단은 반드시 충분한 기술적 해설과 함께 제시되는 연구가 필요하다. 마지막으로 해결해야 할 과제는 좁은 진단범위이다. 이 문제점은 앞서 언급된 절대적인 데이터 부재와 상관성이 높다. 진단된 질병의 희소성으로 인해 관련 의료데이터의 부족 현상이 발생하고 이는 학습에서 사용될 데이터의 부재로 이어지며 진단에 대한 기대치를 낮게 만들게 된다. 결국, 이러한 문제는 데이터의 보완이라는 접근 방법으로는 개선의 여지가 없다. 따라서, 진단하고자 하는 질환에 대한 알고리즘의 최적화가 가장 현실적인 방법이다. 이를 위해서는 다양한 학습 방법과 형태의 혼용을 추구함으로써 각각의 알고리즘에서 나타나는 장점을 극대화하는 접근법이 요구된다 [34]. 3. 결론 4 차 산업혁명이 개발된 최신 기술을 이용하여 현재 우리 사회의 모습을 바꾸게 되는 환경의 변화를 의미한다면, 이러한 변화를 이끄는 핵심적인 최신 기술은 바로 인공지능이다. 하지만, 모든 기술들이 그렇듯이, 인공지능만의 기술로는 환경 변화의 한계를 가지게 된다. 의료진단 영역에서의 인공지능 적용 또한 이런 한계점에 대해서는 자유롭지 않다. 특히, 기술적 인공지능의 공간은 최근 서비스되고 있는 많은 인공지능 플랫폼으로 대체되고 있으며, 국내외 산업 분야에서 가파른 시장규모의 증가가 예상되는 상황에 따라 플랫폼 분야에 대한 투자 또한 빠른 증가세를 보이고 있다 [36]. 일반적인 플랫폼 서비스는 활용 프로세스와 알고리즘의 지원 및 추천과 더불어 데이터의 저장공간까지도 지원한다. 하지만, 인공지능을 이용한 의료진단 개발의 핵심은 의료 빅데이터이다. 본문에서 지속해서 강조하였듯이, 인공지능을 구현하는 알고리즘 자체에 대한 개발과 함께 양질의 의료데이터가 뒷받침되어야 진정한 인공지능 기반 의료 진단이 가능하다. 데이터는 단순한 하나의 사실에 머물러 있는 것이 아니라 진화 과정을 통해 정형화된 지식으로 귀결된다. 일반적으로 데이터는 가공되어 있지 않은 사실들로 현재 의료 데이터는 4 세대에 해당한다. 4 세대의 데이터는 보다 정교해지고 대용량화가 진행되었다는 점에서 기존의 1-3 세대 의료 데이터와는 차별성을 가진다. 하지만, 데이터에 내포된 ‘가치’ 혹은 ‘신뢰도’라는 개념은 비교적 최근에 강조되는 빅데이터의 특성으로, 데이터에 내재된 편견성을 제거하고 재현성을 높일 수 있는 연구 설계의 중요성을 강조하고 있다 [37]. 이를 위해서는 데이터의 표준화가 매우 중요하다. 하지만, 빠른 의학기술의 발전으로 인한 새로운 치료법의 도입 등은 새로운 진료 가이드라인의 등장과 함께

(10)

질병진단 인공지능 개발 동향 김규태 Page 10 / 13 기존의 표준화된 데이터의 중요도가 감소하는 변화가 발생하며, 이 경우에는 기존의 표준화에 대한 개선 또한 필요하다. 결국, 지속적인 표준 데이터의 변화는 데이터를 다루는 주체인 연구자의 데이터에 대한 통계적, 수학적인 해석 능력과 더불어 실험적, 기술적 해결 능력이 요구된다 [38]. 그림 4. 데이터의 진화과정 의료 데이터는 그 속성에 따라 임상 데이터, 유전체 데이터, 청구 데이터, 연구 데이터로 구분된다. 특히, 의료 진단을 위한 데이터는 일반적으로 임상 데이터의 범주에 포함되며, 전문의료인들에 의해 생산되는 데이터 이외에도 진단 장비에 의해 생산 및 저장되는 데이터의 양은 증가 추세에 있다 [37]. 결국, 대량화, 다변화, 고속화되는 의료 빅데이터를 어떻게 다루느냐가 인공지능 기반의 의료진단에 있어서는 가장 핵심적인 역할을 할 것으로 기대되며, 이를 위해서는 양질의 의료 데이터 확보와 함께 생산된 데이터의 관리(저장 및 해석)를 위한 연구가 선행되어야 할 것이다. 4. 맺음말 과거 기계(컴퓨터) 기반의 의료 진단은 전략 흐름도 기반(strategies-flow charts), 통계적 패턴 기반(statistical pattern-matching), 확률 이론 기반(probability theory)이라는 3 가지 유형으로

진행되었으며, 이 시기에는 관련 알고리즘의 개발이 가장 중심적인 연구 내용이었다. 오늘날 관련 알고리즘의 개발은 지속해서 이루어지고 있지만, 4 차 산업혁명으로 촉발된 빅데이터의 생산 및 저장과 클라우드 기술의 개발들로 인해 과거 기계 기반의 의료 진단을 인공지능기반의 의료진단으로 환경을 바꾸어 놓았다. 인공지능 기반의 의료 진단에 대한 의구심이 완전히 해소되지 않았지만, 의료영역에서의 인공지능 기술의 도입은 더 이상 선택이 아니라는 점에서는 공감대가 만들어져 가고 있다. 그렇다면, 오늘날의 인공지능 기반의 의료진단에서 가장 중요하게 다루어져야 하는 요소는 무엇일까? 의료 진단은 인간 생명과 직간접적으로 관련된 의료행위라는 점에서 진단과 관련된 인공지능 기술의 모든 요소들이 중요하다고 할 것이다. 하지만, 관련 알고리즘에 대한

(11)

질병진단 인공지능 개발 동향 김규태 Page 11 / 13 훈련이 다량의 데이터에 의해 이루어지고 이를 통해 진단이 이루어진다는 점에서 의료 빅데이터의 중요성은 어느 때보다 강조되고 있다. 인공지능 기반의 의료 진단을 실현해가는 과정이라는 점에서 앞으로 더 많은 도전과제들이 나타날 것임은 예견되는 바이며, 이를 위해 빅데이터뿐만이 아니라 알고리즘과 관련 하드웨어 기술 개발이 지속해서 이루어져야 할 것이다. 감사의 글 본 보고서 작성은 한국연구재단의 기초연구(018R1A6A1A03025523)와 기초개인연구사업(NRF-2019R1I1A1 A01041450)의 지원을 받아 수행되었음.

5. 참고문헌

[1] Liu X, Faes L, Kale AU, Wagner SK, Fu DJ, Bruynseels A, Mahendiran T, Moraes G, Shamdas M, Kern C, Led-sam JR, Schmid MK, Balaskas K, Topol EJ, Bachmann LM, Keane PA, Denniston AK, A comparison of deep learning performance against health-care professionals in detecting diseases from medical imaging: a sys-tematic review and meta-analysis. Lancet Digital Health. 1: e271-97, (2019).

[2] Hinton G, On Radiology. Conference of Machine Learning and the Market for Intelligence. http://w-ww.mar-ketforintelligence.com/, (2016).

[3] Nording L, A fairer way forward for AI in health care: Without careful implementation, artificial intelligence could widen health-care inequality. https://www.nature.com/articles/d41586-019-02872-2, (2019).

[4] Forbes, ‘How Is AI Used In Healthcare - 5 Powerful Real-World Examples That Show The Latest Advances’, (2018).

[5] Tom E Mitchell, Machine Learning. McGraw-Hill Science/Engineering/Math, (1997).

[6] HACKERNOON, ‘Deep Learning vs. Machine Learning: A simple explanation’ (https://hackernoon.com /deep-learning-vs-machine-learning-a-simple-explanation-47405b3eef08), (2019).

[7] LG 경제연구원, ‘Artificial Intelligent: 최근 인공지능 개발 트렌드와 미래의 진화 방향’, (2017). [8] 한국보건산업진흥원, ‘KhIDI 브리프: 인공지능(AI) 기반 의료기기 현황 및 이슈(1)’, (2018). [9] 디지털타임스, ‘대형병원 “빅 5” 의료 AI 왓슨 도입 꺼리는 이유’, (2018).

[10] 과학기술정보통신부, ‘한국형 AI 정밀의료 서비스, ‘닥터 앤서’ 개발 Start!’ (보도자료), (2018.04.30). [11] Linkedin, ‘From virtual nurses to drug discovery: Artificial Intelligence startups in healthcare’ (https://

www.linkedin.com/pulse/from-virtual-nurses-drug-discovery-artificial-intelligence-pv), (2017). [12] 한국보건산업진흥원, ‘KhIDI 브리프: 인공지능(AI) 기반 의료기기 현황 및 이슈(2)’, (2018). [13] 대한영상의학회지, ‘의료인공지능: 인공지능 초심자를 위한 길라잡이’, (2018).

[14] Krizhevsky A, Sutskever I, Hinton GE, ImageNet Classification with Deep Convolutional Neural Networks. Advances in Neural Information Proceeding System, (2012).

[15] Zeiler MD, Fergus R, Visualizing and understanding convolutional networks. European conference on com-puter vision, (2014).

[16] Razzak MI, Naz S, Zaib A, Deep Learning for Medical Image Processing: Overview, Challenges and Future. arXiv.org, (2017).

(12)

질병진단 인공지능 개발 동향 김규태 Page 12 / 13

[17] Ronneberger O, Fischer P, Brox T, U-net: Convolutional networks for biomedical image segmentation. Int. Conf. Med. Image Comput. Comput.-Assisted Intervention. 234–241, (2015).

[18] Milletari F, Navab N, Ahmadi SA, V-net: Fully convolutional neural networks for volumetric medical image segmentation. 4th Int. Conf. 3D Vis. 565–571, (2016).

[19] Maninis KK, Pont-Tuset J, Arbel´aez P, Van Gool L, Deep retinal image understanding,” Int. Conf. Med. Im-age Comput. Comput.-Assisted Intervention. 140–148, (2016).

[20] Graves A, Jaitly N, Towards end-to-end speech recognition with recurrent neural networks. 31st Interna-tional Conference on InternaInterna-tional Conference on Machine Learning. 32: II-1764-72, (2014).

[21] Graves A, Supervised sequence labelling with recurrent neural networks. Springer Berlin Heidelberg: 5–13, (2012).

[22] Chakravarty A, Sivaswamy J, RACE-Net: A Recurrent Neural Network for Biomedical Image Segmentation. IEEE Journal of Biomedical and Health Informatics. 23(3): 1151-1162 (2019).

[23] Lee H, Shin S, Seo M, Nam G, Joo S, Prediction of ventricular Tachycardia One hour before occurrence us-ing artificial neural network. Science Report. 6, 32390 (2016) doi:10.1038/srep32390, (2016).

[24] Xiao C, Choi E, Sun J, Opportunities and challenges in developing deep learning models using electronic health records data: a systematic review. J Am Med Inform Assoc. 25(10): 1419-1428, (2018).

[25] Langkvist M, Karlsson L, Loutf A, A review of unsupervised feature learning and deep learning for time-series modeling. Pattern Recognit Lett. 42(1): 11–24, (2014).

[26] Shin HC, Lu L, Summers RM, Natural language processing for large-scale medical image analysis using deep learning. Deep learning for medical image analysis. 405-421, (2017).

[27] 전종홍, 이강찬, 의료 인공지능 표준화 동향. 한국전자통신연구원. 34(5): 113-126, (2019). [28] 조선비즈, ‘[헬스케어포럼 2019] ICT 의료 기술 융합, 신헬스케어 시대 열렸다’, (2019). [29] IBM, ‘Forward thinking: Experts reveal what’s next for AI’, (2016).

[30] Chen D, Bai Y, Zhao W, Ament S, Gregoire JM, Gomes CP, Deep reasoning networks: Thinking fast and slow. arXiv.org, (2019).

[31] Borji A, Cheng MM, Jiang H, Li J, Salient object detection: A benchmark. IEEE Trans. Image Process. 24(12): 5706-5723, (2015).

[32] Li Z, Lang C, Chen Y, Liew J, Feng J, Deep reasoning with multi-scale context for salient object detection. arXiv.org, (2019).

[33] Baur C, Wiestler B, Albarqouni S, Navab N, Fusing unsupervised and supervised deep learning for white matter lesion segmentation. Proceed. Machine Learning Res. 102: 63-72, (2019).

[34] Xu J, Xue K, Zhang K, Current status and future trends of clinical diagnoses via image-based deep learn-ing. Theranostics. 9(25): 7556-7565, (2019).

[35] Altaf F, Islam SMS, Akhtar N, Janjua NK, Going deep in medical image analysis: concepts, methods, chal-lenges and future directions. arXiv.org, (2019).

[36] ITFIND, ‘인공지능 플랫폼의 개념과 도입 전략’, (2018).

[37] Labuda N, Lepa T, Labuda M, Kozak K, Medical 4.0: Medical Data Ready for Deep and Machine Learning. Journal of Bioanalysis and Biomedicine. 9(6): 283-287, (2017).

(13)

질병진단 인공지능 개발 동향 김규태 Page 13 / 13 The views and opinions expressed by its writers do not necessarily reflect those of the Biological Research Information Center.

김규태(2020). 질병진단 인공지능 개발 동향. BRIC View 2020-T06

Available from https://www.ibric.org/myboard/read.php?Board=report&id=3425 (Jan 28, 2020) Email: member@ibric.org

수치

그림  3. Recurrent Neural Network (RNN)  구조

참조

관련 문서

4.7.3 Summary of Steps for Filtering in the

Metz, “Unsupervised representation learning with deep convolutional generative adversarial networks”, ICLR(International Conference on Learning Representations)

Filter >

• When a word w appears in a text, its context is the set of words that appear nearby (within a fixed-size window). • Use the many contexts of w to build up a

● Define layers in Python with numpy (CPU only).. Fei-Fei Li & Justin Johnson & Serena Yeung Lecture 8 - 150 April 27,

Preliminary Study of IR Sensor Equipped Drone-based Nuclear Power Plant Diagnosis Method using Deep Learning. Ik Jae Jin and

This study is carried out vocabulary learning through image association as a method on efficient vocabulary learning for middle school students and wanted to know if

Motivation – Learning noisy labeled data with deep neural network.