1. 서 론
1)
현대 사회에서 의료기술, 생활수준 향상 등에 따른 수명연장으로 인해 노인 인구 증가 및 경제 적 부담 등의 이유로 인한 출산율 저하에 따른 유 소년 인구 감소 현상을 보이고 있다. 이 둘의 문제 가 고령화 사회라는 사회적 문제로 연결되어 이미 심각한 사회 문제로 인식하고 있다. 그 중에서 고 령 인구를 위한 의료인력 및 시스템을 최적화 하 여 고령화 사회 Elder Care에 대한 대비를 해야 한 다. UN에 따르면 고령화 사회(aging society)에 대 한 기준은, 인구의 비율에 따라서 65세 이상 인구 가 7% 이상일 경우 고령화 사회, 14% 이상일 경우
저자(E-mail: [email protected])
고령사회, 20% 이상일 경우 초 고령사회로 정의 된다.
해외의 경우, Figure 1에서 보여주듯이 미국 인 구조사국(United States Census Bureau)의 2017년 보고에 따르면 미국 내에서의 노인 인구비율이 10 년 이후 18살 이하의 인구비율보다 높아질 것으로 보고하였다.
특히, 지난 10년 간 베이비부머들의 고령화 및 불경기로 인한 출산저하와 더불어 이민 제한까지 그 원인으로 보고 있으며 이러한 변화가 정부의 재 정 정책과 경제 성장에 심각한 문제를 보일 것이라 고 보고되어있다.
보건사회 연구원에서 보고한 바에 따르면(Figure 2), 미국뿐만 아니라 주요 국가별 인구 고령화 속도
고령화 사회 원격 진료를 위한 확률론적 예측인공지능 연구
정 재 승ㆍ주 현 수† 한국과학기술연구원 차세대반도체
Implementation of Probabilistic Predictive Artificial Intelligence for Remote Diagnosis in Aging Society
Jae-Seung Jeong and Hyunsu Ju†
Post-Si Semiconductor Institute, Korea Institute of Science and Technology, 5, Hwarang-ro 14-gil, Seongbuk-gu, Seoul 02792, Republic of Korea
Abstract: 저출산 고령화 사회로의 진입은 대한민국뿐만 아니라 전 세계적으로 많은 사회 문제를 야기하고 있다. 그 중에서 고령 인구 증가로 인한 의료 수요 증가와 이를 뒷받침 할 의료인력 부족은 곧 다가올 사회문제이다. 4차 산업 혁명으로 인해 다양한 사회문제에 대한 혁신적인 해법들이 제시되고 있는데, 본 기고문에서는 다가올 고령화 사회에 서 의료인력 부족 등에 의한 해결법으로 원격의료 지원을 위한 인공지능 활용을 다루고자 한다. 병 진단 및 예측을 위한 여러 가지 인공지능 알고리즘은 이미 많이 개발 되어 있으나, 일반적으로 딥러닝에 많이 쓰이는 인공신경망 구조 인 합성곱 뉴럴네트워크(convolution neural network)나 기존 퍼셉트론(perceptron) 구조에서 벗어나 확률론적 인공신 경망 중에 하나인 베이지안 뉴럴네트워크(Bayesian neural network)를 다루고자 한다. 그중에서 연산효율적이며 뉴로 모픽 하드웨어로 구현 가능성이 높고 실제 진단 예측(diagnosis prediction) 문제 해결에 강점을 보이는 알고리즘으로써 naive Bayes classifer를 활용한 연구를 소개하고자 한다.
Keywords: aging society, shortage of medical personnel, elder care, artificial intelligence, prediction intelligence, neuromorphic device
*출처: 미국 인구조사국(2017).
Figure 1. 미래 예상 청소년, 고령인구 비율().
*출처: 보건사회연구원(2019).
Figure 2. 주요 국가별 인구 고령화 속도 비교.
를 참고했을 때 일본, 프랑스, 독일, 이탈리아는 이 미 초 고령사회에 진입하였음을 볼 수 있다. 이는 현대 사회에서 단시간에 해결할 문제로 접근하기 보다는 해당 문제로 인해 발생하게 되는 세부 문 제들에 대해 접근하고 해결하여야 할 것이다
대한민국 또한 2000년 고령화 사회에서 2026년 초 고령사회로 접어드는 것으로 예상되고 있어 가 장 빠른 소요 연수로 보고되며 이에 따른 사회적 문제들에 대해 대비하여야 한다. Figure 3에서 보 이듯이 이미 우리나라는 곧 초 고령사회에 진입하 며 2020년 현재 인구구성비에 있어 청소년의 비중 보다 고령인구의 비중이 더 높아진 상태이다. 생 산량과 교육 문제 등 여러 사회문제들이 야기되기
*출처: 통계청(2017).
Figure 3. 국내 연령대별 인구 구성비.
때문에 현재도 다양한 대처방안을 정책적으로 진 행 중에 있다. 본 기고문에서는 4차 산업 혁명에 따 라 빠른 발전을 이루고 있는 인공지능을 활용하여 해결하려는 문제들을 살펴보려 한다.
최근 COVID-19 인한 의료 수요 증가뿐만 아니 라 국내 의사 협회와의 의대 정원 확대 문제 등 의 료인력과 관련한 이슈들이 큰 쟁점으로 급부상하 고 있다. 의료인력 부족 문제 역시 우리나라뿐만 아니라 전 세계적인 문제로 대두되고 있으며, 독 일의 통계 자료 회사인 Statista의 보고에 따르면 Figure 4에서 보이듯이 OECD 국가 중에서도 인 구 1,000명당 의사 비율은 낮은 것으로 보고되어 있다. 순위로 봤을 땐 큰 문제가 아닌 것처럼 보이 지만, 보건복지부의 국내 보건의료 인력에 대한 조사에 따르면(Figure 5) 현재 국내 보건의료 인력 은 수요대비 공급 부족 상태(의사, 간호사 포함)를 겪고 있으며 미래에 더욱 심화될 것으로 예상된다.
국내 전체 보건의료 인력 부족 문제뿐만 아니라, 지역 간 격차도 해결해야 할 사회문제이다. Figure 6에서 설명하는 지역별, 병원 종류별 의사인력 활 동규모에 대한 보건복지부의 조사에 따르면 병원 급, 의원급 의료기관 모두 주요 도시를 제외한 지 역에서는 천 명당 의사 인력이 1 이하로써 낮은 수
Figure 4. 국가별 인구 1,000명당 의사 비율.
*출처: 보건복지부(2017).
Figure 5. 국내 보건의료 인력 수급 전망.
치를 보여주고 있다. 산업활동이 이루어지고 생산 인력이 많이 위치한 대도시 위주의 지역 불균형에 따라 의사 인력도 불균형함을 보인다. 생산인력에 벗어난 은퇴한 고령 인구들 중에서 대도시에 인접 하지 않은 인구 구성원들은 의료서비스가 더욱 필 요한 사실에도 불구하고 오히려 의료기관의 부족 으로 인한 문제를 발생시킬 수 있다.
앞의 단락들에서 설명한 고령인구 증가와 의료 인력 부족에서 오는 문제들을 인공지능을 활용한 기술 적용으로 해결할 수 있다. 현재도 “원격의료”
*출처: 보건복지부(2016).
Figure 6. 지역별 의사 인력 활동 규모.
로써 개발 및 상품 판매가 이루어지고 있으며 최 근에 발생한 COVID-19의 영향으로 언택트 산업 중의 하나로 급부상하고 있는 회사들이 존재한다.
본 연구에서는 진단의 현재 상용 기술들에 대해 간단히 알아보고 본 기고문에서 다루는 주제와의 차별성을 설명할 것이다.
원격의료에 대해 설명하기 위해선 그 범위에 대 한 논의가 우선 되어야 한다. 가장 큰 범주로써 원 격의료, 그 부분 집합들로써 원격 진료 및 원격 수 술과 모니터링으로 나누어 생각해볼 수 있다. 본 연구는 원격 진료 및 환자 모니터링에 적합한 부 분에 대해 설명할 예정이며 현재 미국에서는 원격 진료 중 Telemental health에 해당하는 서비스가 2010년 초창기부터 제공되어오고 있다(Figure 7)[1].
이미 미국은 원격의료를 보험급여로 제공하는 정책을 시행하고 있으며 이를 바탕으로 Figure 8 에서 보이는 것과 마찬가지로 많은 회사들이 원격 의료서비스를 판매하고 있으며 2014년은 이미 6건 중 1건이 대면 진료가 아닌 원격 진료였으며 현재 2020년에는 2배로 늘어날 것이라 예상한다는 보고 가 있다.
*출처: JAMA(2018).
Figure 7. 인구당 원격 진료 사용률.
*출처: Healthpopuli (2015).
Figure 8. 2015년 기준 미국의 원격의료 회사들.
미국 최대 원격진료 회사 Teledoc의 경우 2016 년 95만 건부터 2018년엔 250만 여건의 원격진료 사용횟수를 기록하였으며, 헬스 시스템 회사인 Kai- ser Permanente는 2016년 원격진료가 대면진료를 앞서나갔다고 보고하였다. 앞서 말한 Teledoc의 사례는 화상 채팅, 전화 등의 통신 기기를 통한 대 면을 비대면 서비스로 바꾼 대표적 사례이지만 헬 스케어 웨어러블 기기와 어플 등을 활용한 경우도 존재한다. AliveCor, CellScope, FirstDerm과 같은 회사들은 스마트폰으로 촬영(Figure 9) 및 측정한 환자의 정보를 제출하면 정해진 시간 내로 진단을 해주는 서비스를 제공해주며, 이중에서 FirstDerm 의 경우 전체 이용자 중 70%는 의사를 직접 만날 필요가 없다고 보고한다. 원격진료의 시장 잠재력 은 이미 커져가고 있다.
일본의 경우 기본 가이드라인과 적용대상을 제 시함으로써 원격의료 제도를 만들었고, 중국은 애 초에 개인정보에 대한 규제가 적었기 때문에 원격
*출처: www.firstderm.com/how-it-works.
Figure 9. 스마트폰 촬영을 활용한 원격 진료 예시(피부 사 진으로 피부 질환 원격 진료를 진행하는 FirstDerm의 이용 자 가이드).
의료 서비스 시장규모는 2016년 기준 1조 6백억 원을 기록했다고 보고되어있다. 물론 위의 사례들 의 진료 모델이 전부 동일하진 않으며 국내에 적 용하기엔 의료법 및 시스템의 차이 때문에 고려해 야할 부분들이 많이 존재한다. 하지만, 언택트가 급부상함에 따른 원격 진료와 같은 비대면 서비스 에 대한 중요성과 실제 내원 후 치료를 받아야 하 는지 여부의 정도를 알려주는 것만으로도 본 연구 에서 해결하고자 하는 고령화 사회 의료인력 부족 에 대한 해결책으로써 활용될 수 있는 방법으로 볼 수 있다.
국내에서의 원격의료 산업은 최근에야 관심을 가지게 된 분야이다. COVID-19로 인해 전화 상담 을 통한 원격의료 행위를 허용하였다. 하지만 디 지털 장비들을 사용하는 원격의료에 대해선 여전 히 답보 상태로 볼 수 있다. 네이버와 SKT가 디지 털 원격 진료 시장에 진입, 개척하며 근래에 뉴스 들이 나오기 시작하지만 국내 의료법과 관련하여 현재 주목할 만한 성과나 서비스를 제공해오고 있 는 상황은 아니다. 하지만, 최근 데이터 3법의 통과 및 마이데이터 사업 추진으로 인해 가능성을 보이 고 있지만 의료법과 개인정보와 관련해서는 아직 많은 논의가 필요하다. 특히, 스마트워치로 심전도 를 측정하는 기술을 개발, 공급하려는 최근 국내 기업의 사례(Figure 10)에서는 임상적 안정성과 유 효성에 대한 검증이 필요하기 때문에 최근 이 기술 을 의료행위로 인정하는 것에 대한 갈등이 발생하
*출처: 매일경제(2020).
Figure 10. 원격의료기기 웨어러블 제품 회사와 의료계 반발.
기도 하였다.
하지만, 4차 산업혁명과 최근의 COVID-19와 맞 물려 원격의료 및 이를 뒷받침하는 기술들의 필요 성은 시대적 흐름으로써 간과할 수 없는 사실이 다. 때문에, 국내에서의 원격의료는 아직 시장가능 성이 낮은 상태이지만 앞서 말한 국내의 사례들처 럼 국내외 소비자를 대상으로 꾸준한 기술개발 및 시장개척이 이루어지는 분야로써 연구개발이 필 요하다.
인구 고령화, 의료 인력 부족 문제를 해결하는 방안의 연구배경 근거로 원격의료 기술을 설명하 였다. 원격의료 중에서도 원격 진단을 하는 방법 은 진단 목적에 따라 많은 방법이 존재한다. 그 중 에서도 고령 인구와 관련되어 있으며 긴급 진단이 필요하고 꾸준한 모니터링이 필요한 심혈관 질환, 당뇨 등과 같은 질병들에 대하여, 현재 환자의 상 태가 모니터링 되고 내원, 혹은 긴급 이송이 필요 한지에 대한 의사결정에 도움이 되는 알고리즘을 방법으로 제시하였다. 일반적으로 진단은 환자의 기본 건강 상태에 더하여 당뇨병-혈당 수치, 심혈 관 질환-심전도 수치로 진단 평가를 내린다. 이러 한 환자 정보를 활용하여 진단확률 예측을 하는 데에는 확률론적 예측 인공지능이 적합하다. 인공 지능의 활용에 가장 많이 쓰이는 기본적인 percep- tron 및 이를 기반으로 한 convolution neural net- work (CNN)에서의 패턴 분석을 통한 분류 역시 막강한 인공지능으로써 활용될 수 있다.
하지만 본 기고문에서는 사전 확률(해당 질병에 대한 환자의 data) 값을 바탕으로 사후 확률(해당 질병에 대한 진단 확률)을 계산하는 Bayes’ theorem
*출처: M. Hanif et al., Applied Sciences (2019)[2].
Figure 11. Naive Bayes, MLP, SMO Error rate 비교.
을 활용한 확률론적 인공지능을 소개하고자 한다.
그 중에서 학습 data들 사이의 독립을 가정하고 Gaussian distribution의 feature들을 활용하여 분 류 학습을 하는 Gaussian naive classification을 설 명한다. Figure 11에서 보이는 결과와 마찬가지로 multilayer perceptron 및 sequential minimal opti- mization (SMO)와의 비교에서 error 종류에 따라 model별 양상은 다소 차이는 존재하지만 model building time에서 매우 효율적임을 보여준다[2].
인공지능을 통한 환자 상태 모니터링 및 진단확 률 계산을 위해선 실시간 모니터링이 가능한 측정 기기를 edge device로써 활용해야 하고 실시간 da- ta 누적 학습 및 검증을 위해선 neuromorphic 소자 의 개발이 필수적이다. 기존에 많이 쓰이는 logistic regression 기반 인공지능과 비교했을 때 연산량과 필요한 소자가 적은 장점을 가진다(Figures 12, 13).
또한, 일반적으로 학습에 필요한 data set의 크기 가 작으며 test data를 누적시키며 검증을 하는 동 시에 학습으로 인한 weight 값 갱신이 가능하므로 많은 양의 데이터를 확보하기 어려운 질병 관련 data 학습에 적합하다.
진단에 필요한 data와 적합한 알고리즘을 결정 하고 나면 현재에도 진단 예측알고리즘은 구현이 쉽게 가능하다. 그러나 고령화 사회-의료 인력 문 제의 해결책으로써 실시간 모니터링 개념까지 활 용이 가능해지려면 현재 컴퓨터 OS 위에 프로그
*출처: Lecture Note, Sargur N. Srihari, University at Buffalo.
Figure 12. Machine learning에서의 확률 model별 구조 차이.
*출처: A. Pydi, Medium.com (2019).
Figure 13. Training set 비율에 따른 NBC, perceptron의 loss 비교.
래밍 언어로 인공지능을 구현한 후에 학습 및 검 증을 하는 일반적인 폰노이만 방식 기반의 인공지 능 활용에 그칠 수 없다. 이를 해결하기 위해서 현 재, 학습은 클라우드 서버에, 소비자는 통신 가능한 wearable device (스마트 워치 등)를 착용하는 방 법으로 활용되고 있다. 이러한 사용자가 직접 사용 하는 기기 및 연산을 edge device와 edge comput- ing이라 한다. 하지만 개인 의료 정보에 대한 보 안, 실시간 학습, 통신 AP에서 오는 제품 cost를 고려했을 때 미래엔 기기 자체에서 통신 AP 없이 학습, 검증이 가능한 인공지능이 필요하다. 때문에 확률론적 인공신경망과 병 진단에 대한 실시간 모
Figure 14. Bayesian network와 Naive Bayes model의 구 조 차이.
니터링 활용을 위해 이를 구현할 수 있는 적절한 neuromorphic 소자를 연구하였고 이러한 소자의 모델링을 통해 알고리즘 구현을 진행하고 그 결과 를 소개하고자 한다.
2. 연구 방법
Bayesian neural network (BNN)를 병 진단에 활용하기 위해 우선 적합한 사례 및 공개 데이터를 확보하였다. 또한, 향후 neuromorphic 소자의 활용 을 위한 neural network structure의 간소화를 위해 간단하지만 강력한 Naive Bayes’ classifier (NBC) 를 사용하였으며, 병 진단 관련 공개 data들의 적 합성 평가 및 실제 classification 학습과 검증을 통 해 진단 확률 검증을 진행하였다. Software로 검증 을 확인한 후 neuromorphic 소자로 구현하기 위해 필요 parameter 탐색 및 적절한 소자에 대해 연구 및 이를 활용한 hardware 구현 simulation을 진행 하였다.
Probabilistic graphical model (PGM) 중에서 인 과 관계를 표현하는데 적합한 모델로써 Bayesian network가 있다. 그 중에서도 변수들 사이의 관계 를 독립으로 가정할 수 있을 때 연산과 구조가 단 순해지는 naive Bayes model을 활용한 진단 학습 가능성과 이를 실제 edge device로 활용 가능할 수 있게 해주는 neuromorphic 소자에 대해 연구를 진 행하였다. Figure 14에서 보듯 naive Bayes classi- fier는 pre-defined structure이며 단순한 구조로써 node 구성에 효율적이며 data의 총량이 적어도 clas- sification 학습에 적절한 performance를 보인다.
Figure 14에서 설명하고 있는 Bayes’ theorem을 적용한 확률 분류기의 일종인 naive Bayes classi- fication은 앞서 설명한 대로 특성들 사이의 독립 을 가정하기 때문에 여러 범주에 대한 분류에 가 장 잘 사용된다. 특히 이 연구에서 적용할 자동 의 료 진단 문제 해결에서도 다른 방식들의 모델들과 도 충분한 경쟁력을 가진다. Bayes’ theorem에서 의 조건부 확률 모델의 구성요소에 대해 살펴보자 면 분류에 사용될 인스턴스들(d: evidence)은 N개 의 특성을 나타내는 vector로 표현할 것이다. 여기 에서 분류 결과에 해당하는 확률을 사후 확률(po- sterior probability)로 정의한다. 조건부 확률의 fac- torization을 반복적으로 연쇄법칙을 적용하여 결합 모델을 요약하면 그림의 수식과 같이 정리된다.
이렇게 계산된 특성별 prior probability와 like- lihood의 곱에 비례하는 posterior probability의 크 기를 비교하여 classification 동작을 수행한다.
Naive Bayes classifier (NBC)는 사용하려는 da- ta에 따라 이벤트 모델을 달리 사용할 수 있다. 이 연구에서는 진단에 필요한 생체 데이터의 측정치 를 활용하므로 일반적으로 연속적인 값을 지닌 데 이터를 처리할 때 사용하는 방식인 Gaussian naive Bayes classifier (GNBC)를 활용할 것이다. 이때 가지고 있는 여러 가지 특성으로 분류된 데이터 중 에서 이벤트 모델에 대한 가정들을 따르는 data들 로만 학습을 하여도 우수한 결과를 얻을 수 있다.
이는 small data에서도 높은 accuracy를 보이는 NBC의 강점 중 하나이다. Classification에 사용될 data들의 분포가 Gaussian 분포를 따르면 주어진 클래스의 값들을 매개변수화 하여 정규분포식에 따라 계산할 수 있다.
3. 연구 내용
고령화 인구에서 빈번히 발생하는 질병 중에 대 표적으로 당뇨가 있다. 국가통계포털(Kosis)의 통 계 자료에 의하면 연령대별 당뇨환자 비율은 Table 1과 같다.
고령화 인구 나이대를 포함하고 있는 60세 이상
30~39세 2.5%
40~49세 7.5%
50~59세 13.5%
60~69세 20.3%
70세 이상 26.5%
Table 1. 연령대별 당뇨 환자 비율(국가통계포털)
의 경우 5명 중에 1명꼴로 당뇨가 발생하며 특히 나 혈당 수치의 실시간 모니터링과 관리가 필요한 질병으로써 환자 혹은 환자 가능성이 있는 개인에 게 병원을 수시 방문할 필요 없이 모니터링 하기 에 적합한 질병이다. GNBC를 통한 prediction test 를 하기 위해 공개 data set (pima indians diabetes database)을 사용하였다. 이 data set은 768명의 임 신 횟수(남성의 경우 0), 혈당 수치, 혈압, 피부 두 께, 인슐린 수치, BMI, diabetes pedigree function, 나이 이렇게 8개의 특성들과 당뇨 진단 여부로 구 성되어있다(Figure 15).
GNBC를 사용하기 위한 가정으로 특성들의 분 포가 Gaussian 분포를 따라가는지 확인하였다.
Figure 16에 따르면 skin thickness와 insulin을 제 외한 특성들은 Gaussian 분포를 따른다고 가정할 수 있으며 예측진단 비교를 위해 전체 특성을 이 용한 결과, 가정을 따르지 않는 두 가지 특성을 제 외한 결과를 확인하였다. 또한 일반적인 개인이 측정하기에 insulin 측정 장비는 80만 원선으로써 고령화-인력부족 문제에 합당한 특성이 아니기 때 문에 insulin 특성만을 제외했을 때 진단 정확도의 차이가 있는지 확인해 보았다.
Table 2에 따르면 Gaussian 분포를 따르지 않는 특성들을 포함했을 때 4% 정도 높은 진단 정확도 를 보인다. 하지만 모델에 적합한 분포 특성이 아 니기 때문에 신뢰할 수 있는지에 대해서는 고려해 보아야 한다. 그 외에, 진단기준 75%만 보았을 때 그렇게 높은 수치라 할 수는 없지만 이는 data 및 특성 개수의 부족으로 인한 한계이다. 이는, 향후 의료 data 접근성이 높아져서 충분한 data 양을 확 보한다면 해결할 수 있는 문제이며 GNBC 자체의 성능 평가에 있어서는 동일한 data에 대한 다른
Prediction accuracy Diabetes diagnosis prediction
(8 features) 79.22%
Diabetes diagnosis prediction
(6 features w/o skin thickness & insulin) 75.76%
Diabetes diagnosis prediction
(7 features w/o insulin) 79.87%
Table 2. 특성 구성 요소에 따른 GNBC 진단 정확도 결과
classifier model과의 비교가 필요하다.
Table 3에서는 동일한 pima indians diabetes data
Model Accuracy
K nearest neighbors 71.67%
Decision tree classifier 72.89%
SVM classifier w/ RBF kernel 66.32%
SVM classifier w/ linear kernel 76.69%
Table 3. Classification Model별 진단 정확도 결과 비교
set에 대하여 대표적인 classifier의 예측 정확도 비 교 결과를 보여준다. 8개 특성 기준으로 GNBC보 다 다소 떨어지는 성능들을 보임을 확인할 수 있
*출처: UCI Repository of Machine Learning Data Base (1998).
Figure 15. Pima indians diabetes data set 구성.
Figure 16. Data set 특성 distribution plot.
다. 물론, 정확도만을 위한 알고리즘들은 이미 보 고가 많이 되어오고 있지만 일반적으로 neural net- work의 layer 및 size가 GNBC와 비교했을 때 크 고 많으며 이는 향후 edge device 활용을 위한 neu- romorphic 소자에 대해 부적합하다.
추가로 GNBC test에서 insulin 특성만을 제외한 진단 예측 결과도 확인했을 때 0.7%의 차이만을 보이는 것으로 봤을 때 예측 진단에 있어서 in- sulin 수치가 필수적인 요소는 아님을 확인하였다.
이 결과를 바탕으로 insulin 측정을 고령화-의료인 력 부족 문제 해결로 제시한 elder care at home을 위한 edge device에서 제외함으로써 비용 및 접근 성 관점에서의 활용 가능성이 더 높아질 수 있다.
앞서 설명한 Bayes’ theorem을 사용하는 NBC 계산식과 GNBC의 특성 분포를 적용한 neural net- work 구조는 Figure 17에 설명되어있는 것과 마찬 가지로 특성과 클래스에 대한 확률로부터 사후 확 률을 계산하여 예측결과를 도출한다.
이러한 GNBC의 확률 표현식으로부터 이후 진 단 예측을 edge device로 활용 가능한지에 대한 사 전 연구로써 edge device에 필요한 neuromorphic 소자에 필요한 특성 및 이에 적합한 소자 적용을 연구에서 진행하였다. Layer 사이에 weight을 ma-
trix로써 포함하는 discriminative model들과 달리 GNBC의 구조는 그림과 마찬가지로 특성들의 개수 만큼의 pre, post-synaptic neuron에 해당하는 node 만 갖고 있으면 된다. 이는 neuromorphic 소자로써 저전력, 소형화에 걸맞으며 연산도 간단하기 때문 에 edge device로써의 활용도가 높다. 실제 edge device 활용을 위한 neuromorphic 소자를 GNBC 에 이용하기 위해 node 하나를 소자 하나로 동작 가능한 특성을 보이는 소자들에 대해 연구하였다.
소자가 GNBC에서 사용되는 가우시안 특성과 확 률로써 값을 표현하는 특성을 구현하기 위해 ran- dom한 특성을 갖는 소자들에 대해 조사하여 적용 하였다.
Figure 18에서 소개하는 MTJ는 random switch- ing 소자로써 본 연구와 유사한 stochastic neuron 과 관련한 연구가 최근에 되어오고 있는 소자이 다. 소자의 random 동작에 의한 확률 distribution curve는 논문 내에선 tanh으로 묘사하였다. 본 연 구에서 사용할 Gaussian distribution의 cumulative distribution function (CDF) 역시 tanh과 마찬가지 로 sigmoidal 형태의 함수이며 MTJ 소자의 data를 참고하여 가우시안 CDF로 묘사했을 때 R-square 의 값이 0.9 이상으로 적합한 모델임을 확인하였다.
Figure 17. GNBC structure 및 계산 과정 요약.
이를 바탕으로 소자 모델링 data를 활용하여 neu- romorphic 소자 개발의 가능성 확인을 위해 위에 Figure 17에서 표현한 GNBC 구조를 활용하여 진 단 예측을 실시하였다. 이번 test는 data 및 특성들 의 개수가 위에서 실시한 pima diabetes보다 많은 위스콘신 유방암 진단 data set (WDBC)을 활용하 였다.
Figure 19에서 보이는 것과 마찬가지로 software 기반의 GNBC prediction test와 소자 모델링 data 값들을 likelihood 계산에서의 neuromorphic 소자 로써 모델링하여 사용한 GNBC prediction test에서 1% 이하의 진단 정확도 차이를 보였다. 이를 통해 GNBC의 neuromorphic 소자로써 MTJ 활용가능성 을 확인했다.
4. 결 론
미래에 예상되는 고령화 사회-의료인력 부족 문 제해결을 위해 내원 이전에 고령 환자 스스로 진 단 예측을 할 수 있는 미래 기술에 대한 기초 연구
를 소개하였다. 본 기고문에서 보여준 결과들은 사 회문제를 인공지능 및 전자소자 기술과 의료 data 활용을 통해서 해결할 수 있는 가능성을 보여 주 는 것이라고 할 수 있다. 활용 예로 제시된 연구 내 의 기술이 상용화 되어 문제를 해결하기 위해선, 의료 정책 및 법안뿐만 아니라 실제 소자의 array size 개발 및 웨어러블 디바이스가 필요하다. 최근 에 4차 산업혁명과 더불어 COVID-19의 영향 등 으로 인해 국내 원격진료 등에 대한 관점은 조금 씩 변하고 있으며 본 기고문도 이러한 방향성에 요 구되는 기술을 소개함으로써 향후 사회 문제 해결 에 도움이 될 수 있는 연구들에 더 많은 관심을 갖 도록 하는데 작은 도움이 되고자 한다.
References
1. M. L. Barnett, K. N. Ray, J. Souza, and A.
Mehrota, Trends in telemedicine use in a large commercially insured population 2005-2017,
J. of American Medical Association, 320(20),
*출처: K. Y. Camsari et al., EDL (2017).
Figure 18. Random switching MTJ 소자.
Figure 19. WDBC classification SW 기반과 MTJ 소자 기반 confusion matrix 및 정확도 비교.
2147-2149 (2018).
2. M. Hanif, E. Kim, S. Helal, and C. Lee, SLA-based adaptation schemes in distributed stream processing engines, Appl. Sci., 9(6), 1045 (2019)
3. K. Y. Camsari, S. Salahuddin, and S. Datta,
Implementing p-bits with embedded MTJ, IEEE
Electron Device Letters, 38(12), 1767-1770
(2017).정 재 승
2011~2015 서울시립대 전기전자컴퓨터 공학과 학사
2015~2017 고려대학교 신재생에너지학과 석사
2018~현재 한국과학기술연합대 나노정보융합학과 박사과정
주 현 수
1996~2003 한국과학기술원 원자력공학과 학사 2003~2010 University of Illinois at
Urbana-Champaign 원자력공학과 박사 2010~2015 삼성전자 반도체연구소
책임연구원 2015~현재 한국과학기술연구원
선임연구원