• 검색 결과가 없습니다.

코로나19 대응 "온라인 플랫폼 기반 국제협력연구" 구축 현황 및 향후 빅데이터 연구 활용 가능성

N/A
N/A
Protected

Academic year: 2021

Share "코로나19 대응 "온라인 플랫폼 기반 국제협력연구" 구축 현황 및 향후 빅데이터 연구 활용 가능성"

Copied!
8
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

6

HIRA 빅데이터 브리프

코로나19 대응

“온라인 플랫폼 기반 국제협력연구”

구축 현황 및 향후 빅데이터 연구

활용 가능성

1. 플랫폼 구축 배경

코로나19의 급속한 확산으로 인해 세계 각국 국민들의 생명과 안전이 위협받고, 사회〮경제적 활동이 위축되고 있는 상황이지만, 진료현장에서 임상의들의 진단과 환자 치료에 도움을 줄 수 있는 실제임상자료 기반 근거 및 정부의 정책 수행 시 필요한 정보 제공은 턱없이 부족한 상황이 지속 되었다. 이에 대한민국의 보건복지부(이하 복지부)와 건강보험심사평가원(이하 심평원)은 앞선 IT 인프라를 토대로 운영되는 전 국민 건강보험제도를 통해 신속하게 수집〮정제〮비식별화된 코로나 19 환자의 데이터셋을 전 세계 연구자들이 분석할 수 있도록 세계 최초로 개방하게 되었다. 현재 outbreak가 진행 중인 민감한 주제를 국내외 연구자에게 개방하는 것에 내외부적 우려가 없었던 것은 아니나, 코로나19 국제협력 연구를 통해 인류 전체가 질병을 극복하고 정부의 효과적 정책 수행을 위한 근거 생산에 활용할 수 있는 기회를 제공한다는 목적으로 연구 플랫폼을 구축하게 되었다.

2. 온라인 플랫폼 기반 코로나19

국제협력연구 특징 및 참여 현황

코로나19 국제협력연구 플랫폼(https://covid19data.hira.or.kr)은 심평원이 보유한 코로나19 청구데이터를 기반으로 국내외 연구자가 온라인으로 접속하여 원데이터(raw data)가 아닌 분석코드 및 분석결과(근거)만을 교환하는 방식으로 수행하는 연구체계이다. 심평원은 코로나19 환자의 검사 〮진료 및 이 환자들의 지난 3년 간 기저질환, 복용약제 등 의료이용 정보로 구성된 실제임상데이터를 노연숙 부장 건강보험심사평가원 빅데이터실 빅데이터연구부

(2)

7

I. 보건의료 빅데이터 동향 Ⅱ. 보건의료 빅데이터 분석 사례 Ⅲ. 전문가 기고 Ⅳ. HIRA 빅데이터 활용 가이드 비식별화된 연구용 데이터셋으로 구축하여 지난 3월 27일(금) 전 세계 연구자에게 개방했다. 연구용 데이터셋은 SAS, R 및 공통데이터모델(Common Data Model, 이하 CDM) 형식으로 개방 되며, 환자의 인구학적 정보, 상병정보, 진료〮처방 정보와 확진 및 사망여부 정보가 포함된 59개 변수로 구성되어 있다. 국내외 연구자는 온라인 연구 플랫폼에 게시된 데이터 스키마(테이블 구조 및 변수 설명)와 샘플 데이터셋을 활용하여 분석코드를 작성한 후 연구 플랫폼에 업로드하면, 심평원 내 연구진이 제출된 분석코드를 내부 서버에 보관된 데이터셋에 실행시켜 그 결과(통계)값만 반출해주는 방식으로 진행된다. 2020년 6월 17일(수) 현재 58개국 1,516명의 연구자가 등록하였고, 이들 중 32개국에서 390개의 연구 프로젝트가 신청되어 분석이 진행되고 있으며, 이 중 87건의 프로젝트 결과가 반출 완료되었다. [ 표 1 ] 코로나19 국제협력연구 프로젝트 한국 미국 영국 이스라엘 캐나다 163건(41.9%) 123건(31.5%) 19건(4.9%) 13건(3.3%) 12건 이탈리아 호주 중국 인도 네덜란드 10건 5건 5건 5건 5건 스페인 브라질 프랑스 말레이시아 뉴질랜드 4건 3건 2건 2건 2건 오스트리아 아르헨티나 크로아티아 체코 핀란드 1건 1건 1건 1건 1건 독일 인도네시아 아일랜드 일본 케냐 1건 1건 1건 1건 1건 파키스탄 파나마 필리핀 루마니아 사우디아라비아 1건 1건 1건 1건 1건 스위스 터키 1건 1건 데이터 코로나19 환자 실제임상데이터 - 전 국민 기반 코로나19 관련 검사, 처치, 투약 등 의료이용 정보 및 이들의 기저질환 및 의료이용 내역(3년)을 파악할 수 있는 실제임상데이터 - 코로나19 확진자 및 사망자 변수 등 총 59개 변수 - 자료 건수는 코로나19 명세서 기준 476,508건(확진자 7,590명 포함 총 환자수 234,427명)

(3)

8

HIRA 빅데이터 브리프

3. 온라인 연구 플랫폼 구성 및 연구 방법

1) 연구 플랫폼 체계

코로나19 국제협력연구 플랫폼은 복지부와 심평원이 주관하여 구축 및 관리하고 있다. 국내외 정부, 대학, 의료기관, 언론 및 산업계 연구자가 본 프로젝트에 참여 가능하며, 이 과정에서 심평원은 연구 플랫폼 개발〮유지보수, 연구용 데이터셋 개발〮개방 및 연구 가이드라인 수립 등 연구 환경을 관리하게 된다. [ 그림 1] 코로나19 국제협력연구 시스템 체계도 코로나19 국제협력연구 플랫폼 https://covid19data.hira.or.kr 연구자 등록 관리 연구 프로젝트 관리 데이터 레이크 (저장소) 연구 성과물 공유 연구계획서, IRB, 데이터동의서 분석 코드 분석 결과 제공 연구계획서, IRB, 데이터동의서 분석 코드 분석 결과 제공 국내 정부/대학/의료기관 /언론/산업계 등 국외 정부/대학/의료기관 /언론/산업계 등 연구 플랫폼 개발 및 유지보수 연구용 데이터셋 개발 및 개방 연구가이드라인, 분석도구 제공 등 연구 환경 관리 분석환경 폐쇄망 내 분석 수행 및 이용 통계 패키지 - 전 국민 기반 데이터를 조건에 맞게 추출하여 SAS, R 및 공통데이터모델 (Common Data Model, CDM) 형식의 데이터셋 구축

- SAS, R, Atlas(CDM 분석용) 통계 패키지를 활용한 분석 실행 - 보안 상 인터넷이 연결되지 않은 폐쇄망 내 분석으로 ‘R’과 같은 오픈소스 기반 분석 요청 시 기 설치된 패키지 확인 필요 플랫폼 기반 연구 온라인 연구 신청, 프로젝트 진행 및 반출 - 국내외 연구자가 온라인으로 접속, 등록, 프로젝트 신청, 분석코드 업로드 - 이메일을 통한 결과(통계)값 반출

(4)

9

I. 보건의료 빅데이터 동향 Ⅱ. 보건의료 빅데이터 분석 사례 Ⅲ. 전문가 기고 Ⅳ. HIRA 빅데이터 활용 가이드

2) 코로나19 국제협력 연구 흐름

• (등록 및 연구신청) 국내외 연구 참여자는 https://covid19data.hira.or.kr에 접속하여, 이름, 소속 및 소속기관 이메일 확인을 통해 가입한 후, 프로젝트에 등록하여, SAS, R 및 CDM 방식 으로 분석코드를 작성하여 업로드한다. • (자료제출, 분석실행 및 반출) 심평원 내부 연구진은 업로드된 분석코드를 기관 내 폐쇄 환경에 적재된 연구 데이터셋에 실행시킨 후 그 결과(통계)값을 반출하며, 이 과정에서 재식별 시도가 있었는지 검증한다. 연구 참여자는 반출 결과를 제공받기 전, 연구계획서, 데이터 이용 동의서 (서면) 및 IRB 승인/면제 서류를 제출(업로드)하여야 한다. • (성과 공유) 코로나19 국제협력연구 데이터를 활용한 성과(연구보고서 발간 및 학술지 게재 등)는 공익적 목적을 위해 공식발표 전 그 내용을 복지부 및 심평원과 공유하는 것을 권고하고 있다. [ 그림 2] 코로나19 국제협력연구 흐름도

4. 세부 기능

코로나19 국제협력연구 플랫폼의 주요 기능은 크게 연구 참여자 등록, 데이터 이용 동의(온라인), 연구프로젝트 신청, 데이터셋 및 분석툴 선택, 그리고 게시판 기능으로 이루어져 있다.

1) 연구 참여자 등록

국내외 정부〮학계〮언론계〮산업계 등 코로나19 관련 연구에 참여하고자 하는 개인은 이름, 소속 기관, 소속기관 이메일 주소를 입력하고 비밀번호를 설정하면, 이메일 확인 후 등록이 승인된다. 연구 참여 자격에 별도의 제한은 두고 있지 않다. 웹사이트 가입 https://covid19data. hira.or.kr 프로젝트 등록 분석코드업로드 결과값 반출 학술지 게재 등활용 연구계획서 데이터활용 동의서 IRB 승인/면제 서류 (업로드) 데이터 제공주체에 연구 최종 결과 공유

(5)

10

HIRA 빅데이터 브리프

2) 데이터 이용 온라인 동의

코로나19 연구를 위한 데이터는 복지부와 심평원이 감염병의 세계적 유행에 전 세계가 공동 대처하기 위해 신속히 수집〮정제 후 제공하는 것으로 정보 보안 및 활용 조건 설정을 위한 온라인 사전 동의 과정을 설계하였다.

3) 연구프로젝트 신청

연구 참여자로 등록이 완료되면 연구 프로젝트를 신청할 수 있으며, 연구 프로젝트 제목, 주제 및 연구방법 등 간단한 정보를 입력하면 신청이 완료된다. 연구 프로젝트 페이지에 파일 업로드 기능이 있어 분석코드 및 관련 서류(연구계획서, IRB 서류, 데이터 이용 서면 동의서)를 연구 플랫폼에서 제출할 수 있다.

4) 데이터셋 및 분석툴 선택

본 연구 프로젝트는 SAS, R 및 공통데이터모델(CDM) 형태의 데이터셋으로 분석할 수 있으며, 연구 프로젝트 신청 시 화면에서 데이터셋 및 선택한 데이터셋에 맞는 통계패키지(분석툴)를 지정할 수 있다.

5) 게시판 기능

연구 진행과정에서 연구 참여자와 관리자가 소통할 수 있도록 게시판을 운영하고 있으며, 공지사항 게시 및 Q&A 기능이 있다. [ 그림 3] 코로나19 국제협력연구 주요 기능 화면 로그인 화면

(6)

11

I. 보건의료 빅데이터 동향 Ⅱ. 보건의료 빅데이터 분석 사례 Ⅲ. 전문가 기고 Ⅳ. HIRA 빅데이터 활용 가이드 가입 등록 화면 프로젝트 신청 화면 데이터 동의 화면

(7)

12

HIRA 빅데이터 브리프

5. 향후 빅데이터 연구 확장을 위한 시사점

코로나19와 같은 신종 감염병은 전염성이 높고 감염경로의 예측이 어려워 다양한 임상데이터 확보를 통한 사례분석과 임상연구가 방역 및 정부 정책수립에 필수적이다. 그러나 코로나19 관련 임상정보는 매우 민감한 정보로 외부 연구자들의 접근이 어려워 적극적 연구에 제한이 많은 것이 현실이었다. 따라서 이번 코로나19 국제협력연구와 같은 온라인 플랫폼 방식으로 연구 프로젝트가 진행된다면, 원데이터의 외부 유출 없이 다양한 주제의 연구가 진행될 수 있어 향후 국가 단위 임상근거를 창출할 수 있는 매우 효과적인 방법이 될 수 있다. 또한 온라인 기반의 연구 플랫폼에는 국내뿐 아니라 해외 연구자들도 자유롭게 참여할 수 있어, 전 세계 연구자들과의 근거 공유를 통한 글로벌 집단 지성 기반 문제 해결 매커니즘을 구축할 수 있는 기회가 조성되었다고 하겠다. 데이터셋 및 분석툴 선택 화면 게시판 화면

(8)

13

I. 보건의료 빅데이터 동향 Ⅱ. 보건의료 빅데이터 분석 사례 Ⅲ. 전문가 기고 Ⅳ. HIRA 빅데이터 활용 가이드 그러나 향후 코로나19와 유사한 긴급 상황 발생 시에는 지금의 방식보다는 보완된 국내외 협력 연구가 이루어질 수 있도록 고민하고 있다. 특히, 연구자들이 데이터를 직접 열람하면서 분석할 수 없는 제한된 환경에서의 분석코드 작성 시 필요한 분석가이드 제공 및 데이터 기초분석(baseline analysis) 결과 공유, 그리고 폐쇄 분석 환경에서 오픈소스 기반 분석패키지를 활용한 분석 수요를 어떻게 반영할 수 있을지 등이 당면한 과제이다. 더 나아가, 국내외 협력연구 주제에 따라 온라인 플랫폼 기반 연구, 원격계정을 통한 코호트 연구 및 CDM을 활용한 다기관 분산연구의 적절한 활용을 위한 기반 마련 노력도 매우 중요하다.

참조

관련 문서

연구자는 연구하고자 하는 현상에 대한 충분한 설명과 연구 구조에 대한 묘사, 가정, 자료수집 과정 및 결과를 기술함으로써 독자들이 그들 스스로 다른 상황에서도

의 데이터 무결성 보장 및 노드 인증 최적 기법 개발 연구 핵심원천기술 기밀성이 향상된 블록체인 플랫폼 연구 및 개발 핵심원천기술 블록체인 기반 사물인터넷에서

생체구성물질의 구조 확인의 연구 탄수화물의 발견, 지질의 구조 확인 단백질의 구조 확인, 핵산의 구조 확인 2.. 신진대사

기후변화 대응 병아리콩 연구(Feed the Future Innovation Lab for Climate-Resilient Chickpea) 기후변화 대응 기장 연구(Feed the Future Innovation Lab for

- 송진호 회원은 중대사고 종합/개별현상 해석코드의 특징 및 현황, 원자 력연구원에서 수행하는 관련 연구(MIDAS, LILAC, GASFLOW해석, MCCI Phenomenon,

ㅇ 정규 교육과정 속에서 식생활교육 확대가 필요하고, 교육콘텐츠의 지속적 개발 , 매체의 다양화, 온라인 플랫폼 활용

본 연구 목적은 스트릿댄스의 문화콘텐츠 가능성(레퍼토리 가능성, 전문성 확보 가능성, 사회적환경 가능성)이 스트릿댄스 대중화와 콘텐츠 만족에 대 하여

공유경제 기반의 도시공간 활용 제고방안 연구.. 도시재생