• 검색 결과가 없습니다.

Open Science 정책연구 제3권 제1호

N/A
N/A
Protected

Academic year: 2021

Share "Open Science 정책연구 제3권 제1호"

Copied!
115
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)
(2)
(3)

발간사

2016년 새해 벽두부터 아인슈타인이 예측하였던 중력파를 100년만에 발견하였다는 소식으로 전세계가 들썩였습니다. 그리고 이러한 중력파 발견을 발표한 논문에 1,000여명의 저자의 수가 세간의 화제였습니다. 이는 인류사에 남을 커다란 과학적 발견을 위해 수많은 과학자들이 협력하고 노력하고 있음을 대중에게 각인시키는 큰 계기가 되었습니다. 최근 이루어낸 중요한 과학적 성과들은 주로 거대 실험시설에 생산되는 대규모 데이터와 이를 분석할 수 있는 컴퓨팅 및 네트워크 인프라, 그리고 국경을 뛰어넘는 연구자들 간의 협력에 의해 이루어낸 결과입니다. 이런 개방과 협력이라는 과학기술의 패러다임 전환을 간결하고 함축적으로 나타낸 키워드가 오픈 사이언스(Open Science)라고 할 수 있겠습니다. 특히 2015년 한국에서 개최된 OECD 과학기술정상회담을 기점으로 국내에서도 오픈 사이언스에 대한 관심이 증대되고 있습니다. 현재 국내에서 오픈 사이언스에 대해서 다양한 논의가 진행되고 있으나, 아직까지는 전반적으로 연구 활동이 미진한 상태입니다. 이에 슈퍼컴퓨팅, 네트워크 및 대용량 데이터 인프라 등 세계 최고 수준의 과학기술 R&D 인프라를 기반으로 연구자의 개방형 연구 활동을 지원하기 위한 IT융합형 연구서비스를 제공하는 한국과학기술정보연구원(KISTI)은 국내 과학기술계에 오픈 사이언스에 대한 정보를 제공하고 관련연구를 활성화시키기 위해 ‘Open Science 정책연구’를 발간하게 되었습니다. ‘Open Science 정책연구’는 KISTI 내부뿐만 아니라 외부 과학기술자들의 연구결과를 공유하여 현재 과학계를 움직이는 연구개발 패러다임을 이해하고 향후의 방향성을 제시하는데 가치 있게 활용될 것입니다.

앞으로도 KISTI는 Open Science 전문기관으로써 맡은 바 소임을 다하여 우리나라 과학기술의 길잡이가 되도록 하겠습니다. 끝으로, ‘KISTI Open Science 정책연구지’ 발간을 위해 노력해주신 모든 분들께 노고의 위로의 말씀을 전하며 이로써 발간의 글을 대신하고자 합니다.

2016년 7월

(4)
(5)

1. Open Science 국제 동향 분석 ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 1

조아라, 고미현, 김남규, 이형진(한국과학기술정보연구원)

2. Open Science 관점에서 연구수행 프로세스에 대한 분석 ・・・・・・・・・・・・・・・・・・・・・・ 27

김남규, 이형진(한국과학기술정보연구원)

3. Open Science를 위한 데이터 센터 발전 방향 ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・49

조규진, 윤희준, 노서영(한국과학기술정보연구원)

4. 바이오 전자현미경 시설 운영 방안 ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 71

현재경(한국기초과학지원연구원)

5. Visualizing Life: 원자부터 생명까지 그리고 대용량 데이터 컴퓨팅 ・・・・・・ 89

송지준(한국과학기술원)

6. Industry 4.0과 Cyber Physical System ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・99

(6)
(7)
(8)
(9)

Open Science 국제 동향 분석

조 아 라

1)

/

고 미 현

2) /

김 남 규

3) /

이 형 진

4) Open Science 국제 동향 분석

03

Ⅰ. 서론

1. Open Science 정책의 중요성

▢ Open Science의 중요성 ◦ 초대형 실험장비의 방대한 데이터 분석에 토대한 과학연구 패러다임 부상 - IT 융합연구 환경에 토대한 과학연구 프로세스로의 변화 ◦ 대형 시설장비와 데이터를 활용한 연구방법 확산 및 디지털 기술과 새로운 협업 도구를 활용한 연구 개방과 협력에 대한 중요성 확대 ◦ 고품질 클라우드 기반 오픈 소스를 활용한 사회 문제 해결 필요 ▢ 글로벌 어젠다로 Open Science 급부상 ◦ 2004년 OECD 과학기술 장관회담에서 “공적자금이 투입된 연구 데이터의 접근에 관한 선언”(Declaration on Access to Research Data from Public Funding) 채택 ◦ 2015년 OECD 과학기술 장관회담에서 Open Science가 핵심 의제로 등장

◦ EU에서는 2014년 Horizon 20205) 프로젝트를 중심으로 Open Science 촉진을 위한

프로그램 및 정책 추진

(10)

▢ 국내 Open Science 활성화에 관한 전략 수립의 필요성

(11)

Open Science란 새로운 지식과 가치 창출, 지식확산을 목적으로, ICT를 기반으로 공적자금이 투입된 연구결과물(논문, 데이터 등)의 개방과 협업 연구를 추진하는 기초과학, 응용과학, 응용연구 등을 의미 Open Science 국제 동향 분석

05

Ⅱ. Open Science 개요

1. Open Science 개념

▢ Open Science의 기원

◦ Open Access에서 시작된 Open Science

- 논문의 자유로운 이용에 관한 2002년 Budapest Open Access Initiatives를 기점으로 Open Science에 대한 국제적 논의 시작

- Budapest Open Access Initiatives는 단순히 출판, 데이터가 아닌 모든 연구 생산물 의 재활용까지도 포괄함으로써 Open Science의 영역을 넓히는 데에 기여 ◦ 최근 Open Science는 연구자의 관심이 ‘가능한 한 빠른 출판’에서 ‘가능한 초기부터 지식 공유’로 변화하면서, 이러한 과학 활동 변화를 포괄하는 광의적 개념으로 확장 ▢ Open Science의 정의 ◦ Open Science 정의는 과학연구 수행 방식, 연구 협업, 지식의 공유 및 과학의 조직방 식 등의 변화에 맞춰 진화, 발전 - Open Science에 대한 사회적 관심을 촉발하는 데에 큰 역할을 한 마이클 닐슨 (Michael Nielson)은 「발견의 재발명(Reinventing Discovery: The New Era Networked Science)」에서 Open Science를 “발견과정 초기부터 가능한 모든 과학지 식이 공개적으로 공유되는 것”으로 규정 - OECD에서는 “많은 공적 연구 데이터에 쉽게 접근할 수 있도록 ICT 툴과 플랫폼을 활 용한 광범위한 협업 연구(비과학자의 참여 포함), 새로운 저작권 툴을 활용한 연구결과 확산” 등을 포괄하는 개념으로 인식 - EU에서는 협업 연구를 기반으로 새로운 과학 프로세스 접근 방식, 디지털 기술과 새 로운 협력 툴을 활용한 새로운 지식 확산 방법으로 정의(EC, 2016) ◦ Open Science의 유사 개념

- Open Science의 유사개념에는 Cyberscience, e-Science, Science 2.0, Digital Science 등이 존재

(12)

- e-Science는 사이버 공간에서 국내·외에 위치한 연구자, 연구장비, 연구정보 등의 연 구자원을 공동 활용하여 수행하는 연구활동을 의미 - Science 2.0은 온라인을 매개로 다양한 지역, 분야의 과학자 간의 연구, 기록, 협업 활동을 의미 - Digital Science는 디지털 툴, 네트워크, 미디어를 활용한 연구 수행, 확산, 활용, 변형 하는 것을 의미 ◦ Open Science의 범주

- Open Science는 과학 연구 그 자체부터 대학 교육, 사회, Open Science를 가능케 하는 도구와 플랫폼, 그 밖의 Open Science를 촉진하는 다양한 요소 등을 포괄

출처: Salmi, J. (2015), Study on Open Science: Impact, Implication and Policy Option, EC

(13)

Open Science 국제 동향 분석

07

2. Open Science의 구성요소

▢ Open Access (OA)

◦ (개념) 인터넷 접속에서의 제약 이외에는 어떤 경제적, 법적, 기술적 장벽도 없이 이용 자가 합법적 목적을 달성하기 위해 연구 결과물의 읽기, 다운로드, 복제, 배포, 인쇄, 탐 색, 연결할 수 있도록 허용

◦ (종류) Gold OA, Green OA

- 미국, 캐나다 등에서는 Green OA를 Public Access라고도 지칭

(14)

▢ Open Data (OD)

◦ (개념) 저작권, 특허 등의 기술적, 법적 제약 없이 데이터에 접근, 활용, 재활용할 수 있 는 데이터의 개방

◦ (대상) 연구 자료(출판 이전, 이후 단계의 정형화된 텍스트 등), 연구 데이터, 관찰 및 실험 데이터, 컴퓨터 데이터, 레퍼런스 데이터, 메타 데이터, 연구 방법론 등

◦ (종류) 오픈 연구 데이터(Open Research Data, ORD), 오픈 정부 데이터(Open Government Data, OGD)

◦ (방법) Open Data 방법은 단계별로 크게 5단계로 분류 가능 - 1단계: 공개 라이센스를 활용해 웹에 데이터 공개

- 2단계: 구조화된 데이터를 공개 - 3단계: 비독점형 공개 포맷 활용

- 4단계: 데이터에 연결될 수 있는 식별체계 활용(예: URI, DOI 등) - 5단계: 데이터와 다른 데이터를 연결(Linked Open Data, LOD)

출처: http://5stardata.info/en

▢ 개방형 협력(Open Collaboration, OC)

◦ (개념) 연구 데이터, 연구 방법론 및 연구 인프라, 툴의 공개, 공유, 상호호환을 통한 연 구 협업 ◦ (조건) 공동의 결과물을 생산할 수 있도록 지원하고 협업의 진입장벽을 낮추고 유연한 사회구조를 뒷받침할 수 있는 기술을 기반으로 한 협업 플랫폼 ◦ (종류) 연구자 간 협업, 연구자와 기업 간 협업, 연구자와 시민 간의 협업 - 연구자와 시민 간의 협업은 시티즌 사이언스(citizen science), 클라우드 사이언스 (crowd science), 네트워크 사이언스(networked science), 거대 협업 사이언스 등으 로 지칭

(15)

Open Science 국제 동향 분석

09

- 연구자와 기업 간 협업은 오픈 이노베이션(open innovation)과 유사하지만, 오픈 이 노베이션은 기본적으로 기업의 경제적 가치 창출이라는 명확한 목적하에 지식유통을 활용해 혁신의 내적 가속화와 시장 확장을 도모한다는 점에서 개방형 협력과는 차이 발생 ◦ 국제 협업 연구의 증가와 이들 협업 연구의 과학적 영향력이 증대됨에 따라, 협업 연구 를 지원하는 Open Science 분석 도구들에 대한 개발과 관심 증가 - 천문학, 지리학, 컴퓨터 과학, 수학, 물리학, 생물학 등을 중심으로 협업 연구가 크게 증가 < 그림 4 > 분야별 협업 연구 현황 (1997년, 2012년)

출처: National Science Bureau (2014), Science and Engineering Indicator

- 2000년 대비 2013년 국가별 협업 연구는 유럽, 일본, 중국은 미국 이외 국가들과의 협업 비중이 증가함에 따라 국가별 협업 연구가 다변화되고 있으며, 미국은 유럽과의 협업 비중이 다소 감소한 반면, 한국과의 협업이 크게 증가했고, 한국 또한 유럽 등 다 른 국가와의 협업에 비해 미국과의 협업이 크게 증가

< 그림 5 > 국가별 국제 협업연구 현황 (2000년, 2013년)

출처: Science, research and innovation performance of the EU 2016

(16)
(17)

Open Science 국제 동향 분석

11

 Opne Access 정책 추진이 확대되면서, 현재 전 세계적으로 총 766개의 Open Access 관련 정책 수립 (2016년 5월 기준) ◦ Open Data 정책 추진 - 공공 데이터를 통한 가치 및 새로운 서비스 창출을 위한 정부 데이터 개방 정책 추진 - 연구 논문, 연구원의 프로필, 연구소, 연구 프로젝트 등에 관한 정보를 단일화, 표준화 한 공공 데이터베이스 설립 ◦ 개방형 협업 정책 추진 - 연구기관, 산업체, 시민단체의 조직 간 또는 분야 간 협업, 국제 협업의 장애요인 규명 및 제거 정책 추진  산학 협력을 통해 데이터 자원 접근을 위한 시맨틱 기술(semantic technology)을 적 용함으로써, 신약 개발의 비용 절약 및 장애 요인 제거

※ 예: Open PHACTS, Open Pharmacological Concepts Triple Store

 과학자 간 네트워크, 질의응답, 논문 및 데이터 공유를 위한 소셜 네트워킹 출현

◦ 새로운 비즈니스 모델 개발

- 공공기금, 협동금융(cooperative financing) 모델 등의 출현

 스웨덴 룬드 대학, 스웨덴 국립도서관, 노르드비브(Nordbib)6), 코액션 출판사(Co-Action

Publishing)가 협력해 Open Access 저널 출판 및 연구자의 자가 아카이빙 (self-archiving)에 관한 온라인 가이드 개발

 공공기금을 기반으로, 이용자가 무료로 정기간행물을 읽고, 다운로드, 복사, 배포, 인쇄 가능한 Open Access 논문 디렉터리(Directory of Open Access Journal, DOAJ) 설립

2. 미국 Open Science 정책

▢ Open Access 정책

◦ (미국 국립보건, NIH) PubMed Central(PMC)을 활용한 Public Access 추진

- NIH가 재정 지원하는 연구결과는 논문 게재가 확정되면, PMC에 제출하고 이로부터 1 년 이내에 공개 의무화

- NIH에서 지원하는 연구기금에 Open Access 비용을 포함하고, 연구결과를 비공개한 경우에는 추후 NIH 연구비 신청 불가

◦ (미 국립과학재단, NSF) 연구계획서에 반드시 데이터 공개 계획을 기술하도록 규정하 고, 연구비를 지원받은 논문은 출간 뒤 1년 이내에 연구결과를 공개

- 연구결과의 포괄적 Open Access에 관한 “오늘의 데이터가 내일의 발견(Today's Data, Tomorrow's Discoveries)” 계획 (2015년)

(18)

- 포괄적 Open Access는 동료심사를 진행한 논문, 심사를 거친 컨퍼런스 자료집, 보고 서 등은 1년 이내에 NSF가 설계한 리포지터리를 통해 공개하도록 규정 ◦ (미국 보건복지부, HHS) Open Access 강화에 관한 포괄적인 지침 발표 (2015년 12월) - 연구자는 연구계획서에 데이터 관리 및 공유 등에 관한 데이터 관리 계획 제출하고 논 문심사가 완료된 논문 및 관련 중요 데이터는 12개월 이내에 PMC에 공개 ▢ Open Data 정책 ◦ (국가과학기술위원회, NSTC) 연구 데이터 관리 및 확산에 관한 기본원리를 2009년에 발표 - 과학 연구의 디지털자료는 국가의 재산 - 자료의 보존은 정부의 책임이며, 그 목적은 사회 전체 이익 - 실행공동체는 디지털 사회의 중요한 특징 - 자료의 장기보존 및 접근을 위한 ‘디지털 자료의 생애주기’에 따른 관리 필요 - 일부 디지털 자료는 영구 보존이 불필요 - 물리적 자료에 대한 디지털화에 대한 각 기관의 적극적인 전략 필요 ◦ (백악관 과학기술정책실, OSTP) Project Open Data 계획 (2013년)

- R&D 예산이 1억 달러 이상인 연방정부 기관은 공적자금이 투입된 연구결과(논문, 디 지털 데이터7))에 관한 공개 방안 마련 지시

- NSF, DOE, HHS 등 연방정부 소속 연구관리 기관은 OSTP의 Project Open Data 계 획에 따라 Open Access 지침 마련 ◦ (국립과학재단, NSF) ‘EarthCube’ 운영 - 지구시스템을 이해하고 예측에서의 새로운 방법 개발을 목적으로 지구과학을 위한 데 이터 및 지식관리 시스템 구축 - 지구과학자의 지구 관련 데이터 접속, 분석, 공유 지원 (총 지원금액: 1430만 달러) ◦ (국립보건원, NIH) 데이터 공개 대상 확대 - NIH의 연구 지원을 받는 연구의 경우, 논문, 특허뿐만 아니라 연구과정에서 발생한 일 반 데이터 최종 연구정보의 공유 의무화

- 2012년에 아마존의 AWS(Amazon Web Services) 클라우드를 기반으로 세계 최대 규 모의 인간 유전정보를 담은 ‘1000 Genomes Project’를 통해 인간게놈 정보 공개

※ 1000 Genomes Project’의 데이터셋 규모: 200테라바이트, 1,700명의 DNA 시퀀스

◦ (미국 항공우주국, NASA) 기후변화와 관련된 다양한 데이터 공개 및 인프라 제공 7) 논문에 활용된 데이터셋 등 연구 자료로, 과학자 집단에서 일반적으로 인정하는 디지털 형태의 자료(실험노트, 일차분석, 연구

(19)

Open Science 국제 동향 분석

13

- 아마존 AWS를 기반으로 ‘나사 NEX(NASA Earth Exchange)’ 프로젝트 추진하여, 기 후변화 연구에 필요한 지구 표면의 위성 이미지 등을 공개

- NASA, 아마존, INNOCENTIVE가 공동으로 OpenNEX Challenge 프로젝트를 추진하 면서, 일반인에게도 환경오염이나 기후변화 연구를 할 수 있도록 AWS 인프라 제공 ▢ 개방형 협업 정책 ◦ 오픈 소스 프로그래밍 플랫폼인 Github를 활용한 정부 데이터 소스 코드의 공개 및 개선 - 웹 사이트 설계 및 데이터 공유 포맷에 관련 소프트웨어 코드, 정부 정책 및 전략 초 안 개선 추진 ◦ citizenscience.gov 개설 - 정부가 지원하는 검색 가능한 시민과학 프로젝트 카탈로그, 프로젝트의 설계 및 유지 를 지원하는 툴킷, 모범 사례를 공유하는 연방 커뮤니티 정보 등을 공개 - 시민참여형 과학 프로젝트와 관련된 데이터의 표준화를 통해 보다 쉽고 정확하게 정보 접근하고 협력할 수 있도록 지원할 계획

3. EU Open Science 정책

▢ Open Science 정책의 기본 구조

◦ 유럽의 디지털 단일 시장(Digital Single Market) 수립을 목적 ◦ Open Science 정책 가이드라인

출처: EC (2016), Open Innovation, Open Science, Open th the World: A Vision for Europe

정책 가이드라인 내용 Open Science에 관한 인센티브 제도의 도입 및 활성화  교육 프로그램에서 Open Science 촉진  최고의 Open Science 실현 방안 도입  보다 많은 연구자를 다양한 Open Science 환경에 투입 Open Science의 이행을 막는 장벽 제거  인센티브와 보상 차원에서의 Open Science 참여에 대한 경 력 인정

Open Access의 확대 및 촉진  연구 데이터 및 연구 출판물에 대한 Open Access 추진

Open Science를 위한 연구 인프라 개발

 연구 데이터의 표준 프레임워크 개발  European Open Science Cloud 구축

 유럽 내 Open Science 인프라 구축을 위한 중요 계획 수립 사회경제 활성화를 위해

사회 내 Open Science 내재화  Open Science를 통해 중요 사회적 현안 규명

(20)

◦ Open Science 정책 플랫폼(Open Science Policy Platform, OSPP)

- Open Science 정책 가이드라인에 따라, Open Science 관련 크로스커팅 이슈의 개발 및 이행에 관한 EC의 자문 역할 수행 (2016년 2월 출범)

- 연구보상, altmetrics, European Open Science Cloud, 변화된 출판 비즈니스 모델, 연구 충실성, 시민과학, 개방형 교육, 분석 도구, FAIR8) Open Data 등에 관한 활동

수행

출처: EC (2016), European Open Science Agenda

◦ Open Science 이행을 위한 12가지 행동강령 (2016년) 세션 행동강령 Open Science로의 이행을 막는 장벽 제거  과학계 평가, 사정, 보상 체계 변화  디지털 콘텐츠를 이용한 텍스트 및 데이터 마이닝 확대  지적 재산권과 개인정보보호 등의 문제에 대한 이해 증진  학계 의사소통 비용 및 환경에 대한 투명성 확보 연구 기반시설 발전  FAIR하고 안전한 데이터 원칙 도입  공통의 e-인프라스트럭처 도입 Open Science로의 이행 동기 제공 및 가속화  Open Access 원리 채택  지식 전달에 새로운 출판 모델 활성화  이해관계자의 활동을 조사 및 추적 관찰

Open Science 주류화  Open Access 계획을 발전, 실행, 감시 및 개선

Open Science 확산 및 정착  Open Science에 연구자와 새로운 사용자 참여

 이해관계자들의 Open Science 관련 전문지식과 정보 공유 독려

< 표 4> Open Science 이행을 위한 12가지 행동강령

출처: EU2016NL (2015)

8) Findable(발견 가능한), Accessible(접근 가능한), Interoperable(상호 운용 가능한), Reusable(재사용 가능한)을 의미

(21)

Open Science 국제 동향 분석

15

▢ Open Access 정책

◦ FP7(Seventh Research Framework Programme)의 Open Access Pilot 정책

- (대상) FP7 지원 프로젝트 중 에너지, 환경, 건강, 정보 커뮤니케이션, 연구 인프라 (e-infra), 과학과 사회, 사회경제학 및 인문학 등 총 7개 분야(전체 프로젝트의 약 20%)

- (내용) 최종 출판된 논문 또는 동료심사가 끝난 논문의 6개월 이내에 공개 의무화(단, 과학과 사회, 사회경제학 및 인문학 분야는 12개월 이내에 공개)

◦ Horizon 2020의 연구 결과물의 Open Access 정책

- FP7의 Open Access 정책을 확대, 적용하여 Horizon 2020의 지원을 받는 프로젝트 중 동료심사가 이뤄진 모든 논문의 공개 의무화

< 그림 9 > Horizon 2020 Open Access 기본구조

출처: EC (2016), Guidelines on Open Access to Scientific Publication and Research Data in Horizon 2020

◦ Open Access 전략 개발 및 강화 지원 프로젝트 PASTEUR4OA(Open Access Policy Alignment Strategies for European Union Research)

- EU Open Science 관련 정책 수집, 분석 및 평가

- 연구기관 및 연구지원기관을 위한 Open Access 가이드라인 제공

(22)

▢ Open Data 정책

◦ Horizon 2020의 Open Research Data Pilot 정책

- 연구결과물의 완전 개방과 재사용 기회 제공을 목적으로, Horizon 2020의 일부 프로 젝트를 대상으로 연구 데이터 공개

◦ 유럽 클라우드 계획(European Cloud Initiative) (2016년)

- 데이터 저장 및 관리를 위한 세계 수준의 데이터 인프라 구축 추진 - 초고속망을 통한 데이터 전송 추진 - 보다 강력한 HPC를 통한 데이터 처리 추진 ※ 저가의 칩 개발 및 구축, 유럽 엑사스케일 HPC 생태계 조성을 목적으로, 총 67억 유 로 투자 ◦ 유럽의 모든 연구결과물의 공개 정책 시행 계획 (2016년 5월) - 2020년까지 유럽에서 나오는 모든 연구결과물(논문, 데이터)의 공개에 관한 합의안 발표 ◦ 유럽 Open Data 전략(Open Data Strategy in Europe) (2011년)

- EU 기구와 회원국 공공기관의 모든 공공데이터의 온라인 개방 의무화 - EU 데이터 포털을 개설하고 데이터 처리 기술 연구개발 지원 등을 명시

※ EU 회원국의 공공기관이 보유한 모든 정보는 상업 및 비상업 목적으로 이용 가능하 다는 공공데이터 재활용에 관한 지침(Directive on Re-use of Public Sector Information)(2003년)을 발표

▢ 개방형 협업 정책 ◦ 시민과학 프로젝트

- 지속 가능성 및 사회혁신을 위한 집단인식 플랫폼(Collective Awareness Platform for Sustainability and Social Innovation)을 통한 시민과학 프로젝트 추진

※ 2012년부터 2년간 새로운 Open Science의 패러다임의 구축 목적으로 Socientize 프로젝트 추진

4. 영국 Open Science 정책

▢ Open Access 정책

◦ Finch Report(2012)9)에 기반을 둔 Open Access (2013년)

- 공공자금을 지원받은 논문은 발표 즉시 공개

(23)

Open Science 국제 동향 분석

17

- 논문 처리비용을 연구비에 계상하지 않고, 별도로 논문 출판 처리비용(Article Processing Charge, APC)을 지원 (2014년부터 추진)

- 2017년 4월까지 영국 대학에서 발간되는 거의 모든 학술지 기사가 Open Access로 공개될 예정. 이중 20%는 발간 즉시 이용 가능

◦ 연구지원기관의 Gold OA 정책

- 영국 연구위원회(RCUK)는 RCUK의 연구지원을 받은 연구결과는 Open Access 저널 혹은 하이브리드 저널을 통한 공개 의무화 (2013년 개정) - 펀딩위원회(Funding Council)는 게재 승인을 받은 연구논문은 3개월 이내에 기관 자 체 리포지터리 또는 주제 리포지터리에 등록 의무화 (2016년 4월부터 추진) ※ 2017년 4월 이후부터는 게재 승인 후 3개월 이내에 등록 의무화. 엠바고 기간은 과 학, 기술, 공학, 수학 분야는 12개월, 인문, 사회 분야는 24개월 이내로 제한 ◦ 연구기관의 적극적인 Open Access 정책 (2014년) - 정부 방침에 따라 기관의 리포지터리를 통한 연구 성과 공개를 요구하고 있으나, Open Access 저널 또는 하이브리드 저널를 통한 공개도 허용 - 최근 Green OA 추진 기관 증가 ▢ Open Data 정책 ◦ 영국의 중요 연구지원기관인 영국 고등교육기금위원회(HEFCE), 스코틀랜드 기금위원회 (SFC), 웨일스 고등교육기금위원회(HEFCW), 북아일랜드 고용교육부(DEL)의 Open Research Data 협약 체결 (2016년) - 해당 협약기관에서 지원한 연구에서 비롯된 데이터의 최대한 개방을 강조

5. 일본 Open Science 정책

▢ Open Science 기본방향 ◦ 내각부의 범정부 차원 Open Science 기본 원칙 (2015년) - (과학 논문 접근) 공적 연구에서 발생한 연구결과는 검색, 탐색 및 분석에 대해 장기적 인 보존과 모든 이용자의 접근이 가능 - (디지털화된 연구 데이터 접근) 다양한 연구 데이터 보존 및 공유 방법 고려

(24)

< 그림 10 > 내각부 Open Science 전문가 패널의 Open Science정책 수립 및 이행 구조(안)

출처: Expert Panel on Open Science (2015), Promoting Open Science in Japan: Opening up a new era for the advancement of science, Cabinet Office, Government of Japan

◦ 제5차 과학기술기본계획의 핵심 이슈로 Open Science 제안 (2015년)

- 관련 기관(연구지원 기관, 연구기관, 연구원 등)과 협력해 Open Science 촉진 체제를 구축할 것을 명시

▢ Open Access 정책

◦ 일본 과학기술진흥기구(JST)의 Open Science 정보사업 시책(2015년)

- 일본 링크 센터(Japan Link Center, JaLC)의 연구 데이터에 DOI를 부여하는 실증실 험 프로젝트 게시

- FMDB(Funding Management Database System) 구축 - JST 연구성과 DB 공개

- 정보 분석 기반 활용과 인용정보 정비 - Open Science 인프라 투자 지원

- 일본 과학기술청(Science and Technology Agency)에서 온라인 플랫폼 ‘J-STAGE’을 구축하여 온라인상에서 논문 투고, 심사, 출판 지원하는 등 Open Science를 가속화하 는 정보 플랫폼으로서의 기능 구현 예정

◦ openscience.jp 개설 (2016년)

(25)

Open Science 국제 동향 분석

19

6. Open Science 기술/서비스 동향

▢ Open Access

◦ 논문 공유 서비스 제공, Open Access 저널, Open Access 리포지터리와 함께 Open Access 정책 지원 및 촉진을 위한 서비스 및 프로젝트 등이 운영 - 논문 공유 서비스 - Open Access 저널 - Open Access 논문 리포지터리 서비스명 내용 Academia (기능) 연구자들에게 연구논문 공유, 연구 영향력 심층 분석 결과 모니터, 관련 연구정보 제공 등을 하는 플랫폼 (현황) 2016년 7월 현재 가입자 수 약 4백만 명 (효과) 지난 5년간 Academia에 등록된 논문의 69%의 인용횟수 증가 ResearchGate (기능) 무료 온라인 연구 플랫폼으로, 회원에 대한 개인 프로필 관리 기능 및 블로그 제공, 사이트에 논문 업로드 및 다운로드 가능 (특징) 인덱싱 사용자 프로파일 정보로 비슷한 관심사를 가진 회원과 네트워크 망 형성 가능, 업로드된 논문의 인용, 다운로드 등을 반영한 자체 연구 영향력지수 ‘RG’ 산정 (현황) 이용 가능한 논문 8000만 건, 이용자 800만 명(2016년 기준) arXiv (기능) 논문출판 이전의 전자문서를 자유롭게 다운, 업로드, 검색 가능 (특징) 문서 내용의 해당 분야와의 적합성 확인을 위한 추천 시스템 운영 (현황) 수록된 논문이 100만 편 이상 Directory of Open Access Journal (DOAJ) (기능) Open Access 리포지터리 통합 검색 서비스로 저널 읽기, 다운로드, 복 사, 배포, 인쇄 가능 (특징) 스웨덴 룬드대학(Lund University) 도서관에서 공공자금으로 운영 OAlster (기능) 메타데이터, OA 원문 등을 검색 가능한 Open Access 데이터베이스 (특징) 미국 미시간 대학이 OCLC와 파트너십으로 운영 (현황) 전 세계 1,500여 기관의 3,000만여 건 정보 검색 가능 저널명 내용 PLOS (Public Library of Science) (기능) 과학 및 의학 분야의 대표적인 비영리 Open Access 출판사

(26)

- Open Access 정책 지원 및 촉진을 위한 서비스 및 프로젝트 ▢ Open Data ◦ 과학 데이터 리포지터리(국제 리포지터리 또는 기관 자체 리포지터리), 공공데이터 공개 서비스, 데이터 공유를 위한 인프라 서비스, 리포지터리 네트워크 플랫폼 등이 운영 - 과학데이터 리포지터리 리포지터리명 내용 wwPDB (Worldwide Protein Data Bank) (기능) NMR, X-ray, 이론모델을 이용하여 단백질, 핵산, 분자의 3D 구 조의 데이터베이스 제공 (특징) RCSB의 PDB(미국), EBI의 MSD(영국), Osaka대학의 PDBj(일본) 가 협력한 거대 데이터베이스 (현황) 5만 개 이상의 구조 데이터 수록 Dryad (기능) 학술지 논문 기초 데이터에 대한 생명과학 분야 리포지터리 GBIF (Global Biodiversity Information Facility) (기능) 약 4.2억 건의 생물종 다양성 데이터 저장 및 공유 (특징) 미국, 영국, 독일, 일본, 한국 등 90여 개 국가가 참여하는 OECD 장관급 회의의 승인으로 추진 Zenodo

(기능) CERN, OpenAIRE, EC에서 지원하는 연구성과 공유 리포지터리

(특징) 텍스트, 스프레드시트, 음성, 동영상, 이미지 등 형식을 막론하고, 연구자의 연구 성과를 등재 공유할 수 있도록 지원 (현황) 약 5만 건의 자료 공개 DSpace@MIT (기능) MIT의 논문, 회의자료, 이미지, 동료 간 리뷰자료, 기술보고서, 연 구 중인 자료 등에 대한 저장, 공유, 검색 (특징) MIT와 HP 연구소가 공동 개발한 무료공개 소프트웨어를 기반을 둔 리포지터리 (현황) DSpace 소프트웨어는 전 세계 약 1400여 개 이상의 대학, 연구 소, 공공기관 등에서 결과물 수집, 공유를 위한 기관 리포지터리 시스템으로 활용 Figshare (기능) 개인 연구자, 연구기관, 출판사 등을 위해 자체 기술 허브를 활용 해 다양한 소프트웨어, 앱을 개발해 제공 (특징) 도표, 데이터셋, 이미지, 포스터, 영상 등 어떠한 형태의 연구물이 든 정식 발표하기 전 업로드하여, 연구의 영향력을 평가 가능 (현황) 피어리뷰 2.6천만 건, 다운로드 7.5백만 건, 업로드 80만 건 서비스명 내용 ROARMAP (Registry of Open Repository Mandates and Policies) (기능) 대학, 연구기관, 연구지원기관의 Open Access 정책 자료 제공 (특징) Open Access 정책에 관한 시각화 자료 제공 (현황) 772개 기관의 자료 보유(2016년 7월 기준) PASTEUR4U

(기능) EC 참가국의 Open Access 및 Open Data 정책 수립을 추진하는 프로젝트

(특징) Open Access 정책의 국가별 채택현황, Horizon 2020 준수현황, APC 언급 여부, 리포지터리 등록 등에 관한 자료 제공

(27)

Open Science 국제 동향 분석

21

- 공공데이터 공개 서비스 - 데이터 공유를 위한 인프라 서비스 - 리포지터리 네트워크 플랫폼 네트워크 플랫폼명 내용 OpenAIRE (기능) 리포지터리에 대한 유럽 지역 네트워크 플랫폼 (특징) 유럽 전역의 리포지터리의 메타 데이터를 집계하며, 2015년 1월에 EU에서 총 1천3백만 유로를 투자해 Horizon 2020의 연구결과물을 수집, 공개하는 OpenAIRE2020 플랫폼 생성 (현황) 유럽 전역의 5,551개 리포지터리와 Open Access 저널에서 1,680 만 건의 출판물과 2,300건의 데이터 셋 집계 포털명 내용 data.gov (기능) 공공 데이터를 제공하는 미국 정부 오픈 플랫폼 (특징) CKAN 등의 오픈 소스에 기반을 두어 데이터 원본, 데이터 셋, API 등 프로그램 제공 (현황) 한국 등에도 유사 서비스 제공

EU Open Data Portal

(기능) 유럽 전역의 공공 데이터를 제공하는 오픈 플랫폼 (특징) 단일 공공 데이터 플랫폼을 통해 연구자, 기업, 시민 등이 공공데 이터를 검색, 접근, 재사용할 수 있도록 제공 (현황) 13개 콘텐츠 카테고리에 24만 개 데이터셋 보유 NTIS (National Technical Information Service) (기능) 미국 정부 용역으로 수행되는 각종 연구개발, 기술보고서, 해외의 기술정보를 수집, 정리하여 제공 (특징) 미국 상무부 산하 과학기술정보센터에서 제공 (현황) 약 200개 이상의 미국 정부기관을 비롯해 해외 기관 및 국제기구 등에서 정부 수집 인프라 서비스명 내용 EUDAT (European Data Infrastructure) (기능) 지속 가능한 범 유럽 데이터 인프라 구축 프로젝트 (특징) 유럽의 슈퍼컴퓨터에 데이터 저장 (현황) 유럽의 35개 조직이 참여하며, 15개 유럽 국가에 데이터 공유 서비 스 제공

Open Science Data Cloud (기능) 페타바이트 급의 클라우드 리소스를 제공하는 플랫폼 (특징) 테라바이트 스케일의 대형 연구 프로젝트에서 활발히 사용 European Open Science Cloud (구축 예정) (기능) 광대역 네트워크, 대규모 데이터 저장시설, 초고속 컴퓨터 등으로 구성된 ‘유럽데이터기반’(EDI) (특징) 2017년부터 Horizon 2020의 연구 데이터의 저장 및 공개 (현황) 2021년까지 인프라 구축에 총 67억 유로 투자 예정 AWS (Amazon Web Services) (기능) 아마존 클라우드 서버 호스팅 (특징) REST 및 SOAP 프로토콜을 통해 접근, 이용 및 관리 가능 (현황) NCBI, NASA 등이 AWS 공공데이터 셋을 통해 데이터 공개

DOI

(기능) 디지털 객체 식별자 시스템

(특징) 객체의 메타데이터에 DOI를 부여해, 인터넷 주소 변경 등과 무관하 게 영구적으로 데이터 확인 가능

(28)

▢ 개방형 협업 ◦ 클라우드 기반 플랫폼, 거대 연구실험기기 공유를 통한 연구자 간 협업뿐만 아니라, 클 라우드펀딩, 시민참여 과학 등을 통한 다양한 방식의 시민과의 협업 진행 - 클라우드 기반 연구수행 플랫폼 - 거대 연구실험기기 공유에 기반을 둔 글로벌 협업 프로젝트 - 클라우드펀딩 플랫폼 - 시민참여 과학 - Open Science 협업 지원 네트워크 네트워크명 내용 OCSDNet (Open and Collaborative Science in Development Network) (기능) 과학의 개방성과 협업의 역할에 관심 있는 남반구, 개발도상국의 12개 연 구자-실무자 네트워크 (특징) Open Access 뿐만 아니라, 데이터, 소프트웨어 코드, 프로토콜, 워크플로 어 등의 공유 활성화를 위한 활동 진행 (현황) 약 30개 프로젝트 진행 플랫폼명 내용 Open Science Framework (기능) 클라우드 기반 연구수행 플랫폼 (특징) 전 세계 연구자 간 협업에 사용 가능한 프로젝트 공개 모드와 개인만 사용 가능한 개인 모드로 구분해 서비스 제공하며, 프로젝트의 용이한 관리를 위한 대시보드 제공 (현황) 드롭박스, 아마존 S3, 구글 드라이브 등 툴과 서비스 연결 프로젝트명 내용 CERN (기능) 세계 최대 입자 물리학 연구소로, 입자 가속기 등을 활용해 고에너지 물리 학 연구 수행

(특징) CERN의 연구결과 공유를 위한 Open Data Portal 운영

(29)

Open Science 국제 동향 분석

23

Ⅳ. Open Science 활성화를 위한 정책적 제언

1. Open Science 국제 동향 소결

▢ 국가별 특징

◦ (EU) 범유럽 차원에서 Open Science 정책을 적극 추진

- 글로벌 시장에서의 유럽의 경쟁력 제고를 목적으로 Open Science 거버넌스를 구축하 고 Open Science 관련 인프라, 기술, 서비스에 관한 다양한 정책을 체계적으로 추진 - Horizon 2020가 Open Science 관련 정책을 시범 적용해 보는 일종의 모델로 활용 ◦ (미국) 오바마 정부의 Project Open Data 정책의 중요성

- Open Access 법률 입안을 둘러싼 고등교육기관, 도서관 단체, 소비자단체, 출판사 단체 간의 격렬한 찬반 논쟁으로 Open Science 법률 수립 실패

- 2013년 오바마 정부의 Project Open Data 정책을 통해 연방정부 산하 연구지원기관 의 Open Science 정책 수립 확대

◦ (아시아) 일본, 한국 등은 최근 Open Science 정책 추진 논의 시작

- 미국, EU에 비해 다소 뒤늦게 Open Science에 관심을 갖기 시작했고, 관련 논의는 대체로 Open Access를 중심으로 진행

▢ 향후 전망

◦ 국가 차원의 Open Science 의무화 조항 도입 확대

(30)

2. 국내 Open Science 활성화를 위한 정책적 제언

▢ 정책 및 연구 지원기관

◦ 보다 많은 과학 연구 분야의 개방, 공유, 협업을 위해 Open Science에 관한 법률, 자 원 관리 정책 추진

◦ 체계적인 Open Science 정책 운영을 위한 Open Science 정책 모니터링 및 중장기 로드맵 수립

◦ 보다 많은 사람들의 Open Science 참여를 위한 인센티브 지원 계획 마련 ◦ Open Science 및 디지털 툴에 관한 새로운 프로그램 개발

(31)

Open Science 국제 동향 분석

25

< 참고문헌 >

단행본/보고서

Beagrie, Neil & Houghton, John (2016), The Vlues and Impact of the European Bioinformatics Institute, EMBL-EBI

COAR (2015), Promotion Open Knowledge and Open Science Report of the Current State of Repositories

EU (2016), All European scientific articles to be freely accessible by 2020

EC (2016), European Cloud Initiative to give Europe a global lead in the data-driven economy

EC (2016), European Open Science Agenda

EC (2016), Guidelines on Open Access to Scientific Publication and Research Data in Horizon 2020

EC (2016), Open Innovation, Open Science, Open th the World: A Vision for Europe. in Horizon 2020

EC (2015), Science Ecosystem 2.0: How Will Change Occur?

NSF (2015), NSF'S Public Access Plan: Today's Data, Tomorrow's Discoveries OECD (2015), Making Open Science a Reality

OSTP (2013), Increasing Access to the Results of Federally Funded Scientific Research Picarra, M. (2015), Open Access in the UK: Briefing on the UK Open Access Case Study, PASTEUR4OA

Prem, E. et al. (2016), Open Digital Science, eutema Gmb

Salmi, Jamil (2015), Study on Open Science: Impact, Implication and Policy Option, EC Science Europe (2015), Science Europe Principles on Open Access to Research Publication 논문

안형준 (2016), 데이터 공개에서 열린 지식으로: 2016년 미국 정부의 자료공개 정책(Open Data Policy), 과학기술정책, Vol. 26, No. 2, pp. 4-7, 과학기술정책연구원

신은정 (2015), 오픈 사이언스(Open Science)에 관한 OECD 논의 동향과 시사점, 동향과 이슈, Vol. 22, STEPI

한국정보화진흥원 (2013), 오픈 데이터 플랫폼과 국가 데이터 전략방향, IT & Future Strategy, Vol. 16

Friesile, S. et al. (2015), Opening Science: Towards an Agenda of Open Science in Academia and Industry, The Journal of Technology Transfer August 2015, Volume 40, Issue 4, pp 581– 601

(32)
(33)
(34)
(35)
(36)
(37)

Open Science 관점에서 연구수행 프로세스에 대한 분석

31

Ⅱ. 연구수행 프로세스 분석

1. 천체물리분야: 라이고과학협력단의 중력파 검출 실험

▢ 연구의 목적 ◦ 우주로부터 오는 중력의 파동(중력파)을 검출하기 위해서 지구 상에 검출기를 건설하 여 그 신호를 검출함으로써 중력파가 담고 있는 우주의 정보를 분석하기 위한 실험 및 그 일련의 과학적 미션 ▢ 연구의 특징 ◦ 4킬로미터에 달하는 세계 최대 규모의 장거리 레이저 간섭계 중력파 검출기인 라이고 (LIGO, Laser Interferometer Gravitaional-wave Observatory)에서 나오는 데이터를 분석

- 대규모 데이터 저장 및 분석을 위하여 국제적으로 16개국, 60개 기관, 900여 명 연 구진 참여하는 라이고과학협력단(LIGO Scientific Collaboration, LSC)이 국제공동연 구를 진행하며 LDG(LIGO Data Grid) 컴퓨팅 인프라를 사용

< 그림 1 > 중력파 관측데이터의 분석 과정 가시화

출처: Observation of Gravitational Waves from a Binary Black Hole Merger (2016)

▢ 연구수행 프로세스

◦ 라이고 데이터의 수집 및 저장: 관측시설(중력파 검출기)에서 중력파 검출기 데이터 및 보조채널 데이터 생성

(38)

◦ 온라인 분석 - 간단한 파형예측모형으로 빠른 시간 안(수초~수분)에 중력파 존재 검사 ◦ 중력파가 존재할 가능성이 있는 데이터를 GraceDB에 저장 ◦ 오프라인 분석 - 온라인 분석에서 중력파가 존재할 것으로 예측되는 데이터를 정밀도를 높여 분석. 오 프라인 1단계는 1주일 단위로 데이터를 모아서 파원의 위치, 파원에 관련된 천체의 질 량, 거리 등을 추정. 수 시간에서 수일 소요 - 2단계는 1단계에서 분석 후 중력파가 있는 것으로 확인되면 중력파가 존재하는 시각의 데이터를 활용하여 중력파에 관련된 모든 물리량을 정밀하게 추정 - 이러한 정밀계산을 위해서는 대규모 클러스터 컴퓨터 자원을 이용하여도 수주에서 수개월이 소요 < 그림 2 > 중력파 검출 실험 연구수행 프로세스

2. 고에너지 물리분야: 스위스 CERN의 ALICE 실험

▢ 연구목적

◦ 스위스 CERN의 LHC(Large Hadron Collider) 입자가속기를 이용한 양성자-양성자, 납-납 이온의 충돌 실험을 통해 초고온 고밀도 환경에서의 강한 상호작용의 특성을 탐구하여 빅뱅 직후의 상황을 재현함으로써 우주의 진화를 이해하는 연구

▢ 연구의 특징

(39)
(40)

3. 나노물리분야: 나노소재 탐색실험

▢ 연구의 목적 ◦ 나노소재를 구성하는 다양한 요소들을 결합하는 시뮬레이션을 통해 요구되는 특성을 예측하여 관련 후보물질들을 발굴 - 나노스케일에서는 소재에 분포된 원자들의 분포형태, 모양에 따라 소재의 특성(예: 전기적 특성)에 변화 발생 < 그림 5 > 원자 입자의 분포 모양에 따른 전류 흐름이 상이

출처: Enhancing semiconductor device performance using ordered dopant arrays (2005)

- 단일 물질이라도 모양과 크기에 따라 그 성질이 변화. 즉 단일 물질도 구조 및 크기에 따른 전자의 상태 밀도 변화가 발생

< 그림 6 > 단일 물질의 구조/크기에 따른 전자의 상태 밀도 변화

(41)
(42)

4. 바이오분야: 유전체 변이탐색 실험

▢ 연구의 목적

◦ 정상적인 유전체와 특정 질병이 발현된 유전체를 비교하여 어떤 유전체의 변이가 특정 질병에 영향을 미치는지 탐색하는 연구

▢ 연구의 특징

◦ (Open Source 기반) 분석도구(Tool)은 대부분 Open Source을 사용

(43)

Open Science 관점에서 연구수행 프로세스에 대한 분석

37

◦ 원시데이터(Raw data) 확보: 시퀀싱에서 얻은 DNA의 염기서열 단위데이터의 총합 ◦ 원시 데이터 QC 수행: 확보된 염기서열의 상태 검사 < 그림 9 > 일반적인 전체 유전체 시퀀싱 절차 출처: 차세대 비교유전체 연구를 위한 생물정보학의 도전 (2014) ◦ 염기서열 정렬4)분석 수행: 무작위로 얻어진 염기서열 단위데이터를 정렬 < 그림 10 > 유전체 어셈블리 절차 출처: 차세대 비교유전체 연구를 위한 생물정보학의 도전 (2014) ◦ 정렬된 염기 서열 데이터 후처리: 통계기법 등을 통하여 염기서열 정렬을 보정 및 확정

(44)
(45)

Open Science 관점에서 연구수행 프로세스에 대한 분석

39

5. 전산유체역학(Computational Fluid Dynamic)

(46)
(47)

Open Science 관점에서 연구수행 프로세스에 대한 분석

41

▢ 연구 프로세스

◦ 미국 국립환경예보센터(National Centers for Environmental Prediction, NCEP)에서 생산된 전 지구 예측 모델(Global Forecast System) 결과파일과 해수면온도(Sea Surface Temperature, SST) 자료를 다운

◦ WPS(WRF Preprocessing System) 수행: NCEP에서 받은 자료를 WRF에서 사용할 수 있도록 전처리 수행

◦ WRF(Weather Research & Forecasting) 모델 수행

(48)
(49)
(50)
(51)
(52)

· 예) 전산유체분야

(53)

Open Science 관점에서 연구수행 프로세스에 대한 분석

47

< 참고문헌 >

단행본/보고서 국가과학기술자문회의 (2004), 계산과학공학의 육성방안 연구 중력파, 아인슈타인의 마지막 선물 (2016) 한국과학기술정보연구원 (2015), 정보인프라정책연구 제2권 1호 한국과학기술정보연구원 (2015), 정보인프라정책연구 제2권 3호 한국과학기술정보연구원 (2015), Future Intelligence 제3호 한국과학기술정보연구원 (2015), Future Intelligence 제4호 한국과학기술정보연구원 (2015), Future Intelligence 제8호 한국연구재단 (2014), 국가 초고성능컴퓨팅 개발 활용 선도 인력양서 기획연구

Princeton University Press (2014), Introduction to Computational Science: Modeling and Simulation for the Sciences (2nd Edition)

PITAC(The President's Information Technology Advisory Committee) (2005), Computational Science: Ensuring America's Competitiveness

논문

김재범 (2014), 차세대 비교유전체 연구를 위한 생물정보학의 도전, 정보과학회지, Vol. 32, No. 3, pp. 9-17

B. P. Abbott et al. (LIGO Scientific Collaboration and Virgo Collaboration) (2016), Observation of Gravitational Waves from a Binary Black Hole Merger, Phys. Rev. Lett., Vol. 116, Iss. 6

Takahiro Shinada, Shintaro Okamoto, Takahiro Kobayashi, Iwao Ohdomari (2005), Enhancing semiconductor device performance using ordered dopant arrays, nature, Vol.437, No.20, pp.1128-1131 기타 서울대학교 자연과학대학 (2004), 자연과학 2004 가을 제 17호 한국과학기술정보연구원 (2009), Supercomputing Vol.37 한국과학기술정보연구원 (2015), Future Intelligence, 제4호 류훈 (2016), 나노소재 정보기반의 차세대 나노소자 설계 사이트 서울대학교 계산과학 협동과정, http://cst.snu.ac.kr 연세대학교 계산과학공학과, http://cse.yonsei.ac.kr

(54)
(55)
(56)
(57)

Open Science를 위한

데이터 센터 발전 방향

조 규 진

1)

/ 윤 희 준

2)

/ 노 서 영

3) Open Science를 위한 데이터 센터 발전 방향

51

Ⅰ. 논의 배경

▢ Open Science 논의의 재등장

◦ 최근 OECD 및 EU 등 국제기구 주도로 Open Science 논의 등장

- Open Science의 기본적인 의의인 과학지식의 개방과 협력은 새로운 개념이 아니며, 지속적으로 논의되었던 개념

- 1940년대 Robert King Merton(1942)은 현대 과학의 주요한 특징으로 과학적 발견의 공동소유, 사회 및 연구커뮤니티 협력의 산출물로서의 과학지식을 제시(OECD, 2015: 10)

(58)
(59)

Open Science를 위한 데이터 센터 발전 방향

53

< 그림 3 > 연구패러다임의 변화

출처: Tansley & Tolle(2009)

▢ 연구의 필요성

◦ Open Science 논의가 Open Data 및 Open Collaboration으로 진화하고 있는 동시 에, 연구 패러다임이 데이터집약형 연구로 전환되는 현시점에서 가장 핵심적인 기능과 역할이 요구되는 데이터 센터에 대한 논의 필요

- Open Science의 개념 및 의의를 OECD 논의를 중심으로 검토하고, Open Science 맥락에서 데이터 센터 역할을 개념적으로 탐색

- Open Science 맥락에서 최근 데이터 센터 동향과 관련하여 미국의 Open Data 정책 과 데이터 센터 동향을 탐색하고, 한국의 기초과학분야 대표 데이터 센터인 KISTI의 글로벌 대용량 실험데이터 허브센터의 기능을 소개

(60)

Ⅱ. Open Science와 데이터 센터

1. Open Science의 개념과 범위

▢ Open Science의 정의

◦ Open Science의 경우 다양한 관점에서 정의될 수 있는데, 기본적으로 연구과정 초기부 터 결과까지 모든 종류의 과학지식이 공개적으로 공유되어야 한다는 철학을 포함 - Open Science를 정책의제로 제안하고, 관련 연구를 주도하고 있는 OECD의 경우 “공

공자금으로 지원된 연구성과 및 연구과정의 데이터를 디지털포맷으로 공개하여 연구커 뮤니티뿐만 아니라 일반 국민도 보다 쉽게 접근하고 활용할 수 있도록 하는 메커니즘” 을 의미 (OECD, 2015)

- 공공자금으로 지원된 연구에서 발생된 데이터와 연구성과에 대해 쉽게 접근하고 활용 할 수 있는 과학 지식 생산체계의 규범으로 개념화

◦ Open Science의 개념은 1940년대부터 지속적으로 논의되어왔으나, OECD를 중심으로 2004년부터 시작되어 2015년에 본격적인 의제로 확장 (STEPI, 2015)

- 1940년대 과학지식의 공공재적인 성격에 대한 논의를 통해 과학지식의 공유 및 협력 등 Open Science 철학이 논의되었으나, 본격적으로 OECD를 중심으로 2004년 공공 연구의 성과에 대한 개발, 연구데이터에 대한 접근성 노력이 시작

- 2006년부터 공공연구 데이터 개방에 관한 지침 개발이 시작되었으며, 2015년에는 “Making Open Science a Reality”보고서를 통해 Open Science 논의를 확장

- 특히, 2015년 OECD 과학기술 장관회의를 통해 Open Science를 핵심의제로 채택 ▢ Open Science의 범위

◦ Open Science는 연구결과 및 데이터에 대한 접근성 향상을 통한 “쉬운 과학 연구” 및 “융합의 활성화를 통한 가치 창출”을 추구하는데, 이를 위한 주요 수단으로 OECD는 Open Access, Open Data, Open Collaboration을 제시

◦ 연구결과에 대한 개방을 의미하는 Open Access에서, Open Data 및 Open Collaboration이 Open Science의 핵심적인 수단으로 부각

(61)

Open Science를 위한 데이터 센터 발전 방향

55

한 개방 및 공유까지 포함

- 또한, 연구과정에서의 개방 및 공유, 이를 통한 연구자 간 협력이 원활하게 이루어질 수 있도록 관련 시스템의 구축, 개방·공유·협력의 주요 수단인 IT 인프라의 호환성까지 Open Science 논의에 포함

< 그림 4 > OECD Open Science 논의 범위

(62)

2. Open Science와 데이터 센터

▢ Open Science에서 데이터의 개방·공유 논의

◦ Open Science 맥락에서 Open Data는 어떠한 제약 없이 누구나 데이터에 대한 접근 성이 보장되어, 재활용이 가능한 것을 의미 ◦ 데이터의 개방·공유를 통해 다양한 측면의 긍정적인 외부효과 기대 - 데이터의 개방·공유를 통한 데이터의 재활용이 가능함에 따라 데이터 수집 및 처리 등 데이터관리 개선이 용이해지며, 데이터관리의 중복비용 발생 방지 - 데이터 개방을 통해 연구의 투명성이 제고되며, 제3자의 동일 데이터에 대한 동일 분 석을 통해 연구과정의 오류 탐색 용이 - 데이터 공유를 통해 연구결과의 과학적인 입증뿐만 아니라 다른 연구목적을 위한 데이 터 재분석으로 One Source Multi Use 가능하며, 대용량 데이터 분석을 위한 연구자 간 협력 가능

- 이외에 데이터의 효용성 제고와 연구과정의 경쟁을 통한 혁신 촉발의 효과 기대 ▢ Open Science를 위한 데이터 센터의 역할

◦ Open Science의 경우 OECD가 중점적으로 추진하고 있는 Open Access, Data, Collaboration 이외에 Open Source, Open Methodology 등이 포함될 수 있는데, 이 는 데이터 센터의 기능과 밀접한 관련

- 앞서 논의한 OECD의 Open Science 이외에 Open Source, Open Peer Review, Open Methodology 등 연구과정의 다양한 활동이 Open Science의 맥락에서 논의 가능

< 그림 5 > Open Science의 다양한 맥락

출처: Stępińska-Ustasiak(2015: 6)의 그림

(63)

Open Science를 위한 데이터 센터 발전 방향

57

- 기본적으로 데이터의 개방 및 공유를 비롯하여, 이를 위한 IT 하드웨어 및 소프트웨어 의 코드 공개, 데이터 분석 플랫폼과 관련된 분석방법 및 연구방법론 공개 등의 경우 데이터 센터의 핵심적인 역할 및 기능과 밀접하게 관련 ◦ 데이터의 개방·공유, 이를 통한 협력에 있어서 데이터 센터 인프라가 핵심적인 역할과 기능 수행

(64)

Ⅲ. 국내외 Open Science 관련 데이터 센터 동향 및 사례

1. 미국 데이터 센터 최신동향

▢ 미국 정부의 Open Data Policy

◦ 미국의 경우 오바마 행정부 출범 이후 지속적으로 데이터의 개방 및 공유를 촉진하는 정책을 추진4) - 오바마 행정부 출범 이후 연방정부가 지원하는 연구개발의 성과 및 결과를 디지털 포 맷으로 개방하여, 연구자를 비롯한 일반 국민까지 쉽게 접근할 수 있는 정책 추진 - 이에 연방정부의 각 기관이 연구개발을 지원함에 있어서 데이터의 관리와 공유에 있어 서 다음의 기본 원리를 준수할 것을 요구  1단계: 오픈 라이센스를 활용해 웹에 데이터 공개  연방정부의 지원을 받은 과학연구의 자료는 국가 재산  과학연구 데이터의 관리 및 보존은 정부의 책임  과학연구의 디지털자료의 보존과 관리를 위해 자료의 생애주기에 따른 접근 필요  과학연구 자료를 디지털 포맷으로 변환하는데 있어서 각 기관의 적극적인 노력 요구

- 2013년 발표된 Project Open Data에서는 연방정부의 연구개발과제에 지원하는 경우 연구계획서에 연구결과 및 연구자료의 공개 및 관리에 있어서 구체적인 계획을 포함하 도록 요구 ◦ 2016년 미국 백악관 과학기술정책국(OSTP)는 데이터 개방과 관련된 새로운 정책 방향 제시5) - 오바마 행정부의 데이터 개방·공유 정책에도 불구하고, 개방된 데이터가 매우 다양하 고, 방대함에 따라 실질적으로 활용이 제한되는 문제, 데이터베이스 및 데이터 활용 플 랫폼이 사용자 중심으로 설계되지 않은 문제가 제기 (STEPI, 2016) - 이에 2016년의 새로운 정책방향은 데이터 개방을 넘어 데이터의 재활용이 쉽게 가능 하도록 하는데 초점을 두어, 데이터에 대한 접근성 향상, 데이터 활용을 위한 사용자 친화적 플랫폼 구축 및 데이터 활용지침 제공 등을 추진 ▢ 미국 연방정부의 데이터 센터 통합 추진 ◦ 미국의 경우 연방정부 차원에서 데이터 센터의 중복 투자 방지 및 효율성 제고를 위해 통합 데이터 센터 방향 추진 (GAO, 2011) - 미국 정부는 연방기관에서 산발적으로 운영하는 데이터 센터의 유휴 인프라(컴퓨팅서 버 및 스토리지)의 낭비를 줄이고, 데이터 센터의 효율화를 위해 연방 데이터 센터 통 4) The White House(2009), Presidential Memorandum on “Transparency and Open Government”, Memorandum for the Heads of

Executive Departments and Agencies

(65)

Open Science를 위한 데이터 센터 발전 방향

59

합 계획(Federal Data Center Consolidation Initiative)을 2011년부터 추진

- 데이터 센터의 통합을 통해 그린 IT 및 그린 데이터 센터 추진, 데이터 센터의 인프라 투자비용 절감, 전반적인 데이터 센터 보안 강화 등 달성 기대 - 또한, 절감되는 투자비용의 경우 인프라 하드웨어에 대한 투자에서 효율적인 컴퓨팅 플랫폼 및 데이터 센터 기술에 대한 투자로의 전환 추진 - 2015년 기준, 연방기관의 산발적인 데이터 센터 3,125개를 통폐합하여, 10,584개의 데 이터 센터가 운영되고 있으며, 이를 2019년까지 5,203개로 통합할 계획 (GAO, 2016) ▢ 대용량 데이터 허브센터 구축 계획6) ◦ 대용량 데이터의 효율적이고 효과적인 공유 및 활용을 위해 과학분야별 대용량 데이터 허브를 통합적으로 구축할 계획 발표 - 2015년 미국 국가과학재단(NSF)는 산발적으로 존재하는 대용량 데이터를 효과적으로 수집하고, 관리 및 분석하기 위해 통합적인 대용량 데이터 허브 구축을 추진

- 대용량 데이터 연구개발 계획(Big Data R&D Initiative)의 일환으로 5백만 달러를 투자하여, 4개의 대용량 데이터 지역 혁신 허브(Big Data Regional Innovation Hub) 구축, 대용량 데이터 허브 구축에는 대학, 재단, 연구기관 및 기업 등 250여 개 기관 이 참여

◦ 과학분야별 4개의 대용량 데이터 허브센터

- South Hub: 미국 남부 16개 주 및 D.C. 지역을 포함하며, 조지아 공대(Georgia Institute of Technology)와 노스캐롤라이나 대학(University of North Carolina)이 공동으로 운영 및 조정

 분야: 보건의료, 해안재난, 산업 데이터, 재료 및 제조, 생물서식지 데이터

- Northeast Hub: 북동부 9개 주를 담당하며, 콜롬비아 대학(Columbia University)에 의해 운영 및 조정

 분야: 에너지, 금융, 교육 관련 데이터과학, 기후 및 환경

- Midwest Hub: 중서부 12개 주를 담당하며, 일리노이대학교(University of Illinois at Urbana-Champaign)에 의해 운영 및 조정

 분야: 농업, 수자원, 스마트시티

- West Hub: 알래스카와 하와이를 포함한 서부 13개 주를 포함하며, UC San Diego, UC Berkeley, 워싱턴 대학(University of Washington)에 의해 공동운영 및 조정

 분야: 대용량 데이터 기술, 데이터 집약형 과학적 발견, 천연자원, 자연재해, 개인 맞춤형 의료

(66)

< 그림 6 > 분야별 대용량 데이터 허브센터의 4개 지역

출처: https://www.whitehouse.gov/blog/2015/11/04/big-announcements-big-data

2. 한국 과학기술분야 데이터 센터 사례: KISTI-GSDC

▢ KISTI 글로벌대용량실험데이터허브센터(Global Science experimental Data hub Center: GSDC) 개요

◦ 국내 유일의 기초과학 분야 대용량 실험데이터 센터

◦ 세계 주요 대형입자가속기(CERN7), KEK8)) 및 거대 관측 장비(LIGO9)) 등 대형연

구시설에서 생산되는 대용량 실험데이터를 국내 기초과학 연구자들이 활용할 수 있도 록 데이터분석환경을 구축하여 서비스하는 기초과학 분야 데이터 센터

◦ 입자물리 분야, 천제물리, 유전체 등 6개 기초과학 분야의 데이터 센터 기능 수행 - CERN 가속기를 활용한 ALICE, CMS 실험, 일본 KEK 가속기를 활용하는 Belle 실험,

LIGO의 중력파검출, 중성미자검출(RENO), 개인별 맞춤의료를 위한 유전체 분야 데이 터 등 6개 분야의 데이터의 저장 및 분석 지원

- 향후 사회문제 해결형 연구개발 관련 데이터(재난재해 데이터), 전자현미경 데이터(구 조생물학 분야) 등으로 지원분야 확대를 통해 통합데이터 센터로 성장 추진

7) CERN(Conseil Europe en pour la Recherche Nucleaire, 유럽핵입자물리연구소) 8) KEK(Kō Enerugī Kasokuki Kenkyū Kikō, 일본 고에너지가속기연구소)

(67)

Open Science를 위한 데이터 센터 발전 방향

61

< 그림 7 > KISTI GSDC 지원 실험분야 ▢ KISTI-GSDC 최상위데이터 센터(Tier-1) 인증 ◦ CERN 가속기 실험의 경우 Tier 구조를 통해 전 세계의 데이터 센터를 연결하여 데이 터의 저장, 공유, 분석 ◦ CERN 가속기의 경우 대용량의 실험데이터가 생산됨에 따라(30 페타바이트/년) 단일 국가, 단일 기관의 컴퓨팅자원 및 스토리지로 데이터의 관리 및 분석이 불가능

※ WLCG: Worldwide LHC Computing Grid

(68)
(69)
(70)

Ⅳ. Open Science 활성화를 위한 한국형 데이터 센터 구축 전략

1. 과학기술분야 한국형 통합데이터 센터 및 데이터분석 통합 플랫폼 구축 전략

▢ 한국형 데이터 센터의 필요성 ◦ 과학기술분야의 경우 선진국에 비해 연구자 규모와 연구개발예산 규모가 상대적으로 낮 아 경쟁력 확보에 한계가 존재 - 과학기술분야의 경우 한국은 OECD 선진국에 비해 연구인력 규모가 작음 ※ 2012년 기준 노동연령인구(25세-64세) 천 명당 과학기술분야 박사학위자의 경우 스 위스(27.5명) 오스트리아(15.8명), 미국(14.0명), 스웨덴(13.6명), 독일(12.9명) 등 선진 국에 비해 한국은 6.9명으로 상대적으로 매우 낮은 수준 < 그림 9 > OECD 국가 과학기술분야 박사학위자 규모 비교 출처: KISTEP(2015: 8) 그림을 재구성 - 기초과학분야 예산의 경우에도 실질적인 연구개발규모가 선진국에 비해 낮은 수준 ※ 2014년 기준 기초과학분야 연구개발예산의 경우 미국 약 35조 원, 독일 약 8조 원인 반면, 한국은 4.5조 원에 머물고 있으며, 이 중 연구기관지원 및 국립대학교원 인건 비를 제외한 순수 기초과학 연구개발예산은 2조 원에 불과 (국회 예산정책처, 2016) ◦ 한국형 데이터 센터의 경우 한국의 ICT 인프라 강점 및 IT 인프라 서비스 기관을 적극 적으로 활용하는 전략 필요 - 인력 및 예산규모의 경우 경쟁력을 갖출 수 없으나, 한국의 강점인 ICT 인프라와 IT 인프라 서비스를 중심으로 하는 연구기관을 활용하는 독자적인 한국형 데이터 센터 모 델 수립 필요

- Open Data의 경우 IT가 핵심수단이 되는 만큼, IT 인프라를 활용하는 한국형 데이터 센터 모델이 경쟁력을 갖출 수 있음

▢ 한국형 통합데이터 센터 구축 전략

(71)

Open Science를 위한 데이터 센터 발전 방향

65

- 데이터 센터의 경우 IT 기반의 인프라 서비스를 중심으로 하는 바, 서비스통합 논리 적용 가능

- 서비스 통합의 전략으로 고객 중심 통합, 프로그램 중심 통합, 정책 중심 통합 등의 통 합전략이 고려될 수 있으며(Kagan & Neville, 1993), 이는 다시 시스템 기반의 접근, 기관 중심 접근, 고객 중심 접근으로도 전략 유형이 가능(King & Meyer, 2005)

(72)
(73)
(74)

 연구커뮤니티 중심의 데이터 생성 및 등록  연구자 스스로 데이터 등록을 위해 D-UUID10) 생성 등록  영구 보존형 실험 데이터(타 커뮤니티 활용) DOI 부여  일반 사용자는 Web을 통해 DOI가 부여된 데이터 검색 및 활용  일반적인 논문, 성과보고서 를 포함하는 학술문헌 정보 포괄  기존 연구성과물 시스템과 연계 < 그림 12 > 데이터분석 통합 플랫폼

참조

관련 문서

Animating View s (via their ViewModifier s which can implement the Animatable protocol) Transitions (animating the appearance/disappearance of View s by specifying

96) Bundesministerium für Wirtschaft und Energie (BMWE), Energieeffizienzstrategie Gebäude - Wege zu einem nahezu klimaneutralen Gebäudebestand, 2015, S.. Otto,

Target sites for miR-15a, miR-16, and miR-223 in the IKKα 3′ UTR each contributed to the regulation of IKKα protein expression, but did not effect IKKβ or IKKγ expression

Exogenous rCCL3 improves phagocytosis and killing by macrophages from TNF −/− mice The finding that CCL3 gene expression was augmented in macrophages from WT and TNF −/−

Notably, Ser729 phosphorylation on PKCε, an indicator of active PKCε, decreases following overnight treatment with ETO or with PKCε-i (Figure 3D), suggesting that the effect of

Council Decision (CFSP) 2015/1837 of 12 October 2015 on Union s upport for the activities of the Preparatory Commission of the Com prehensive Nuclear-Test-Ban

L69-1 Customs Commission Delegated Regulation (EU) 2016/341 of 17 December 2015 s upplementing Regulation (EU) No 952/2013 of the European Parliament and of the Council

“Well it‟s a it‟s a it‟s a place and it‟s a g-girl and a boy + and the-they‟ve got obviously something which is made some made made made well it‟s just beginning to go