• 검색 결과가 없습니다.

Open Science 정책연구 제3권 제2호

N/A
N/A
Protected

Academic year: 2021

Share "Open Science 정책연구 제3권 제2호"

Copied!
114
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

발간사

2016년 새해 벽두부터 아인슈타인이 예측하였던 중력파를 100년만에 발견하였다는 소식으로 전세계가 들썩였습니다. 그리고 이러한 중력파 발견을 발표한 논문에 1,000여명의 저자의 수가 세간의 화제였습니다. 이는 인류사에 남을 커다란 과학적 발견을 위해 수많은 과학자들이 협력하고 노력하고 있음을 대중에게 각인시키는 큰 계기가 되었습니다. 최근 이루어낸 중요한 과학적 성과들은 주로 거대 실험시설에 생산되는 대규모 데이터와 이를 분석할 수 있는 컴퓨팅 및 네트워크 인프라, 그리고 국경을 뛰어넘는 연구자들 간의 협력에 의해 이루어낸 결과입니다. 이런 개방과 협력이라는 과학기술의 패러다임 전환을 간결하고 함축적으로 나타낸 키워드가 Open Science라고 할 수 있겠습니다. 특히 2015년 한국에서 개최된 OECD 과학기술정상회담을 기점으로 국내에서도 Open Science에 대한 관심이 증대되고 있습니다. 현재 국내에서 Open Science에 대해서 다양한 논의가 진행되고 있으나, 아직까지는 전반적으로 연구 활동이 미진한 상태입니다. 이에 슈퍼컴퓨팅, 네트워크 및 대용량 데이터 인프라 등 세계 최고 수준의 과학기술 R&D 인프라를 기반으로 연구자의 개방형 연구 활동을 지원하기 위한 IT융합형 연구서비스를 제공하는 한국과학기술정보연구원(KISTI)은 국내 과학기술계에 Open Science에 대한 정보를 제공하고 관련연구를 활성화시키기 위해 ‘Open Science 정책연구’를 발간하게 되었습니다. ‘Open Science 정책연구’는 KISTI 내부뿐만 아니라 외부 과학기술자들의 연구결과를 공유하여 현재 과학계를 움직이는 연구개발 패러다임을 이해하고 향후의 방향성을 제시하는데 가치있게 활용될 것입니다.

앞으로도 KISTI는 Open Science 전문기관으로써 맡은 바 소임을 다하여 우리나라 과학기술의 길잡이가 되도록 하겠습니다. 끝으로, ‘KISTI Open Science 정책연구지’ 발간을 위해 노력해주신 모든 분들께 노고의 위로의 말씀을 전하며 이로써 발간의 글을 대신하고자 합니다.

2016년 12월

(2)
(3)
(4)
(5)

이형진

Ⅰ. 서론

Ⅱ. Open Science

Ⅲ. KISTI Open Science 전략

Ⅳ. 결론

(6)
(7)

KISTI Open Science 추진 전략

이 형 진

1)

KISTI Open Science 추진 전략

03

(8)

04

- 네이처지의 집계에 의하면 1960~2010년 분야별 협업 연구(논문) 공동 저자 수가 지속 적으로 증가하여 물리학분야 2.2명에서 19명, 화학분야 2.4명에서 5.1명으로 공저자 수가 획기적으로 증가하고 있음 ▢ R&D 패러다임의 변화 ◦ 초대형 실험장비의 방대한 데이터 분석을 통해 자연현상을 기술하는 과학연구 패러다임 부상 - 데이터 기반 과학은 컴퓨터를 활용한 알고리즘 시뮬레이션, 과학실험의 발전을 촉진 ◦ 대형 시설장비와 데이터를 활용한 연구방법 확산 및 디지털 기술과 새로운 협업 도구를 활용한 연구 개방과 협력에 대한 중요성 강조 - 초대형 입자가속기, 천체 망원경 등 새로운 장치와 데이터 수집장치에 활용되는 디지 털 기술 및 분석 도구는 데이터 수집의 규모의 확장, 분석 시간의 단축, 과학의 새로운 발전의 도구로 활용 ◦ IT 융합연구 환경에서 성공적인 과학연구를 수행하는데 필요한 연구 프로세스 변화 - 고품질 클라우드 기반 오픈 소스를 활용한 사회 문제 해결 필요 ▢ 연구성과물의 개방과 자유로운 접근 ◦ 공적 자금으로 지원된 연구 결과물을 디지털화해 과학자, 산업체, 일반 대중이 자료를 공유하여 협력과 혁신을 장려 - 연구성과물의 개방은 다음과 같은 이유 때문임 • 첫째, 과학이 갈수록 데이터 중심이고 비싸져서 종종 행정, 법적 그리고 privacy 규제 를 받기 때문 • 둘째, 과학 정보에 접근하기 위해서는 적합한 정보통신인프라가 요구되게 됨 • 셋째, 대학에 특허 인센티브 제공함에 따라 연구자의 데이터 공유의 인센티브가 떨어 지기 때문 • 넷째, 과학 출판사들이 웹 바탕으로 한 정보 접근이 어려워지기 때문임2) ▢ 글로벌 어젠더로 급부상 ◦ 2004년 OECD 과학기술장관 회의에서 “공적자금이 투입된 연구 데이터의 접근에 관한 선언”(Declaration on Access to Research Data from Public Funding" 채택 - 2015년 대전에서 개최된 OECD 과학기술정상회담에서 Open Science가 핵심 의제로

등장

(9)

KISTI Open Science 추진 전략

05

- EU에서는 2014년 Horizon 2020 프로젝트를 중심으로 Open Science 촉진을 위한 프로그램 및 정책 추진

- UNESCO 등의 국제기구 및 개별 국가 차원에서 Open Science 활성화를 위한 다양한 프로그램 개발 ◦ 디지털 기술의 급속한 발전은 개방형 과학(Open Science), 개방형 혁신, 과학의 대중화 에 기여했음을 확인하고, 차세대 생산혁명의 가능성에 주목 - 공적 자금이 투입된 연구결과(출판물, 데이터 등)를 디지털화 해 공개함으로써 연구성 과‧과정에 대한 후속 검증 및 추가 연구, 다양한 연구 협력 네트워크로 새로운 연구방 법 개발에 활용할 수 있는 개방형 과학이라고 정의 - 디지털 시대에 있어 과학기술계의 공유경제로 연구시설과 자금이 부족한 어떤 연구자 라도 보다 쉽게 연구자원에 접근하고 활용할 수 있도록 하여 새로운 가치를 창출하는 연구개발의 새로운 패러다임으로 자리매김

2. KISTI 전략으로서 Open Science

가. 국내 Open Science 체제의 구축

(10)

06

◦ 개방·공유·소통·협력의 가치를 바탕으로 하는 연구개발 패러다임 전환을 위한 정책 연구 - 컴퓨팅 및 데이터 중심형 R&D 수행의 패러다임 이동의 동향분석을 통해 Open Science 개념의 정립 및 범위의 설정 - 불가능한 연구를 가능하게 하고 기존 연구의 생산성을 극대화 시킬 수 있는 IT 융합형 연구개발 체제의 구상 방향 제시

◦ 연구개발 패러다임 변화를 반영, KISTI의 개방협력형 Open Science 연구 플랫폼 정책 방향을 지원하기 위한 KISTI 중장기 발전 전략 수립 기초 자료 제공

- Open Science 연구 플랫폼 정책에 부합하는 KISTI 기관 발전의 방향과 2020년경의 위상 설정

- KISTI 출범 후 추진해온 개방형연구지원 사업을 종합․정리하는데 도움이 되고, 새로운 패러다임에 부합한 연구사업 체제의 방향 제시

(11)

KISTI Open Science 추진 전략

07

Ⅱ. Open Science

1. Open Science 개념

가. Open Science의 정의

▢ 오픈 액세스에서 시작된 Open Science ◦ 학술논문의 자유로운 이용에 관한 2002년 부다페스트 오픈 액세스 이니셔티브(Budapest Open Access Initiatives)를 기점으로 Open Science에 대한 국제 논의 시도

◦ 부다페스트 오픈 액세스 이니셔티브는 단순히 출판, 데이터가 아닌 모든 연구 생산물의 재활용까지도 포괄함으로써 Open Science의 활동 영역을 넓히는 데에 기여 ◦ 최근 연구자의 관심이 ‘가능한 빨리 출판’에서 ‘가능한 초기부터 지식 공유’로 변화하면 서, Open Science는 변화되고 있는 과학활동을 포괄하는 개념으로 전환 ▢ 현재의 Open Science ◦ Open Science 개념은 과학연구 수행방식, 연구협업, 지식의 공유 및 과학의 조직방 식 등의 변화에 따라 진화․발전 - Open Science에 대한 사회적 관심을 촉발하는 데에 큰 역할을 한 마이클 닐슨 (Michael Nielson)은 『발견의 재발명(Reinventing Discovery: The New Era Networked Science)』(2012)에서 Open Science를 “발견과정 초기부터 가능한 모든 과학지식이 공개적으로 공유되는 것”으로 규정

- Open Science를 국제적 이슈로 부각시키고 관련 논의를 확장시킨 OECD에서는 Open Science를 ICT 툴과 플랫폼을 통해 많은 공적 연구 데이터에 쉽게 접근해서 이 를 활용한 연구, 과학에서의 광범위한 협력연구, 연구결과 확산에 새로운 저작권 툴을 활용 등으로 정의

(12)

08

나. Open Science의 유사 개념

◦ Open Science의 유사개념에는 Cyberscience, e-Science, Science 2.0, Digital Science 등이 존재 - Cyberscience는 과거에는 불가능했거나 구현하기 어려운 복잡한 문제를 가상실험실 (virtual laboratory)을 통해 탐구하여 기존의 이론과 실험을 발전시키는 새로운 연구방법 - e-Science는 사이버 공간에서 국내·외에 위치한 연구자, 연구장비, 연구정보 등의 연 구자원을 공동활용하여 수행하는 연구활동 - Science 2.0은 온라인을 매개로 다양한 지역, 분야의 과학자 간의 연구, 기 록, 협업 활동 - Digital Science는 디지털 툴, 네트워크, 미디어를 활용한 연구 수행, 확산, 활용, 변형하는 방법 - Open Science는 데이터 기반의 새로운 과학적 패러다임을 반영하며, 기존의 cyberscience 등의 개념을 포괄하는 광의적 의미

2. Open Science의 구성요소

가. 주요 요소

▢ 오픈 액세스(Open Access, OA)

◦ 인터넷에 접속하는 데에 따른 제약 이외에는 어떤 금전적, 법적, 기술적 장벽도 없이 이용자가 합법적 목적을 달성하기 위해 연구결과물의 읽기, 다운로드, 복제, 배포, 인쇄, 탐색, 연결할 수 있도록 허용하는 것

◦ 오픈 액세스에서 저작권은 저자가 소유하되, 이용과 배포에 아무런 제약이 없어야 하며, 다만 연구결과에 대한 통제권은 저자가 소유하고, 사용자는 연구결과를 인용시 출처 명시 ▢ 오픈 데이터(Open Data, OD)

◦ 저작권, 특허 등의 기술적, 법적 제약없이 데이터에 접근, 활용, 재활용할 수 있는 데이 터의 개방

◦ 출판 이후뿐만 아니라 이전 단계의 정형화된 텍스트 등의 연구자료, 관찰 데이터, 실험 데이터, 컴퓨터 데이터, 레퍼런스 데이터, 연구방법론, 메타 데이터, 연구데이터 등 ◦ 오픈 연구 데이터(Open Research Data, ORD), 오픈 정부 데이터(Open Government

(13)

KISTI Open Science 추진 전략

09

▢ 개방형 협력(Open Collaboration, OC)

◦ 연구데이터, 연구방법론 및 연구인프라, 툴의 공개, 공유, 상호호환을 통한 연구 협업 수행 ◦ 공동의 결과물을 생산할 수 있도록 지원하고 협업의 진입장벽을 낮추고 유연한 연구수 행을 뒷받침할 수 있는 기술을 기반으로 한 협업 플랫폼이 존재 ◦ 종류로는 연구자간 협업, 연구자와 기업간 협업, 연구자와 시민간의 협업 등이 있음 - 연구자와 시민간의 협업은 시티즌 사이언스(citizen science), 크라우드 사이언스

(14)

10

- Open Methodology : 연구에 이용된 방법론 공개

- Open Peer Review : 논문심사의 투명성을 위해 심사자의 리뷰결과 공개 - Open Access : 연구활동의 결과물인 논문에 대한 자유로운 접근 허용 - Open Educational Resources : 학교에서 활용되는 교육 자료의 공유

다. 연구프로세스와 Open Science 요소

◦ 이러한 특성을 R&D프로세스 상에서 구현하여 세분해보면 주로 연구기획과 연구수행적 측면으로 구분되며 연구기획을 위한 Open Access와 연구수행을 위한 Open Collaboration으로 구분되며 이는 상호간에 Open Science Infra.라는 공통점을 갖고 있음

(15)

KISTI Open Science 추진 전략

11

◦ 첫째 관점은 정책적인 면에서의 당위론적인 관점의 성격이 강함. - 공공재로서의 과학은 개방성이 당연한 것이고 지식의 공유와 확산을 통한 새로운 지식 과 가치 창출을 목표로 함. ‘개방’에 대한 초점이 연구개발 결과와 데이터에 놓여 있음. ◦ 둘째 관점은 IT(Information Technology) 패러다임 발전에 따른 과학 연구개발 활동의 디지털화에 따른 연구 개발 패턴의 전환으로 보는 관점임. - 이는 연구개발 프로세스가 개방된 패턴으로 전환하고 있고 디지털화된 연구개발 활동은 협력을 통한 문제 해결과 새로운 지식과 가치를 창출하는 패턴으로 전환 하고 있다는 관점. - 따라서 정책도 협력을 통한 문제 해결과 새로운 지식과 가치를 창출을 목표로 함. ‘개방’에 대한 초점이 연구개발 프로세스에 있음. < 그림 3 > Open Science 유형

나. 새로운 R&D 프로세스와 Open Science

(16)

12

< 그림 4 > 데이터 기반연구개발 패러다임에 의한 새로운 R&D 프로세스

다. Open Science의 주요 대상 범위

◦ Open Science Service에 적합한 사용자는 과학적 지식을 창출하고 개방성을 지닌 R&D특성을 나타내는 그룹이어야 함

- 따라서 Open Science Service의 사용자는 기초 및 응용 연구의 성격을 가지면서 과 학적 지식을 창출하고자 하는 연구자 그룹으로 대학 및 공공연구소가 주요 사용자 임 ◦ 개발영역의 경우 기업의 제품개발과 기술개발의 영역으로 기업이익과 직결되는 연구개

발 활동의 공개에 어려움이 있고 반면 외부에서 생산해낸 실험결과치를 적극적으로 활 용하려하는 등 오픈이노베이션 관점의 R&D활동은 활발히 이루어지고 있음

(17)

KISTI Open Science 추진 전략

13

Ⅲ. KISTI Open Science 전략

1. 현황 분석(SWOT 분석)

가. 현황

◦ Open Science 추진과 관련한 KISTI 내외부의 강점과 약점, 기회와 위협요소를 브레인 스토밍을 통해 도출하여 정리함 ▢ 강점 ◦ KISTI는 지난 20여년간 슈퍼컴퓨터, 대용량스토리지, 초고속네트워크 등 연구개발 e-인 프라를 보유 운영하고 있음 ◦ 과학기술 정보유통체계도 ICT융합형으로 전개하여 국가과학기술 지식정보시스템인 NTIS와 NDSL 등 장기간의 정보서비스 경험과 성과가 축적되어 있음

◦ 2005년부터 e-Science 프로젝트를 수행하여 우리나라 Open Science 체제의 기반을 닦았으며 이후 2010년을 전후하여 GSDC / EDISON사업이 그리고 2015년 부터는 COREEN 등 협업연구, 데이터공유, 협업환경 제공 중 ◦ 출연연 역할 재정립 등의 정책 수요에 대해 기관장 등 주요보직자의 추진의지가 강함 ▢ 약점 ◦ 정보유통 및 슈퍼컴퓨팅, 정보분석 등 주요 부문별 사업추진으로 전사적 관점의 Open Science 추진체제 부재 ◦ 다양한 업무만큼 불특정 다수를 대상으로한 연구개발 서비스 진행으로 핵심고객이 불명 확함 ◦ 프로젝트의 선택과집중 및 일몰체제의 부재로 과거부터 진행해온 서비스가 난립하여 일 관성 있는 연구개발 서비스 체제 구축이 어려움 ◦ KISTI 3대 기능 중심의 기관경영으로 3대 기능을 융합한 단일 기능으로의 Open Science에 대한 내부 구성원들의 공감대 형성 부족 ▢ 기회 ◦ 데이터 기반의 R&D 패러다임으로의 전환기로 대형연구시설에서 산출되는 대용량의 데 이터가 세계 각국으로 분산되어 처리되는 등 데이터 관련 과학의 대두되고 있음

(18)

14

◦ 미래부의 데이터 개방 및 활용을 위한 관련정책 추진하여 NTIS 8대 성과물로서의 실험 데이터 지정 등 Open Data 관련 필요성을 제기하고 있음 ◦ 국내 연구자들을 위한 데이터 개방 관리 활용에 관한 특화된 서비스 부재하여 KISTI의 서비스가 각광을 받고있는 상황 ▢ 위협

◦ 국내 연구자들의 Open Science 인식 및 수용의지 부족하여 소소한 IT인프라만이 적용 되는 연구나 과거의 실험과 관찰 중심의 연구가 진행되고 있는 형편임 ◦ 물리, 화학, 바이오, 의학 분야에서는 연구개방이 활발하나 전통산업 분야 등은 저조한 상황으로 연구분야별 연구개방에 대한 수준 및 수요 상이하여 선별적 추진이 필요함 ◦ 클라우드 컴퓨팅 이용 증대로 해외 글로벌 기업의 컴퓨팅 인프라 서비스 제공으로 공적 분야의 시장을 위협하고 있는 상황 ◦ 민간 정보서비스의 분야확대 및 질적 고도화와 서비스 체계 고도화로 KISTI의 정보서비 스 품질이 저하되고 있음

나. 전략

▢ SO 전략 : 강점 활용을 통한 기회 확대 ◦ 수요 기반 서비스를 개발하여 자발적 참여의사가 있는 분야를 대상으로한 데이터 공개 와 활용체제를 구축하여 실효성을 높임 ◦ 대형 국가 R&D 사업을 발굴하여 대형연구시설 장비와 이를 통해 생산된 데이터가 처리 될 수 있는 컴퓨팅 환경을 제공하여 국내 수요를 적극적으로 발굴 ◦ 이와함께 글로벌 협업연구 참여하여 해외의 실험 데이터를 국내 연구자들이 활용할 수 있는 체제를 구축하여 실험시설 장비가 없어도 연구할 수 있는 과학기술공유경제체제를 구축함 ▢ ST 전략 : 강점 활용을 통한 위협 극복 ◦ 활용가능성 및 국내 수요 존재에 대한 우려를 Best Practice 발굴을 통해 서비스 모델 을 제시함으로써 다양한 분야에 활용될 수 있도록 추진

◦ 민간영역에서 수행할 수 없는 공적 국가 R&D 사업을 대상으로 Open Science 인프라 를 서비스함으로서 기능의 공공성 강화 추진

▢ WO 전략 : 약점 보안을 통한 기회 활용

(19)

KISTI Open Science 추진 전략

15

플랫폼 기반의 서비스체제 구축

◦ 단편적 서비스를 요구했던 고객 층이 융합된 서비스를 수혜할 수 있도록 타겟고객 특화 서비스 개발 추진

▢ WT 전략 : 약점보완을 통한 위협극복

◦ 국가차원의 Open Science 거버넌스 구축하여 법제 및 정책적으로 KISTI의 주요 미션 으로서의 Open Science 추진

◦ 지속적인 Open Science 수요조사와 환경 예측으로 Open Science 파트너로서의 KISTI 역할 수행

다. 수행전략

▢ 분야별 추진 로드맵 수립 ◦ 주요 데이터 집중연구 분야별 수요 및 예측 조사를 통해 Open Science 잠재고 객 발굴 ◦ Open Science 지원 분야 선정 및 추진로드맵 작성을 통한 단계적 추진 ▢ Open Science 플랫폼 구축∙서비스

◦ 안정적인 인프라 제공을 위한 KISTI Open Science Infra. 융합체제 구축 ◦ 현재 많은 수요가 발생하고 있는 과학데이터 리포지토리 구축 서비스

◦ 고가의 일반 상용 SW 사용으로 인한 연구의 독창성 약화와 비용적 부담을 연구현장과 밀접한 Open Source 기반 분석 S/W 개발 지원으로 창의적 연구개발활동 지원

(20)

16

2. KISTI Open Science 추진전략

가. 방향

▢ KISTI의 위상정립 ◦ (방향) 학술정보를 포함한 특허, 보고서 등 과학기술정보의 검색/유통을 위한 민간 포털 서비스 시장은 이미 매우 커진 상태로 과학기술정보의 단순 제공(유통) 서비스 보다는 「국가 고유 과학기술 콘텐트 특화 서비스(공공 미션)」에 집중할 필요가 있음 - 국가 고유 Data/정보자원 중심의 레포지토리/아카이빙 및 서비스 등 하드웨어적 전문 성과 강점을 활용한 분야를 육성할 필요가 있음 ◦ (임무) 국가 R&D 사업의 효율화와 대형성과 창출을 위한 ICT 협업 전문 연구원 ◦ (대상) 국가 R&D 사업 Project Level 대형시설장비 및 데이터 집약형 연구자

- 계산과학을 수행하는 첨단 과학기술연구자(출연연, 신진 교수, 국가 석학, 공공 연구원) ◦ (역할 1) ICT 융합 R&D 파트너 : Science Gateway, S&T Information 컨설팅, 국가

R&D CIO ◦ (역할 2) 공적기능 수행 강화 : 표준, 인증, 정책수립, 육성, 공공 인프라 구축 등 국가 Agency로서의 기능 ▢ 중점 추진 분야 ◦ 패러다임 선도를 위한 Open Science 체제 확산을 위해 가장 시급한 것은 연구 단위의 디지털화가 필요 - 현재 데이터공개가 되지 않거나 중복실험을 해서 효율성이 떨어지는 문제보다 ICT기반 의 연구 자체가 부족하다는 것이 우리나라 과학기술 발전의 심각한 문제로 연구단위의 디지털화가 출발점 국가 Open Science 체제 구축의 출발점임

- Open Science 수요가 부족한 우리나라로서는 연구현장에서 ICT를 융합한 연구활동을 육성하기 위한 KISTI 교육 육성 프로그램이 활성화 추진

▢ KISTI의 비효율성 제거

◦ KISTI 주요 서비스 현황 조사/분석 결과, 서비스의 Core(본질)는 같으며 다수의 유사/ 중복 개발 업무 진행

◦ KISTI 서비스 플랫폼이 국내 Open Science를 주도/지원하고, 외부 Open Science 관 련 서비스 시스템과 유연하게 연계되어 데이터 주도성과 외부 개방성(글로벌화)을 함께 추구될 수 있도록하는 내부 융합체계 구축이 필요

(21)

KISTI Open Science 추진 전략

17

량 보유 부각

- KISTI 브랜드의 Open Science플랫폼을 구축할 수 있도록 KISTI 23개 주요 서비스, 88개 하위 서비스 내 구성 기술 요소(컴포넌트) 중복 내용을 해소할 필요가 있음 - 현재까지 S/W의 자체 자산화 어려움은 분절된 조직의 핵심역량의 외주 의존성이 커짐

에 따라 통합 서비스 플랫폼으로의 성장 한계점이 노정되어왔음 - 이와 함께 체계화 되지 못한 인프라와 Data Set을 정비해야 함

- KISTI는 다양한 Data set을 다량 보유 중이나, 23개(88개) 서비스별로 각각 DB를 따 로 구축하여 운영하고 있어 통합 검색 및 활용이 어려운 상태

- 향후, 표준화 및 인프라 공유를 통한 통합 작업-서비스 필요

< 그림 6 > KISTI 인프라 융합 및 Open Science 플랫폼 개발

(22)

18

나. KISTI Open Science 구성체계

▢ KISTI 기능 체계화

◦ Data활용 R&D 수행과 기획 분야를 대상으로 KISTI 기능의 재편

◦ 실험 Data를 중심으로 Open Collaboration분야와 Open Data 분야로 구분하고 Open Data의 관점에 Open Access분야를 포함

◦ 분산된 인프라와 데이터 자원의 융합을 바탕으로한 KISTI 정보인프라 서비스체제 가 유기적으로 제공될 수 있도록 Open Science 플랫폼을 구축

◦ KISTI 인프라 서비스를 각 연구분야의 전문가들과 공유할 수 있도록 KISTI 내부의 Science Gateway 역할을 수행하는 ICT 융합 전문가집단을 구성하여 연구분야에 ICT 가 접목하여 협업을 추진할 수 있는 체제를 구축

(23)

KISTI Open Science 추진 전략

19

▢ KISTI 서비스 체계화

◦ 융합된 인프라와 KISTI Open Science 플랫폼을 바탕으로 기존의 KISTI Open Science 체제를 국가R&D 수행자에게 서비스 할 수 있는 체제를 구축함

- 데이터의 개방 수집에서 응용 협업 및 성과창출에 이르는 데이터 활용 전주기 지원 - 대형연구시설 장비 생산데이터의 입수와 개별 연구자의 데이터를 개방 활용 할 수 있

는 체제의 구축

◦ KISTI가 구축 운영하고 있는 NTIS, DoI등의 체제가 슈퍼컴퓨팅 인프라와 대용량데이터 센터의 서비스와 융합하여 국가연구개발사업의 데이터를 종합적으로 입수․개방․관리․활 용할 수 있는 체제를 구축

(24)

20

Ⅳ. 결론

1. 요약

▢ 개방과 환경변화

◦ Open Science는 시대적 흐름이고 새로운 R&D 패러다임을 수용할 수 있는 개념적 체 제임 ◦ 과거 지식의 공유로 새로운 혁신을 이루었던 것처럼 ICT의 융합을 통한 혁신은 Open Science의 핵심적 가치라 할 수 있음 ◦ 이러한 시대적 변혁의 중심에는 대용량의 데이터의 생산과 활용이라는 연구활동의 변화 가 있어 데이터를 잘 다루는 소위 ‘治Data’역량이 필요한 상황임 ▢ 발전 전략으로서의 Open Science ◦ 출연연의 새로운 미션을 요구하고 데이터와 컴퓨팅역량을 R&D 활동에 접목하여 창의적 연구성과 창출 및 연구생산성 강화를 요구하는 정책당국의 수요에 있어 KISTI는 Open Science 전담기관으로 위상을 강화시켜야 할 것임 ◦ 그동안 수행해온 인프라적 강점과 개발역량을 바탕으로 다양한 연구자의 니즈에 협업할 수 있는 ICT 융합 R&D 전문가 집단으로 성장하기 위해 보유 인프라의 및 데이터자원 의 융합은 물론 국가적으로 구축 운영되고 있는 인프라와 데이터 또한 활용 할 수 있는 가상 연동체제를 구축해야함

이와함께 Open Science 저변강화를 위한 단위 연구자들의 ICT화 촉진을 위한 교육 육성 체계의 강화와 법제 및 정책적 선도를 KISTI의 주요역할로 자리매김 해야 함

2. 시사점

(25)

KISTI Open Science 추진 전략

21

◦ 이와함께 그간 축적한 인프라 구축 및 운영과 연구환경 개발의 경험의 장점을 강화하여 Data Scientist로서의 위상으로 전문성을 강화해야 함

◦ 이를 통해 정보/인프라 서비스기관에서 Open Science Enabler로 그리고 R&D Partner로서의 위상으로 발전하여 대형협업 연구성과를 창출하는 단계로 진입할 수 있 을 것임

< 그림 9 > KISTI 발전 방향

▢ 차세대 R&D패러다임 생태계 구축

◦ KISTI는 ICT 융합의 R&D 파트너로서 국가 Open Science 체제 선도를 주요 임션으로 정립

- Open Science 인프라 구축 및 R&D 데이터의 관리 유통 기반 구축을 토대로 이를 위 한 컴퓨팅, 데이터, 네트워크 인프라를 구축 운영함

- 이를 토대로 KISTI Open Science 플랫폼과 Science Gateway를 통해 6T 및 신성장 동력 분야의 계산과학 협업연구를 지원하여 각 도메인별 대형 연구성과 창출을 유도 - 국가 Open Science 체제 구축을 위해 예산, 인력양성, 법제도 및 커뮤니티 육성과 공

(26)

22

< 그림 10 >Open Science 생태계 육성

▢ Open Science Enabler & Data Scientist

◦ 국가 R&D 사업의 IT 융합(Open Science / 계산과학) 전담 Open Science Enabler - 사이버인프라 구축운영, 실험데이터 센터, 계산과학공학 육성, 연구단위의 디지털화 촉

진을 수행

◦ 국가 과학기술 데이터 전담기관의 최고 전문가(Data Scientist)로서 국가 R&D 사업의 전주기에 걸친 ICT 융합 연구 지원

(27)

KISTI Open Science 추진 전략

23

< 참고문헌 >

단행본

EU (2016), All European scientific articles to be freely accessible by 2020 OECD (2015), Making Open Science a Reality

Kuhn, T.S., 1962. The Structure of Scientific Revolutions. University of Chicago Press, Chicago, IL.

신은정 (2015), Open Science(Open Science)에 관한 OECD 논의 동향과 시사점, 동향과 이슈, Vol. 22, STEPI 한선화 외(2011), KISTI 미래발전 방향으로서의 과학데이터 기획 연구 한선화 외(2011), 국가과학데이터 공유 융합체제 구축에 관한 연구 이형진 (2016), 주요국의 초고성능컴퓨터 육성 정책 입법 동향 김봉훈 (2015), 계산과학 융합 국가R&D 동향분석 및 설문조사 장행진 (2008), 사이버 R&D 인프라 구축 활용방안 기획연구 정부통합전산센터 (2012), 2012 정부통합전산센터 백서 EMC (2014), Digital Universe

사이트

https://en.wikipedia.org/wiki/Open_science

(28)
(29)
(30)
(31)

오픈 과학기술 클라우드를 통한 공유형

통합연구개발 인프라 구축 및 운영

-

클라우드에 기반한 협업형 연구개발 지원 체계 구축

김 종 원

1) 오픈 과학기술 클라우드를 통한 공유형 통합연구개발 인프라 구축 및 운영

27

Ⅰ. 서론

▢ ICT 기술 발전에 따른 자원 공유의 활성화

(32)

28

▢ 클라우드 중심의 자원 공유를 활용하는 국가적인 추진 체계 및 생태계 필요

◦ 클라우드를 중심으로 SDN/NFV를 통한 유연한 유/무선 네트워킹을 담당하여 종단에 위치한 IoT 까지 연결을 확대하는 소프트웨어-정의 인프라(Software-Defined Infrastructure: SDI)로의 혁신적인 전환이 전세계적으로 급속하게 진행되고 있음 [R. Jain and P. Subharthi (2013), 김종원 (2015B)].

◦ 다가오는 소프트웨어-중심 개방형 인프라로의 변화는 ICT 융합 도메인들로 과학기술 연구개발과 연결되면서 소위 Scientific IoT-Cloud 와 Industrial IoT-Cloud 형태로 확산되는 추세도 예상됨.

◦ 이를 인프라/플랫폼/서비스의 구조적인 측면에서 한 덩어리로 바라보면, SDI 에 기반한 미래형 인프라가 <그림 1>과 같은 역 피라미드 모습의 쐐기 형태로 자리를 잡으면서 분 수처럼 넓게 퍼지는 다양하고 지능화된 서비스를 창출할 것으로 전망됨.

◦ 따라서 과학기술 분야에 대해서는 국가적 차원에서 오픈소스 중심의 개발운영병행체제 (Development & Operation: DevOps) 자동화 방식을 활용하여 맞춤형으로 개방된 협 력 생태계를 만들어 내는 오픈 과학기술 클라우드 개념에 기반한 인프라/플랫폼/서비스 통합을 통한 혁신을 이끌어 내기 위한 노력을 필요함. ◦ 세부적으로는 통합된 연구개발 공유환경을 인프라/플랫폼 측면에서 효과적으로 구축하 도록 개별 과학기술 분야로 분산되는 산발적인 모습이 아닌 전체적으로 합쳐진 모습으 로 DevOps 자동화 방법론에 따라 조화롭게 구축과 운영을 주도하는 미래형 ICT 중심 의 과학기술 분야 연구개발 공유환경에 대한 추진이 필수적임. ◦ 또한 구축된 연구개발 공유환경의 효과적인 구축/운영과 선순환적으로 발전하는 활용과 개선이 이뤄지는 오픈소스(open-source) 소프트웨어와 자발적인 커뮤니티의 협력에 기 반하는 연구개발 공유환경 생태계가 조성되도록 노력해야 함.

Open Platforms (Tools)

(33)

오픈 과학기술 클라우드를 통한 공유형 통합연구개발 인프라 구축 및 운영

29

II. 과학기술 연구개발 협업을 위한 공유형 인프라 개념

▢ 과학기술 사이버인프라의 개념과 구축과 운용

◦ 최근 정보통신기술(Information and Communications Technology: ICT) 인프라의 구축과 운용의 중심이 하드웨어에서 소프트웨어(Software-Defined) 중심의 소프트웨어 -정의 인프라(Software-Defined Infrastructure: SDI)로 급속하게 전환되고 있음. ◦ 이러한 변화는 국가 R&D 생명주기(lifecycle)를 총괄적으로 지원하는 핵심적인 인프라

(infrastructure) 자원과 플랫폼(platform) 도구로 부각되고 있는 과학기술 사이버인프 라(Cyber Infrastructure)의 구축과 운용에 대해서도 <그림 2>와 같은 구도에서의 혁 신적인 접근을 새롭게 요구함 [NSF ACI].

◦ 미국 NSF(National Science Foundation)의 OCI(Office of CyberInfrastructure)에서 주관하는 과학기술 사이버인프라는 <그림 2>의 좌측 하단과 같이 HPC(High Performance Computing), Data, Networking/Cybersecurity, Software 분야들로 나눠진 인프라 자원과 플랫폼 도구들을 보급하고 확산하면서 Learning/Workforce Development 분야로 구성된 교육과 인력양성을 육성하는 것에 초점이 맞춰짐.

4

-ACI (Advanced Cyber Infrastructure)

(34)

30

▢ 통합된 과학기술 연구개발 공유환경 개념

Control Tower & Access/Visibility Center Provisioning for

Automated R&D

Experiments

Multiple Users Playgrounds for Virtual HPC

Ops

Dev

Virtual BigData Virtual Presence IoT-SDN-Cloud HPC & Data Lake

Provisioning

Portal

Orchestration

Portal

< 그림 3 > 과학기술 연구개발을 위한 클라우드 중심의 놀이터 역할의 Open Science & Technology Cloud 개념

(35)

오픈 과학기술 클라우드를 통한 공유형 통합연구개발 인프라 구축 및 운영

31

◦ 특히 과학기술 연구개발에 필요한 계산/저장/네트워킹을 담당하는 ICT 자원을 융합형 박스 형태의 자원집합에 기반한 통합형 공유환경으로 준비하여 HPC, BigData 및 Presence (영상회의를 포함하는 실감형 원격협업 장비) 기능들을 연구자들이 원하는 대 로 구성하고 제공하려면 제어와 데이터 분리 원칙에 근거해서 자원집합을 자동화된 수 준에서 관제(monitor & control)하는 혁신적인 방법론이 필요함.

▢ 통합된 과학기술 연구개발 공유환경을 위한 세부 요구사항들

◦ 통합된 연구개발 공유환경을 소프트웨어 기반으로 접근하면서 전체 자원집합에서 연구 자가 원하는 과학기술 연구개발 목표에 필요한 기능(function/role)을 충족시킬 수 있 는 자원들을 <그림 3>의 좌측과 같이 Provisioning Portal의 개념을 통하여 선별적으 로 확보하도록 지원해야 함. 단순한 UI(user interface) 차원의 Provisioning을 지원하 는 데 그치는 것이 아니라 Open APIs for Provisioning을 제공하여 연구자의 연구개 발 소프트웨어에 직접적으로 통합하는 것도 가능해야 함.

◦ 상기한 과정을 통해서 선별적으로 확보된 자원들을 과학기술 연구자들이 자유롭게 자신 들이 원하는 기능을 수행시키기 위해 활용하도록 지원하는 도구 측면은 <그림 3>의 우 측과 같이 Orchestration Portal 의 개념을 통해서 지원되어야 하며, Provisioning Portal 과 동일하게 UI 방식과 Open APIs 방식의 모두 지원하는 것이 필요함.

◦ 또한 목표로 하는 과학기술 연구개발과 요구되는 자원들과의 상호/의존 관계를 이해하 는 모델링, 연구개발에 할당되어 활용되는 각종 자원들의 상태를 파악하는 가시성을 담 당하는 모니터링, 그리고 모델링/모니터링 정보를 결합하면서 다양한 연구개발을 진행 하는 연구자들과 자원집합 간의 조율(coordination)을 전체적인 차원에서 조절하는 것 이 가능해야 함. ▢ 과학기술 연구개발 공유환경을 위한 네트워킹 요구사항들 ◦ 연구개발 공유환경 자원들과 이를 통합적으로 제공하는 창구 역할을 하는 DevOps 타 워 간의 실제적인 상호 연결을 위해서는 국가과학기술연구망(KREONET)과 같은 과학기 술 연구개발 네트워크에 기반한 연동(federation)을 위한 다양한 연결(inter-connect) 네트워킹을 <그림 4>와 같이 체계적으로 구성하고 운영해야 함. ◦ 이때 안전한 공유를 위한 보안 기술을 적절하게 적용하는 것은 필수적이며, 이를 위하 여 참여하는 사이트별로 공유할 특화된 과학기술 설비/장치들과 연구자가 속한 사이버 랩(Cyber Lab)을 DMZ(demilitarized zone) 영역에 위치시켜 복잡하게 얽힌 보안문제 에서 분리하는 것이 효과적임 [Science DMZ].

(36)

32

◦ 또한 공유형 자원집합에 포함된 자원들을 설정하고 관리하기 위한 provisioning 용도, 자원 상태를 파악하기 위한 visibility 용도, 자원을 원하는 대로 활용하기 위한 orchestration 용도 등으로 각각 분리된 연결 네트워킹을 체계적으로 사전에 준비함으 로써, 중앙 DevOps 타워에 위치한 관리자 또는 원격지에 산재한 연구자들이 하고자하 는 용도 별로 분리하여 활용하면서 공유환경을 운영할 수 있어야 함.

Science R&D

Networks

Campus

Site

Provisioning / Visibility / Orchestration

Science

DMZ

Managed FlowSpace DevOps Tower with Access/Visibility Center Shared HPC/ BigData (DataLake)

Cyber

Labs

Shared Science Facilities Shared Science Facilities Open Data Exchange

(37)

오픈 과학기술 클라우드를 통한 공유형 통합연구개발 인프라 구축 및 운영

33

III. 클라우드 중심으로 구축하는 소프트웨어-정의 인프라의 확산

1. 클라우드 기반의 공유형 인프라의 확산

▢ 클라우드 기반 인프라 구축 동향 ◦ <그림 5>의 좌측 상단과 같이 가상화된 계산/저장 자원의 공유를 중심으로 대규모의 클라우드 데이터센터들을 구축하여 규모의 경제성을 누리면서, IaaS/PaaS/SaaS 로 호 칭되는 인프라/플랫폼/소프트웨어 계층별로 폭발적으로 확산하는 클라우드에 주목해야 함. 특히 SaaS 측면의 클라우드 서비스들은 총체적인 클라우드로의 세력 이동에 따라 cloud-native 한 신규 응용 서비스와 기존 응용 서비스들의 클라우드 이전을 모두 수 용하면서 확산하고 있음 [M. Armbrust et al. (2010)]. ◦ 클라우드에 기반한 ICT 자원공유를 돌이켜보면, 초기에는 과학기술 분야를 중심으로 그 리드 컴퓨팅(Grid computing) 방식으로 알려졌던 HPC 계산 중심의 자원 공유가 태동 하고, 이후 BigData 슬로건으로 확산된 대규모 데이터 중심의 자원 공유로 이어지고, 현재는 추가적으로 다양한 공유 형태로 확대되고 있는 상태임. 즉 광대역 네트워킹의 발전에 의한 고속의 데이터 공유가 가능해지면서 원격지에 분산된 계산 및 저장 자원의 공유가 실용화 되었으며, 추가적으로 가상화 기술의 도움을 받아 자원집합의 통합 효율 성과 개별적인 활용 독립성을 균형감 있게 제고하는 상태임.

◦ <그림 5>의 하단에 제시한 것과 같이 아마존 AWS(Amazon Web Service), MS Azure, 구글 Google Cloud, IBM Softlayer 등이 주도하는 대규모 클라우드 데이터센

Cloud

(38)

34

터들이 전세계적으로 구축되어 운영되고 있음. 동시에 오픈소스 OpenStack소프트웨어 에 기반한 사설(private) 및 하이브리드(hybrid) 클라우드 구축이 통신사업자, 대기업 등을 중심으로 빠르게 확산되고 있음. ◦ 예를 들면 소프트웨어-정의 인프라의 대표 주자인 클라우드 데이터센터들은 복잡해진 자원운영을 자동화하여 공유형 인프라의 경제성과 유연성을 향상시킨 것임. 이러한 측 면에서 서버, 네트워크, 스토리지를 하나로 묶어 간편하게 확장/운영하는 융합형 (hyper-converged) 박스 형태의 자원 구성이 대규모 클라우드 사업자들에서 시작하여 점차 확대되고 있는 추세임. ◦ 이를 통해 클라우드가 급속도로 확대되어 미래 ICT 인프라의 중심으로 자리잡으면서 전 세계적인 클라우드-우선(Cloud-First) 또는 나아가 클라우드-독점(Cloud-Only) 추세를 이끌고 있음. 3 -IaaS: 16.3% + PaaS/SaaS: 83.7% Year 2015

(39)

오픈 과학기술 클라우드를 통한 공유형 통합연구개발 인프라 구축 및 운영

35

▢ 소프트웨어-정의 인프라와 개방형 플랫폼을 공유하는 서비스 실증

◦ <그림 7>에 소프트웨어-정의 인프라(Software-Defined Infrastructure: SDI)와 개방형 플랫폼(Open Platform)을 활용하여 다양한 미래형 서비스를 생성하는 전체적인 과정을 제시함. User-Defined Services:Create and Orchestrate Smart IoT-Cloud Services with Domain-specific Open Data

Open Platform:Prepare Open

APIs by Placing and Tuning

Inter-connected Functions Software-Defined Infrastructure: Build Programmable & Virtualized Resource Pools with Hyper-converged SmartX Boxes < 그림 7 > 소프트웨어-정의 인프라와 개방형 플랫폼을 활용한 다양한 서비스 생성 ◦ 인프라 제공자의 입장에서 계산/저장/네트워킹 자원을 융합형(hyper-converged)으로 소위 스마트 박스(Box) 개념을 활용하여 손쉽게 확보하여 제공하는 추세임. 즉 스마트 박스 개념으로 자원 종류는 단순화하면서, 수량을 늘리는 스케일-아웃(scale-out) 방식 으로 인프라의 효율성을 향상시켜 인프라 구축과 운영의 경제성을 확보하려고 함. ◦ 따라서 이러한 융합형 자원집합의 개념에 따라 펼쳐진 지능형 사물들(smart things),

에지(edge)에 위치한 소규모 클라우드들(μClouds), 연합형(federated) 클라우드 데이터 센터들을 잇는 미래지향적인 소프트웨어-정의 인프라를 <그림 7>과 같이 구성하는 추 세가 확산되고 있음 [김종원 (2015B)].

◦ 또한 상기한 인프라 위에 개방형으로 플랫폼을 제공하는 운영자들은 가상머신(VM) 또는 컨테이너 형태의 기능들(functions)을 종단/에지/코어에 펼쳐진 스마트 박스들에 자유 롭게 배치하고 동작시켜 플랫폼 사용자들이 필요로 하는 요구 사항을 만족시킴. 이를 통해서 다양한 색상의 컬러 펜들로 비유되는 Open APIs(Application Programming Interfaces)가 하나의 기능 또는 이들의 연결(inter-connect 또는 chaining)로 이뤄진 복합적인 기능 등을 통해서 만들어지고 활용됨.

(40)

36

IV. 클라우드에 기반한 과학기술 자원공유 관련 동향

▢ 클라우드 중심의 자원공유 인프라/플랫폼 사례: Open Science Clouds

◦ 과학기술 도메인별로 특화된 연구개발을 수행하는 구도에 맞춰서 맞춤형으로 재구성하 는 가상화한 자원집합(virtualized resource pool)을 미리 준비해서 구축하고 운영하는 소프트웨어-정의 차원의 자원공유 인프라/플랫폼은 대부분 클라우드와 연동한 형태로 <그림 8>과 같이 다양하게 나타나고 있음.

◦ 계산 중심으로 과학기술 연구개발을 위한 자원공유에 집중한 사례들은 먼저 그리드 컴 퓨팅에서 유래한 Open Science Grid 활동[Open Science Grid], 슈퍼컴퓨팅 자원의 공동활용 체제2)를 지속적으로 구축/운영하고 있는 미국의 XSEDE(Extreme Science

and Engineering Discovery Environment)[XSEDE]와 EU의 PRACE (Partnership for Advanced Computing in Europe)[PRACE] 등이 대표적임.

◦ BigData 확산에 따라 저장 중심으로 과학기술 연구개발을 위한 자원공유에 집중한 사 례들이 뒤를 이어서 나타나고 있으며, 미국 주도의 OSDC (Open Science Data Cloud) 활동[Open Science Data Cloud], 미국 NSF의 BigData Regional Hub 활동 [NSF BigData], EU의 Open Science Cloud 프로젝트[European Open Science Cloud] 등이 있음.

Open Science

Cloud Efforts

10 -NSF BigData Regional Hubs < 그림 8 > Open Science 클라우드 사례들

(41)

오픈 과학기술 클라우드를 통한 공유형 통합연구개발 인프라 구축 및 운영

37

◦ 또한 HEP (High Energy Physics) 분야라는 특정한 사이언스 주제에 집중한 대규모 국 제협력인 CERN (유럽 입자 물리 연구소) 주도의 LHC (Large Hadron Collider) 프로 젝트에서는 오픈스택을 활용하는 클라우드 인프라를 이용한 계산/저장과 LHCONE(LHC Open Network Environment) 이라는 국제연동 네트워킹을 접목하는 사례도 관찰됨. ◦ 추가로 미국 MOC(Massachusetts Open Clouds) 활동 사례와 같이 클라우드를 중심으

로 한 전방위적인 오픈 협력을 <그림 8>의 하단과 같이 사용자/응용, 데이터, 교육 및 인력, 클라우드 연구, DevOps 코어 등을 다양한 산학연 및 공공 기관 파트너들과 함께 추진하기도 함 [Massachusetts Open Clouds].

▢ 클라우드 중심의 자원 인프라 및 플랫폼 공유 사례: Open Technology IoT-Clouds

Open Technology

IoT-Cloud Efforts

< 그림 9 > 기술 분야의 클라우드 기반 자원 공유에 연관되는 Industrial IoT-Cloud 개념

◦ 다소 과장된 해석으로 간주될 수 있지만, 산업적인 기술 중심으로 클라우드 기반의 자원 공유를 <그림 9>와 같은 Open Technology IoT-Cloud 차원에서 해석해 보는 것도 가 능함. 덧붙여서 상기한 Open Science Cloud 사례 중에서 미국 MOC 활동은 과학기술 과 산업 분야를 접목하는 클라우드를 연계하는 자원 공유의 사례로 간주할 수도 있음. ◦ 즉 산업 발전에 주목하여 IoT와 클라우드의 연결을 추구하는 Industrial IoT-Cloud 개

(42)

38

랫폼을 소프트웨어-중심으로 통합한 미래지향적인 자원공유의 모습도 관찰되고 있음 [P. C. Evans and M. Annunziata (2012)].

(43)

오픈 과학기술 클라우드를 통한 공유형 통합연구개발 인프라 구축 및 운영

39

V. 인프라/플랫폼/서비스 계층 구조와 과학기술 분야 자원공유

▢ 뒤집힌 피라미드 형태의 인프라/플랫폼/서비스 계층 구조 - 현재 활발하게 구축이 시작된 소프트웨어-정의 방식의 ICT 인프라는 미래형 자원이 가져야 할 단순화된 확장성을 살리도록 융합형 스마트 박스 형태를 활용하여 자원 형 태는 단순화 시키면서 인프라 운영은 개발운영병행체제(DevOps) 자동화로 고도화하는 방식을 적용 중임. - 이를 통하면 <그림 10>의 우측 상단과 같이 아래 쪽에 위치한 인프라가 뾰쪽하게 모 이면서 탄탄해질 것임. 그 결과로 아래 부분은 점차적으로 좁혀져서 일반적인 피라미 드 형태의 인프라 모습이 아닌, 뒤집힌 피라미드 형태가 되어야 바람직함.

HPC

Data

Networking/

Security

Science & Technology

(44)

40

스 계층 구조를 따르는 경우에는 수직적인 결합에 우선 순위를 부여하더라도 인프라/플 랫폼/서비스를 하부에 위치한 소프트웨어-정의 인프라를 기준으로 통합적으로 연계하려 는 노력이 자연스럽게 병행되면서 수평적인 조화와 연결에도 긍정적으로 영향을 미치는 구도가 그려질 수 있음. ▢ 과학기술 분야의 클라우드 기반 연구개발 자원공유의 방향성에 대한 의견 ◦ <그림 10>의 하단에는 과학기술 분야의 사이버 인프라의 핵심 구성 요소들을 HPC, Data, Software, Networking/Security 주제로 나누어 생각하면서 이들 Open S&T Cloud 차원과 연계하는 프레임워크의 구도를 잠정적으로 고민해 봄.

◦ Open S&T Cloud를 장기적인 안목에서 성공적으로 구축하고 운영하기 위한 프레임워 크 입장에서 세부적으로 살펴보면, 먼저 Networking/Security 구성 요소가 제공하는 안전하고 초고속의 데이터 공유 능력을 효과적으로 활용할 수 있는 연결 네트워킹을 제 공하는 것이 필요함.

◦ 또한 상기한 Networking/Security를 매개로 논리적인 차원에서 하나로 통합된 공유형 자원집합을 <그림 11>과 같이 OCP (Open Compute Project) 오픈소스 하드웨어, OpenStack 과 같은 오픈소스 클라우드 인프라/플랫폼, OpenHPC 오픈소스 HPC 클러 스터 소프트웨어, 다양한 오픈소스 BigData 클러스터 및 Analytics 엔진 등의 기술적인 힘을 빌려서 자동화된 수준으로 재구성하여 연구자들의 실제적인 활용 요구에 따라서 맞춤형으로 제공하도록 운영하는 것이 핵심적으로 요구됨. ◦ 추가적으로 상기한 유연성 있는 재구성이 가능한 융합형 자원집합 공유를 통하여 상단 에 위치한 HPC, Data, Software 구성 요소들을 통합적이고 맞춤형을 조화시키는 방식

Reconfigurable

Platforms

Diversified & Affordable

HPC/BigData Services

(45)

오픈 과학기술 클라우드를 통한 공유형 통합연구개발 인프라 구축 및 운영

41

(46)

42

< 참고문헌 >

논문

김종원 (2013), 신속하고 경제적인 서비스 실증을 위한 SDN 지원 시험환경의 개발 및 운 영, SK Telecommunications Review, vol. 23, no. 5.

김종원 (2015A), 오픈소스 융합형 화이트 박스에 기반한 소프트웨어-정의 인프라 환경, OSIA Standards & Technology Review Journal, vol. 28, no. 1.

김종원 (2015B), SDN/NFV/Cloud를 통합한 소프트웨어-정의 인프라, 한국통신학회지 정보 와 통신, vol. 32, no. 7.

P. C. Evans and M. Annunziata (2012), Industrial Internet: Pushing the boundaries of minds and machines, General Electric White Paper.

R. Jain and P. Subharthi (2013), Network virtualization and Software Defined Networking for cloud computing: A survey, IEEE Communications Magazine, vol. 51, no. 11.

M. Armbrust et al. (2010), A view of cloud computing, Communications of ACM, vol. 53, no. 4.

사이트

NSF ACI, https://www.nsf.gov/div/index.jsp?div=ACI Science DMZ, https://fasterdata.es.net/science-dmz/ Open Science Grid, https://www.opensciencegrid.org/ XSEDE, https://www.xsede.org/

PRACE, http://www.prace-ri.eu/

Open Science Data Cloud, https://www.opensciencedatacloud.org/ NSF BigData, https://www.nsf.gov/cise/bigdata/

European Open Science Cloud,

(47)
(48)
(49)

Open Science 구조설계

임 상 범

1)

Open Science 구조설계

45

Ⅰ. Open Science 주요 논의

1. OECD의 Open Science 논의

▢ 정책 동향

◦ OECD는 2015년 ‘Making Open Science a Reality’에서 OECD를 중심으로 Open Science의 정책 동향 및 시사점 소개

- OECD 보고서에서 David(2003)를 인용하여 Open Science가 과학의 본질로 정의 - Open Science의 구성 요소를 Access, Data, Collaboration으로 구분

- 이러한 배경에는 ICT기반 기술(인터넷 기술, 디지털 연구자원 등)의 보급으로 인한 변 화가 있음

◦ 공적 자금으로 지원된 공공연구의 연구 결과물과 연구 데이터의 접근성을 높이려는 정 책으로 시행

- Open Science의 구성 요소에서 Open Access, Open Data 중심의 정책으로 연구 결 과물과 연구 데이터의 공개를 중심으로 추진

- 일부에서는 과학 연구 과정에서 시민과 민간주체들이 참여하여 과학 연구 과정을 개방 하려는 활동이 존재

▢ 데이터 개방

◦ OECD는 2004년 과학기술장관 회의에서 공공연구의 성과물인 연구데이터에 대한 접근 을 제고하기 위해 “Declaration on Access to Research Data from Public Funding”이라는 선언을 통해 데이터 개방을 위한 노력을 유도

(50)

46

2. European Commission(EC)의 Open Science 논의

▢ 정책 동향

◦ 유럽은 European Commission(이하 EC)에서의 Horizon 2020에서 Open Science 진 흥을 위한 정책을 수립하여 활발하게 움직이고 있음

- Research and Innovation 정책의 하나로 Open Science정책 영역 존재 - EC의 Open Science는 Horizon 2020에서 유럽의 경쟁력 확보를 위해 추진

◦ EC는 Open innovation 정책을 Open Science 정책과 구분한 별도의 정책으로 간주 하여 Open Data와 Access를 강조.2)

3. 미국 OSTP의 Open Science 논의

▢ 정책 동향

◦ 미국의 Open Science에 대한 논의는 Office of Science and Technology Policy(이 하 OSTP)에서 중심이 되어 진행

- Open Government Data 정책은 정부 데이터를 공개함으로써 경험기반 (Evidence-based)정책 수립의 토대 마련

- 이러한 Open Government Data 정책은 Project Open Data 정책으로 확산 - 초기 정보의 공개와 협력은 GitHub로부터 시작

◦ 미국의 OSTP Open Science 정의에 의하면 “공적 자금이 지원된 연구에 대해 연구 결 과물과 연구 데이터를 국가의 전략적 자산으로 활용하여 지식의 공개와 협력을 통해 국 가적 문제와 혁신활동, 삶의 향상, 경제 성장과 일자리 창출을 목적”으로 함

▢ 지향점

◦ 미국의 Open Science의 접근은 오픈소스 툴의 활용과 Open Data, 과학주체 간 개방 된 협력(Open collaboration)을 지향

- Open Science의 핵심 웹사이트인 GitHub는 오픈소스 프로젝트 운영 서비스 제공하 고 오픈 데이터를 제공함으로써 오픈 데이터를 제공하고 Citizen science 웹사이트를 통한 개방된 다양 주체의 협력을 촉진

- OSTP는 Open Science를 위한 새로운 Hub로 Citizenscience.gov 사이트를 소개하 고 있는데 여기에는 정부 부처에서의 홈페이지가 망라되어 있고 일반 citizen science 내용을 풍부히 다루고 있음

(51)

Open Science 구조설계

47

- ‘New Visions in Citizen Science’는 미국의 정부부처에서 시행되고 있는 시민 협력 과학연구의 활동에 대한 사례를 소개하고 있어 시민들 차원의 협력 연구 촉진

4. 한국의 Open Science 논의

▢ 현황 ◦ 2015년 10월 대전에서 개최된 과학기술장관회의의 주요 화두는 글로벌 이슈를 해결을 위한 Open Science의 실행 - 대전선언문을 통해 “개방형 과학 촉진을 위한 정책개선 지원”을 정부에 요청 - Open Science란 모든 종류의 과학적 지식을 개방하고 공유하는 것을 말하며, 네트워 크 인프라의 발달과 함께 필요성 대두

◦ 국내에서도 한국과학기술정보연구원(KISTI)의 주도하에 NDSL(National Discovery for Science Leaders)을 통해 일부 학술정보를 공개하고 있으며, 과학데이터 공동 활용을 위한 정책 수립을 추진

(52)

48

Ⅱ. Open Science 서비스 수요 및 프로세스 분석

1. 기존 프로세스와 Open Science형 R&D 활동 비교

▢ 기존 프로세스와 Open Science형 R&D 활동(<그림 1>)의 특징 ◦ 기존 프로세스와 Open Science형 R&D 활동의 차이점

- 정보 서비스의 활용 여부 - 컴퓨팅을 활용한 활동의 유무 - e-Publication을 활용하는지에 대한 여부 ◦ 기획 단계 - 기존 프로세스에서는 정보와 지식을 수집할 때 연구자가 스스로 관련 사항들을 찾아야 하는 불편함이 있으며, 정보에 대한 한계로 다양한 관점에서 접근하는데 어려움

- Open Science형 R&D 활동을 통하면 다양한 정보와 지식을 정보 서비스를 통해 활용 할 수 있게 되어, 보다 다양한 관점에서 정확한 정보를 수집할 수 있는 장점을 가지고 있으며, 또한 이렇게 수집된 정보를 활용하여, 보다 창의적이고 명확한 목표를 설정 ◦ 실험과 관찰 단계

- 기존 프로세스에서 실행하는 실험과 관찰은 연구자의 실험실 레벨에서 가설을 세우고 이를 위한 실험식과 법칙, 원리 등을 정리하여, 이를 바탕으로 관찰을 수행

(53)

Open Science 구조설계

49

- 이러한 프로세스는 많은 경우에 대해 직접 실험 및 관찰을 해야 하기 때문에 실행하는 모든 경우에 대한 직접적인 결과물을 얻을 수 있다는 장점이 있지만, 물리적인 시간이 나 자원이 많이 소요 - 또한, 데이터의 활용과 생산에 대한 관리를 수동으로 연구자가 직접 관리를 해야 하기 때문에, 데이터에 대한 재 사용률이나 정확성 측면에서 떨어지는 면이 있음

- 이에 비해 Open Science형 R&D 활동은 기본적으로 컴퓨팅 인프라를 기반으로 연구 를 진행하기 때문에 많은 실험을 직접 수행하지 않고도 경우의 수를 많이 줄일 수 있 어서 연구를 진행하는데 시간이나 자원을 아낄 수 있음 - 데이터의 측면에서 봤을 때도, 활용하거나 생산된 데이터들이 자동적으로 관리될 수 있기 때문에, 결과 데이터의 검증, 재사용, 정확성 측면에서 많은 장점이 있음 ◦ 연구결과물 활용 단계 - 기존에 연구에서는 연구결과에 대한 보고서나 논문을 활용하는데 있어 한계점을 나타 내고 있음. 이러한 이유로 향후 비슷하거나 발전된 연구를 수행하고자 하는 연구자가 해당 결과를 연구에 반영하기에 어려움이 있음

(54)

50

카탈로그, 데이터 공유 플랫폼 등의 요구 사항이 존재 ◦ 인프라 수요 - 과학기술분야에서 연구를 진행하는데 있어 점점 더 많은 인프라 자원을 활용하는 거대 과학분야로 옮겨가고 있는 추세 - 이러한 추세에 부응하기 위해서는 컴퓨팅 인프라, 네트워크, 스토리지 등의 수요가 증 가하고 있는 추세 - 과학기술분야 연구를 위한 구체적인 인프라 수요는 슈퍼컴퓨터, 대용량메모리, CPU클 러스터, 클라우드 등의 인프라가 있음 ◦ S/W, 플랫폼 수요 - 다양한 과학기술 분야가 존재하고 있기 때문에 개별의 연구 그룹에서 요구하는 소프트 웨어 및 플랫폼 수요도 다양한 실정임 - 소프트웨어 측면에서 보면 크게 상용 소프트웨어, Open Source 소프트웨어, 자체개 발 소프트웨어 등이 있음 - 이러한 소프트웨어 중에서 단순히 구매하여 제공할 수 있는 상용소프트웨어도 있지만, 점점 소프트웨어의 사용 추세가 Open Source 소프트웨어로 옮겨가고 있는 실정이며, 완전공개나 커뮤니티 공개 소프트웨어가 증가

- 이러한 추세에 부합하기 위해, KISTI에서는 Open Source 소프트웨어 분야에 대한 수 요를 충족하기 위해 이에 맞는 연구 개발을 진행해야함

(55)
(56)
(57)

Open Science 구조설계

53

◦ 과학데이터의 관리를 위한 법과 정책 - 국가 차원에서 과학데이터를 어떻게 공유할 것인지와 활용할 것인지에 대한 정책 수립 - 이에 따른 법제도를 제정하여 데이터의 유통 시 의무적으로 따를 수 있는 체계를 마련 ◦ 과학데이터의 추진 체계 - 과학데이터를 어떻게 공유하고 활용할 것인지에 대한 고민을 전담기관을 두어 정책을 수립하고 수행을 지원할 필요가 있음

(58)
(59)
(60)
(61)

Open Science 구조설계

57

데이터를 가공하고 처리하는 기능, 메타데이터를 관리하고 검색하고 자동으로 메타데 이터를 입력하는 기능을 기본적으로 가지고 있어야함. - 자체보유 또는 외부기과에 있는 데이터는 연계를 통해 메타데이터를 생성하고 데이터 카탈로그를 생성하게 됨. 생성된 메타데이터는 메타데이터 DB에 저장되어 관리됨. - 이러한 기본적인 기능들을 기반으로 통합검색, 통계조회, 룰 정의, 큐 모니터링과 같은 기능들을 부가적으로 제공하여 사용자들이 편리하게 통합 프레임워크를 활용할 수 있 도록 해야 함

- 모든 기능들은 Open API를 통해 외부에 제공되며, Open API를 기반으로 웹 포털이 나 모바일 앱과 같은 곳에서 사용자들이 사용할 수 있는 환경을 만들어 줄 수 있으며, 가시화 서비스나 통합 관리 서비스 등에서도 Open API를 활용할 수 있음 ◦ KISTI는 이미 데이터를 통합하여 관리하고 다양한 소스로 부터 데이터를 받아들여 처리 하고 해당 데이터를 분배할 수 있는 기능을 가진 통합 프레임워크를 구상하고 개발하고 있음

3. 서비스 연계관점

▢ 현황 및 고려사항 ◦ 서비스 연계관점에서의 Open Science의 가장 중요한 점은, 사용자 관점에서 생각해야 한다는 점임 - 서비스를 기획하는 단계에서부터 사용자를 염두에 두고 기획을 해야 하며, 기존의 서 비스들과의 관계도 고려해야 함 ◦ 이러한 일들을 가능하게 할 수 있는 방법 중에 하나는 서비스들을 아우를 수 있는 플랫 폼을 개발하여, 모든 서비스들을 공통의 플랫폼에서 동작할 수 있도록 해는 방법임 - 이러한 방법은 제공하는 서비스들을 Open Science환경으로 변경하여 사용자들이 쉽 고 효율적으로 서비스를 이용할 수 있는 장점을 가지고 있음 - 또한 이러한 플랫폼은 서비스 제공뿐만 아니라, 연구기관을 대표하는 브랜드로써의 역 할도 할 수 있음 - 해외의 사례를 보면, 컴퓨팅을 하는 유명한 연구그룹 중 많은 그룹은 자신들만의 브랜 드(플랫폼, 소프트웨어 등)을 가지고 있음 ▢ Sci-GaIA 프로젝트

(62)

58

가지고 있음

- Sci-GaIA 프로젝트의 사용자들은 통합된 Open Science 플랫폼을 통해 자신들의 연 구 결과를 재생산, 재사용하기 위해 공개 할 수 있음

- 이러한 결과들을 ORCID 프로파일에 링크를 하여 과학자나 결과물에 대한 홍보효과를 높일 수 있음.

◦ 이 플랫폼은 제공자 그룹으로부터 제공된 자원을 Open Science Commons에 있는 코 어 서비스들과 통합하며, Commons에 있는 서비스들은 연구자, 연구결과물, 그리고 인 증등과 같은 사항을 통합하여 서비스로 제공하고 있음

▢ KISTI Open Science의 플랫폼

◦ Open Science 플랫폼을 국가출연연구소 중에서 Open Science에 가장 최적화된 조직 인 KISTI를 대상으로 구성하였음(<그림 6>)

◦ KISTI에서 보유하고 있는 컴퓨팅, 네트워크, 데이터 저장소, 연구 시설/장비등을 포함한 Open Science 인프라를 기반으로 KISTI에 적합한 Open Science를 구성하여, 우리나 라의 과학계와 중소기업을 위한 플랫폼을 개발하고 제공하는 것을 목표로 함.

- 기본적인 철학은 연구과제의 전주기 즉 기획 단계부터 개발 후 테스트까지를 지원할 수 있는 체제를 구축

(63)

Open Science 구조설계

59

◦ KISTI Open Science는 크게 기획, 데이터 수집, 분석, 교육과 같은 4가지 영역으로 구 성되어 있음

- 이러한 목표를 이루기 위해서, 기본적으로 KISTI에서 보유하고 있는 ASTI, NTIS, GSDC, EDISON, COREEN, NDSL과 같은 전문가 그룹, 프로젝트, 기술과 함께 Open Access, Open data를 위한 doi, Open Source등의 외부 표준이나 기술을 결함하여 실질적인 서비스에서 활용하게 됨

◦ 기획

- 기획이라는 목표를 이루기 위해, Knowledge Base/Data Analysis라는 서비스를 제공 하게 됨 - 이 서비스는 연구과제나 중소기업의 현안 해결이나 신기술 개발에 도움을 주기 위해, 현존하는 기술들을 분석하여, 연구과제나 신기술 개발의 아이디어 단계부터 긴밀하게 협조함 - 과제 수행의 성공가능성을 높이기 위해 전반적인 기획에 합께 참여하여 도움을 줄 수 있는 서비스를 제공함 ◦ 데이터 수집

- Open Access Repository라는 서비스를 통해 제공하게 됨

- 데이터 수집의 기본적인 기능은, 관측을 통해 제공되는 실측데이터, 실험을 통해 얻어 지는 실험데이터, 시뮬레이션을 통해 얻을 수 있는 가상데이터 등을 포함해 연구 수행 중에 생성되는 모든 데이터를 대상으로 이를 다른 연구자들이 자유로이 활용할 수 있 는 방법을 모색하는데 중점을 두고 서비스를 제공함

◦ 분석

(64)

60

구를 해야만 하는 환경이 조성되고 있음 - 이러한 수요를 충족하기 위해 Open Collaboration을 제공하고 있음 - Open Collaboration은 먼 거리에 떨어져 있는 연구자들끼리 공동연구를 진행하고자 할 때, 필요한 여러 가지 기능들을 제공하여, 직접 만나지 않아도 연구를 진행하는데 어려움이 없도록 도와주는 서비스를 말함 ◦ 교육 - 교육이라는 목표를 이루기 위해 ‘OA 저널등재, 개방, 교육’이라는 서비스를 제공함 - 해당 서비스는 저널 형태로 출판된 연구결과에 대한 개방과 Open Science를 수행하 는데 필요한 코어 교육을 제공하는 서비스임 - 교육의 측면에서 보면 앞에서 언급한 서비스들에 대한 교육을 포함해서, 컴퓨팅 자원 활용에 대한 교육 등을 포함하고 있음 ◦ 이러한 서비스들은 개별적인 서비스로 존재하는 것이 아니라, 사용자에게는 통합된 하 나의 서비스로 보이게 됨 - 통합된 하나의 서비스를 위한 플랫폼이 존재 하게 되고, 연구자의 연구를 전주기적으 로 수행, 관리 할 수 있는 체계를 이루고 있음

참조

관련 문서

Open Knowledge

LoRa® Network Server – Open Source... LoRa® Network Server

ASF에서 만들어지는 소프트웨어는 Apache License 이며 그러므로 ASF 에서 만들어지는 소프트웨어는 Free Software 또는 Open Source Software 입니 다. 현재

폼을 열어 레코드들이 표시될 때 발 생하며, 이 이벤트는 Current 이벤트 전에 발생하고 Open 이벤트 후에 발 생함.

100 lux 조건 하에 동영상 촬영을 진행하 고, 모든 동영상 촬영이 끝난 후 Noldus의 Ethovision(ver. 8.0)으 로 mouse가 open arms에 머문 시간과 mouse가 open

호출 URL 형식..

Tullio Scovazzi, “Open Questions on the Exploitation of Genetic Resources in Areas Beyond National Jurisdiction”, Am. Nagoya Protocol on Access to Genetic Resources and the

concept of quadratic convergence. • Knowing how to implement both the secant and the modified secant methods. • Knowing how to use MATLAB’s fzero function to estimate