한국과학기술정보연구원
2 0 1 7 K I S T I 오 픈 데 이 터 정 책 포 럼
2017
KISTI 오픈데이터 정책포럼
이형진, 고미현, 조아라, 서민호 발표자 : KISTI 신진섭 박사, KISTI 이정훈 박사, GIST 김종원 교수, KISTI 안선일 박사
2017 정책연구 단행본
2017 KISTI 오픈데이터 정책포럼
ISBN 978-89-294-0985-2
비매품/무료
2017 정책연구 단행본
정책연구실
속표지
2017 KISTI 오픈데이터 정책포럼
1장. 추진 배경 및 필요성
··· 12장. 정책포럼
··· 31절. DOI 시스템의 발전방향 ··· 3
2절. 연구데이터 관리체계 해외 사례 및 시사점 ··· 32
3절. KISTI 개방형 과학기술 데이터 플랫폼 ··· 42
4절. 웹 기반 계산과학 데이터 공유 활용 분석 플랫폼 ··· 61
3장. 결론 및 시사점
··· 801
1장. 추진 배경 및 필요성
1 1 1 1 1 1 1 1 1 1
1 1 1 1장 장 장 장 장 장 장 장 장 장 장 장 장 장. . . 추진 추진 추진 추진 추진 추진 추진 추진 추진 추진 추진 추진 추진 추진 배경 배경 배경 배경 배경 배경 배경 배경 배경 배경 배경 배경 배경 배경 및 및 및 및 및 및 및 및 및 및 및 및 및 및 필요성 필요성 필요성 필요성 필요성 필요성 필요성 필요성 필요성 필요성 필요성 필요성 필요성 필요성 1장. 추진 배경 및 필요성
과학연구 수행방식은 기존의 이론, 실험 중심에서 데이터 및 사이버인프라를 활용하는 3세대, 4세대 방식으로 진화
대형 시설장비와 데이터를 활용한 연구방법 확산 및 디지털 기술과 새로운 협업 도구를 활용한 연구개방과 협력연구 수요 증가
데이터 기반 과학의 가상화를 통해 빅사이언스의 수행과 과학기술 패러다임 변화
유럽 등 선진국은 연구데이터의 공유, 확산을 통한 가치창출을 위해 오픈 사이언스 정책을 추진함
글로벌 어젠다로 개방형 과학(open science)에 대한 관심의 고조
2004년 OECD 과학기술 장관회담에서 “공적자금이 투입된 연구데이터의 접근에 관한 선언”(Declaration on Access to Research Data from Public Funding) 채택
2015년 OECD 과학기술 장관회담에 개방형 과학이 핵심 의제로 등장
“데이터 중심형”으로의 연구개발 패러다임 전환에 따른 “저비용 고효율”로의 생산성 극대화 필요
국가 R&D 사업에 연구데이터 공동활용 및 데이터 기반의 연구방법론을 적용 확대하여, 국가 차원의 R&D패러다임 전환 유도 필요
연구 패러다임이 대용량 데이터 중심의 거대과학으로 진화함에 따라 원천데이터의 수집‧관리 및 활용을 위한 인프라 지원 필요
2
2017 KISTI 오픈데이터 정책포럼
연구데이터 생산 및 활용의 확대 추세에도 불구 국가 차원의 추진 체계 및 관련 제도 미비로 지속적인 활용 확대에 한계 존재
국가 차원의 연구데이터의 관리 및 개방을 위한 거버넌스 체계의 부재
데이터 생산기관의 체계적인 관리 부재로 국가연구시설장비에서 생성된 연구(실험)데이터가 단독으로 활용된 이후 소멸
대형연구프로그램 등 국가 연구개발과제 종료 후, 연구데이터에 대한 재활용 및 가용 여부, 소재(위치) 정보 파악 불가능
국내 연구자의 연구데이터 공유‧활용 경험 및 관련 인식 부족
“KSITI 오픈데이터 정책포럼” 추진
(목적) 오픈 데이터 시대를 대비해 기관의 중·장기적인 대응체계를 구축
(방법) 오픈 데이터 관련 전문가와 주제를 선정하고 기관 내・외부 전문가들과 공론의 장 마련
(구성) 포럼은 총 4회 진행됐으며, 각 주제별로 발표자 1인, 토론자 1~2인으로 구성
회차 일자 주제 발표자
1 7월 21일 DOI 시스템의 발전방향 신진섭 박사
(정보기반실)
2 8월 11일 연구데이터 관리체계
해외 사례 및 시사점
이정훈 박사 (과학데이터전략연구실) 3 11월 7일 KISTI 개방형 과학기술 정보 플랫폼 김종원 교수
(광주과학기술원) 4 12월 4일 웹 기반 계산과학 데이터
공유 활용 분석 플랫폼
안선일 박사 (융합연구플랫폼개발실)
<표 1> 2017년 KISTI 정책연구 포럼 주제 및 발표자
3
2장. 정책포럼
2 2 2 2 2 2 2 2 2 2
2 2 2 2장 장 장 장 장 장 장 장 장 장 장 장 장 장. . . 정책포럼 정책포럼 정책포럼 정책포럼 정책포럼 정책포럼 정책포럼 정책포럼 정책포럼 정책포럼 정책포럼 정책포럼 정책포럼 정책포럼 2장. 정책포럼
1절 DOI 시스템의 발전방향
개요
일시: 2017년 7월 21일 오전 10시
장소: KISTI 대전 본원 제3회의실
발표: 신진섭 박사(정보기반실)
토론: 곽승진 교수(충남대)
발표내용
4
2017 KISTI 오픈데이터 정책포럼
5
2장. 정책포럼
6
2017 KISTI 오픈데이터 정책포럼
7
2장. 정책포럼
8
2017 KISTI 오픈데이터 정책포럼
9
2장. 정책포럼
10
2017 KISTI 오픈데이터 정책포럼
11
2장. 정책포럼
12
2017 KISTI 오픈데이터 정책포럼
13
2장. 정책포럼
14
2017 KISTI 오픈데이터 정책포럼
15
2장. 정책포럼
16
2017 KISTI 오픈데이터 정책포럼
17
2장. 정책포럼
18
2017 KISTI 오픈데이터 정책포럼
19
2장. 정책포럼
20
2017 KISTI 오픈데이터 정책포럼
21
2장. 정책포럼
22
2017 KISTI 오픈데이터 정책포럼
23
2장. 정책포럼
24
2017 KISTI 오픈데이터 정책포럼
25
2장. 정책포럼
26
2017 KISTI 오픈데이터 정책포럼
27
2장. 정책포럼
28
2017 KISTI 오픈데이터 정책포럼
29
2장. 정책포럼
30
2017 KISTI 오픈데이터 정책포럼
주요 논의
KISTI의 DOI RA로서의 성과
- 학술정보 및 데이터의 유통, 큐레이션 체제를 구축함 - 전통지식 인증, 보호 및 활용에 기여
- 재난안전정보 플랫폼의 정보 소재파악 및 연계 - 단행본 유통 활성화를 위한 ISBN-A 제공
- 데이터스토어의 유통망관리 식별체계인 오픈데이터 플랫폼 구축 예정
기관의 국내 DOI 제공 서비스 수준
- Crossref와 비슷한 수준의 서비스 제공 예정(‘17년)
- 학술정보에 대한 유사도 검색 기능은 없음. 이에 Copykiller와의 제휴 등 다양한 방안을 모색하여 유사도 검색 기능을 구현하고자 함
31
2장. 정책포럼
향후 DOI 시스템의 발전 방향
- (DOI 적용 대상 확대) 학술정보, 과학데이터, 공공데이터를 비롯해 유통, 서비스 산업 관련 데이터 등 다양한 콘텐츠 유형으로 DOI 외연 확대
- (학술정보 등록률 상승) 과총, 연구재단 등과의 협력을 통해 DOI 등록을 학회(연구지) 평가 지표에 포함
- (기관 차원) DOI 사업 전념 인력 확보, 내부적인 긴밀한 연계를 통한 역할 분담
32
2017 KISTI 오픈데이터 정책포럼
2절 연구데이터 관리체계 해외 사례 및 시사점
개요
일시: 2017년 8월 11일 오후 4시
장소: KISTI 대전 본원 제3회의실
발표: 이정훈 박사(과학데이터전략연구실)
토론: 이영진 선임기술원(기초과학연구원 전산지원팀)
발표내용
33
2장. 정책포럼
34
2017 KISTI 오픈데이터 정책포럼
35
2장. 정책포럼
36
2017 KISTI 오픈데이터 정책포럼
37
2장. 정책포럼
38
2017 KISTI 오픈데이터 정책포럼
39
2장. 정책포럼
40
2017 KISTI 오픈데이터 정책포럼
주요 논의
공공 데이터와 연구 데이터 간 차이
- 국내에서 공공 데이터는 연구 데이터와 구분해서 통상적으로 정부 행정부처에서 관리하는 데이터의 개방을 의미함. 반면, 해외에서는 대체로 공공 데이터에 연구 데이터가 포함됨
생산된 연구 데이터 관리 문제
- 생산된 연구 데이터에 대한 통합 관리에 대한 연구자들의 요구가 많음.
그러나 현재는 연구자 개인이 책임을 지고 있는 상황임. 이에 대한 대책 마련이 필요함
국내 오픈 데이터가 잘 추진되지 않는 이유
- 호주의 경우 대학을 중심으로 연구가 추진되고 있기 때문에, 일관된 정책을 추진하기가 용이함. 반면 국내의 경우 연구, 교육 관련 정부 행정부처, 교육 기관 등이 다양하고 복잡해서, 오픈 데이터 정책을 드라이브 하는 데에 어려움이 많음. 한국과 같은 복잡한 거버넌스 체계를 갖고 있는 국가로는 일본이 있음
- 이에 보다 중장기적인 발전 비전을 가지고 오픈 데이터 정책을 수립, 추진하는 것이 필요함
오픈 데이터에 대한 국내·외 연구진의 인식 차이에 대한 재검토 필요
- 일반적으로 오픈 데이터에 대한 국내 연구진의 인식이 해외 연구자보다 낮다고 평가함
- 그러나 국내·외 연구진 간의 인식 차이에 대한 면밀한 검토가 필요함. 국내 연구진의 경우도 이미 해외 연구자들과 긴밀한 협력 관계를 형성하고 자신의 데이터를 제공, 공유하면서 공동연구를 수행하고 있음
- 무엇보다 국내 연구진들 또한 오픈 데이터에 대한 중요성을 인식하고 있음.
연구자는 데이터 공개를 통해 연구의 투명성과 함께 특정 연구에 대한
“최초” 연구 수행에 대한 인정을 받기 때문임. 이런 점에서 국내 연구자들 또한 자신의 연구 데이터 공개에 대한 소극적이지 않음
- 오히려 오픈 데이터를 저해하는 것은 연구자가 아닌 관련 제도임. 보안, 절차 등을 이유로 데이터 공개에 어려움을 겪기도 함. 그로 인해 연구자들은 기관 리포지터리보다 구글 드라이브를 선호하는 경향이 있음
41
2장. 정책포럼
- 오픈 데이터 기반 연구 협업의 경우, 분야 내 연구 협업은 이미 글로벌 체계 하에서 활발히 진행되고 있음. 다만 데이터 활용 주체가 연구자로 제한되어 있어서, 이러한 연구 협업 현황이 가시화되고 있지 않은 것임
42
2017 KISTI 오픈데이터 정책포럼
3절 KISTI 개방형 과학기술 데이터 플랫폼
개요
일시: 2017년 11월 07일 오후 4시
장소: KISTI 대전 본원 제3회의실
발표: 김종원 교수(광주과학기술원)
토론: 조재혁 박사(한국과학기술기획평가원) 이순석 박사(한국전자통신연구원)
발표내용
43
2장. 정책포럼
44
2017 KISTI 오픈데이터 정책포럼
45
2장. 정책포럼
46
2017 KISTI 오픈데이터 정책포럼
47
2장. 정책포럼
48
2017 KISTI 오픈데이터 정책포럼
49
2장. 정책포럼
50
2017 KISTI 오픈데이터 정책포럼
51
2장. 정책포럼
52
2017 KISTI 오픈데이터 정책포럼
53
2장. 정책포럼
54
2017 KISTI 오픈데이터 정책포럼
55
2장. 정책포럼
56
2017 KISTI 오픈데이터 정책포럼
57
2장. 정책포럼
58
2017 KISTI 오픈데이터 정책포럼
59
2장. 정책포럼
60
2017 KISTI 오픈데이터 정책포럼
주요 논의
기관의 중장기 발전 전략으로서 오픈데이터 플랫폼은 과학뿐 아니라 기술까지 포괄하는 “과학기술 오픈데이터 플랫폼”을 지향해야 함
오픈데이터 플랫폼 구축에 있어 급변하는 외부 환경에 대한 대응방안 모색이 필요함
데이터와 지식, 정보 간의 차이 규명이 필요함
오픈 사이언스 플랫폼 구축 이전에 오픈 사이언스의 발전 방안에 대한 고민이 선행되어야 함
오픈 사이언스의 중요 장애요소는 리얼 데이터의 부족함. 이에 데이터 수집 방안 모색이 필요함
나아가 보다 공격적인 오픈 사이언스 전략이 필요함
도래할 4차 산업혁명 시대를 대비해 중요 이슈로서 재난, 의료와 함께 국방에 주목하고, 이에 대한 관련 연구 수행이 필요함
4차 산업혁명의 중요 키워드인 초지능성, 초연결성, 초융합성에 기반한 중장기 발전 전략 수립 및 검토 필요함
현재 R&D는 기술개발 후 산업으로의 이전에서 그치는 것이 아니라 해당 기술이 최종적으로 사회에 미치는 영향까지 고려하여, 관련 정책, 법률, 규제 등을 함께 수립해 나가는 패캐징 전략을 활용하고자 노력함. 이에 기관 중장기 발전 전략 수립에서도 이러한 패키징 전략 모색이 필요함
61
2장. 정책포럼
4절 웹 기반 계산과학 데이터 공유 활용 분석 플랫폼
개요
일시: 2017년 12월 04일 오후 4시
장소: KISTI 대전 본원 제3회의실
발표: 안선일 박사(융합연구플랫폼개발실)
토론: 고대식 교수(목원대) 김은영 교수(고려대)
발표내용
62
2017 KISTI 오픈데이터 정책포럼
63
2장. 정책포럼
64
2017 KISTI 오픈데이터 정책포럼
65
2장. 정책포럼
66
2017 KISTI 오픈데이터 정책포럼
67
2장. 정책포럼
68
2017 KISTI 오픈데이터 정책포럼
69
2장. 정책포럼
70
2017 KISTI 오픈데이터 정책포럼
71
2장. 정책포럼
72
2017 KISTI 오픈데이터 정책포럼
73
2장. 정책포럼
74
2017 KISTI 오픈데이터 정책포럼
75
2장. 정책포럼
76
2017 KISTI 오픈데이터 정책포럼
77
2장. 정책포럼
78
2017 KISTI 오픈데이터 정책포럼
79
2장. 정책포럼
주요 논의
계산과학 분야 플랫폼 구축시, 온톨로지 통일에 어려움이 존재함.
계산과학 분야를 시작으로 향후 플랫폼은 기계, 바이오 분야로 확대할 계획을 가지고 있음. 이때 플랫폼은 하나의 단일 플랫폼 즉, 계산과학 플랫폼의 기능을 변형, 확장하여 이들 분야를 포괄하는 것이 아니라, 분야별로 개별 플랫폼을 구축할 예정임
현재 플랫폼은 연구용보다는 교육용 성격이 더 강함.
해당 플랫폼은 모든 사용자가 자유롭게 접근해 다양한 데이터를 올리고, 공유할 수 있는 시스템이 아니라, 기관에서 연구기관, 혹은 프로젝트, 연구자 등을 통해 획득한 데이터와 소프트웨어를 탑재하고 있음. 즉, 완전한 개방형 오픈 사이언스 플랫폼이 아니라, 데이터, 소프트웨어에 대한 오픈 액세스가 허용된 플랫폼임.
해당 플랫폼은 공유, 활용, 분석 플랫폼 보다는 분석에 초점을 맞춘 플랫폼으로 판단됨. 이에 플랫폼의 기능을 보다 명확히 할 필요가 있음
생명과학 분야 연구자의 경우 데이터 공유 활용 분석 플랫폼에서 기대하는 중요 기능은 데이터의 저장, 보안, 백업 기능 등임. 이에 플랫폼을 통한 관련 기능 구현 방안에 관한 모색이 필요함
계산과학뿐 아니라 향후 다양한 분야의 연구자가 활용할 수 있도록 general platform의 성격으로 설계하는 것이 바람직하다고 판단됨
80
2017 KISTI 오픈데이터 정책포럼
3 3 3 3 3 3 3 3 3
3 3 3 3 3장 장 장 장 장 장 장 장 장 장 장 장 장 장. . . 결론 결론 결론 결론 결론 결론 결론 결론 결론 결론 결론 결론 결론 결론 및 및 및 및 및 및 및 및 및 및 및 및 및 및 시사점 시사점 시사점 시사점 시사점 시사점 시사점 시사점 시사점 시사점 시사점 시사점 시사점 시사점 3장. 결론 및 시사점
오픈데이터는 공적 자금으로 수행된 연구데이터의 개방을 의미함. 오픈데이터 관점에서 공적 자금으로 수행된 연구 결과는 해당 연구를 수행한 연구자의 개인 소유물이 아닌 다양한 연구자 및 일반 대중이 공유, 재활용 가능한 공공재로 간주됨
최근 오픈 데이터가 글로벌 현상으로 부상하는 것은 무엇보다 최근 과학기술 연구가 대규모 연구자금과 연구인력, 대형 연구시설을 기반하기 때문임. 즉, 급변하는 R&D 패러다임 변화에서 오픈 데이터는 불가피함
동시에 오픈 데이터는 동일 데이터를 다양한 연구분야의 다양한 연구경험을 가진 연구자들이 공유함으로써, R&D 효율성 제고하고 학제간/다학제 연구를 촉발/촉진하여 과학기술의 혁신에 기여함
나아가 작은 과학 혹은 분야 내 특정 연구지식과 방법으로 해결할 수 없는 복잡한 21세기 새로운 글로벌 환경문제와 국내 사회 문제 해결 등에도 기여함
이에 KISTI는 국가 R&D 데이터의 생산/공유/재활용을 위한 인프라, S/W 등을 지원하는 서비스 기관으로서 오픈데이터에 관한 중장기 발전전략을 수립하고 이를 기반으로 국가 오픈데이터 활성화에 기여할 수 방안을 모색할 필요가 있음
이와 관련해 KISTI 오픈데이터 정책포럼에서는 오픈데이터 관련 기관 내·외 전문가들과 함께 오픈데이터에 관한 기관의 향후 발전전략을 모색함
KISTI 오픈데이터 정책포럼에서는 다음과 같은 시사점을 도출함 - 기관 DOI 서비스의 활성화
① 연구논문뿐 아니라 다양한 형태의 연구데이터에 대한 DOI 부여 방안 모색이 필요함
② 연구데이터 개방/공유에 기여한 연구자 업적 평가시스템 도입을 위한 연구의 지원/평가 기관과의 협력이 필요함
③ DOI 사업의 발전을 위한 DOI 관련 인력 확보 및 관련 인력양성을 위한 교육 프로그램 추진이 필요함
81
3장. 결론 및 시사점
- 오픈 데이터 정책 수립
① 국내 연구환경을 고려하여 벤치마킹 가능한 해외 연구 데이터 거버넌스 및 정책 발굴/분석이 필요함
② 현재 국내 연구데이터의 개방/공유 관련 업무는 대체로 연구자 개인의 업무로 간주됨. 연구데이터 개방/공유에 관한 연구자의 업무 과중은 연구자의 오픈데이터에 관한 소극적인 태도에 영향을 미칠 수 있음. 이에 대한 개선이 시급함
③ 기관 차원에서는 연구 프로세스와 연구자의 수요에 기반한 오픈데이터 지원 서비스 및 모델 개발이 필요함
- 기관 오픈데이터 플랫폼 구축
① 과학연구뿐 아니라 기술을 포괄한 과학기술 오픈데이터 플랫폼 구축이 필요함
② 기관 오픈데이터 플랫폼은 데이터 허브(클라우드 기반으로 HPC/AI를 활용)/
데이터 레이크(재구성이 가능한 오픈 S&T 플랫폼)/데이터 패브릭(HPC/HTC, 네트워크 활용)이라는 세 가지 계층구조에서 접근해야 함
③ 기관 구조 또한 인프라/플랫폼/서비스의 계층구조로의 기관 전체 조직 및 시스템을 구조적으로 전환해야 함
④ 클라우드 중심의 공유형 계산/저장/네트워킹 자원집합을 구축하고, 가상화를 통해 자원들을 맞춤형으로 지원하는 것이 필요함
⑤ 공유 인프라를 기반으로 과학기술 IoT-Cloud 형태로 사용자 협업 커뮤니티들과 교류, 지원하는 개방형 과학기술 오픈데이터 생태계를 조성함