• 검색 결과가 없습니다.

해외 과학데이터 관리 체계 조사

N/A
N/A
Protected

Academic year: 2021

Share "해외 과학데이터 관리 체계 조사"

Copied!
138
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

이정훈 김선태 김지현 박형선 심원식 이상호 이상환 이승복 최명석 한종규, , , , , , , , ,

2015.11.

(2)
(3)
(4)
(5)
(6)
(7)
(8)
(9)

지은이

이정훈 / KISTI

김선태 / KISTI

박형선 / KISTI

이상호 / KISTI

이상환 / KISTI

이승복 / KISTI

최명석 / KISTI

김지현 이화여자대학교

/

심원식 성균관대학교

/

한종규 한국지질자원연구원

/

(10)
(11)

서론 1. ··· 1 오픈 사이언스 1.1 ··· 2 과학데이터 대상과 범위 1.2 ··· 4 과학데이터의 활용 가치 1.3 ··· 7 연구의 범위 1.4 ···10 유럽 과학데이터 관리 및 공유 체계 2. ··· 11 연구 및 혁신 프로그램 의 연구데이터관리 정책 2.1. Horizon2020(EU ) ··· 11 유럽 연구데이터 관리 액세스 플랫폼 2.2. · ··· 12 시사점 2.3. ···15 영국 과학데이터 관리 및 공유 체계 3. ··· 17 법제도 및 정책 3.1. ··· 17 관리 체계 3.2. ··· 27 시사점 3.3. ···32 호주 과학데이터 관리 및 공유 체계 4. ··· 35 법제도 및 정책 4.1. ··· 35 관리 체계 4.2. ··· 40 시사점 4.3. ···51 미국 과학데이터 관리 및 공유 체계 5. ··· 53 법제도 및 정책 5.1. ··· 53 관리 체계 5.2. ··· 70 기관별 관리 사례 5.3. ··· 91 시사점 5.4. ···104 종합 분석 6. ··· 107 해외 과학데이터 관리 체계 요약 6.1. ··· 108 국가별 6.2. 비교 및 시사점 ···111 참고문헌 < > ··· 115

(12)
(13)

그림 오픈 사이언스의 세부 영역 < 1. > 3 그림 공유 및 활용을 위한 연구 결과 출판물 데이터 의 액세스 절차 < 2. ( , ) > 3 그림 호주 연구데이터 액세스와 데이터 인프라 사용 증가에 따른 이익 < 3. > 7 그림 < 4. OpenAIRE> 13 그림 < 5. Zenodo> 14 그림 레지스트리 < 6. re3data > 15 그림 생명 주기 < 7. NERC DMP > 26 그림 에든버러 대학교의 연구데이터 관리 로드맵 예 < 8. > 30 그림 의 인프라 및 서비스 구성 < 9. ANDS > 43 그림 < 10. OAI-PMH Protocol> 44 그림 의 와 의 관계

< 11. RIF-CS Entities Properties > 44

그림 데이터 프로세스

< 12. Australian Research Data Commons > 45

그림 의 영역별 연간 비용 지출 현황 < 13. ANDS > 46 그림 호주 전역에 분산 구축된 데이터 스토리지 < 14. RDSI > 49 그림 사이버인프라 부서의 역할 < 15. NSF > 71 그림 유전학 데이터 공유 관리 체계 < 16. NIH > 73 그림 통합 데이터 생태계 < 17. DoE CESD > 76 그림 데이터 통합 아키텍처 < 18. DoE CESD > 77 그림 환경데이터 관리 프레임워크 < 19. NOAA > 78 그림 환경데이터 관리 경영 구조 < 20. NOAA > 79 그림 환경데이터 관리 아키텍처 개념도 < 21. NOAA > 81 그림 프레임워크 < 22. PDLM > 83 그림

< 23. National Data Service> 85

그림 의 운영 < 24. NCEI > 89 그림 < 25. NSF VertNet> 91 그림 검색 결과 < 26. NSF VertNet > 93 그림

< 27. NIH FCP & INDI> 95

그림

< 28. NITRC> 96

그림

< 29. DoE JGI Genome Portal> 97

그림

< 30. NOAA NCEI> 98

그림

< 31. NASA NSSDCA> 101

그림

(14)

그림 호주 과학데이터 관리 및 공유 체계 < 35. > 109 그림 미국 과학데이터 관리 및 공유 체계 < 36. > 110 그림 주요 국 < 37. 가의 과학데이터 관리 공유에 대한 정책 지원 및 인식 비교· > 112

(15)

표 연구 활동 에 대한 영국 의 정의

< 1. “ ” RAE > 4

표 영국 오픈 연구데이터 포럼의 연구데이터 정의

< 2. > 5

표 영국 와 의 비교

< 3. FOI Act EIRs > 20

표 데이터 정책 요약 < 4. NERC > 23 표 영국 학문 분야별 데이터 관리 체계 비교 < 5. > 29 표 호주 의 연구 정의 < 6. the code “ ” > 36 표 기능 < 7. ANDS > 42 표 호주 대표 데이터 센터 < 8. > 48 표 미국 연방정부기관의 구성요소 비교 분석 < 9. DMP > 67

(16)
(17)

서론

1.

현대 사회의 발전과 더불어 각 분야에서 연구의 산출물로서 연구데이터가 생산되 고 있다 특히 정보 통신 기술. (Information and Communication Technology)의 발달은 연구데이터를 활용 가능한 귀중한 자산으로 활용 가능하게 하여 전 세계적으 로 연구데이터의 큐레이션과 공개 및 공유의 유용성에 대한 인식이 높아지고 있다. 특히 2000년대에 들어서부터 본격적으로 과학데이터의 구축과 활용 체계 마련을 위 한 정책과 프로젝트를 통해 개별 국가 내부에서 뿐만 아니라 전 세계적으로 공유와 활용하기 위한 노력이 추진되고 있다. 과학데이터의 공유와 활용의 인식 증가는 대규모의 연구자금 시간과 고수준 지적, 노동력의 산물인 연구 결과에 대해 학계는 물론 산업계 및 일반 사회의 활용을 높임 으로써 새로운 지식 창출을 이끌 뿐만 아니라 효율적인 연구를 통해 첨단 융합 연구 및 혁신을 야기하는 새로운 과학 추진방법인 오픈사이언스로 나타나고 있다. 2013년 월 영국에서 개최된 과학장관회의에서 그동안 대표적인 연구의 산출물로 여겨지 6 , G8 던 논문에 추가하여 연구데이터의 오픈화를 공식적으로 공동 성명을 통해 발표함으로 써 오픈 사이언스 개념은 세계적으로 급속히 확산되고 있다 특히 . 2015년 대한민국 대전에서 개최된 OECD 세계과학장관회의의 결과인 OECD 대전 선언문(Daejeon 를 통해 오픈 사이언스의 현실화에 대한 국제사회의 구체적인 행동이 촉 Declaration) 구되었다. 이러한 세계적인 추세와 달리 국내에서는 국가차원의 과학데이터의 관리 및 활용 에 대한 통일적인 개념과 추진 방향이 명확히 정립되지 않고 특히 과학데이터 공유 및 활용에 대한 조직적인 논의는 전무한 상황에서 체계 구축의 실효성에 대한 저울질 만 하고 있는 상황이다 이미 국제적으로 사이언스의 오픈에 대한 기조 하에 각종 정. 책 수립 및 표준화가 진행되고 있어 국내 상황만을 주시하며 적극적으로 행동에 옮기 지 않고 머뭇거리는 동안 세계 표준에서 멀어져 버릴 가능성이 있다. 따라서 국내의 가치 있는 많은 연구 활동의 결과가 또 다른 연구와 연계하여 새로 운 가치 창출을 위해 활용될 수 있도록 지원함은 물론 국제 사회와의 협력을 통해 세 계를 이끌기 위한 전략을 수립하고 추진해야 한다.

(18)

오픈 사이언스

1.1

오픈 사이언스는 지금까지의 연구 방법을 보완하여 과학을 새롭게 발전시킬 수 있 는 가능성을 가지고 있는 개념이다 과학 연구 분야뿐만 아니라 산업계와 일반 국민. 에 이르기까지 모든 이용자가 디지털화 된 연구 성과를 활용함으로써 사회 전반의 변 화와 혁신을 가져올 수 있다 현대 사회 구조의 기반이 된 근대 과학의 발전은 과학. 분야의 개방성으로부터 시작될 수 있었다. 1600년대 과학을 이끄는 대표적인 두 집단 은 바로 연금술사들과 자연주의 철학자들의 대학이었다 이후 연금술은 역사의 뒤편. 으로 사라졌지만 대학은 오늘날까지 남아 과학의 산실로 자리매김하고 있다 이 차이. 의 실마리는 연구 분야의 오픈 커뮤니티 안에서 동료들 간의 상호 심사(peer review) 문화를 선택한 대학의 공개성에서 찾을 수 있다 근대 과학 분야의 발전은 바로 이러. 한 공개와 개방에 기반한 것이다.1) 세기에 접어들어 인터넷 등의 기술이 촉매가 되어 과학자들 사이의 연구 21 ICT 과정이나 결과의 공유의 움직임이 오픈 사이언스의 형태로 또다시 일어나고 있다 오. 픈 사이언스는 연구 결과의 재사용 재분배 재생산의 관점에서 연구데이터 노트 또, , , , 는 연구 과정 전반의 산출물을 자유롭게 활용하여 누구나 협력과 연구에 기여할 수 있도록 하는 연구 방법2)으로 과학 연구 분야뿐만 아니라 산업계와 일반 국민에 이르 기까지 모든 이용자가 디지털화 된 연구 성과를 활용하는 연구 경향이다. ICT 기술은 연구 내용 과학 출판물 그리고 대규모 연구데이터를 디지털 형태로 쉽게 조직화하, , ① 여 다른 연구자들 및 사회 구성원들과 공유를 가능하게 하고, ②온라인 리포지토리, 아키이브를 통해 연구 과정의 산출물인 문헌과 데이터 및 정보 컬렉션의 저장 액세, 스 사용 및 재사용을 가능하게 하여 데이터 집중형 연구 및 협업을 촉진하는 매개역, 할을 수행할 수 있다. 기술과 과학의 전통적인 오픈 개념이 만난 오픈 사이언스를 통해 기술 혁신뿐 ICT 만 아니라 장기적인 관점에서의 연구 촉진을 꾀할 수 있어 전세계 과학 분야의 기업 및 정책 입안자들이 주목하고 있다 특히 . OECD에서는 공적 자금이 지원된 연구 결 과 출판물과 연구데이터 에 대해 연구 활성화의 목적으로 대중의 제약 없는 또는 최소( ) ( 한의 제약으로 디지털 형태의 접근을 가능하게 하도록 연구자 정부 연구 자금 지원) , , 기관 그리고 과학 커뮤니티 대상의 국가별 정책 시행을 권유하고 있다, .3)

1) Paul A. David, (2013) The Historical Origins of ‘Open Science’: An Essay on Patronage, Reputation and Common Agency Contracting in the Scientific Revolution, Capitalism and Society, 3(2) 2008.

2) Facilitate Open Science Training For European Research (FOSTER), http://www.fosteropens cience.eu

(19)

오픈 사이언스는 다양한 대상의 지식공유 운동으로 과학 출판물에 대한 제약 없는 온라인 접근을 허용하는 오픈 액세스 연구 과정에서 생산되는 데이터에 대한 접근과, 재사용에 대한 오픈 연구데이터, ICT 기술을 활용하여 다양한 주체의 참여를 통한 공 동 연구를 추진하는 오픈 협력 출판 이후의 동료 심사 오픈 연구 노트북 연구 장비, , , 에 대한 액세스 오픈 소스 소프트웨어 시티즌 사이언스 연구 크라우드펀딩 등의 활, , , 동이 추진되고 있다 이들 중 오픈 액세스 오픈 연구데이터 그리고 오픈 협력은. , , 에서 중점 추진하고 있는 측면으로 연구 정보의 공유 및 활용 체계를 구성하는 OECD 근간이 된다. 그림 < 1 오픈 사이언스의 세부 영역. > 그림 < 2 공유 및 활용을 위한 연구 결과 출판물 데이터 의 액세스 절차. ( , ) > 오픈 액세스나 오픈 연구데이터를 생각할 때 흔히 연구 결과에 대한 여러 가지 의 무사항과 및 권리조항과의 충돌을 우려하게 된다 하지만 그림 와 같이 연구 결과에. 2 대한 다양한 이해 문제의 결정권을 존중하여 특허나 연구 결과의 상업적인 활용을,

(20)

위한 권리 보호를 고려한 활용 모델이 제시되고 있다.4)

유럽 연구 및 혁신 프로그램인 Horizon 2020이나 호주 국가 협업 연구 인프라 전 략단(NCRIS: National Collaborative Research Infrastructure Strategy), 미국 등을 통해 연구 정보에 대한 공개를 추진하는 구체적인 이유는 과학 출판물과 NIH 데이터에 대한 폭넓은 접근 허용을 통해 연구 결과 자체의 질적 향상① , ②협력을 통 한 불필요한 중복 연구 방지, ③빠른 마켓 진출을 통한 성장 혁신 촉진 그리고 시, ④ 민과 사회의 참여 확대로 연구 과정의 투명성 향상을 이룰 수 있기 때문이다 특히. 단순한 경제적인 이익을 넘어 사회 혁신의 원동력으로 오픈 사이언스의 가치를 활용 하기 위해 정책 개발과 법제도 지원을 바탕으로 과학데이터의 관리 체계를 구축하고 파일럿 프로그램을 통해 실행에 옮기고 있다.

과학데이터 대상과 범위

1.2

관리 공유 그리고 공동 활용의 대상이 되는 과학데이터는 단순히 과학 연구를 통, , 해 생성되는 결과물만을 지칭하지 않는다 과학데이터는 사회 인문과학을 포함한 포. 괄적인 의미에서 연구데이터(research data)라 지칭한다 연구는 지식 이해 그리고. , , 통찰을 얻기 위해 수행되는 독창적인 조사과정으로 정의할 수 있다 영국의 연구 평. 가원(UK Research Assessment Exercise)에서는 연구에 대해 좀 더 구체적인 정의 를 내리고 있다 표( 1).5)

4) Guidelines on Open Access to Scienctific Publications and Research Data in Horizon 2020, 2013

5) UK RAE(2005), RAE 2008 Research Assessment Exercise: Guide on Submission, RAE 03/200 5, Annex B ‘Definition of research for the RAE’, http://www.rae.ac.uk/pubs/2005/03/rae03 05.pdf

Research is defined as that which:

‘... includes work of direct relevance to the needs of commerce, industry, and to the public and voluntary sectors; scholarship; the invention and generation of ideas, images, performances, artefacts including design, where these lead to new or substantially improved insights; and the use of existing knowledge in experimental development to produce new or substantially improved materials, devices, products and processes, including design and construction.

It excludes routine testing and routine analysis of materials, components and processes such as for the maintenance of national standards, as distinct from the development of new analytical techniques. It also excludes the development of teaching materials that do not embody original research.’ Here the term ‘scholarship’ has the particular meaning:

(21)

본 보고서에서는 공공 데이터 연구 산출물 등 현재 다양한 목적과 활동의 대상으, 로 지칭되는 데이터와 구분하여 과학 분야의 연구 활동을 통해 생산되어 관리 공유, 및 활용되는 대상을 과학데이터라 지칭한다 과학데이터는 연구 과정을 통해 생성되. 는 최종 결과물일 수도 있으며 경우에 따라 이러한 과학데이터는 연구 종료 시점에, 만 생산되는 것이 아니라 분야에 따라 다양한 연구 과정 단계에서 생산될 수 있기 때 문에 과학데이터와 관련한 정책 수립 및 시행에 앞서 구체적인 대상의 정의와 범위의 한정이 필요하다. □ 관리의 대상인 과학데이터의 정의 및 범위 ○ 연구 데이터에 대한 학술적 정의6)는 이미 여러 개 존재하며 해외에서 사용하는, 정의를 차용 가능하지만 국내 연구 환경에 적합한 실제적인 과학데이터 관리 공, 유와 활용을 위해서 연구 분야나 기관의 특성을 반영하여 대상을 세분화하여 서로 다른 정책 및 활성화 전략을 적용하는 것이 바람직 함

Research Data are quantitative information or qualitative statements collected by researchers in the course of their work by experimentation, observation, interview or other methods. Data may be raw or primary (e.g. direct from measurement or collection) or derived from primary data for subsequent analysis or interpretation (e.g. cleaned up or as an extract from a larger data set). Data may include, for example, statistics, collections of digital images, sound recordings, transcripts of interviews, survey data and fieldwork observations with appropriate annotations.

표 < 2 영국 오픈 연구데이터 포럼의 연구데이터 정의. > ○ 과학데이터 대상 정의 시 고려 요소 ­ 데이터의 목적 연구 과정과 결과를 정당화하는데 필요한 기록: ­ 연구 과정 연구의 주요 투입 자료 또는 연구 결과: ­ 연구 수행 방법 일차적 실험 계측 관찰 일차 데이터의 변환 출판된 데이터: / / , , ­ 데이터의 형태 계량 데이터 정성 데이터: , ­ 데이터 수집 방법 설문 측정 및 관측 기록 거대 장치를 통한 생산 컴퓨터를: , , , , 이용한 실험 등

6) Concordat on Open Research Data, http://www.rcuk.ac.uk/research/opendata

‘... the creation, development and maintenance of the intellectual infrastructure of subjects and disciplines, in forms such as dictionaries, scholarly editions, catalogues and contributions to major research databases.’

(22)

○ 해외 사례의 경우 분야나 관리 기관에 따라 세부적인 대상의 범위를 다르게 정의 하고 있지만 일반적으로 연구의 결과물이나 연구 결과를 뒷받침하기 위한 자료로 정의함

­ NIH (National Institutes of Health)는 최종 연구 데이터를 과학 커뮤니티에서 일반적으로 연구 결과를 뒷받침하고 문서화하기 위해 필요한 사실에 근거한 기록 된 자료라고 정의

­ DoE (Department of Energy)는 연구 데이터를 과학 커뮤니티에서 일반적으로 연구 결과를 확증하기 위해서 필요한 사실에 근거한 기록된 자료라고 정의 ­ IES (Institute of Education Science)에서는 데이터를 학술 커뮤니티에서 일반

적으로 받아들여지는 기록화 된 사실적인 자료로서 연구결과를 기술하거나 지원 하는데 필요한 자료로 정의하고 있으며 데이터에서 제외되는 유형의 자료 제시, ○ 지구과학 해양학 등 특정 분야를 중점적으로 다루는 기관의 경우 해당 분야의 과,

학 데이터를 중점적으로 다루고 있음

­ NOAA (National Oceanic and Atmospheric Administration)에서 정의한 해 양학 데이터는 물리적 화학적 생물학적 데이터의 세 가지로 각각의 예시를 제공, , ­ NASA (National Aeronautics and Space Administration)의 경우 지구 시스템 과학 연구의 산물로 과학데이터를 정의하고 있으며 이와 관련된 데이터 예시 제공 ○ 기관마다 차이가 있지만 일반적으로 관리 대상이 되는 데이터는 해당 기관에서 연

구비를 지원하여 수행된 연구의 데이터임

­ NSF (National Science Foundation)의 경우 연구비를 지원받아 연구를 수행하 는 과정에서 생산 수집된 원본 데이터 샘플 물리적 컬렉션 기타 연구 자료는, , , , 공유되어야 함 ­ NIH의 경우 연간 직접경비 만 달러 이상의 연구비를 신청하는 연구자들은 최50 종 연구데이터의 공유 방법 또는 데이터 공유가 불가능한 이유를 설명해야 함 ­ DoE의 경우 연구비 지원을 받기 위해 제출하는 모든 제안서는 연구과정에서 발 생하는 데이터를 공유 보존할 것인지 여부와 공유 보존 방안을 설명해야 함/ / ○ 관련 법률 및 규정에 따라 일부 데이터는 공개하지 않거나 제한적으로 접근할 수 있도록 함 ­ NSF의 경우 데이터를 관리할 때 개인정보 기밀 보안 지적재산권 기타 권리나, , , , 요구사항을 보호해야 한다고 명시함 ­ NIH의 경우 데이터를 관리할 때 개인정보를 보호해야 한다고 명시함 또한 중소. 기업혁신연구에 해당하는 경우 중소기업법을 준수하도록 함 민간 분야와 공동추. 자를 통해 수행된 연구의 경우 일부 데이터를 공개하지 않을 수 있음 ­ DoE의 경우 데이터를 관리할 때 비밀보장 개인의 프라이버시 개인 식별정보, , ,

(23)

미국의 국가안보 국토안보 경제안보를 보호해야 한다고 명시함 또한 소유권, , . , 영업기밀 지적재산권을 인지하고 모든 적용 가능한 법률 규정, , , DOE 지시 및 정 책을 준수할 것을 요구함

과학데이터의 활용 가치

1.3

연구 결과의 공개와 공유는 과학 연구 분야에서는 당연한 문화이지만 과학데이터 의 관리 공유와 활용을 위한 인프라와 체계를 구축하기 위해서는 상당한 비용이 필, 요하기 때문에 과학데이터 활용 가치에 대한 평가가 요구된다 과학데이터 공유를 통. 한 연구 진실성 향상 및 정성적인 가치는 이미 세계적으로 인식되어 있지만 실제적인 활용 가치의 충분한 평가는 아직 이루어지지 않고 있다 국가차원에서 과학데이터의. 관리가 가장 체계적으로 이루어지고 있는 호주의 연구를 통해 과학데이터의 경제적 가치를 가늠해 볼 수 있다. □ 호주 연구 데이터의 가치7) 그림 < 3 호주 연구데이터 액세스와 데이터 인프라 사용 증가에 따른 이익. >

7) J. Houghton and N. Gruen, Open Research Data: Report to Australian National Data Services (ANDS), Nov. 2014

(24)

○ 호주 공공 연구를 통한 데이터의 가치는 연간 억 달러에서 억 달러로 추산19 60 8) ○ 특히 연구 데이터 큐레이션과 공유는 연간 억18 ~55억 달러의 가치가 있을 것으로 추산되며 이 중 적게는 억 달러에서 많게는 억 달러까지의 이익이 아직 활용, 14 49 되지 않은 데이터로부터 기대되는 이익으로 추정됨 ­ 이런 가치 추산을 바탕으로 연구 데이터 관련 정책이나 인프라 구축은 아직 사용 되고 있지 않은 데이터의 가치의 활용을 목적으로 해야 함 ­ 정책 수립과 인프라에 대한 상대적으로 적은 투자로 연구 혁신 경제적 가치의, , 주요한 증대를 기대할 수 있음 ○ 부문별 가치 ­ 공공 연구 데이터 가치 연간 억 : 19 ~ 60억 달러 영국 연구 활동 시간 기준( )  Use value: 데이터의 생산 조작 그리고 분석에 소요되는 연구 시간 비용, , 오스트레일리아 내 연구 활동 중 의 연구 시간이 데이터의 생산 관리 그 : 46% , , 리고 분석에 소요  연구에 대한 투자 이익 과거 년 동안의 : 20 R&D에 대한 평균 이익 대비 년간1 연구 데이터 활동 투자에 대한 순현재가치(net present value) 이익

­ 리포지토리 및 인프라의 가치 연간 억 : 18 ~ 55억 달러 영국 데이터 센터 기준( )  연구 효율성 데이터 센터 사용자들의 연구 시간 경감 및 경감된 시간의 연구: 활동에 재투자 효과  데이터 재사용 데이터를 직접 생산이나 수집하지 않은 연구자들의 재사용으로: 인한 부가 이익 ­ 데이터 공유로 인해 예상되는 잠재적 가치 추산 연간 억: 14 ~49억 달러9)  전체 연구 데이터 중 현재 큐레이션 및 공유되고 있는 데이터의 비율(10~20%) 대비 추가 데이터의 활용으로 인한 효과  오스트레일리아 내 분야별 국가 데이터 센터 구축을 위한 비용은 연간 1.3 ~2 억 달러로 추정 - 영국 연구회 산하 분야별 전체 연구 경비 대비 데이터 센터 운영 비용 비율 을 기준으로 오스트레일리아 연구 환경 내 데이터 센터 비용 산 (1.4%~1.5%) 정 - 미사용 데이터의 공유 및 활용을 통한 잠재적 가치는 비용 대비 매우 높게 추정  연구에 대한 투자 이익 과거 년 동안의 : 20 R&D에 대한 평균 이익 대비 년간1 연구 데이터 활동 투자에 대한 순현재가치(net present value) 이익

8) 가치의 하계는 노동 비용 기준 상계는 보수적 방법을 적용한 총 연구 자금 및 비용으로 추산, 9) 예상 시나리오 기반 가치 추산

(25)

□ 국가 차원의 데이터 공유 체제를 통해 국가적 이익을 위한 과학데이터 활용 사례 ○ CSIRO (Commonwealth Science and Industry Research Organisation)

­ 중력장 탐색을 위해 사용되는 CSIRO Parkes Radio 의 펄사 데이터 아카이브를 구축하여 관측 Telescope 데이터를 개월내에 공개할 수 있게 된 결과18 , 2012 년 이 데이터를 활용하여 아이슈타인이 제안한 중력 파동의 존재를 확인하는 연구 활동이 국제적으로 확 대되고 관련 분석 도구 개발 및 새롭게 발견된 천체 에 대한 펄사 관련 연구 결과가 출판됨

○ AURIN (Australian Urban Research Intelligence Network) ­ 멜버른으로부터 10km 외곽의 128ha 지역에 대한 연

방 및 주 정부 관련 기관 지역 의회 그리고 민간 회, , 사의 데이터 및 관련 도구를 AURIN ANDS과 를 통해 활용하여 해당 지역 개발을 위한 교통 보건 환경, , , 주거 및 복지 시설 건축을 위한 정책 수립

○ TERN & ALA

­ Terrestrial Ecosystems Research Network (TERN)을 구축하여 AusCover 및

기관을 통한 다양한 형태의 관측 데이터를 통합하고 의

AusPlots , CSIRO Atlas

를 통해 생물다양성 정보 및 개별 동식물 정보를 기반 of Living Australia (ALA)

으로 Univ. of Adelaide ANDS와 의 지원을 통해 지역의 생태학 정보와 관련 데 이터를 검색 분석 시각화 할 수 있는 연구 환경 구축, ,

­ 과거 무관한 것으로 여겨진 데이터들의 관계를 분석하고 이를 통해 오스트레일리 아 다양한 환경 정보를 기반으로 하는 연구 진행 중

○ Tropical Data Hub

­ 오스트레일리아 인구의 5%만이 거주하지만

년 오스트레일리아 수출 물량의 이상을

2012-13 1/2

유통하고 국가 전체 농작물 생산의 10%를 담당하는 북부지역에 대한 개발과 정책 수립을 위해, ANDS의 지원 하에 James Cook Univ.의 eResearch

팀이 를 구축하여 해당

Centre Tropical Data Hub 지역의 각종 정보를 통합

­ 통합된 데이터를 통해 환경 연구뿐만 아니라 각종 생물 개체를 통한 말라리아의 전파 경로 연구 등 다양한 연구 활동 진행

(26)

연구의 범위

1.4

과학데이터10)의 공유 및 활용에 대한 시각은 기존의 학술논문이나 특허 등 전통적 인 성과물에 추가된 성과 관리의 측면과 연구 성과의 확산과 나아가 다양한 분야에서 의 경제발전에 이르기까지 데이터의 가치를 활용하는 측면이 공존한다 나아가 데이. 터의 공유를 과학 연구 과정의 일부로 인식하는 연구 문화 자체의 변화까지를 의미하 기도 한다 특히 연구 정보의 액세스가 출판물에만 집중되어 있는 상황에서 과학데이. 터 공유 및 활용에 대한 여러 측면을 포함하는 국가차원의 플랫폼을 구축하기 위해서 는 관련 문화적 공감대의 형성과 더불어 효과적인 제도와 정책의 단계적 수립과 지속 적인 지원이 필요하다. 본 보고서에서는 과학데이터의 공유 환경을 구축하고 활용을 시도하고 있는 주요 국가의 관리 체계 구축 현황을 분석하여 주요 이슈와 체계 운용 시 예상되는 문제에 대한 대책을 살펴본다 각 국가별 현황은 . 2015년까지의 상황을 반영하였다 유럽을. 대표하는 영국 과학데이터 관리 체계를 모범적으로 구축 운용하고 있는 호주 그리고, , 미국의 사례를 통해 각 국가에서 과학데이터 공유 및 활용을 위한 법제도 지원 상황 과 이를 실행하기 위한 거버넌스 구조를 살펴본다 그리고 효과적인 제도 실행을 위. 한 정책과 데이터 관리 기관에서 해당 정책의 적용 사례를 통해 과학 데이터 관리 체 계 구축 시 발생하는 다양한 문제들에 대한 대책과 기관의 역할에 따른 접근 방법을 분석한다. 10) 오픈 사이언스의 관점에서 연구데이터는 과학분야 연구과정의 산출물이므로 본 보고서에서는 과학데 이터와 연구데이터를 동일한 대상에 대한 용어로 사용한다.

(27)

유럽 과학데이터 관리 및 공유 체계

2.

유럽의 각 국가의 연구 단체들은 분야별 필요에 따라 자체적으로 동료 연구자들 사이에 연구 정보를 공유해 왔다 그러나 . 2000년도 바이오메디컬 분야의 세계적인 데 이터 공유 움직임(Fort Lauderdale Principes 2003, Toronto Statement 2009)에 이어 OECD 국가들 사이에 공공 펀딩의 연구데이터에 대한 액세스 지침과 가이드라 인(OECD Principles and Guidelines for Access to Research Data from Public 이 협정되면서 국가별로 진행되는 과학데이터 공유 체제 구축에 대한 Funding 2007)

유럽 연합 전체의 포괄적 정책을 수립하게 되었다. 2012년 유럽 연합 과학 정보의 액 세스와 보존에 대한 제안서(EC Commission Recommendation on Access to and 를 시작으로 유럽 연합 연구 및 혁신 프로 Preservation of Scientific Information)

그램인 Horizon2020을 통해 본격적인 체제 구축을 진행하고 있다 본 장에서는. 에 포함된 과학데이터 관련 세부 조항을 살펴본 뒤 실제 구현된 과학데 Horizon2020 이터 관리 및 액세스 플랫폼 사례를 통해 유럽 연합의 과학데이터 공유 및 활용 상황 에 대한 시사점을 도출한다.

2.1. Horizon2020

11)

(EU

연구 및 혁신 프로그램 의 연구데이터관리

)

정책

12)13)14)15) □ EU는 연구와 기술혁신 분야에 연구자금을 지원하기 위해서 Horizon2020(2014 프로그램을 운영하고 있음 억 2020) (800 EUR) ~ □ EU 회원국이 Horizon 2020의 연구자금을 신청하기 위해서는 연구제안서에 데이 터관리에 관한 일반정보를 포함하여 제출해야하며 유럽위원회, (EC: European 는 제출된 내용을 를 기준으로 평가함 Commission) ‘impact’

11) The EU Framework Programme for Research and Innovation, http://ec.europa.eu/progra mmes/horizon2020/en/what-horizon-2020

12) Data Support for EUI Horizon 2020 Projects,http://www.eui.eu/Projects/EUIdatarepository/ H2020datapilot.aspx

13) Guidelines on Open Access to Scientific Publications and Research Data in Horizon 2020, Version 1. 0, 11 December 2013, http://ec.europa.eu/research/participants/data/ref/h2020/grants_manual/hi/o a_pilot/h2020-hi-oa-pilot-guide_en.pdf

14) Guidelines on Data Management in Horizon 2020, Version 1.0, 11 December 2013, http://e c.europa.eu/research/participants/data/ref/h2020/grants_manual/hi/oa_pilot/h2020-hi-oa-data-mgt_en.pdf 15) Research Data Guide, Version 2.0, May 2014, http://www.eui.eu/Documents/Research/Library/Rese

(28)

□ 연구책임자는 연구제안서를 작성할 때 다음과 같은 질문에 대해 작성해야 함 ○ DMP 항목 ­ 어떤 유형의 데이터를 생산 수집할 것인가/ ? ­ 어떤 표준을 사용할 것인가? ­ 연구목적 달성을 위해 데이터를 어떻게 활용할 것이며 연구결과의 검증과 재사, 용을 위해 데이터를 어떻게 공유하고 접근 가능하도록 할 것인가 그렇게 하지? 못한다면 이유가 무엇인가? ­ 데이터를 어떻게 관리하고 보존할 것인가, ? □ Horizon2020 프로그램에서는 체계적인 연구데이터 관리를 위해 연구데이터 파일 럿(research data pilot)을 시작하였으며 연구데이터 파일럿에 참여하는 연구프, 로젝트는 계약체결 후 개월 이내에 보다 더 상세한 데이터관리계획6 (DMP: Data 을 의무적으로 제출해야 하고 데이터관리계획은 연구수행과정

Management Plan) ,

동안 계속 진화되어 보다 더 정밀하게 수정되어야 함

○ 데이터관리계획 템플릿 구성 내용

­ Data set reference and name ­ Data set description

­ Standards and metadata 조항 ­ Data sharing 계획

­ Archiving and preservation (including storage and backup) 방식

□ 연구자금 수혜자는 연구데이터 리포지토리에 데이터를 저장해야 하며 누구나 무, 료로 데이터를 이용할 수 있도록 해야 함 ○ 과학논문 출판에 사용된 데이터는 결과 검증을 위해 가능한 빠른 시일 안에 메타 데이터와 함께 리포지토리에 저장해야 함 ○ 기타 데이터는 데이터관리계획(DMP)에서 정한 기한 내에 메타데이터와 함께 리포 지토리에 저장에 해야 함

유럽 연구데이터 관리 액세스 플랫폼

2.2.

·

□ Open Access Infrastructure for Research in Europe: OpenAIRE16)

○ EU 연구자금(H2020, FP7, ERC)을 통해 얻어진 연구결과물 보고서 논문 연구데( , ,

(29)

이터 등 은 오픈 엑세스 리포지토리를 통해 공유하도록 하고 있음) ○ OpenAIRE는 연구결과물의 오픈 엑세스 정책을 지원하기 위해 만들어진 포털로 연구자 데이터 제공자 연구관리자 자금지원기관에게 다양한 서비스를 제공함, , , ○ OpenAIRE는 연구결과물을 직접 저장 관리하지는 않으며 메타데이터 검색 기능․ , 을 통해 데이터 리포지토리와 링크를 제공함 □ Zenodo17) ○ EU 연구과제 또는 연구기관의 연구결과물을 공유하기 위한 데이터 리포지토리 시

스템으로 CERN(European Organization for Nuclear Research) Data Centre 에서 운영

○ ERC(European Research Council)은 EU 연구자금 지원을 받은 연구결과물을 저장할 기관 리포지토리나 주제 분야 리포지토리 시스템이 존재하지 않는 경우( ) 연구결과물을 Zenodo에 저장하기를 권장함

17) https://zenodo.org/

그림

(30)

그림

< 5. Zenodo>

□ Registry of Research Data Repositories : re3data.org18)

○ re3data.org는 DataCite(re3data.org Working Group)가 관리하고 있으며 현, 재 1,200개의 데이터 리포지토리가 등록되어 있음

○ re3data.org 프로젝트 파트너

­ GFZ German Research Centre for Geosciences (웹사이트 운영) ­ Humboldt-Universität zu Berlin

­ Purdue University

­ Karlsruhe Institute of Technology (KIT) ○ re3data.org 프로젝트 자금 지원기관

­ German Research Foundation (DFG) in Germany

­ Institute of Museum and Library Services (IMLS) in the United States ○ re3data.org에 데이터 리포지토리를 등록하기 위한 조건

­ 대학 연구기관 도서관과 같은 법인 기관이여야 함, ,

­ 데이터의 이용조건 뿐만 아니라 데이터와 리포지토리에 접근할 수 있는 조건을, 명확히 해야 함

­ 영문으로 된 사용자 인터페이스(GUI)를 제공해야 함

­ 연구데이터 중심이어야 함(Data provider and/or Service provider)

(31)

그림

< 6. re3data 레지스트리>

시사점

2.3.

□ EU 연구개발 프로젝트인 FP7(7th Framework Programme for Research and

가 년 종료됨에 따라 년에 Technological Development: 2007 2013)~ 2013 2014 새롭게 출범한 EU 연구개발 프로젝트인 Horizon2020 (2014 2020)~ 에서는 연구 결과물 보고서 논문 연구데이터 의 자유로운 접근과 공유를 위한 오픈 엑세스 정( , , ) 책을 보다 더 강력하게 추진하고 있음 □ EU에서 연구결과물에 대해 오픈 데이터 정책을 강력히 추진하는 이유는 연구결과 검증을 통해 연구결과의 품질과 신뢰성을 높이고 연구데이터의 재사용을 통해 연, 구의 효율성(fund once, re-use many times)을 높이는데 목적이 있음

□ Horizon2020뿐 만 아니라, ERC 등 EU 연구자금을 통해 얻어진 연구결과물의 관 리를 위해 데이터 정책 및 데이터관리지침을 마련하여 시행하고 있으며 연구계획, 서에 데이터관리계획(DMP)을 반드시 포함하여 제출하고 평가받도록 하고 있으며, , 연구가 진행되는 과정에서 DMP를 지속적으로 수정 보완하여 완성도를 높이도록, 하고 있음 □ EU 연구자금을 받아 연구를 수행한 연구자는 생산한 연구결과물을 re3data.org에 등록된 기관 리포지토리 혹은 주제 분야 리포지토리에 저장할 수 있으며 적당한( ) ,

(32)

저장소가 없을 경우 CERN 데이터 센터에서 운영하는 Zenodo 리포지토리에 등록 할 것을 권장하고 있음

□ EU는 연구자 데이터 제공자 연구관리자 자금지원기관에게 연구결과물 관리에, , , 대한 다양한 서비스를 제공하기 위해 웹기반의 OpenAIRE 포털을 구축하여 지원 하고 있음

(33)

영국 과학데이터 관리 및 공유 체계

3.

영국은 전통적으로 연구 과정과 그 결과의 공유를 자연스런 과학 연구의 과정으로 바라보는 연구 문화를 바탕으로 국가 제도가 마련되기 전부터 분야별 연구 정보의 공 유가 이루어지고 있었다 이에 따라 관리 체계와 분야별 과학데이터 센터가 구축되어. 왔다 연구 정보에 대한 상업적인 활용 및 개인정보 보호를 포함한 권리문제가 대두. 되면서 정보 공유와 활용에 의해 발생할 수 있는 다양한 이해관계의 충돌을 방지하기 위한 법제도가 마련되기 시작했고 이후 연구 출판물 및 데이터에 대한 공공성의 확대 및 활용 활성화를 위한 국가차원의 제도 및 정책을 지원하고 있다.

법제도 및 정책

3.1.

법제도

1)

□ Freedom of Information Act 2000 (FOI Act)

○ 영국 데이터 공유 및 활용에 직접적으로 적용되는 법률 기반으로 사회 구성원의①

공공 기관이 생산한 정보에 접근할

(member of the public) (public authorities)

권리 보장과 대상이 되는 공공 기관 정의 (not every organization funded by② 및 대상 기관의 활동과 관련된 특정 정보를 공개할 의무 지정 public money) . ○ 배경 ­ 영국 정부 현대화 및 공공 기관의 개방 및 투명성 보장을 위한 정책 일환으로 제 정되었으며 공공 단체들의 정보 및 기록물 관리와 정보 요청에 대한 지침을 규정, 함. ­ 1997년 노동당의 선언문을 기반으로, 2000년 왕실승인을 받은 후 국회 동의를, 거쳐 2005년 월부터 시행1 . ­ 법무부와 데이터 보호법(1998)을 관리하기 위해 설립된 데이터 보호 위원회(Data 를 전신으로 하는 정보 위원회 사무국

Protection Commissioner) (Information

이 법의 실행 및 운영 담당

Commissioner’s Office) .

­ 스코틀랜드의 경우 FOI Act와 동일한 목적의 Freedom of Information

를 년 국회통과를 통해 제정하여 년부터 시행

(Scotland) Act 2002 2005 .

­ 영국의 정보 개방 관련 각종 정책의 기본 근거 제공.

(34)

모두 접근 가능해야 함.  정보 요청자가 관련 법 적용을 언급하지 않더라도 모든 명시적인 정보 요청에 대해 FOI Act 적용. ­ 공공 단체의 정보관련 활동에 대한 지침 역할 수행.  정보 관련 법제도 및 지침 마련 시 기준 역할.민간 이해 당사자들의 이익 보호 및 참여와 신뢰 향상을 바탕으로 정부 정보를 활용한 가치 창출의 기회 모색. ­ 2012년 개정을 통해 데이터셋에 대한 구체적인 항목을 명시하여 대상이 되는 정 보의 범위를 데이터로 확장19) ○ 내용 ­ 공공 단체가 보유한 정보의 액세스 권한 비용 및 실행 규칙 명시,  법률 적용 대상 기관 - 정부 기관 정부가 소유한 모든 회사 및 기타 법률에서 명시한 , , 400여 개별 기관 및 법률 적용 대상으로 판단한 100,000여 공공 기관 - 연구 관련 기관(Schedule 1) 고등 교육법에 의해 정부 지원을 받는 대학교(university, college, ① 및 연구소

school, hall, institution of a university) (institution, a designated institution)

북아일랜드 Further Education 조항에 의해 펀드를 지원받는 개인 ②

기타 명시 기관 일부 발췌( ) ③

The Biotechnology and Biological Science Research CouncilThe Council for the Central Laboratory of the Research Councils  The Council for Science and Technology

The Economic and Social Research Council

 The Engineering and Physical Science Research Council  The Medical Research Council

The Natural Environment Research Council

 The Particle Physics and Astronomy Research Council  The Agricultural Research Institute of Northern Ireland  The Industrial Research and Technology Unit

참고 관련 규정인 환경 정보 규정 < > (Environmental Information 에서는 환경관련 공공 서비스를 제공하거나 책임을 가지는 공공 Regulations) 단체의 통제를 받는 모든 기관 예 청소 업체 등 을 추가로 포함함( , ) .  정보 제공 방식 - 정보 요청에 대한 개별 정보 제공

(35)

- 국가 정보 위원회(Information Commissioner)가 승인한 방식으로 출판을 통한 정보 제공  액세스 비용(Fee, section9, 12, 13) - 정보 제공을 위한 기관의 비용 청구 허가 비용 고지 이후 개월 내 비용이: 3 지불되지 않으면 정보를 제공하지 않을 수 있음 - 특정 정보를 제공하기 위한 비용이 적절한 한도 를 넘을 경우 해당 정보는“ ” 공개 면제 대상이 됨  실행 규칙(Code of Practice) - 정보 접근 규칙(section 45)  정보 요청에 대한 도움과 지원 제공  요청된 정보를 위해 적절한 공공 단체로 요청 전달  정보와 관련되거나 정보 공개로 영향을 받을 사람과 상의  공공 계약 시 정보 공개 조항 포함  불만 사항 처리 절차 제공 - 기록물 관리 규칙(section 46)  자료 관리 기능에 대한 책임  자료 관리에 관한 정책(policy statement) 마련의 요구  자료 관리 역할을 담당하기 위한 고용 훈련 및 개발,  자료 생성 보유 관리 및 폐기 절차 수립, ,  전자 기록물 관리  정보 접근 요청 거절 요건  출판 체계 (publication schemes) ­ 공개 예외 정보

­ 실행 기관의 기능 및 역할 (secretary of state, lord chancellor, information commissioner)  정부의 역할 분담 사항 외 실행 주체가 되는 특정 기관의 설립 여부는 명시되, 어 있지 않음 ­ 집행 절차 ­ 기타  법 집행에 대한 항소 요건 및 절차  관련 규정 사이의 조정 사항 및 시행 스케줄  공공 단체가 보유하고 있는 개인 정보의 접근과 관련하여 접근 권리 및 예외 사 항 명시 □ 과학데이터 관리 및 공유 관련 법령

(36)

○ 공공 기록물 법(Public Records Act)

­ 1958년 제정된 공공 기록물 관련 법령으로 공공기관의 정보 기록 의무에 대한 법 적 근거 역할.

○ 데이터 보호법(Data Protection Act 1998)

­ 각종 정보 수집 공개 및 활용 시 발생하는 개인 정보 및 민감 정보의 보호에 관, 한 법령.

­ 개인 정보에 관한 유럽 데이터 보호 지침(European Data Protection

를 시행하기 위해 데이터 보호법 와

Directive) 1984(Data Protection Act 1984)

개인 데이터 접근법 1987(Access to Personal Files Act 1987)의 대체법으로 제정.

○ 환경 정보 규정(Environmental Information Regulations-EIRs)

­ 공공단체가 보유하고 있는 환경 정보에 대한 공공 접근에 대한 규정으로 이전 규 정(1992제정, 1998 개정 을 폐지하고 ) 2004년 재 제정하여 2005 1년 월부터 시행.  공공 단체는 환경 정보를 접근할 수 있는 방안을 사전에 마련해야 함.  공공 사회 구성원은 공공 단체에 환경정보를 요청할 권한을 가짐. ­ 환경 정보 정의  국토의 상태와 관련된 모든 정보 물 대기 동식물군( , , )  환경에 영향을 미치는 모든 활동 정보 빛 소음 배출물( , , )  환경 보호를 위한 모든 수단 정보  지도관련 정보 포함 ­ 공공 기관의 지속적이고 사용 가능한 전자 형태의 공간 정보 제공을 요구한 유럽 연합 내 공간 정보에 대한 규정인 Infrastructure for Spatial Information in 를 환경 정보 규정을 통해 준수함

the European Community Regulation(2009) .

­ 현재 많은 분야의 과학데이터가 환경 정보의 정의에 포함되므로 과학데이터의 공 동 활용 시 FOI와 EIRs를 함께 고려함.

FOI Act EIRs

명시적(in writing) 정보 요청 필수 정보 요청이 명시적일 필요 없음 정보제공 비용이 적절한 한도 를 넘을" " 경우 정보제공 면제 비용과 관련한 면제 조항 없음 단 적절. , " 한 비용 청구 가능" 타 주체 대신 보유하고 있는 정보 제외 주체 여부와 무관하게 기관 내 보유하고 있는 모든 정보 대상 공익과 상관없는 면제 조항 있음 모든 면제 사항은 공익과 관련됨 정보 공개의 공익적 측면이 더 크지 않 다면 상업적 이익을 침해할 가능성이 있, 는 정보 공개 유보 환경 배출물 관련 정보의 공개 요청은 거부될 수 없음 표

(37)

○ Copyright and Rights in Performances (Research, Education, Libraries and Archives) Regulation 2014

­ 연구데이터 공개 및 공동 활용 시 발생하는 지적 재산 관련 이슈에 대한 규정으 로 비영리 연구 목적의 데이터 분석 데이터 및 텍스트 마이닝 포함 에 대해 저작( ) 권 적용 예외 인정.

저작권 및 지적 재산 관련 사항

2)

□ 영국의 FOI Act와 관련된 지적 재산권은 기록 정보에 적용되는 ①저작권 과 데이터베이스 권리 임

(copyright) ② (database right) ○ 적용법

­ Copyright Design and Patents Act 1988

­ Copyright and Rights in Databases Regulations 1997

○ 데이터베이스에 대한 저작권과 데이터베이스 자체에 대한 권리는 구분

­ 데이터베이스에 대한 저작권 내용을 선택하고 정리하는 창의적인 과정에 대한: 가치 보호

­ 데이터베이스 권리 데이터베이스에 저장되는 자료 수집에 소요된 시간과 노력의:

가치 보호

□ 기본적으로 지적 재산권이 FOI Act에 의한 정보공개를 막지 않으며, FOI Act역시 지적 재산권을 침해하지 않도록 적용 ○ 한번 공개된 정보는 지속적으로 지적 재산권의 보호를 받음 □ 지적 재산권과 상업적 이익이 관련될 수 있지만 많은 경우 공공 기관의 정보는, 상업적 가치가 없다는 시각 ○ 정보가 상업적 자산이거나 상업적 가치가 있는 경우 지적 재산권리를 통해 공개, 된 정보를 보호함

□ 지적 재산권으로 상업적 이익을 보호할 수 없는 경우, FOI Act (section 43)의 예 외 조항 고려 ○ 영업 비밀을 구성하거나 정보를 보유한 기관이나 개인의 상업적인 이익을 침해할 우려가 있는 경우 해당 정보의 공개를 면제할 수 있음, ­ 지적 재산권을 침해할 수 있더라도 공개에 따른 공공의 이익을 고려해야 함, ○ 정보 공개가 지적 재산권을 침해할 영향이 있는 경우 공개를 거부할 수 있음 (EIRs, 12)

(38)

□ FOI Act 적용으로 인해 재사용을 전제로 데이터셋을 제공할 경우 출판 체계, 을 통해 적절한 라이선스 정책이 포함되어야 함

(publication scheme)

○ 공개하는 정보에 대해 일반적으로 Open Government Licence (OGL) 적용 의무( 사항이 아닌 권고 사항임)

관리 정책

3)

□ 과학데이터 관리 정책 관련 지침

○ 영국의 과학데이터 관리 정책은 RCUK의 Common Principles on Data Policy 과 EPSRC에서 마련한 Freedom of Information 법령에 따른 Publication

을 기반으로 수립 Scheme

○ 2011 (revised 2015): 데이터 정책 공동원칙 (common principles on data policy) ­ 영국 세부 연구 위원회의 데이터 정책 관리 공유( , , DMP) 프레임워크 제공 ­ 핵심 내용  정부 지원의 연구데이터는 공공재이며 공공의 이익을 위해 생산된 것  정부 지원의 연구데이터는 가능한 공개적으로 활용될 수 있어야 함 ­ 기반 지침

 2007: OECD principles and guidelines for access to research data from public funding

Biomedical 분야: Fort Lauderdale Principles (2003), Toronto Statement (2009)

­ 참조 지침

2012: Science as an open enterprise (UK, the Royal Society)

2012: Recommendation on Access to and Preservation of Scientific Information (EU Commission)

2013: Increasing Access to the Results of Federally Funded Scientific Research (US, the Office of Science and Technology Policy)

□ 연구비 지원기관 중심의 정책 적용

○ 영국은 RCUK의 데이터 정책 공동원칙 하에 연구데이터의 관리 및 공유 정책 수립 ○ RCUK 산하 개 연구회는 공동원칙에 근거한 개별적 데이터 정책 제정7

­ EPSRC를 제외한 개 연구회에서 6 Data Management Plan(DMP) 제출 의무화 ­ 데이터 공유 규정 적용

(39)

NERC: 데이터수집 이후 년 이내2EPSRC: 연구결과출판시점  STFC: 연구결과출판 개월 이내6 ­ 데이터 공유 준수 확인 제도 적용  ESRC: 데이터 미공유시 연구비 25% 지급거부NERC: 소속 데이터센터를 통해 공유 점검  EPSRC: 대학 기관에게 데이터 공유 확인 의무 부과 ­ 예) NERC 데이터 정책 요약( ) 20) http://www.nerc.ac.uk/research/sites/data/policy/data-value-checklist/  기본 원칙 ․ NERC 예산지원으로 생산된 데이터는 공공재로 간주 ․ 생산 데이터는 NERC가 지정한 데이터센터에 의무적으로 제출 ․ 특별한 사유가 없는 한 누구나 이용할 수 있도록 데이터 오픈 무료 제공, ․ NERC는 데이터 관리에 필요한 지속적인 인프라 지원  데이터 접근 ․ 모든 데이터는 요구하는 사람 또는 기관에게 제공 ․ EIR(2004)에 명시된 데이터를 제외하고 모두 오픈 ․ 데이터 생산 종료일로부터 최대 년간 공개 유예기간을 설정하여 데이2 , 터 생산자에게 배타적 사용권을 부여 ․ 데이터는 무료 제공을 원칙으로 하며 특별한 경우 유료, ․ 제 자가 제공한 데이터의 경우 라이센스 정책을 따름3 ․ 데이터 사용자는 데이터 소스에 대해 밝혀야 함  데이터 센터 ․ 분야별 전문지식을 지닌 데이터 전문인력 보유 운영, ․ NERC는 데이터 관리 및 유통을 위해 데이터 센터 지원 ․ NERC는 ‘Data Value Checklist20)를 유지관리

․ NERC는 데이터 센터의 모든 정보를 검색할 수 있는 Data Discovery Service운영  데이터 수집

․ NERC가 지원하는 프로젝트의 모든 제안서에는 ‘outline Data Management Plan21)을 반드시 포함해야 함

: ‘Data Value Checklist’ 기준에 부합하는 데이터 셋과 ‘Data Management 을 이행하기 위해 필요한 모든 자원을 기재

Plan’

․ 과제선정과정에서 ‘outline Data Management Plan’ 평가

․ 선정된 과제는 3 6~ 개월 이내에 데이터 센터와 함께 ‘detailed Data Management Plan22) 작성

․ NERC 예산지원을 받는 모든 프로젝트는 ‘Data Management Plan’ 이행을 위해 데이터센터와 협업하고 최종 생산데이터는 데이터센터에 의무적으로 제출,

(40)

□ 민간 지원기관의 경우에도 데이터 관리 및 공유를 위한 자체적인 정책 수립 ○ 의생명공학 분야 민간 연구비지원기관인 Wellcome Trust는 2010년부터 선도적

으로 Data Management and Sharing Policy 정책 시행

정책

4) Data Management Plan (DMP)

□ DMP는 연구 수행 전반에 걸쳐 데이터 관리 및 공유에 대한 문서 대개 ( 2~3쪽의 짧은 분량 로 데이터관리의 핵심 요소임) ○ 연구 계획만을 위한 요소가 아니라 DMP의 생명 주기는 연구 프로젝트 제안에서 종료 이후까지 적용 그림( 7) ○ DMP를 연구비 지원기관이 연구자를 통제하고 확인하는 도구라고 생각하는 것보 다 연구가 수행되기 전에 계획을 세우게 함으로서 데이터 품질을 높일 수 있다는 것과 법적인 공개 의무에서 연구자를 보호하는 수단으로 인식되고 있음 ○ DMP 정책은 연구데이터 관리 및 공유 체계에서 유효한 수단이지만 데이터 정책 전체는 아님 □ UKRC의 공동 원칙을 근거로 연구 위원회 별 DMP 정책 수립 ○ MRC, ESRC는 DMP의 peer review 관련 지침 수립

○ AHRC (Arts and Humanities Research Council)23)

A technical plan is required, where digital outputs or digital technologies are an essential part to the planned research outcomes. This should give a summary of those outputs, explain the technical methodology, technical support / experience, and address preservation, sustainability and use.

21) http://www.nerc.ac.uk/research/sites/data/dmp/outline-dmp-template/ 22) http://www.nerc.ac.uk/research/sites/data/dmp/dmp-template/

23) [UK]AHRC_Research Funding Guide, p.51

․ 상기 사항을 이행하지 않을 경우 예산지원 중단 및 향후 프로젝트 제안 자격을 박탈당, 함  연구보고서에 사용된 데이터의 공개 ․ NERC가 예산을 지원한 연구보고서에는 프로젝트에서 생산한 데이터 목 록과 이들 자료들의 접근 방법이 포함되어야 함 ․ NERC 예산지원 생산 데이터는 데이터 센터를 통해서 공개 표 < 4. NERC 데이터 정책 요약>

(41)

○ BBSRC (Biotechnology & Biological Science Research Council)24)

A data sharing plan is required, which may include details of: data areas, types and formats; standards and metadata; secondary use; methods for data sharing; and timeframes for release. ○ EPSRC (Engineering & Physical Science Research Council)

­ EPSRC는 연구비 지원 양식에 DMP를 요구하지는 않지만 관련된 데이터 관리 정 책 및 계획의 준비를 요구하고 있음

­ EPSRC 지원을 받는 기관들은 2015 5년 월까지 EPSRC의 연구데이터 정책을 준 수하기 위한 계획을 2012 5년 월까지 마련하도록 요구하였으며 연구 수행 기관들, 은 데이터가 생성된 뒤 년 이내에 데이터를 온라인으로 출판해야 함1

○ ESRC (Economic & Social Research Council)25)

ESRC grant applicants who plan to generate data are responsible for preparing and submitting data management and sharing plans for their research projects as an integral part of the application.

○ MRC (Medical Research Council)26)

A data management plan should be provided at the proposal stage, as per the MRC guidelines. A template is provided explaining what to include. This covers a description of the data, data collection, data management, data security, data sharing and responsibilities.

○ NERC (Natural Environment Research Council)27)

A mandatory, single page, Outline Data Management Plan (ODMP) is required for all grant and fellowship applications, as per the NERC guidelines. Where appropriate, a full DMP will also be written in collaboration with the NERC Environmental Data Centres.

○ STFC (Science and Technology Facilities Council)28)

Data management plans are expected for projects that will result in the production or collection of scientific data.

24) [UK]BBSRC_Data Sharing Policy, p.7 25) [UK]ESRC_Research Data Policy 26) MRC Reviewers Guideline on DMP 27) NERC Data Policy

(42)

그림 < 7. NERC DMP 생명 주기>

활성화 전략

5)

□ 데이터의 오픈액세스 필요성에 대한 논의는 연구 커뮤니티 내 개별 연구자들 사이 에 이미 상식적인 공감대가 형성되어 있음 □ 단지 데이터 관리의 효과적 방안 및 연구 커뮤니티가 데이터 개방을 효율적으로, 수행하기 위한 방안 마련에 초점을 둠 □ 인센티브를 통한 활성화 방안 ○ 강제적(negative) 방안 ­ 데이터 개방을 펀딩의 필수 요건으로 강제함 ○ 긍정적(positive) 방안 ­ 데이터 개방 및 질을 다음 펀딩 지원 시 고려 조건으로 반영함

(43)

○ 데이터 저널 등으로 인용 credit 부여 및 연구 커뮤니티 내 데이터 재사용에 대한 공헌 인정 □ 연구 내용에 따라 필요 시 공개 금지 기간 등의 다양한 옵션을 마련하여 연구 주 체의 권익 보호 □ 영국 데이터 관리 주체의 대표적인 두 기관 비교 ○ NERC: 개별 연구자 및 기관의 자발적인 데이터 관리 유도 ○ EPSRC: 데이터 관리에 대한 책임을 기관에 부여하여 개별 연구자 역시 데이터, 관리의 윤리적 책임이 있으나 관리를 위한 실제적인 시스템 및 방안을 기관의 책 임하에 마련하도록 함

관리 체계

3.2.

1) Information Commissioner’s Office

□ 개인의 사적 정보를 보호하는 반면 공공 단체의 정보 개방을 촉진하여 공익의 관 점에서 정보 권리의 신장을 추진하기 위해 영국 정부에서 설립한 독립 기구

□ 과학데이터 거버넌스에 대응하는 법제도의 시행을 주관하는 정부 역할을 수행

영국 연구 위원회

2)

(Research Council UK)

□ 영국 연구 관리 및 지원 기관인 Research Council UK (RCUK)를 중심으로 분야 별 개 연구회7 (Research Councils)를 통해 연구 자금 지원 연구 전략 및 정책, 수립 연구 커뮤니티 지원 연구 인력 양성 국내외 연구 교류 및 협력 등 연구 과, , , 정 전반의 관리와 지원 담당

­ Arts & Humanities Research Council (AHRC)

­ Biotechnology & Biological Sciences Research Council (BBSRC) ­ Engineering & Physical Sciences Research Council (EPSRC) ­ Economic & Social Research Council (ESRC)

­ Medical Research Council (MRC)

­ Natural Environment Research Council (NERC) ­ Science and Technology Facilities Council (STFC)

□ RCUK 산하 연구회(RC)는 분야별 연구 성과에 대한 전문가를 확보하고 있고 이, 들을 중심으로 데이터 정책을 개발하고 시행하고 있음

(44)

○ 분야별 정책 전문가들은 적어도 10-20년 이상 연구 성과 연구데이터 분야 경력을, 바탕으로 정책 수립

○ 각 연구회의 정책전문가들은 Research Outputs Network을 통해 오픈 액세스, 오픈 연구데이터 관련 정책을 개발 조율하고 있음 의장, ( : NERC Mark Thorley)의 □ 연구회(RC) 소속 연구소에서 수행하는 대규모 장비 기반 연구를 통해 생산되는 데 이터는 해당 연구소, RC의 담당 부서 등의 협업을 통해 분야별 데이터 리포지토 리를 통해 세계적으로 공유되고 있음 ○ 국가연구소의 대형장비 기반 실험 측정에서 생산되는 데이터의 관리 및 공유는 이· 미 상당 부분 진행되고 있고 특히 EU/국제 차원의 통합 제공이 활발함 ○ EU 차원의 데이터 리포지토리가 활성화 되어 있음

○ 예) Science & Technology RC (STFC)

­ Rutherford Appleton Laboratory ISIS에 라는 연구소를 통해 가속기를 통해 중성 자 뮤온 입자 관련 데이터를 수집하고 이를 , EU 차원의 PaNdata 네트워크를 통해 공유(STFC Scientific Computing Department Research Data Group 의 담당) ­ CERN Large Hadron Collider 의 프로젝트에서 생산되는 데이터 전체 용량( 100

이상 추정 를 다양한 시스템 포함 을 통해 공유

petabytes ) (EUDAT ) (STFC

의 담당

Scientific Computing Department Data Services Group )

□ 영국 국가연구소의 대부분은 연구회(RC)에 소속되어 있으며 각 연구회는 주요 연, 구 분야 데이터센터의 직접 운영을 통해 데이터 정책을 적용함

○ NERC(지구해양환경 분야)

­ Marine - British Oceanographic Data Centre (BODC)

 1969년 설립된 대표적인 데이터센터로 명 이상의 연구자가 해양학 분야 연50 구데이터 수집(NERC 연구소 및 NERC 지원과제 등 메타데이터 입력 및 데이), 터 공유 관련 업무를 수행하고 있음 이 중 명 이상이 데이터 사이언티스트로( 35 구성)

­ Atmospheric - British Atmospheric Data Centre (BADC)

­ Earth observation - NERC Earth Observation Data Centre (NEODC) ­ Solar and space physics - UK Solar System Data Centre (UKSSDC) ­ Terrestrial and freshwater - Environmental Information Data Centre

(EIDC)

­ Geoscience - National Geoscience Data Centre (NGDC) ­ Polar and cryosphere - Polar Data Centre (PDC)

(45)

○ ESRC(사회과학분야) ­ UK Data Service  기존 데이터 수집 및 공유 서비스에서 확대하여 연구자 및 대학 기관을 대상으 로 데이터 관련 서비스 직접 지원 ○ RC의 학문 분야에 따른 데이터 관리 체계 비교 생명공학분야 RC인 BBSRC의 경우에도 분야 주제 데이터 리포지토리가 활성화되어 있어서( ) ※ 별도의 데이터센터가 없음 ○ 모든 분야에 공통적으로 적용이 가능한 하나의 데이터 관리 방안 수립은 불가능하 므로 기본적인 연구 인프라를 개발한 뒤 각 분야 및 기관의 상황에 맞춤형으로 적 용이 필요함 ○ 현재 영국 내 데이터 관리 서비스 및 데이터 관리 정책 적용에 대한 평가 기준은, 연구회마다 다르며 향후 보다 근거 중심의 , evaluation방안 마련이 필요함 □ 데이터 관리에 따른 소요 비용을 산정하기 위해서는 데이터 관리 프로세스를 정교 화하여 각 부분의 비용 산정이 필요함 NERC 지구환경해양 ( ) EPSRC 이공학 ( ) ESRC 경제사회 ( ) 해당 학문에서 데이터 생성 환경 데이터 측정 반복되 기 어려움. 데이터 측정과 관련된 장비 및 측정 환경 데이 터 중요 반복적인 데이터 측 정 가능 데이터 측. 정과 관련된 장비 및 측정 환경 데이 터 중요 체계적인 샘플링 통 해 수집된 데이터의 축적이 중요 측정도. 구 및 데이터 도큐 멘테이션 필수 관련 데이터센터 산하 개의 분야별7 데이터센터 보유 물( 리적으로 개5 ) 데이터센터 없음 단일한 중앙집중 데 이터센터(UK Data Service) 데이터관리 및 공유 시행 체계 를 통해 data center 데이터 기탁 지원 및 확인. data 가 직접 데 scientist 이터 수집에 참여 가능. 데이터기탁에 데이터수집 시점 이 후 최대 년 간의2 유예기간 연구기관에 데이터 관리 및 공유 정책, 지원 시스템 및 서 비스 체계 위임 연. 구비지원과제를 통 해 15년 월 이후5 연구결과에 연구데 이터의 소재 및 접 근방법 명시토록 함. 향후 이를 지키지 않는 연구기관 및 연구자에 대한 제재 가능 데이터센터를 통해 데이터 기탁 지원 및 확인. 연구종료 시점 이후 개월 이3 내 데이터 기탁 요 구 데이터 기탁되지. 않으면 연구비 25% 를 보류할 수 있다 는 규정 있음 표 < 5 영국 학문 분야별 데이터 관리 체계 비교. >

(46)

대학 기관

3)

□ 대학 등 고등교육기관(Higher Education)을 포함한 연구기관은 EPSRC의 정책에 따라 데이터 관리 및 공유 정책 시행

○ 2011년 월 5 EPSRC policy framework on research data 수립

○ 영국의 연구기관 대학 은 ( ) 2015년 월까지 기관별 데이터 공유 수행을 위한 정책5 및 절차에 대한 로드맵 작성 제출, ­ 예 에든버러 대학교의 연구데이터 관리 로드맵 그림) ( 8)29) ○ EPSRC 정책에 근거한 기관별 이행(compliance)이 2015년 월부터 시작5 ­ 이에 따라 EPSRC 연구비 지원을 받은 연구에서 생산된 연구출판물에는 관련 데 이터를 어디서 어떻게 접근할 수 있는지 명시해야 함 ○ EPSRC 정책은 대학별 연구데이터 정책 수립 및 시행에 결정적인 영향 ­ 대학의 IS, 도서관들도 기존의 기관리포지토리에 데이터 관리 및 공유 기능을 추 가하고 연구자를 지원할 수 있는 부서 및 인력을 제공하고 있음, □ 대학의 인프라 구축 비용 절감을 위해 JISC를 통해 영국 내 대학을 대상의 를 구축하고 지역 기반으로 연결하여 데이터 카탈로그 서 Elastic data repository

비스 제공 그림 < 8 에든버러 대학교의 연구데이터 관리 로드맵 예. > □ 개별 연구자들은 연구비 지원기관의 데이터 정책에 따라 대부분의 연구계획서에 를 작성 DMP 29) http://www.ed.ac.uk/files/imports/fileManager/UoE-RDM-Roadmap-140106.pdf

수치

그림  오픈  사이언스의  세부  영역&lt;1.  &gt; 3 그림  공유  및  활용을  위한  연구  결과 출판물 데이터 의  액세스  절차&lt;2

참조

관련 문서

Emergency Medical Information Center 033-1339 National Health Insurance Corporation (for foreigners) 02-390-2000/033-811-2000.

국민의 실질소득을 유지 또는 상승시키며, 국가가 자유무역 및 공정한 시장제도 아래에서. 재화 및 서비스를 생산할

Ministry of Economic Affairs, R.O.C. Innovation and Incubation Center, National Kaohsiung University of Science and Technology 、 Institute For Information

: long mean free path : long mean free path – Single Wafer Type.. Basic Method of Plasma Etching(3)

ICE-POP 2018 was voluntarily joined by 29 agencies from 12 countries, including KMA Numerical Prediction Center, National Institute of Meteorological Sciences, National

In addition, I compared Kim Ki-Su 'Arirang' music score and current middle school music textbooks 'Arirang' score, which were presented at the National

Introduction to Data Communication Networks, M2608.001200, 2021 FALL SEOUL NATIONAL

▶ 데이터 부족 문제를 해결하기 위한 Idaho National Lab(INL)의