• 검색 결과가 없습니다.

Ⅱ. 환경정책연구에서의 데이터 활용

4. 데이터 관련 주요 쟁점

○ 데이터 접근 권한 문제

- 국가마다 데이터 접근 권한에 대한 기준은 다름: 캐나다를 포함한 일부 국가에서는 정부 및 비정부기관 모두에서 데이터에 접근할 수 있는 권한을 제공하고 있음. 아일랜드에서 는 공공기관에서의 데이터 접근만을 허용함

- 데이터 접근 권한이 생산자(소유자)에 대한 특정 의무와 상충되는 경우가 많음

- 거의 모든 유형의 데이터에 대한 접근 허용 규정이 있으나 데이터 활용의 극대화를 위해 서는 (정책) 연구 및 통계작성 목적으로 활용되는 데이터 접근에 대한 허용 기준 완화 및 접근 권한의 유연화가 필수적일 것으로 판단됨

○ 개인정보보호 문제

- 개인정보는 카페, SNS, 블로그, 댓글 등 웹상에 나타난 모든 요소에 노출되어 있어 이로 인해 개인의 프라이버시(privacy) 침해가 발생할 수 있고, 특히 비즈니스 가치가 증가할 수록 개인정보의 유출 위험이 높아질 수 있음

- 개인정보보호는 자신에 관한 정보의 공개 여부를 통제하고 영향을 끼칠 수 있는 개인의 권리로 정의함. 그들의 경쟁력과 소비자를 보호하고자 하는 취지에서 개인정보보호는 동일하게 적용될 수 있을 것임

- 서비스와 기기를 사용함으로써 정보를 만들어내는 이용자들 대부분이 해당 행위를 하고 있다는 것과 부가적으로 생성된 정보가 어떻게 사용되지를 인지하지 못한다는 점. 이에 따라 데이터가 훨씬 더 방대해지고 활용성이 높아진다면 개인정보보호에 관한 우려도 커질 것으로 전망됨

- 우리나라는 개인정보보호와 관련해서는 미국, 유럽, 일본이 보다 강한 규제제도를 가지 고 있는 것으로 평가됨(그림 2-10 참조)

- 규제 수준이 상당히 높아서 관련 기술 및 산업이 제대로 성장하지 못하고 있다는 지적이 많으며, 빅데이터 활용과 개인정보보호 관련 법률의 상충 우려를 해소하는 것은 빅데이 터 활용 산업을 활성화하기 위한 핵심 사안으로 관련 규제의 개혁이 필요함5)

5) KCFT(2014), “빅데이터 활용과 개인정보보호”, 검색일: 2019.10.11.

자료: 디지털 금융센터(2017).

<그림 2-10> 세계 주요지역의 개인정보 규제 강도

- 장기적으로는 개인정보가 포함된 데이터가 개인 자산화 될 수 있도록 블록체인 기술 도 입이 필요함. 블록체인 도입을 통해 내 데이터의 활용처를 명확하게 파악할 수 있으며 이를 통해 수익창출 및 원하지 않는 경우에는 활용범위를 제한하는 등의 조치가 가능하 도록 하는 것에 대한 검토가 필요함6)

○ 데이터 관리(management) 및 저장소(repository) 구축 관련 주요 쟁점7)

- 데이터 저장소가 구축됨에 따라 정보의 관리·보호에 관한 정책과 지침의 적용을 받게 되 는 더 많은 데이터가 유입됨으로써 관리하는 데 어려움을 겪을 수 있음

- 불필요한 데이터의 유입은 피할 수 없으며 이에 따른 높은 저장 비용이 발생함

- 연구 데이터: 연구개발과제 수행 과정에서 실시하는 각종 실험, 관찰, 조사 및 분석 등을 통하여 산출된 사실 자료로 연구 결과의 검증에 필수적인 데이터(국가연구개발사업의 관리 등에 관한 규정, 제2조 18항8))

6) brunch, “블록체인 기술과 개인 데이터의 자산화”, 검색일: 2019.10.11.

7) Sanderson, Reeson, and Box(2017).

8) 국가법령정보센터, “국가연구개발사업의 관리 등에 관한 규정”, 검색일: 2019.10.11.

- 연구자들은 생산된 연구 데이터를 연구자 소유로 인식하고 있으며 연구 데이터 관리와 공유를 지원할 수 있는 기반 환경이 미비함

- 과학기술계에서는 연구 결과에 검증이 필수적이고 각종 방식을 통해 검증 프로세스를 거침, 특히 데이터 분석 결과를 출판하는 저널에서는 데이터 수집 경로, 데이터 전처리 방법 등에 대한 명확한 기술을 요구하고 데이터 분석을 수행한 소스 코드를 요구하는 경 우도 다수 존재함

- 과학기술계에서는 데이터 관리 계획(DMP: Data Management Plan)을 도입하는 경 우도 있지만 효율성에 대해서는 논란의 여지가 있음

- DMP는 생산 및 수집(데이터 유형, 생산·수집 방법 등 저장 및 보존, 데이터 저장·관리·

백업 방안 공유, 데이터 공유 시점·방식·범위 관리, 공유 책임자, 성명·연락에 대한 연구 전 과정에 대한 데이터 관리를 하는 계획임9)

9) DMP, “DMP 공개 템플릿 목록”, 검색일: 2019.11.11.

<표 2-2> 데이터 관리 계획(DMP) 템플릿 사례

한국연구재단 DMP 템플릿 (공개용)

한국연구재단

연구비 지원 기관 : 한국연구재단 작성자 : DMP 관리자

1) 연구 과제 요약

연구 과제 연구 개요

지원 기관 및 기간

수행 기관(연구책임자) 및 참여 기관(세부책임자)

2) 연구 데이터 형태

데이터의 종류 및 형태

연구 수행 과정에 생성 및 재사용하는 데이터의 종류, 형태, 파일 포맷, 크기 및 숫자 등 데이터 형태 : 텍스트, 스프레드시트, 이미지, 3D 모델, 소프트웨어, 영상(음성) 파일 등 연구 데이터 생성 및 가공 방법

기존 연구 데이터 활용 시 데이터 종류, 확보 및 활용 방법, 생성하는 데이터와의 관계 연구 데이터 신뢰성 검증 및 확보 방안

3) 연구 데이터 및 메타 데이터 표준

데이터, 메타 데이터 포맷 및 구성 요소(안)

- 이미지(광학, 전자 현미경 등 소재의 이미지), 스펙트럼(XRD, XPS, Raman 등 물성과 관련 있는 spectra), 물성(전기, 화학, 광학, 촉매, 에너지 등 다양한 물성)은 기본 set로 소재 연구 데이터화 - 그 외 필요하다고 판단되는 데이터는 자율적으로 추가함

4) 연구 데이터 공유 및 제한 계획

연구 데이터 공유 방법 및 공개에 필요한 자원(소프트웨어 또는 장비)

연구 데이터 공개 시기

정책, 지적재산권 등에 의한 공개 유예(엠바고) 기간 필요 유무. 필요하다면 기간 명시 지적재산권 확보 주체 및 공유/활용 가능성

5) 연구 데이터 재사용 및 배포 계획

연구 데이터에 관심을 가지고 활용할 가능성이 있는 대상 연구 데이터 재사용 및 재활용 방법

연구 데이터 접근 제한 대상(있을 경우 이유 제시)

6) 연구 데이터 보관 계획

연구 데이터 관리, 가공 및 보관을 위한 장기적 계획 연구 데이터를 저장할 저장소 또는 데이터베이스 연구 과제 종료 후 연구 데이터의 보관 가치

연구 데이터를 보관하고 공유하기 위해 가공(변환)할 필요 유무

연구 데이터를 재사용하기 위해 제출 가능한 메타 데이터 및 문서 종류 자료: DMP, “DMP 공개 템플릿 목록”, 검색일: 2019.11.11.

- <표 2-2>는 한국연구재단의 DMP 템플릿 사례를 나타내고, <그림 2-11>은 DMP의 주 요 흐름을 나타냄

- 미국, 영국 등 주요 선진국은 공공자금이 투입된 연구 성과물(논문, 보고서, 데이터 등) 을 공유·활용 촉진 정책을 추진, 특히 연구 성과물 중 연구 데이터의 쉬운 접근과 재사 용을 촉진하기 위해 DMP 의무화를 추진하고 있음

- <그림 2-12>와 같이 우리나라 과기정통부에서도 2019년 시범 R&D 과제를 대상으로 데이터 관리계획 제출 의무화를 우선 시행하며, 2020년부터 적용대상을 단계적으로 확대할 예정임

자료: Bulter University, “Data Management”, 검색일: 2019.11.11.

<그림 2-11> DMP의 흐름

자료: 국가과학기술연구회(2019), “출연(연) 연구 데이터 관리·활용 방안 연구”, 검색일: 2019.10.10.

<그림 2-12> 과기계 연구 데이터 관리를 위한 DMP 적용

- 하지만 DMP와 같이 엄격한 데이터 관리 정책은 신중한 도입이 필요함. 복잡하고 까다 로운 데이터 관리 과정으로 인해 연구의 효율성 감소가 나타날 수 있음. 특히 연구 기간 이 짧고 예산이 적은 과제의 경우에는 여러 측면에서 볼 때 달성하기 어렵고, 연구의 질 이 저하되는 역효과만 발생할 수 있는데, 대부분의 정책연구가 이에 해당함

- 연구자의 입장에서 데이터 관리 및 공유에는 많은 시간과 비용이 필요함. 이로 인해 연 구의 효율성 감소에 대한 고려가 필요하며, 패널티 정책이 아닌 인센티브 정책을 통해

데이터 활용의 극대화가 필요함

- 연구자에게 생성된 데이터를 검증함에 있어 너무 무거운 책임을 요구할 경우 적극적인 데이터 공유를 하지 않는 경우가 많게 발생할 것임. 데이터를 공유하는 부담을 최소화하 기 위해 데이터 목록화 및 검증을 위한 추가 인력을 활용하고, 데이터를 활용하고자 하 는 연구자가 데이터의 존재 여부를 확인한 후 협업하는 형태로 진행하는 것이 필요하며, 데이터 공유를 위한 데이터 저장소 구축(repository)이 필요함

○ 정책연구에서 데이터 공유의 필요성 및 시너지 효과10)

- 연구 데이터가 분산되어 있어 연구자가 데이터를 찾기가 쉽지 않은 문제 및 연구자들 사 이의 데이터 공유가 원활하지 않는 등의 문제가 존재함

- 연구 데이터 생산 및 소유의 독점 문제를 완화하고, 문제 해결을 위한 단편적 접근 및 분 석 결과의 지역적 활용을 지양하며, 다양한 데이터를 중심으로 협업을 장려하여 고부가 가치 지식의 범용적 활용 체계를 구축함

- 연구 데이터 관리 및 분석 결과 도출의 효율성 증대: 연구 데이터 분실 및 탐색 시간의 최소화와 재활용을 극대화하여 연구 시간 및 비용을 절감할 수 있음

- 각종 조사, 실험, 관찰, 행정자료 등을 통하여 생성된 객관적이고 사실적인 데이터 공유 및 기반 구축을 통해 데이터 중심의 정책 연구를 활성화함. 이는 정책 시행의 주요 근거 로 활용될 수 있으며 보다 투명하고 객관적인 정책 개발의 기반이 됨

- 데이터 접근성 확대로 주요 이슈에 대한 보다 신속한 대처 및 예측 분석을 통한 선제적 대응이 가능함

- 데이터의 부족한 부분에 대한 상호보완 및 단일 데이터에서는 파악할 수 없는 새로운 관 점의 인사이트 도출 및 의사결정 기회를 제공하는 기반을 구축함

10) RDP, “Research Data Platform”, 검색일: 2019.11.11.

○ 빅데이터 분석 및 성과에 대한 쟁점

- 빅데이터 분석을 위해서는 장비 구입, 서버 구축, 개발환경 구축, 데이터 분석 및 알고리 즘 구축이 필요함. 또한 데이터 분석을 위해서는 수학, 통계학, 전산학 등 다양한 분야의

- 빅데이터 분석을 위해서는 장비 구입, 서버 구축, 개발환경 구축, 데이터 분석 및 알고리 즘 구축이 필요함. 또한 데이터 분석을 위해서는 수학, 통계학, 전산학 등 다양한 분야의