• 검색 결과가 없습니다.

환경정책연구에서 데이터 활용성 강화를 위한 기초 연구

N/A
N/A
Protected

Academic year: 2021

Share "환경정책연구에서 데이터 활용성 강화를 위한 기초 연구"

Copied!
53
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

환경정책연구에서 데이터 활용성 강화를 위한 기초 연구

Paper 2019-13

Basic Research for Improving Data Utilization in Environmental Policy Research

환경정책연구에서 데이터 활용성

강화를 위한 기초 연구

(2)

참여연구원 김도연 (한국환경정책·평가연구원 연구원) 강선아 (한국환경정책·평가연구원 연구원) ❚연구자문위원 (가나다순) 박성택 (한국소프트웨어기술인협회 교수) 신동원 (한국환경정책·평가연구원 부연구위원) 이병권 (한국환경정책·평가연구원 부연구위원) 이진희 (한국환경정책·평가연구원 연구위원) 홍광표 (한국직업능력개발원 부연구위원) ⓒ 2019 한국환경정책·평가연구원 발행인 윤 제 용 발행처 한국환경정책·평가연구원 (30147) 세종특별자치시 시청대로 370 세종국책연구단지 과학·인프라동 전화 044-415-7777 팩스 044-415-7799 http://www.kei.re.kr 발 행 2019년 12월 20일 등 록 제 2015-000009호 (1998년 1월 30일) ISBN 979-11-5980-316-1 95530 이 보고서의 인용 및 활용 시 아래와 같이 출처를 표시해 주십시오. 진대용, 김도연, 강선아(2019), 「환경정책연구에서 데이터 활용성 강화를 위한 기초 연구」, 한국환경정책·평가연구원.

(3)

연구의 주요 내용

○ 연구의 필요성 및 목적 - ICT 기술의 발달과 함께 다양한 환경 분야의 데이터 축적으로 인해 데이터를 기반으로 정책 연구를 수행할 수 있는 환경이 조성되었음. 하지만 아직 연구 과정에서 다양한 데 이터를 (재)생산 및 활용하고 있음에도 데이터에 대한 관리 및 공유를 통해 연구 데이터 의 재활용 및 융합 시너지 효과를 발휘하지는 못하는 상황이어서 연구 데이터의 활용성 강화 및 체계적인 관리를 위한 연구가 필요한 상황임. 따라서 본 연구에서는 환경정책연 구에서 데이터 활용과 관련된 주요 이슈를 정리하고, 데이터 중심의 연구를 활성화하기 위한 단기·중기·장기적 관점의 최소한의 필수 로드맵을 제시하였음

정책 제안

○ 정책 수립 과정에서 보다 적극적인 데이터 활용이 필요함, 특히 스몰 데이터는 분석 없이 데이터 자체가 중요한 경우가 많아 데이터의 관리 및 공유가 매우 중요하다고 판단됨 ○ 축적된 빅데이터의 적극적인 활용 및 연구의 활성화를 통해 기존에는 활용하지 못했던 데 이터를 정보로 변환하여 활용함으로써 환경정책 수립을 보완할 필요가 있음 ○ 단기적으로는 데이터 활용성 강화를 위한 관리 및 활용 체계를 구축하기 위한 방안(데이 터 수집, 데이터 저장소 구축, KEI에 적합한 데이터 관리(공유) 계획, 데이터 활용성 평가 기준 도입 등)을 고려할 필요가 있음 ○ 중기적으로는 데이터 저장소를 중심으로 주요 데이터 수집 및 연구 데이터와 산출물을 축 적 및 활용함으로써 데이터 기반 융합 연구의 활성화를 도모함 ○ 장기적으로는 데이터 기반 환경정책 개발(의사결정 지원)을 위한 플랫폼 구축을 통해 연 구 데이터 및 산출물 서비스, 이를 통한 환경정책 제안 및 활용 사례 축적이 필요함 주제어: (빅)데이터, 데이터 기반 정책연구, 데이터 소스, 환경정책, 데이터 관리 체계, 데이터 저장소

(4)

례 Ⅰ. 서 론 ···1 1. 연구의 필요성 및 목적 ···1 2. 연구의 내용 및 범위 ···2 Ⅱ. 환경정책연구에서의 데이터 활용 ···4 1. 데이터 기반 정책 연구의 개요 및 필요성 ···4 2. 빅데이터의 개념 및 필요성 ···6 3. 데이터 활용 현황 설문조사 ···9 4. 데이터 관련 주요 쟁점 ···15 5. 환경정책연구에서의 빅데이터 분석 활용 방안 ···23 Ⅲ. 데이터 활용성 강화 방안 ···29 1. 환경정책연구에서의 데이터 활용성 강화 방안 ···29 2. 환경 분야별 주요 데이터 소스 정리 ···35 IV. 결론 ···45 1. 환경정책연구에서의 데이터 활용 주요 이슈 ···45 2. 환경정책연구에서의 데이터 활용성 강화를 위한 제언 ···46 참고문헌 ···47

(5)

서론

1. 연구의 필요성 및 목적

○ 정책 효과 제고를 위해 데이터1) 기반 정책 연구 강화 필요 - 현재 데이터에 기반을 둔 정책 결정은 세계적인 추세이며 인간의 직관에 근거한 정책보 다 바람직하게 받아들여지고 있음2) - 환경정책연구에서도 데이터 활용 및 기반 연구의 활성화를 통해 정책의 객관성, 신뢰성, 투명성 등을 제고하고 정책효과를 극대화할 필요성이 있음

- 특히 정보통신기술(ICT: Information and Communication Technology)의 발전과 함께 축적된 빅데이터 활용을 통해 다양한 분야에서 변화를 시도하고 있는 중이며, 환경 정책 분야에서도 빅데이터에 기반한 환경정책 추진이 요구되는 상황임 자료: 헬스코리아뉴스(2017.6.17). <그림 1-1> 빅데이터 도입률 1) 본 연구에서는 사용된 ‘데이터’는 ‘스몰데이터’와 ‘빅데이터’를 모두 포함하는 용어이며, 각각에 대해서 언급할 때에는 ‘스몰데이터’, ‘빅데이터’로 구분하여 작성함. 2) 윤광석 외(2016).

(6)

- 스위스 국제경영개발대학원(IMD)이 발표한 2018년 전 세계 디지털 경쟁력 순위 보고 서에 따르면 우리나라의 빅데이터 활용 순위(Use of big data and analytics ranking)

는 63개국 중 31위로 조사되었음3) ○ 환경정책연구에서 데이터의 활용성 강화를 위한 데이터 관련 주요 이슈 정리, 관리 체계 및 로드맵 필요 - KEI에서는 연구 과정에서 다양한 데이터를 (재)생산 및 활용하고 있지만 데이터에 대한 관리 및 공유를 통해 연구 데이터의 재활용 및 융합 활용으로는 이루어지지 않고 있음 - 데이터 활용에 있어 데이터 관련 이슈의 파악이 필요함 - 환경정책연구에서 데이터 기반 정책 연구 강화를 위한 단기·중기·장기적 관점의 로드맵이 필요함

2. 연구의 내용 및 범위

○ 환경정책연구에서의 데이터 활용 - 데이터(증거) 기반 정책의 필요성 정리: 데이터(증거) 기반 정책의 약점과 강점, 정책 수 립 과정에서 데이터 활용의 중요 쟁점 - 환경정책연구에서의 빅데이터 활용: 빅데이터의 개념 및 분류, 스몰데이터와 빅데이터 의 활용에 있어서 중요 쟁점 - 정책연구에서 빅데이터 연구 도입의 필요성 ○ 데이터 활용성 강화를 위한 주요 이슈 정리 및 로드맵 제시 - 원내 데이터 활용 현황 설문조사를 통해 데이터의 범위와 크기, 연구 데이터 관리, 데이 터 저장소의 필요성 등 데이터 관련 주요 이슈 파악 - 데이터 관련 주요 쟁점 정리: 데이터 접근 권한, 개인정보 보호, 연구 데이터 관리 (management) 및 저장소(repository) 구축 관련 주요 쟁점, 빅데이터 분석 및 성과에 대한 쟁점 - 빅데이터 분석의 주요 방법론 및 환경정책연구에서 활용이 가능한 영역 제시 등 - 환경정책연구에 활용된 분야별 주요 데이터 소스 정리 3) IMD(2018).

(7)

- 데이터 기반 연구를 위한 사전 준비: 연구 데이터 관리를 위한 KEI에 적합한 데이터 관 리 계획 연구 필요, 연구 데이터 저장을 위한 데이터 저장소 구조 및 기능 제시

- 데이터 관리 체계 및 데이터 활용성 강화를 위한 로드맵 제시: 단기·중기·장기적으로 데 이터 활용성을 강화하기 위한 주요 요소 기술

(8)

환경정책연구에서의 데이터 활용

1. 데이터 기반 정책 연구의 개요 및 필요성

○ 데이터(증거) 기반 정책의 필요성

- 학계에서는 “증거 기반 정책(EBP: Evidence Based Policy)”이 주로 사용되며 데이터 활용 정책은 데이터가 증명 가능한 정책의 도구로 사용 - 증거 기반 정책 수립은 객관적인 자료, 과학적 증거를 통해 엄격하고 포괄적으로 정책 결정을 수행할 때 사회적인 목표에 잘 부합한다는 믿음을 반영 - 증거를 통해 정치적 이념 및 편견, 검증되지 않은 사실을 주장하는 의견에 대한 검증 및 상호 보완이 가능함 - 객관적이고 신뢰성 있는 정책 수립의 모범적인 근거를 제시할 수 있으며 이에 걸맞은 정 책을 수립함으로써 사회 전체적으로 긍정적인 효과를 제공하는 것이 가능함 - 증거 기반 정책은 기존의 의견 기반 정책과 상호 배타적으로 활용되는 것이 아니며 정책 환경, 시의성, 중요성, 증거 수준 등을 고려하여 차별적으로 활용할 때 효과가 극대화 됨 - 현재 대부분의 정책 연구에서는 정형화된 (스몰)데이터를 주로 활용하며, 잘 만들어진 데이터는 분석 없이 데이터 자체만으로 매우 중요한 의미를 지니는 경우도 다수 존재하 는데, 이로 인해 데이터 공유 자체가 가지는 효과가 매우 큰 것으로 판단됨 - 빅데이터의 경우 분석을 통해 도출된 결과를 바탕으로 정책 연구에 있어 증거로 활용할 수 있을 것으로 기대할 수 있음 ○ 데이터(증거) 기반 정책의 약점 - 수많은 데이터 중에서 의사결정 및 정책 수립에 필수적이고 신뢰할 만한 것이 무엇인지 판단하기 어렵고, 실제로 의사결정에 필요한 데이터가 없는 경우가 다수 존재할 수 있음 - 신뢰성 없는 데이터를 생성 및 활용하거나 조작(의도된 오류나 실수 등)하는 사례들이 지적되는 등 각 부서에서 정책 수립 및 추진 과정에서 데이터 수집, 분류, 분석의 엄밀성 에 대한 중요성을 인지하지 못하는 현실적 한계가 여전히 존재함

(9)

- 잘못된 데이터의 생산, 활용, 분석을 통해 잘못된 결론을 뒷받침하는 경우가 발생할 수 있 음, 따라서 분석에 대한 철저한 검증이 필요하며 검증이 어려운 경우에는 한 개의 가능성으 로 받아들이는 것이 필요하며, 검증 레벨에 따라 차별화하여 정책에 반영하는 것이 필요함 ○ 정책 수립 과정에서의 데이터 활용 및 중요 쟁점 - 기존의 정책 수립 과정을 요약하면 사회 문제 발생 → 의제 설정 → 정책 결정 → 정책 집행 → 정책 평가 → 정책 종결 등의 과정을 통해 이루어짐 - 정책 수립 과정의 각 단계에서 데이터 활용과 관련된 주요 이슈들을 정리하면 <표 2-1> 과 같음 <표 2-1> 정책 수립 과정에서의 데이터 활용 단계 주요 내용 데이터 활용 이슈 문제 발생 정책 수립 이전 문제 발생 - 사회적 문제가 발생하기 전 수치 예측, 트렌드 분석 등을 활용한 사전적 징후 감지 및 선제적 대응을 위한 데이터 활용 필요 의제 설정 문제 인식 및 우선순위 설정 - 사회적 문제에 대한 정책 수요 도출을 위한 증거(데이터) 활용 필요 - 문제의 심각성을 뒷받침하기 위한 신뢰도 높은 증거 필요 정책 결정 정책 대안들에 대한 비교분석 및 선택 - 문제에 대한 정책 현황 및 정책 대안들을 비교 분석, 정책적 대안의 필요성을 뒷받침하기 위한 증거 필요 - 정책의 효과, 필요 예산, 정책적 인과관계 등을 뒷받침하기 위한 신뢰성 높은 증거 필요 정책 집행 정책 집행과 관련된 실제적인 활동 - 전문지식 및 실무경험에 대한 이해 및 축적이 요구 - 정책 현장 집행에 필요한 근거 필요 정책 평가 정책 모니터링 및 정책 집행과정과 영향력 평가 및 분석 - 모니터링 및 평가 과정에 필요한 신뢰도 높은 데이터 필요 - 정책 전후 변화를 추적하기 위한 데이터 수집 및 분석 필요 자료: 오철호(2017), p.8을 토대로 저자 수정.

(10)

2. 빅데이터의 개념 및 필요성

○ 빅데이터의 정의 - 3V의 특징을 가지는 데이터로 요약: 3V는 데이터의 크기(Volume), 데이터 생성 속도 (Velocity), 형태의 다양성(Variety)을 의미(그림 2-1 참조) - 수십 기가바이트에서 펩타바이트의 크기와 다양한 형태를 가지는 싱글 컴퓨터에서 인 메모리 방식으로는 처리하기 어려울 정도의 대용량 데이터를 의미 - 빅데이터는 일반적으로 대용량의 데이터를 의미하지만 그 이외의 데이터 생성 속도가 빠르거나 비정형성이 높은 데이터의 경우에도 빅데이터의 범주에 포함됨 자료: GE리포트 코리아(2016.12.18). <그림 2-1> 빅데이터의 특징: 3V ○ 빅데이터의 분류 - 데이터 형태에 따른 분류: 정형 데이터와 비정형 데이터로 분류 - 정형 데이터는 우리가 일반적으로 볼 수 있는 엑셀과 같은 툴로 만들어진 테이블 형태의 데이터 (데이터베이스에 저장된 형태)를 의미 - 비정형 데이터는 텍스트, 이미지, 동영상, 음성 등의 데이터를 포함(그림 2-2 참조) - 정형 데이터 중 사이즈가 큰 경우 또는 비정형 데이터 분석에는 빅데이터 분석 방법론의 활용을 고려 - 정형 데이터를 활용한 빅데이터 분석 사례: 컨볼루션 신경망을 활용한 미세먼지 예측, 한강 수질 예측 모형 개발(강성원 외, 2017)

(11)

- 기계학습 기반 환경 이슈 감성 분류기(강성원 외, 2018), 이미지를 활용한 미세먼지 오 염도 추정(진대용 외, 2018)은 비정형 데이터를 활용한 빅데이터 분석 사례에 해당 - 실질적으로는 빅데이터와 스몰데이터의 개념이 모호해진 상황이며 데이터를 활용하는 연구 전체를 빅데이터 연구로 칭하는 경우가 많음 자료: Searchbusinessanalytics(2018). <그림 2-2> 비정형 데이터의 종류 ○ 스몰데이터와 빅데이터의 정책적 활용에 있어서의 차이점 - 스몰데이터는 분석 없이 데이터 존재 자체만으로 매우 중요한 의미를 지니는 경우가 많 아 적극적인 데이터 공유를 통한 (증거로) 활용이 중요함(연구보고서에 나타난 많은 결 과들, 각종 환경 통계 지표 등이 이에 해당함) - 스몰데이터를 만드는 많은 경우 부분 통계학자들이 목표/조사 모집단을 정의하고, 이 모 집단에 근접하기 위해 표본을 추출 및 데이터를 수집 및 결과를 도출하기 때문에 목표에 부합되는 정보를 얻을 수 있다는 장점이 있음 - 스몰데이터의 경우 현재에도 간단한 통계 분석과 함께 각종 정책에 활용되고 있는 상황 이지만 많은 사람들과의 내·외부 공유가 보다 적극적으로 이루어질 필요가 있음 - 빅데이터는 기존에는 의미 있는 정보로 활용하지 못했던 뉴스, SNS, 학술논문 등을 포 함한 텍스트 데이터, 이미지 데이터, 소리 데이터, 위성 데이터, 센서 데이터 등을 활용 해 의미 있는 정보를 변환하여 활용한다는 점이 핵심임

(12)

- 빅데이터를 활용하기 위해서는 복잡한 분석 과정이 필요하다는 단점이 있으며, 알고리 즘 구축 시 데이터에 기반하여 유연한 모델 구축을 통해 수치 예측, 패턴 분석, 추정 목 표를 달성할 수 있다는 장점이 있음 ○ 정책연구에서 빅데이터 연구 도입의 필요성 및 가능성 - 빅데이터를 일상생활에 이용함으로써 발생되는 수많은 데이터들을 활용하여 경험을 통 한 더 풍부하고 깊은 통찰력을 얻을 수 있는 기회를 제공할 수 있을 뿐만 아니라 각종 지 표의 개발을 보완할 수 있음 - 빅데이터는 시의적절한 통계를 작성할 수 있는 잠재력을 지니고 있음. 기존의 각종 지표 는 정부 정책에 의해 독점적으로 수집되는 조사 자료와 행정 자료에 기초를 두고 있어 지속적인 결과 도출 및 정리가 어려움 - 높은 시간 해상도, 공간 해상도, 다양한 관점에서의 결과 도출이 가능함. 이를 통해 기존 에는 발견하기 어려운 새로운 인사이트를 도출하여 한 개의 지표로 활용이 가능함 - 빅데이터 분석을 위해서는 서버 등의 하드웨어 장비 설치, 초기비용 및 전처리와 알고리 즘 구축을 위한 노력이 필요하지만 구축이 완료되면 이를 통해 실시간/지속적으로 대부 분의 데이터 활용이 가능함 - 현재 빅데이터 분석 방법론은 급속도로 발전하고 있으며 새로 개발된 방법론을 적용함 에 따라 기존 결과와 다른 시각의 결과를 도출할 수 있음 - 2014년 미국 정부는 ‘기후 데이터 이니셔티브’를 통해 방대한 양의 기상 관련 데이터 분 석을 실시함으로써 기상 예측의 정확성을 향상시키고, 기후 변화에 따른 피해를 최소화 할 계획을 수립하였음4) - 하지만 빅데이터는 만능이 아니며 스몰데이터를 통해 적합한 문제, 빅데이터 분석에 적 합한 문제, 의견 기반 연구가 적합한 문제를 잘 구분지어 연구를 수행할 필요가 있음 4) ITFIND - IT 지식포털(2014), “미국 공공 부문의 빅데이터 도입 정책에 대한 평가와 성과 제고를 위한 고려 요 인”, 검색일: 2019.10.10.

(13)

3. 데이터 활용 현황 설문조사

○ 설문조사 개요 - 본 연구에서는 원내 구성원 전체를 대상으로 환경정책연구에서 데이터 활용 현황에 대해 파악하고자 설문조사를 실시하였으며, 총 100명이 설문조사에 참가하였음 자료: 저자 작성. <그림 2-3> 응답자 연구 분야 분포도 - <그림 2-3>과 같이 응답자의 연구 분야 조사 결과, 기후변화가 41명(41%)으로 가장 높았 고, 그 이후로는 통계 활용 연구 22명(25%), 자연환경 24명(24%), 물관리 22명(22%) 순 으로 높은 비율을 나타냄

(14)

○ 설문조사 결과 자료: 저자 작성. <그림 2-4> 연구 활용 데이터 성격 설문조사 - 첫 번째 질문은 <그림 2-4>와 같이 연구 활용 데이터의 분야를 조사함. 환경통계 분야가 48명(48%)으로 가장 많았고, 그 다음으로는 기상·기후 및 기후변화 데이터가 45명 (45%), 사회통계 36명(36%), 대기오염 32명(32%) 순으로 나타남 - 다양한 환경정책연구에서 데이터를 활용하고 있으며, 특히 환경통계 및 기상·기후, 기후 변화 데이터 등 다매체와 연관성이 높고 자주 활용하는 데이터를 조사하여 데이터 저장소 에 탑재 및 공유하는 등 보다 적극적으로 활용할 필요가 있음

(15)

자료: 저자 작성. <그림 2-5> 연구 활용 데이터 성격 설문조사 - 두 번째 질문은 <그림 2-5>와 같이 연구 활용 데이터의 성격을 조사함 - 데이터는 실시간으로 나오는 계측치와 확정치가 모두 많이 사용되고 있으며 주요 실시간 데이터 및 확정 데이터에 대해서는 추후 활용을 위해 수집 및 관리가 필요하다고 판단됨 - 자가 생산 데이터, KEI 생산 데이터, KEI 외 국내 생산 데이터, 국외 생산 데이터 등 다양 한 경로로 데이터를 활용하고 있으며, 자가 생산(2차 생산 포함) 데이터 및 자주 활용하고 있는 국·내외 외부 데이터 등에 대한 관리가 필요한 것으로 판단됨, 이는 환경정책연구의 특성상 단일 매체가 아닌 다매체 융·복합 연구적인 특성이 반영된 것으로 여겨짐 - 통계 및 수치형 데이터를 66명(66%)이 주로 사용하고 있으며, 원내에서는 대부분 정형 스 몰데이터를 활용하고 있는 것으로 판단되고 복잡한 데이터 분석보다는 데이터 자체의 존 재 유무 및 공유가 중요할 것으로 판단됨 - 텍스트 데이터는 44명(44%)이 사용하고 있으며, 경험적으로 볼 때 텍스트 자체를 텍스트 마이닝 기술을 통해 활용하는 것은 아니고 문서에 포함된 텍스트, 표, 그림 등을 활용하는

(16)

것으로 판단되며 주요 데이터에 대해서는 별도의 관리가 필요함 - 공간정보, 지도 서비스 등을 통해 활발히 활용되고 있음을 알 수 있으며, 공간정보에 대해 서도 관리가 필요하다고 판단됨 자료: 저자 작성. <그림 2-6> 연구 활용 데이터 크기에 대한 설문조사 - 세 번째 질문은 <그림 2-6>과 같이 연구 활용 데이터의 크기에 대해 조사함 - 데이터의 크기가 1GB를 넘는 경우가 46명(46%)으로 상당히 많았으며, 100MB 미만의 작 은 데이터의 경우는 35명(35%)으로 역시 많이 활용하고 있음을 확인할 수 있음. 또한 데 이터의 공유 및 분석을 통해 다양한 형태로 활용할 수 있을 것으로 기대함 자료: 저자 작성. <그림 2-7> 연구 데이터 활용 시 도움이 필요한 부분에 대한 설문조사 - 네 번째 질문은 <그림 2-7>과 같이 연구 데이터 활용 시 도움이 필요한 부분에 대해 조사함

(17)

- ‘필요한 데이터를 찾아줬으면 좋겠다.’는 응답이 51명(51%)으로 가장 많은 것을 확인 할 수 있음. 이는 연구자가 데이터는 필요하지만 데이터를 찾을 수 없어 활용이 어려운 현재 의 상황을 나타내며, 원내 데이터 저장소 구축, 데이터 수요 조사, 데이터 맵 구축 및 보다 적극적인 연구 데이터 공유를 통해 활용성 강화가 필요할 것으로 판단됨 - ‘공문발송 등 절차이행을 해주면 좋겠다.’는 응답이 49명(49%)이나 되는 것을 알 수 있음. 즉, 이 결과는 데이터를 제공받기 위한 데이터의 협조절차가 어렵거나 많은 시간과 노력 이 필요하다는 것을 나타내는데, 이는 데이터 관리, 중개, 협업 및 협조 등을 위한 전담 부 서 및 체계에 대한 논의가 필요할 것으로 판단됨 - ‘기존에 받았던 데이터를 다른 연구에 바로 사용했으면 좋겠다.’는 응답이 37명(37%)이나 되는 것을 확인할 수 있음. 이는 데이터의 취득절차가 복잡하거나 연구자에게 기간 또는 내용을 제한하여 데이터를 제공하는 경우, 데이터 인계절차가 어려운 경우 등의 문제가 있을 수 있으며, 이러한 문제는 외부 유관 기관과의 협업을 통해 데이터 활용절차를 간소 화하는 절차가 필요할 것으로 판단됨 자료: 저자 작성. <그림 2-8> 연구 데이터 공유방법에 대한 설문조사 - 다섯 번째 질문은 <그림 2-8>과 같이 연구 데이터의 공유방법에 대한 설문조사를 수행함 - 대부분 메일이나 FTP를 활용하고 있음을 알 수 있으며, 데이터 연구 활성화를 위해 데이 터 저장소 구축 등의 방법을 통해 보다 쉽게 데이터를 공유할 수 있도록 하는 방안이 필요 함. 실제 원내 데이터 공유 및 외부 접근 등의 문제에 대해 많은 부분 불편함을 겪고 있음

(18)

자료: 저자 작성. <그림 2-9> 연구 데이터 관리 및 공유에 대한 설문조사 - 여섯 번째 질문은 <그림 2-9>와 같이 연구 데이터 관리 및 공유에 대한 설문조사를 수행함 - KEI 내부에 데이터 저장소와 같은 데이터 공유 시스템이 필요하며(61명, 61%), 이를 통해 연구 생산성이 증가한다는 점에 대해서는 대부분 공감함(66명, 66%) - KEI에서는 연구자가 필요한 데이터를 찾는 데 어려움이 있음을 나타냄 - 데이터 관리를 위한 담당자(조직), 연구 활용 데이터 및 산출물 관리 등 데이터 관리 체계 에 대한 전반적인 논의가 필요해 보임. 또한 데이터 관리에 있어 관리 체계(제도) 부재, 관 리 시스템 부재, 전담 조직의 부재 등은 많은 사람들이 공감대를 형성하고 있다고 판단됨

(19)

4. 데이터 관련 주요 쟁점

○ 데이터 접근 권한 문제 - 국가마다 데이터 접근 권한에 대한 기준은 다름: 캐나다를 포함한 일부 국가에서는 정부 및 비정부기관 모두에서 데이터에 접근할 수 있는 권한을 제공하고 있음. 아일랜드에서 는 공공기관에서의 데이터 접근만을 허용함 - 데이터 접근 권한이 생산자(소유자)에 대한 특정 의무와 상충되는 경우가 많음 - 거의 모든 유형의 데이터에 대한 접근 허용 규정이 있으나 데이터 활용의 극대화를 위해 서는 (정책) 연구 및 통계작성 목적으로 활용되는 데이터 접근에 대한 허용 기준 완화 및 접근 권한의 유연화가 필수적일 것으로 판단됨 ○ 개인정보보호 문제 - 개인정보는 카페, SNS, 블로그, 댓글 등 웹상에 나타난 모든 요소에 노출되어 있어 이로 인해 개인의 프라이버시(privacy) 침해가 발생할 수 있고, 특히 비즈니스 가치가 증가할 수록 개인정보의 유출 위험이 높아질 수 있음 - 개인정보보호는 자신에 관한 정보의 공개 여부를 통제하고 영향을 끼칠 수 있는 개인의 권리로 정의함. 그들의 경쟁력과 소비자를 보호하고자 하는 취지에서 개인정보보호는 동일하게 적용될 수 있을 것임 - 서비스와 기기를 사용함으로써 정보를 만들어내는 이용자들 대부분이 해당 행위를 하고 있다는 것과 부가적으로 생성된 정보가 어떻게 사용되지를 인지하지 못한다는 점. 이에 따라 데이터가 훨씬 더 방대해지고 활용성이 높아진다면 개인정보보호에 관한 우려도 커질 것으로 전망됨 - 우리나라는 개인정보보호와 관련해서는 미국, 유럽, 일본이 보다 강한 규제제도를 가지 고 있는 것으로 평가됨(그림 2-10 참조) - 규제 수준이 상당히 높아서 관련 기술 및 산업이 제대로 성장하지 못하고 있다는 지적이 많으며, 빅데이터 활용과 개인정보보호 관련 법률의 상충 우려를 해소하는 것은 빅데이 터 활용 산업을 활성화하기 위한 핵심 사안으로 관련 규제의 개혁이 필요함5) 5) KCFT(2014), “빅데이터 활용과 개인정보보호”, 검색일: 2019.10.11.

(20)

자료: 디지털 금융센터(2017). <그림 2-10> 세계 주요지역의 개인정보 규제 강도 - 장기적으로는 개인정보가 포함된 데이터가 개인 자산화 될 수 있도록 블록체인 기술 도 입이 필요함. 블록체인 도입을 통해 내 데이터의 활용처를 명확하게 파악할 수 있으며 이를 통해 수익창출 및 원하지 않는 경우에는 활용범위를 제한하는 등의 조치가 가능하 도록 하는 것에 대한 검토가 필요함6) ○ 데이터 관리(management) 및 저장소(repository) 구축 관련 주요 쟁점7) - 데이터 저장소가 구축됨에 따라 정보의 관리·보호에 관한 정책과 지침의 적용을 받게 되 는 더 많은 데이터가 유입됨으로써 관리하는 데 어려움을 겪을 수 있음 - 불필요한 데이터의 유입은 피할 수 없으며 이에 따른 높은 저장 비용이 발생함 - 연구 데이터: 연구개발과제 수행 과정에서 실시하는 각종 실험, 관찰, 조사 및 분석 등을 통하여 산출된 사실 자료로 연구 결과의 검증에 필수적인 데이터(국가연구개발사업의 관리 등에 관한 규정, 제2조 18항8)) 6) brunch, “블록체인 기술과 개인 데이터의 자산화”, 검색일: 2019.10.11. 7) Sanderson, Reeson, and Box(2017).

(21)

- 연구자들은 생산된 연구 데이터를 연구자 소유로 인식하고 있으며 연구 데이터 관리와 공유를 지원할 수 있는 기반 환경이 미비함 - 과학기술계에서는 연구 결과에 검증이 필수적이고 각종 방식을 통해 검증 프로세스를 거침, 특히 데이터 분석 결과를 출판하는 저널에서는 데이터 수집 경로, 데이터 전처리 방법 등에 대한 명확한 기술을 요구하고 데이터 분석을 수행한 소스 코드를 요구하는 경 우도 다수 존재함

- 과학기술계에서는 데이터 관리 계획(DMP: Data Management Plan)을 도입하는 경

우도 있지만 효율성에 대해서는 논란의 여지가 있음

- DMP는 생산 및 수집(데이터 유형, 생산·수집 방법 등 저장 및 보존, 데이터 저장·관리·

백업 방안 공유, 데이터 공유 시점·방식·범위 관리, 공유 책임자, 성명·연락에 대한 연구

전 과정에 대한 데이터 관리를 하는 계획임9)

(22)

<표 2-2> 데이터 관리 계획(DMP) 템플릿 사례 한국연구재단 DMP 템플릿 (공개용)

한국연구재단

연구비 지원 기관 : 한국연구재단 작성자 : DMP 관리자 1) 연구 과제 요약 연구 과제 연구 개요 지원 기관 및 기간 수행 기관(연구책임자) 및 참여 기관(세부책임자) 2) 연구 데이터 형태 데이터의 종류 및 형태 연구 수행 과정에 생성 및 재사용하는 데이터의 종류, 형태, 파일 포맷, 크기 및 숫자 등 데이터 형태 : 텍스트, 스프레드시트, 이미지, 3D 모델, 소프트웨어, 영상(음성) 파일 등 연구 데이터 생성 및 가공 방법 기존 연구 데이터 활용 시 데이터 종류, 확보 및 활용 방법, 생성하는 데이터와의 관계 연구 데이터 신뢰성 검증 및 확보 방안 3) 연구 데이터 및 메타 데이터 표준 데이터, 메타 데이터 포맷 및 구성 요소(안) - 이미지(광학, 전자 현미경 등 소재의 이미지), 스펙트럼(XRD, XPS, Raman 등 물성과 관련 있는 spectra), 물성(전기, 화학, 광학, 촉매, 에너지 등 다양한 물성)은 기본 set로 소재 연구 데이터화 - 그 외 필요하다고 판단되는 데이터는 자율적으로 추가함 4) 연구 데이터 공유 및 제한 계획 연구 데이터 공유 방법 및 공개에 필요한 자원(소프트웨어 또는 장비)

(23)

연구 데이터 공개 시기 정책, 지적재산권 등에 의한 공개 유예(엠바고) 기간 필요 유무. 필요하다면 기간 명시 지적재산권 확보 주체 및 공유/활용 가능성 5) 연구 데이터 재사용 및 배포 계획 연구 데이터에 관심을 가지고 활용할 가능성이 있는 대상 연구 데이터 재사용 및 재활용 방법 연구 데이터 접근 제한 대상(있을 경우 이유 제시) 6) 연구 데이터 보관 계획 연구 데이터 관리, 가공 및 보관을 위한 장기적 계획 연구 데이터를 저장할 저장소 또는 데이터베이스 연구 과제 종료 후 연구 데이터의 보관 가치 연구 데이터를 보관하고 공유하기 위해 가공(변환)할 필요 유무 연구 데이터를 재사용하기 위해 제출 가능한 메타 데이터 및 문서 종류 자료: DMP, “DMP 공개 템플릿 목록”, 검색일: 2019.11.11. - <표 2-2>는 한국연구재단의 DMP 템플릿 사례를 나타내고, <그림 2-11>은 DMP의 주 요 흐름을 나타냄 - 미국, 영국 등 주요 선진국은 공공자금이 투입된 연구 성과물(논문, 보고서, 데이터 등) 을 공유·활용 촉진 정책을 추진, 특히 연구 성과물 중 연구 데이터의 쉬운 접근과 재사 용을 촉진하기 위해 DMP 의무화를 추진하고 있음 - <그림 2-12>와 같이 우리나라 과기정통부에서도 2019년 시범 R&D 과제를 대상으로 데이터 관리계획 제출 의무화를 우선 시행하며, 2020년부터 적용대상을 단계적으로 확대할 예정임

(24)

자료: Bulter University, “Data Management”, 검색일: 2019.11.11. <그림 2-11> DMP의 흐름 자료: 국가과학기술연구회(2019), “출연(연) 연구 데이터 관리·활용 방안 연구”, 검색일: 2019.10.10. <그림 2-12> 과기계 연구 데이터 관리를 위한 DMP 적용 - 하지만 DMP와 같이 엄격한 데이터 관리 정책은 신중한 도입이 필요함. 복잡하고 까다 로운 데이터 관리 과정으로 인해 연구의 효율성 감소가 나타날 수 있음. 특히 연구 기간 이 짧고 예산이 적은 과제의 경우에는 여러 측면에서 볼 때 달성하기 어렵고, 연구의 질 이 저하되는 역효과만 발생할 수 있는데, 대부분의 정책연구가 이에 해당함 - 연구자의 입장에서 데이터 관리 및 공유에는 많은 시간과 비용이 필요함. 이로 인해 연 구의 효율성 감소에 대한 고려가 필요하며, 패널티 정책이 아닌 인센티브 정책을 통해

(25)

데이터 활용의 극대화가 필요함 - 연구자에게 생성된 데이터를 검증함에 있어 너무 무거운 책임을 요구할 경우 적극적인 데이터 공유를 하지 않는 경우가 많게 발생할 것임. 데이터를 공유하는 부담을 최소화하 기 위해 데이터 목록화 및 검증을 위한 추가 인력을 활용하고, 데이터를 활용하고자 하 는 연구자가 데이터의 존재 여부를 확인한 후 협업하는 형태로 진행하는 것이 필요하며, 데이터 공유를 위한 데이터 저장소 구축(repository)이 필요함 ○ 정책연구에서 데이터 공유의 필요성 및 시너지 효과10) - 연구 데이터가 분산되어 있어 연구자가 데이터를 찾기가 쉽지 않은 문제 및 연구자들 사 이의 데이터 공유가 원활하지 않는 등의 문제가 존재함 - 연구 데이터 생산 및 소유의 독점 문제를 완화하고, 문제 해결을 위한 단편적 접근 및 분 석 결과의 지역적 활용을 지양하며, 다양한 데이터를 중심으로 협업을 장려하여 고부가 가치 지식의 범용적 활용 체계를 구축함 - 연구 데이터 관리 및 분석 결과 도출의 효율성 증대: 연구 데이터 분실 및 탐색 시간의 최소화와 재활용을 극대화하여 연구 시간 및 비용을 절감할 수 있음 - 각종 조사, 실험, 관찰, 행정자료 등을 통하여 생성된 객관적이고 사실적인 데이터 공유 및 기반 구축을 통해 데이터 중심의 정책 연구를 활성화함. 이는 정책 시행의 주요 근거 로 활용될 수 있으며 보다 투명하고 객관적인 정책 개발의 기반이 됨 - 데이터 접근성 확대로 주요 이슈에 대한 보다 신속한 대처 및 예측 분석을 통한 선제적 대응이 가능함 - 데이터의 부족한 부분에 대한 상호보완 및 단일 데이터에서는 파악할 수 없는 새로운 관 점의 인사이트 도출 및 의사결정 기회를 제공하는 기반을 구축함

(26)

○ 빅데이터 분석 및 성과에 대한 쟁점 - 빅데이터 분석을 위해서는 장비 구입, 서버 구축, 개발환경 구축, 데이터 분석 및 알고리 즘 구축이 필요함. 또한 데이터 분석을 위해서는 수학, 통계학, 전산학 등 다양한 분야의 지식이 필요하고 분석을 수행하는 분야에 대한 최소한의 지식을 가진 인력이 필요함 - 2016년 가트너는 빅데이터 프로젝트의 60%가 실패한 것으로 추산, 1년 뒤 가트너의 애 널리스트 닉 휴데커는 60%의 추정치가 “지나치게 보수적”, 실제 실패 비율이 85%에 근 접한다고 언급하였으며 이러한 상황이 지금도 바뀌지 않았음을 언급함11) - 투자 대비 원하는 만큼의 효과를 얻지 못하는 경우가 다수, 즉 많은 비용을 투자하여 분석을 진행 했지만 예상했던 뻔한 결과가 나오거나 원했던 결과 값이 제대로 나오지 않는 경우가 대부분임 - 빅데이터 분석은 데이터 수집 – 데이터 분석 – 시각화 등의 과정으로 이루어지며 한 주기 연구를 수행하는 데 많은 시간이 필요하기 때문에 단기성과 도출이 어려운 부분이 있음 - 미국에서 정부 주도의 공공 부문에 대한 빅데이터 도입이 활성화되고 있으므로 실질적인 성과 에 대해서는 논란이 존재함. 일각에서는 정부가 대규모 예산을 투입하고 있음에도 불구하고 현재 공공 부문의 빅데이터 활용 수준이 민간 부문과 비교했을 때 크게 뒤쳐진다고 지적함12) - 통계학자들은 목표/조사 모집단을 정의하고, 이 모집단에 근접하기 위해 표본 추출물을 구성하여 데이터를 수집하지만 빅데이터는 데이터가 먼저 생성되고 이를 분석하기 때문 에 원하는 표본에 대한 데이터 수집이 어려울 수 있음 - 빅데이터 분석의 최대 강점인 지속적/실시간 분석이 이루어지지 않고 일회성 분석에 그 치는 경우가 많으며, 실제 이를 달성하기 위해서는 많은 워크로드가 필요함 - 빅데이터 분석을 통해 미래에 대한 예측이 아니라 과거 데이터에 대한 사후 분석에만 머문다면 정 책연구에서 그 기대효과는 크게 감소하며 선제적으로 활용하기 위한 방안을 연구할 필요가 있음 - 빅데이터를 활용하는 데에는 비용이 소요될 것인데, 특히 민간이 보유한 빅데이터 및 외 부 자료 취득에 관련한 재정 규정이 미비한 경우가 많음 - 데이터 저장 및 분석 인프라 도입 비용이 부담 되어 빅데이터 프로젝트가 원활하게 진행 되지 못하는 문제가 발생함 - 연구를 수행할 때의 시의성, 연관성, 정확성, 일관성, 접근성, 예상 결과와 비용 및 응답 부담 경감 사이의 균형을 유지하기 위해 적절한 선택을 해야 함 11) CIOkorea(2019.5.21), “‘실패 가능성 85%’ 빅데이터 프로젝트의 문제와 해법”, 검색일: 2019.11.11. 12) 미국 공공 부문의 빅데이터 도입 정책에 대한 평가와 성과 제고를 위한 고려 요인.

(27)

5. 환경정책연구에서의 빅데이터 분석 활용 방안

○ 정책에서 빅데이터의 활용 방안 및 중요 쟁점 - 정책을 수립 및 결정하기 위해서는 현황 분석, 설문조사, 전문가 자문 등의 긴 과정이 필 요하기 때문에 실제 정책은 사후 대책으로 이어지는 경우가 다수. 빅데이터를 활용할 경 우 실시간적/지속적인 정책 수요 및 트렌드 분석이 가능함 - 주요 이슈에 대한 모니터링을 통해 사회 문제를 보다 빠르게 파악하여 정책의제로 설정 하고 정책 집행 후에는 빠른 피드백을 통해 정책 보완 및 수정에 활용함. 예시로 2010년 을 전후한 ‘미세먼지’ 연관 기사에서는 단순히 ‘미세먼지’ 발생에 대한 내용이 대부분이 었다면 최근에는 ‘미세먼지’와 ‘건강’, ‘취약계층’ 등 복합적인 내용들이 많이 나타나고 있다는 등 트렌드의 변화를 반영한 정책을 수립할 수 있음 - 실측 데이터에 기반을 둔 예측 모델을 구성할 경우에 데이터만 충분하다면 (단기) 예측 에 있어 보다 높은 정확도를 보임. 예시로 과거의 미세먼지 오염도 데이터를 사용해 미 래의 미세먼지 오염도를 예측할 경우 단기 예측에서는 매우 높은 예측 정확도를 나타냄. 이를 통해 미세먼지 경보를 조기 발령한다거나 보다 시의성 높은 미세먼지 저감 조치를 취할 수 있을 것으로 보임 - 하지만 높은 정확도를 보이는 예측을 위해서는 주로 최신 기계학습 방법론은 딥러닝 (Deep Learning) 기반의 방법을 사용하여 미세먼지 오염도를 추정하는 함수를 구성하 는데, 이는 미세먼지 예측에 도움이 되는 모든 독립변수들을 포함시켜 예측 정확도를 향 상시키며 매우 높은 변동성(variation)을 보이는 경우에도 매우 높은 정확도를 보임. 하 지만 이로 인해 함수의 형태가 매우 복잡해져 인과관계를 설명하기가 어려운 단점이 있 음. 또한 장기 예측에서는 정확도가 떨어지는 문제가 있어 장기적인 정책 수립 활용에는 어려움이 있으며 아직 이에 대해서는 보다 많은 연구가 필요함 - 기존에는 의미 있는 정보로 활용하지 못했던 비정형성이 높은 SNS 텍스트 이미지 데이터 등도 의미 있는 정보를 변환하여 활용할 수 있다는 점을 충분히 활용할 필요가 있음

(28)

자료: MEconferences Blog, “ Learning Every Function with Machine Learning”, 검색일: 2019.11.11.

<그림 2-13> 머신러닝 방법론의 분류

○ 빅데이터 분석 방법론은 크게 다양한 체계로 분류할 수 있지만 분석에 활용되는 기계학 습(Machine Learning) 방법론 측면에서는 <그림 2-13>과 같이 크게 세 가지, 즉 지도 학습(Supervised Learning), 비지도학습(Unsupervised Learning), 강화학습 (Reinforcement Learning)으로 분류할 수 있음 - 지도학습은 독립변수 및 종속변수 또는 정답(label)이 포함된 훈련 데이터(Training Data)에서 학습(Learning)을 통해 종속변수의 값을 추정 또는 예측하기 위한 함수를 도출해내는 방법임. 종속변수가 이산형 변수일 경우에는 분류(classification) 문제로, 연속형 변수일 경우에는 회귀(regression) 문제로 분류함 - 지도학습 예시: 초미세먼지 PM2.5 예측을 수행할 경우 독립변수(Nox, Sox, 중국대기 질, 기압, 기상, 과거/현재의 PM 2.5)와 종속변수(미래의 PM2.5)를 통해 함수를 도출 하여 예측에 활용하는 방식 - 비지도학습은 종속변수 또는 정답이 없는 독립변수만 포함된 데이터에서 패턴 분석을 수행함 - 비지도 학습 예시: 초미세먼지 PM2.5,PM10, Nox, Sox 등을 기준으로 패턴을 분류함

(29)

○ 연구 목적별 빅데이터 분석 방법론 활용 요소 <표 2-3> 머신러닝 방법론의 분류 목적 주요 내용 빅데이터 방법론 활용 요소 측정 및 탐지 센서, 드론, 위성 등을 활용한 측정 및 탐지 - 대기오염 물질 배출, 불법 폐기물 소각 등 수치 측정 및 이상 값 탐지 기술을 활용하여 주요 지점 상시 감시 예측 미래의 종속변수 값 예측 - 딥러닝 방법론을 활용한 예측 정확도 향상 (현재는 단기 예측 에서 높은 정확도, 변동성이 높은 데이터에서도 예측 가능) - 알고리즘 개선 및 데이터 축적에 따른 모델 수정 및 실시간 예 측 및 정확도 개선 효과 - 실측 값과 예측 값 사이의 차이 비교 분석을 통한 정책적 활용 방향 모색이 필요 - 모델링 결과 등과 결합하여 단기·중기·장기 예측에 통합 활용 인과관계 규명 이론에 근거한 독립변수와 종속변수 사이의 인과관계 설명 - 인과관계 규명을 위한 빅데이터 활용 방법론 모색 필요 - 최신 방법론 LIME을 포함한 빅데이터 분석 모형에 모델 설명 력을 강화한 다양한 방법론 적용 및 활용 연구 필요 - 기존의 분석/전문가 지식의 결과와 비교 분석 및 상호보완 영향력 분석 특정 변인 변화에 따른 종속변수 변화 측정 - 민감도 분석 활용: 현재의 현상을 설명할 수 있는 최적 추정 모형을 구성하고 독립변수의 값을 변화시켜 타깃 변수 값의 변화를 추정 - 기존의 영향력 분석 결과와 비교 분석 상관관계 분석 변수 간 상관 패턴 파악 - 클러스터링 방법론을 활용한 변수들 사이의 연관 패턴 분석 기타 이미지 분석 텍스트 분석 - 텍스트 마이닝을 활용: 텍스트 데이터를 활용한 환경정책 수 요 및 정책에 대한 감성 분석, 정책 수요 및 공급에 대한 분석, 정책 간 연관성 분석 등에 활용 - 이미지 분석 기법의 활용: 이미지 데이터를 활용한 대기오염, 수질오염을 추정하고, 생태교란종 식별 등 기존에 포괄하지 못한 데이터의 활용 분석, 대기 위성 이미지 영상 분석 등에 활용 자료: 강성원 외(2017)를 참조하여 저자 수정.

(30)

○ 공공 데이터를 활용한 정책적 활용의 주요 사례 - 공공 부문에서는 데이터 통합 및 개방, 빅데이터 분석 및 정책 수립, 업무 자동화 등에 데이터를 주로 활용하고 있음. <표 2-4>는 주요 우수 사례를 재분류 및 요약한 것임 <표 2-4> 공공 데이터를 활용한 정책적 활용 주요 사례 분류 내용 데이터 통합 및 개방 - 기상관측 자료를 생산하는 유관 기관(환경부, 산림청 등)의 자료를 기상자료개방포털 서비스로 통합 제공(기상청) - 실험동물정보, 식품 및 영양성분 등 의료 관련 데이터 개방(식품의약품안전처) - 독성정보를 제공하여 국민생활안전 향상(생활환경안전정보시스템, 식품의약품안전처) - 나라장터 입찰공고, 낙찰정보 서비스 등 데이터 개방(조달청) - 7개 기관의 자체 전자조달시스템의 입찰공고, 계약정보 등을 연계하여 오픈 API 데이터를 조달정보 개방 포털에서 통합 제공(조달청) - 경기데이터드림과 자동기상관측장비(AWS) 서버 간 데이터 연계를 통해 정확한 관측 데이터 (24개 시·군) 개방(경기도) - 청년 통계 데이터 개발 및 개방(세종시) - 전통사찰 현황, 부동산 중개업소, 시립박물관 관람객 현황 등의 공공 데이터 신규 개방(정읍시) - 시공 중인 공동주택(아파트) 현황, 노인인구 현황 등의 공공 데이터 신규 개방(대구 달서구) - 식품제조가공업소 현황, 인공어초 정보 등의 공공 데이터 신규 개방(부산 영도구) 데이터 분석 및 정책 수립 - 창업자를 위한 세무교육활동 등 창업의사결정 지원 - 국세 데이터 분석을 통해 최근 어려움에 빠진 자영업자·소상공인 지원 대책 마련에 활용 (국세청) - 날씨 정보 데이터를 활용하여 날씨 정보와 날씨에 따라 입을 옷을 추천해주는 민간 서비스 창출(기상청) - 조달 데이터 분석을 통해 기업의 제품판로 개척 기회 제공(조달청) - 119 구급차 배치 및 운영 최적화, 소상공인 주요 업종의 상권분석 컨설팅 등(경기도) - CCTV 최적화 설치 지역 지정 등 정책 반영(부산시) - 신용평가자료 데이터에 기반한 지방세 체납자 분석 및 체납액 회수전략 수립(부산시) - 지방세 체납 정보 분석 및 모니터링 모델을 개발하여 체납 지방세 회수율 증대(충청북도) - 관광 데이터 분석 및 관광객 성향 분석을 통해 충청북도 맞춤형 관광정책 수립(충청북도) - 재난 관련 데이터 정보를 제공하는 유관 기관과의 연계를 통한 홍수예측 대응 시스템 구축 - 효율적인 통근버스 도입을 위한 직원 거주지 빅데이터 분석 계획 등 추진(광주시) - 인허가 데이터를 활용한 역세권 분석으로 소상공인협회의 창업 지원(부천시) - 국민연금공단 데이터(공적연금 가입자 현황), 양주시 구인구직 데이터를 활용한 일자리 데이터 분석 추진(양주시) - 대구 북구 8경 관심도 분석(대구 북구) - 주민행복중심 생활지도 서비스 및 이용 기반 구축(대구 북구) - 공공 데이터를 활용한 민원 테마 분석으로 국민 요구사항 도출 및 맞춤형 정책 발굴 지원 (부산 북구) - 능허대 문화축제 데이터 분석으로 축제 메인 장소 변경 등 정책 반영(연수구) - 2018년도 해수욕장 피서객 데이터를 분석하여 정책에 반영(해운대구)

(31)

<표 2-4>의 계속 분류 내용 업무 자동화 및 편의 서비스 - 4대 보험 자료를 연계·활용하여 연말정산 간소화 및 행정절차 축소(국민건강보험공단) - 2018년 개정세법 데이터를 활용하여 복잡한 세금 계산을 간편히 계산하는 민간 서비스 창출 (국세청) - KISTI와 DOI 데이터 교환을 통해 국민 편의성 증대(특허청) - 데이터 기반 비즈니스 모델을 보유한 5년 미만 스타트업 대상 사업 예산 및 공간지원 등(경기도) - 산·학·연 데이터 협력 관계자 네트워크 구축을 통한 협업 과제 발굴, 노하우 공유 등(경기도) - 병원, 약국 데이터를 활용해 병원정보와 진료예약까지 한 번에 가능한 민간 서비스 창출 (부산시) - 전통·문화·생활정보 등의 데이터를 활용한 「세종시가이드 앱」 서비스 운영(세종시) - DUR 품목 및 의약품 정보 데이터를 활용하여 건강관리 정보를 제공하는 민간 서비스 (식품의약품안전처) 자료: 정책브리핑, “조달청, 경기도, 대구 북구 등 공공 데이터 관리 우수기관 선정”, 검색일: 2019.11.11.

(32)

○ 환경정책영역에서 빅데이터의 활용 - 환경정책영역에서 빅데이터 활용 (예상) 사례를 목적에 따라 정리하였음 <표 2-5> 환경정책영역에서 빅데이터 활용 (예상) 사례 목적 주요 활용 사례 측정 및 이상 탐지 - (중소규모) 환경오염물질 배출시설의 오염도 측정 및 탐지 - 수도 파이프 누수 탐지 - 식물 병해충, 서식지 손실, 생태 교란종, 위험 동물 탐지 - 동물 포획/로드킬 탐지 - 환경오염, 환경정의, 환경취약계층, 자연재해위험 지도 구축 - 불법 폐기물 소각 탐지 - 시민 참여형 환경 데이터 수집 연구(미세먼지, 생태분포 데이터 수집 등) 상관관계 분석 - 환경오염물질 사이의 상관관계 분석 - 지역별 환영오염 패턴 분석 - 환경 텍스트 연관 패턴 분석 - 생물 다양성 패턴 분석 영향 반응 측정 및 인과관계 규명 - 환경오염(수질오염, 대기오염) 원인 분석 - 환경정책별 영향력 분석 - 환경질병 원인 분석 - 대기오염/기후변화/수질오염에 따른 건강영향 분석 예측 - 환경오염(대기오염/수질오염) 예측 - 폐기물/쓰레기 발생량 예측 - 환경오염물질, 기름 유출 이동경로 예측 - 하천 수위 예측 - 에너지 수요 예측 - 조류 서식지 이동 패턴 예측 - 자연재해(폭염, 홍수, 지진 등) 예측 - 작물 생산량 예측 - 온실가스 배출량 예측 - 환경 분야 미래 트렌드 예측 기타 - 기후 재난별 피해 비용 추정 - (친환경)에너지 효율 최적화 - 최적 미세먼지 측정소/발전소/전기차 충전소 위치 - 최적 공기정화 시간 추정 - 친환경제품 도입에 따른 시장 규모 추정 - 토지/녹지 이용 변화 분석 - 환경정책 수요 및 공급 분석 - 환경 텍스트(SNS 등) 감성 분석 자료: 이은환 외(2019)를 참조하여 저자 수정.

(33)

데이터 활용성 강화 방안

1. 환경정책연구에서의 데이터 활용성 강화 방안

○ 데이터 관리 및 활용 체계 구축을 통한 데이터 중심 패러다임 도입 필요 - 많은 데이터가 분산되어 있어 어디에 무엇이 있는지에 대한 정보에 대한 공유가 필요하 고 연구자들 사이의 데이터 공유가 원활하지 않는 등의 소통 문제 해소가 필요함 - 데이터 공유 및 활용 체계 구축을 통해 연구 데이터 분실 및 탐색 시간의 최소화와 재활 용을 극대화, 연구 시간 및 비용 절감이 필요함 - 데이터 공유의 기여와 혜택의 불균형 해소가 필요: 활용성이 높은 자체 생산/가공 데이 터에 대한 저작권을 부여하고 일정의 인센티브 제공 등의 제도 도입 등이 필요함 - 데이터 활용성 평가기준 도입 필요: 데이터 인용 및 활용에 따른 평가기준 확립이 필요함 - 연구 데이터의 생산, 정제, 관리, 공유, 서비스 구축 등에 대한 보상 체계 확립과 실질적 인 데이터 공유, 융합, 협업을 통한 융합 연구의 장려가 필요함

자료: Bierer, Crosas, and Pierce(2017), pp.1684-1687. <그림 3-1> 데이터 관리 사례

(34)

- 데이터 정책 사례: 페널티 정책보다는 인센티브 정책으로 적극적인 데이터 공유 참여 유 도, 예시로 <그림 3-1>과 같이 보고서뿐만 아니라 데이터에 대해 ID를 부여하고 보고서 작성 시 특정 데이터를 활용할 경우 데이터의 ID를 기록하고 있음 - 개방적인 연구 환경으로 전환하기 위해 관련 교육, 인식 제고, 인센티브 등과 같은 방법을 통해 각 연구 데이터 공개 및 공유의 중요성을 강조하고 문화 확산을 위한 노력이 필요함 - 공개 데이터, 개인정보 비식별화 조치 후 활용 가능 데이터, 공유 불가 데이터 등 연구 데이터 보안과 관련한 명확한 가이드라인 확립이 필요함 ○ KEI에 적합한 데이터 관리(공유) 계획 도입 필요 - 현재 KEI에서는 단순 연구 보고서 제출 이외에 데이터 관리 체계가 없는 상황임

(35)

<표 3-1> KEI DMP 템플릿 및 데이터 사양 기술서 KEI DMP 템플릿 (예시)

한국환경정책·평가연구원

연구명 식별자(자동 부여) ○ 데이터 식별자 리스트 ○ 제출일자 데이터 사양 (Data Specification) ○ 데이터 식별자(자동 부여) ○ 데이터명 ○ 데이터 설명 ○ 자체 생산 데이터/외부 데이터 (복수 체크 가능) □ 자체 생산 데이터 □ 외부 데이터 ○ 생산 데이터/가공 데이터 여부 (복수 체크 가능) □ 원본 데이터 □ 가공 데이터 ○ 연관 분야 (복수 체크 가능) □ 기후 □ 대기 □ 물 □ 자원순환 □ 환경정의 □ 에너지 □ 국제협력 □ 빅데이터 □ 기타 ○ 데이터 파일 (자체 생산/재생산 데이터의 경우 업로드) ○ 데이터 링크 (외부 데이터) ○ 데이터 처리/가공/재생산 여부 ○ 데이터 타입 (실측(확정)치/추정치) ○ 관련 연구 식별자 (연구명) : (생략 가능) ○ 문의처/담당자 (생략 가능) ○ 보안 사항 (데이터 공개 제한 여부/사유 등) 자료: 저자 작성.

(36)

- <표 3-1>과 같이 KEI에 적합한 데이터 사양(specification)을 중심으로 최소화된 형식 의 데이터 관리 계획(DMP) 도입 및 데이터 저장과 공유가 가능한 데이터 저장소(data repository) 구축이 필요함 - DMP와 같이 엄격한 데이터 관리 정책은 신중한 도입이 필요하며 복잡하고 까다로운 데 이터 관리 과정으로 인해 연구의 효율성 감소 효과가 나타날 수 있음. 따라서 패널티 정 책이 아닌 인센티브 정책을 통해 데이터 활용의 극대화가 필요함 - KEI에서는 데이터를 직접 생산한 연구도 있지만 외부에서 생산한 데이터 활용 및 가공 중심의 연구가 많아 연구 종료 시 연구에 활용된 데이터 제출 및 데이터 공유에 따른 추 가 작업의 최소화가 필요함 - 현재 연구자들은 생산된 연구 데이터를 연구자 소유로 인식하고 있으며 연구 데이터 관 리와 공유를 지원할 수 있는 기반 환경이 미비함 - 연구자들은 전체 데이터를 그대로 이용하기보다는 일부 데이터 셋을 해당 연구에 맞도 록 가공하여 활용하는 경우가 많은데, 데이터 생산자는 미래 이용자의 요구를 완전히 예 측할 수 없기 때문에 데이터 공유를 통해 다양한 분석의 수행이 가능하도록 해야 함 ○ 데이터 중심의 연구 활성화를 위한 로드맵 제시 자료: 저자 작성. <그림 3-2> 데이터 중심의 연구 활성화를 위한 로드맵

(37)

- 단기적으로는 원내외 데이터 공유 및 연구 활성화를 위해 데이터 저장소 설계 및 구축이 최우선적으로 필요하고, 연구 과정에서 활용된 데이터 및 연구 산출물 관리 등을 위해 데이터 관리 계획, 데이터 탐색이 어려우며, 데이터 협업, 중개, 융합 연구 등을 위한 데 이터 관리 인력 등이 필요하다는 내용 등을 포함한 KEI에 적합한 데이터 관리 체계 구축 이 필요함 - 중기적으로는 연구 데이터 관리 체계의 고도화를 통해 연구 데이터 및 산출물의 축적과 공유가 활성화되고 이로 인해 데이터 기반 융합 연구의 활성화가 필요함 - 장기적으로는 주요 데이터의 수집 자동화와 연구 데이터 및 산출물을 서비스화하는 작 업이 필요하고, 데이터 융합 활용 사례 축적을 통해 데이터 기반 환경정책 및 서비스 개 발 등이 포함된 플랫폼 구축이 이루어져야 함 ○ 데이터 저장소 구축 및 관련 서비스 구축에는 단계적 접근이 필요 자료: 저자 작성. <그림 3-3> 데이터 중심의 연구 활성화를 위한 로드맵

(38)

- 데이터 목록화 → 데이터 수집/업로드 → 데이터 검증 → 데이터 활용을 위한 데이터 저장소 구축이 필요함(그림 3-3 참조) - 데이터에 대한 제약 상황 등이 있음을 고려할 때 데이터 목록화를 통한 존재 유무를 파 악하는 것이 중요하며, 이후 데이터 수집/업로드, 검증 등을 통한 관리가 필요함 - 연구자가 데이터를 다운로드, 업로드, 변경, 현황 조회 및 검색을 할 수 있는 시스템이 구축되어야 하며, 전문가는 이를 검증할 수 있도록 구성할 필요가 있음 자료: 저자 작성. <그림 3-4> 데이터 관리자의 역할 - <그림 3-4>는 데이터 관리자의 역할을 그림으로 나타낸 것이며, 원활한 데이터 공유 및 연구자의 부담을 최소화하기 위해 데이터 업로드/다운로드, 목록화, 중개, 검증 등을 수 행하기 위한 전담 데이터 관리자가 필요함

(39)

○ 장기적으로는 환경정책을 위한 플랫폼 구축 필요 - 데이터 저장소 및 관리 체계 도입 → 지속적인 데이터 수집 및 축적 → 데이터 활용 분 석 및 시각화 등을 활용한 연구 데이터와 산출물의 서비스 및 데이터 기반 환경정책 개 발(의사결정 지원)을 위한 플랫폼 구축이 필요함. <그림 3-5>는 데이터 기반 재난정보 관리 시스템 사례를 나타낸 것임 자료: 파이넨셜뉴스(2014.12.23), “정부, 재난 관련 기업 30곳 키운다”, 검색일: 2019.10.10. <그림 3-5> 데이터 기반 재난정보 의사결정 지원 플랫폼 사례

2. 환경 분야별 주요 데이터 소스 정리

○ 주요 환경 분야별 데이터 소스 정리 - 주요 데이터 소스를 환경 일반 및 통계, 기후/대기, 물환경, 자원순환, 자연/지구환경, 환경보건, 기타로 나누어 정리하였음 - 웹사이트에 특정 분야의 데이터를 포괄적으로 담고 있을 경우 웹사이트명과 그에 대한 설명을 기술하였고, 데이터만 공공 데이터 포털 등에 따로 올려져 있을 경우 데이터명 및 그에 대한 설명을 기술하였음 - 데이터 소스 정리를 위해 한국환경·정책평가연구원에서 발간한 보고서를 중심으로 주 요 웹사이트/데이터명(또는 기관명)을 중심으로 주요 데이터들을 정리하였으며 활용 빈 도 및 중요도에 따른 연구자의 판단에 의해 순서대로 정리하였음 - 정리된 데이터 소스는 추후 강성원 외(2018)에서 개발한 오픈 데이터맵에 통합할 예정임

(40)

<표 3-2> 환경 일반 및 통계 데이터 소스 정리 NO 웹사이트/ 기관명 관리자 제공형태 데이터 설명 1 환경 통계 포털 환경부 파일, 웹 대기질, 수질, 수자원, 기후변화, 폐기물, 보건, 에너지 등 환경 관련 각종 통계 제공 <http://stat.me.go.kr> 2 환경공간 정보 서비스 환경부 파일, 웹, 오픈 API 토지피복지도, 환경주제도, 토지이용/규제이역 등 다양한 환경공간정보를 제공 <https://egis.me.go.kr> 3 국토환경 정보센터 한국환경정 책·평가연 구원 파일, 웹, 오픈 API 국토환경 관련 공간정보, 연구결과 및 보고서 환경자원·토지이용, 환경주제도 등 정보 제공 <http://www.neins.go.kr> 4 환경영향평 가정보지원 시스템 환경부/ 한국환경정 책·평가연 구원 웹, 오픈 API 환경영향평가 정보 조회, 평가 진행 현황, 평가행정정보, 평가지리정보 등 환경영향평가 관련 정보 제공 <https://www.eiass.go.kr> 5 국가지표 체계 통계청 파일, 웹, 오픈 API 정부기관에서 엄선한 740개 지표를 통하여 다양한 방면에서의 우리나라 현 위치를 보여줌 <http://www.index.go.kr> 6 KOSIS 국가 통계포털 통계청 파일, 웹, 오픈 API 국가승인통계 전체를 데이터베이스로 한 곳에 구축 <https://kosis.kr> 7 통계청 통계청 파일, 웹, 오픈 API 국가통계 발전을 선도하며, 신뢰받는 통계생산으로 각 경제 주체에게 유용한 통계정보 제공 <http://kostat.go.kr> 8 OECD 환경 통계 OECD 파일, 웹 OECD 회원국의 경제, 재정, 사회, 환경 등의 분야별 통계를 공식적으로 정리한 자료 제공 <https://data.oecd.org/environment.htm> 9 UNSD 통계 DB UNSD 파일, 웹 유엔 회원국의 교육, 고용, 에너지, 환경, 식량과 농업, 건강, 산업, 인구 등 광범위한 분야에 대한 통계 자료 제공 <http://data.un.org> 10 UNSD 국가별 환경 통계 스냅샷 UNSD 파일, 웹 국가별 환경 통계 스냅샷 제공 <https://unstats.un.org/unsd/environment/Qu estionnaires/country_snapshots.htm> 11 Open SDG Data Hub UNSD 파일, 웹 지속 가능한 개발 관련 데이터 제공 <http://www.sdg.org> 12 OECD.Stat OECD 파일, 웹 OECD 국가 및 일부 비회원국의 데이터 및 메타 데이터 정보 제공 <https://stats.oecd.org> 13 Eurostat EU 파일, 웹 환경/에너지, 경제 금융 등 유럽 통계 자료 제공 <http://ec.europa.eu/eurostat/data/database>

(41)

<표 3-3> 기후/대기 분야의 주요 데이터 소스 정리 NO 웹사이트명 (데이터명) 관리자 제공형태 데이터 설명 1 기상청 기상청 파일, 웹, 오픈 API 대한민국의 날씨, 태풍, 황사, 기후 등에 대한 정보(예보, 실측치 등) 제공 <http://kma.or.kr> 2 에어코리아 한국환경공단 오픈 API파일, 웹, 대한민국의 초미세먼지(PM2.5),미세먼지 (PM10), O3(오존), 질소산화물(Nox), 일산화탄소(CO), 황산화물(Sox) 정보(예보, 실측치 통계) 등 제공 <http://airkorea.or.kr> 3 국가 대기오염물질 배출량 통계 환경부 국립환경과학원 파일, 웹 국가 대기오염물질 일산화탄소(CO), 질소산화물(Nox), 산화물(Sox) 등의 배출량 정보 제공 <https://kencis.me.go.kr> 4 한국환경공단 한국환경공단 오픈 API파일, 웹, 오존황사 발생정보 측정소정보, 대기오염 통계, 대기오염정보, 운행자동차 전문정비 자료, 운행자동차 저감장치 사업 현황, 도로 재비산먼지 측정정보, 전기차충전소 운영현황 정보 제공 <https://www.keco.or.kr> 5 기후변화 정보 포털 기상청 기후변화감시과 파일, 웹 기후변화 감시, 기후변화 시나리오, 전망보고서, 예측 정보 등 제공 <http://www.climate.go.kr/> 6 기후변화 취약성 평가 지원 도구 시스템 한국환경정책· 평가연구원 파일, 웹 광역/기초 지자체 기후변화 취약성 평가 지원 도구 제공 <https://vestap.kei.re.kr> 7 온실가스 종합 정보 환경부 온실가스종합 정보센터 웹, 파일 국가 온실가스 인벤토리, 배출량 통계 등 제공 <http://www.gir.go.kr> 8 국가기후변화 적응 포털 한국환경정책· 평가연구원 웹, 파일 기후변화 적응과 관련된 일반적인 상식부터 전문 정보, 교육, 전문가 네트워크 등의 종합 서비스 제공 <https://kaccc.kei.re.kr> 9 자동차 배출가스 및 소음 인증 환경부 국립환경과학원 파일, 웹, 오픈 API 자동차 배출가스 및 소음 인증 정보 제공 <https://kencis.me.go.kr> 10 기후환경대응 에너지사용량 정보  한국지역난방 공사 파일, 웹, 오픈 API 기후환경 대응 사용시설별 소비되는 열원 에너지 사용량(TJ) 정보 제공 <https://www.kdhc.co.kr> 11 대기배출원조 사 자료 통계 DB 환경부 파일, 웹 1종, 2종, 3종별 사업장 수, 배출시설 수, 방지시설 수, 배출구 수 현황 <https://www.data.go.kr>

(42)

<표 3-3>의 계속 NO 웹사이트명(데이터명) 관리자 제공형태 데이터 설명 12 기후변화 피해정보 한국환경정책 평가연구원 파일 기후변화 피해 분석과 관련된 자료의 Meta DB (원시자료의 출처, 위치 특성 등) <https://www.data.go.kr> 13 산사태 정보 시스템 산림청 웹 산사태 관련 예측정보, 위험정보 제공 <http://sansatai.forest.go.kr> 14 중국 대기질 Wangjiezju (개발자) 웹 중국 367개 도시별 대기질 (AQI/품질수준/PM2.5/PM10/SO2/CO/NO2/ O3) 자료 제공 <https://www.aqistudy.cn/historydata/> 15 경기데이터 드림 경기도 파일, 웹 경기도 대기오염물질 배출업소 관리 현황, 대기측정 대행업체 현황, 실내공기질 관리법 적용 대상 다중 이용시설 현황 등 정보 제공 <https://data.gg.go.kr/> 16 경기도 보건환경연구원 경기도 보건환경연구원 웹, 이미지 (의정부시, 수원본청 ) 시간별 대기이미지, 대기환경월보, 경기도 대기 오염도 등 정보 제공 <https://air.gg.go.kr> 19 한국서부발전 한국서부발전㈜ 파일, 웹, 오픈 API 서부발전 태안발전본부 주변지역 대기오염물질 농도, 온실가스 배출 현황, 발전소별 대기오염물질 현황 등 제공 <https://www.data.go.kr> 20 한국동서발전 한국동서발전㈜ 파일, 웹, 오픈 API 발전소의 대기오염물질 배출 현황, 연료소비 현황, 발전소 주변 대기질 및 기상정보 현황 등 정보 제공 <https://www.data.go.kr> 21 한국남동발전 한국남동발전㈜ 파일, 웹, 오픈 API 발전소의 대기오염물질 배출 현황, 발전소 주변 대기질 정보 제공 <https://www.data.go.kr> 22 환경산업기술원 환경산업기술원 파일 비산업 부문 온실가스 감축 사례와 제품의 탄소배출량 산정 작성지침 매뉴얼 자료 <https://www.data.go.kr> 23 부산환경공단 부산환경공단 파일 부산환경공단 소각처리시설 일일 대기질 현황 제공 <https://www.data.go.kr>

(43)

<표 3-4> 물환경 분야의 주요 데이터 소스 정리 NO 웹사이트/ 데이터명 관리자 제공형태 데이터 설명 1 물환경정보 시스템 국립환경과학원 환경부 웹, 파일, 오픈 API 수칠, 총량, 퇴적물, 방사성물질, 생물, 수리·수문·기상 정보 제공 <http://water.nier.go.kr> 2 실시간 수질 정보시스템 국립환경과학원 환경부 파일 실시간 수질정보 제공<http://www.koreawqi.go.kr> 3 국가수자원 종합정보시스템 한강홍수통제소 웹, 파일 수문기상, 유역, 하천, 댐, 지하수, 수도 등 수자원 관련 정보 제공 <http://www.wamis.go.kr> 4 국가지하수정보센터 환경부 웹, 파일 지하수 상식, 지하수 정보지도, 지하수 관측망 등 정보 제공 <http://www.gims.go.kr> 5 국가해양환경 정보통합시스템 해양환경공단 웹, 파일, 오픈 API 해양환경측정망, 해양수질자동측정망, 수질평가지수, 어장환경 모니터링 등 해양환경 관련 정보 제공 <http://meis.go.kr> 6 수자원공사 공공데이터 수자원공사 웹, 파일,오픈 API 수문, 수문제원 댐, 수위, 지하수, 정수장, 요금 등 수자원 관련 정보 제공 <https://www.kwater.or.kr> 7 종합정보시스템농업용수 한국농어촌공사 웹, 파일 기반시설, 용수관리정보, 수질정보, 실시간 계층 정보, 농업생산기반정비 통계연보 등 농업용수 관련 정보 제공 <https://rawris.ekr.or.kr> 8 한국환경공단 한국환경공단 웹, 파일, 오픈 API 상수도정보 통합 DB, 상수도통계, 수도 관련 수질 자료, 하수도보급 현황 정보 제공 <https://www.keco.or.kr> 9 해양환경관리 공단 해양환경관리공단 오픈 API 해양수질자동측정망, 해양수질정보 등 제공<https://www.data.go.kr> 10 지하수수질 측정망 DB 국립환경과학원 오픈 API환경부 지하수측정지점정보, 측정분석 결과 등을 제공 <https://www.data.go.kr> 11 경기도 데이터 드림 경기도 오픈 API 경기도 수질오염 배출 현황, 지하수 수질검사 측정 결과. 지하수의 채수위치, 측정결과 적합 여부, 수질자동측정소 등 정보 제공 <https://www.data.go.kr> 12 경기도 보건환경연구원 보건환경연구원경기도 파일 수질환경월보, 중점관리저수지 수질검사 결과 <https://www.data.go.kr> 13 인천광역시 보건환경연구원 보건환경연구원인천광역시 웹, 파일,오픈 API 하천 및 도시관류 수질검사, 해양수질 측정정보, 약수터 수질검사 결과 등 제공 <https://www.data.go.kr> 14 부산환경공단 부산환경공단 파일 하수처리시설 월별 평균 수질 현황, 하수처리시설 일일수질 현황 <https://www.data.go.kr> 15 대구환경공단 대구환경공단 웹, 파일 대구환경공단 하수처리 수질 데이터 <https://www.data.go.kr>

(44)

<표 3-5> 자원순환 분야의 데이터 소스 정리 NO 웹사이트/ 데이터명 관리자 제공형태 데이터 설명 1 한국환경공단 한국환경공단 웹, 파일, 오픈 API 폐기물 배출 및 처리 현황, 폐기물 배출 사업장 정보, 폐기물 통계정보, 폐기물 재활용 관련 통계, 재활용 가능 자원 가격조사, 음식물 쓰레기 배출정보, 재활용 가능 자원 가격조사 관련 정보 제공 <https://www.keco.or.kr> 2 해양쓰레기통합 정보시스템 해양환경공단 웹, 파일, 오픈 API 해양쓰레기 모니터링 및 통계, 사업정보 등 제공 <https://www.malic.or.kr> 3 자원순환정보시 스템 한국환경공단 웹, 파일 정부의 자원순환 정책 수립 기초자료를 제공하고, 폐기물 통계 입력 관리시스템을 통한 체계적인 폐기물 통계정보 생성·제공 <https://www.recycling-info.or.kr> 4 한국 폐기물협회 한국 폐기물협회 웹, 파일 폐기물 통계, 처리 업체 등 폐기물정보 제공 <https://www.kwaste.or.kr> 5 한국수자원공사 한국수자원공사 오픈 API 하수처리장 폐기물 발생량, 지역별 골재자원조사 결과 제공 <https://www.kwater.or.kr> 6 생산자 적임 재활용 제도(EPR) 한국환경공단 웹, 파일 생산자책임재활용제도, 재활용 부과금 계산 폐기물 재활용 관련 정보 제공 <https://www.iepr.or.kr/> 7 폐기물적법처리 시스템 (올바로) 한국환경공단 웹 폐기물 배출에서 최종 처리까지를 통합한 관리 시스템, 폐기물 통계, 순환골재 등 폐기물 관련 정보 제공 <https://www.allbaro.or.kr/> 8 한국원자력환경 공단 한국원자력환경 공단 웹, 파일, 오픈 API 개봉선원폐기물 관리 현황, 밀봉선원폐기물 관리 현황 정보, 방사성폐기물 반입 및 처분 현황, 방사성폐기물 연구자료 등 정보 제공 <https://www.data.go.kr> 9 한국중부발전 (주) 한국중부발전 (주) 오픈 API 발전소에서 배출되는 석탄회, 탈황석고 출고량, 폐기물 처리정보 등 제공 <https://www.data.go.kr> 10 한국서부발전 (주) 한국서부발전 (주) 파일, 웹, 오픈 API 석탄 재활용 내역, 폐기물 처리 내역 및 현황 등 제공 <https://www.data.go.kr> 11 한국동서발전 한국동서발전 (주) 파일, 웹, 오픈 API 석탄 재활용 내역, 폐기물 처리 내역, 녹색 제품 구매 현황 등 제공 <https://www.data.go.kr>

(45)

<표 3-5>의 계속 NO 웹사이트/데이터명 관리자 제공형태 데이터 설명 12 한국남동발전 한국남동발전 (주) 파일, 웹, 오픈 API 발전소에서 배출되는 석탄회 처리 현황 등 정보 제공 <https://www.data.go.kr> 13 대구환경공단 대구환경공단 파일 대구환경공단 성서소각장에서 처리하는 폐기물 현황 <https://www.data.go.kr> 14 광주환경공단 광주환경공단 파일 광주광역시 생활폐기물 수집운반업체 현황(주소, 연락처 등), 생활폐기물 반입 현황 등 제공 <https://www.data.go.kr> 15 경기도 데이터 드림 경기도 오픈 API 생활폐기물 처리, 폐기물 관리서비스업, 음식폐기물 처리 정보 제공 <https://data.gg.go.kr> 16 음식물쓰레기 배출정보 한국환경공단 오픈 API, 파일 RFID 기반 음식물쓰레기 종량제 시행 지자체 음식물쓰레기 배출정보(요일별, 시간대별) <https://www.data.go.kr>

참조

관련 문서

한국인 심전도 진단 데이터 기상관측 데이터. 항공우주소재 물성 데이터

관리시스템 • 의사결정을 위한 기본 데이터로 기업의 재무데이터, 회계데이터, 매출/마케팅 데이터, 생산, 인적자원 데이터 등 모든 기업

최상의 데이터 센터 구축을 위한 데이터 인프라 혁신 전략..

• 분석 이미지 데이터 저장 효율 제고를 위한

이 연구에서는 농업부문 데이터 경제 체계 구축 활성화를 위해 농업부문 데이 터의 전주기 활용 체계를 구축하기 위한 데이터 활용 현황과 문제점을 진단하고,

공공 데이터 개방(정부3.0)과 행정업무 능률 향상을

앞서 데이터 기록이 무엇인지, 예술·식품·기술·의료분야의 데이터 기록을 통해 다양한 데이터 기록의 방법에 대해 알아보았습니다.. 데이터 기록이 사회에 미친 영향은

이와 같은 문 제점 해결을 위해 TPMS의 유효신호 판정을 위한 양방향 통신 데이터 구조를 소개 하고 양방향 통신 데이터 신뢰성 확보를 위한 기존의 TPMS에서 고려하지 않은 우 수한