• 검색 결과가 없습니다.

환경정책연구에서의 빅데이터 분석 활용 방안

Ⅱ. 환경정책연구에서의 데이터 활용

5. 환경정책연구에서의 빅데이터 분석 활용 방안

○ 정책에서 빅데이터의 활용 방안 및 중요 쟁점

- 정책을 수립 및 결정하기 위해서는 현황 분석, 설문조사, 전문가 자문 등의 긴 과정이 필 요하기 때문에 실제 정책은 사후 대책으로 이어지는 경우가 다수. 빅데이터를 활용할 경 우 실시간적/지속적인 정책 수요 및 트렌드 분석이 가능함

- 주요 이슈에 대한 모니터링을 통해 사회 문제를 보다 빠르게 파악하여 정책의제로 설정 하고 정책 집행 후에는 빠른 피드백을 통해 정책 보완 및 수정에 활용함. 예시로 2010년 을 전후한 ‘미세먼지’ 연관 기사에서는 단순히 ‘미세먼지’ 발생에 대한 내용이 대부분이 었다면 최근에는 ‘미세먼지’와 ‘건강’, ‘취약계층’ 등 복합적인 내용들이 많이 나타나고 있다는 등 트렌드의 변화를 반영한 정책을 수립할 수 있음

- 실측 데이터에 기반을 둔 예측 모델을 구성할 경우에 데이터만 충분하다면 (단기) 예측 에 있어 보다 높은 정확도를 보임. 예시로 과거의 미세먼지 오염도 데이터를 사용해 미 래의 미세먼지 오염도를 예측할 경우 단기 예측에서는 매우 높은 예측 정확도를 나타냄.

이를 통해 미세먼지 경보를 조기 발령한다거나 보다 시의성 높은 미세먼지 저감 조치를 취할 수 있을 것으로 보임

- 하지만 높은 정확도를 보이는 예측을 위해서는 주로 최신 기계학습 방법론은 딥러닝 (Deep Learning) 기반의 방법을 사용하여 미세먼지 오염도를 추정하는 함수를 구성하 는데, 이는 미세먼지 예측에 도움이 되는 모든 독립변수들을 포함시켜 예측 정확도를 향 상시키며 매우 높은 변동성(variation)을 보이는 경우에도 매우 높은 정확도를 보임. 하 지만 이로 인해 함수의 형태가 매우 복잡해져 인과관계를 설명하기가 어려운 단점이 있 음. 또한 장기 예측에서는 정확도가 떨어지는 문제가 있어 장기적인 정책 수립 활용에는 어려움이 있으며 아직 이에 대해서는 보다 많은 연구가 필요함

- 기존에는 의미 있는 정보로 활용하지 못했던 비정형성이 높은 SNS 텍스트 이미지 데이터 등도 의미 있는 정보를 변환하여 활용할 수 있다는 점을 충분히 활용할 필요가 있음

자료: MEconferences Blog, “ Learning Every Function with Machine Learning”, 검색일: 2019.11.11.

<그림 2-13> 머신러닝 방법론의 분류

○ 빅데이터 분석 방법론은 크게 다양한 체계로 분류할 수 있지만 분석에 활용되는 기계학 습(Machine Learning) 방법론 측면에서는 <그림 2-13>과 같이 크게 세 가지, 즉 지도 학습(Supervised Learning), 비지도학습(Unsupervised Learning), 강화학습 (Reinforcement Learning)으로 분류할 수 있음

- 지도학습은 독립변수 및 종속변수 또는 정답(label)이 포함된 훈련 데이터(Training Data)에서 학습(Learning)을 통해 종속변수의 값을 추정 또는 예측하기 위한 함수를 도출해내는 방법임. 종속변수가 이산형 변수일 경우에는 분류(classification) 문제로, 연속형 변수일 경우에는 회귀(regression) 문제로 분류함

- 지도학습 예시: 초미세먼지 PM2.5 예측을 수행할 경우 독립변수(Nox, Sox, 중국대기 질, 기압, 기상, 과거/현재의 PM 2.5)와 종속변수(미래의 PM2.5)를 통해 함수를 도출 하여 예측에 활용하는 방식

- 비지도학습은 종속변수 또는 정답이 없는 독립변수만 포함된 데이터에서 패턴 분석을 수행함 - 비지도 학습 예시: 초미세먼지 PM2.5,PM10, Nox, Sox 등을 기준으로 패턴을 분류함

○ 연구 목적별 빅데이터 분석 방법론 활용 요소

○ 공공 데이터를 활용한 정책적 활용의 주요 사례

<표 2-4>의 계속

분류 내용

업무 자동화 및

편의 서비스

- 4대 보험 자료를 연계·활용하여 연말정산 간소화 및 행정절차 축소(국민건강보험공단) - 2018년 개정세법 데이터를 활용하여 복잡한 세금 계산을 간편히 계산하는 민간 서비스 창출

(국세청)

- KISTI와 DOI 데이터 교환을 통해 국민 편의성 증대(특허청)

- 데이터 기반 비즈니스 모델을 보유한 5년 미만 스타트업 대상 사업 예산 및 공간지원 등(경기도) - 산·학·연 데이터 협력 관계자 네트워크 구축을 통한 협업 과제 발굴, 노하우 공유 등(경기도) - 병원, 약국 데이터를 활용해 병원정보와 진료예약까지 한 번에 가능한 민간 서비스 창출

(부산시)

- 전통·문화·생활정보 등의 데이터를 활용한 「세종시가이드 앱」 서비스 운영(세종시) - DUR 품목 및 의약품 정보 데이터를 활용하여 건강관리 정보를 제공하는 민간 서비스

(식품의약품안전처)

자료: 정책브리핑, “조달청, 경기도, 대구 북구 등 공공 데이터 관리 우수기관 선정”, 검색일: 2019.11.11.

○ 환경정책영역에서 빅데이터의 활용