• 검색 결과가 없습니다.

생활밀착형 환경이슈에 대한 수요반영 개선 연구 : 민원 빅데이터 분석을 중심으로

N/A
N/A
Protected

Academic year: 2021

Share "생활밀착형 환경이슈에 대한 수요반영 개선 연구 : 민원 빅데이터 분석을 중심으로"

Copied!
104
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

생활밀착형 환경이슈에 대한

수요반영 개선 연구

민원 빅데이터 분석을 중심으로

(2)

참여연구원 강성원 (한국환경정책·평가연구원 선임연구위원) 한국진 (한국환경정책·평가연구원 선임전문원) 김진형 (한국환경정책·평가연구원 연구원) 김도연 (한국환경정책·평가연구원 연구원) 강선아 (한국환경정책·평가연구원 연구원) ❚연구자문위원 (가나다 순) 박성택 (한국소프트웨어기술인협회 교수) 박은정 (한국외국어대학교 교수) 이두형 (환경부 정보화담당관) 박창석 (한국환경정책·평가연구원 선임연구위원) 이창훈 (한국환경정책·평가연구원 선임연구위원) 홍한움 (한국환경정책·평가연구원 부연구위원) ⓒ 2019 한국환경정책·평가연구원 발행인 윤 제 용 발행처 한국환경정책·평가연구원 (30147) 세종특별자치시 시청대로 370 세종국책연구단지 과학·인프라동 전화 044-415-7777 팩스 044-415-7799 http://www.kei.re.kr 인 쇄 2019년 3월 26일 발 행 2019년 3월 31일 등 록 제 2015-000009호 (1998년 1월 30일) ISBN 979-11-5980-205-8 93530 인쇄처 세일포커스(주) 02-2275-6894 이 보고서를 인용 및 활용 시 아래와 같이 출처를 표시해 주십시오. 진대용 외(2019), 「생활밀착형 환경이슈에 대한 수요반영 개선 연구: 민원 빅데이터 분석을 중심으로」, 한국환경정책·평가연구원. 값 5,000원

(3)

빅데이터 연구의 중요 방법인 텍스트 마이닝은 문서 토픽 분류, 키워드 빈도수 분석, 연관 키워드 및 네트워크 분석, 문서요약 등의 알고리즘을 활용해 텍스트 내에 숨어있는 유의미한 패턴과 지식들을 추출하여 여러 분야의 의사결정에 활용되고 있습니다. 최근 미세먼지, 폐기물/쓰레기, 소음, 악취 등 다양한 환경문제가 사회적 이슈화 되고 있습니다. 하지만 실제로 해결을 요구하는 환경문제와 환경정책의 대응 사이에는 괴리가 존재하는 상황입니다. 이에 수요자의 다양한 의견이 반영된 텍스트를 발굴하고 분석을 통해 다양한 환경정책의 수요를 파악하고 적합한 환경정책을 공급 하는 등의 방법을 통해 보완이 필요합니다. 현재 발생하고 있는 다양한 환경이슈를 해결하기 위해서 정부부처를 포함하여 범국민적인 노력이 이루어지고 있지만 근본적인 해결을 위해서는 보다 다양한 관점의 연구가 필요합니다. 본 연구에서는 환경 민원 분석을 통해 다양한 시민들의 생활과 관련한 환경 이슈를 도출하고, 정책적 활용 방향에 대해 제시하였습니다. 본 연구의 결과가 환경정책연구에서도 빅데이터를 보다 적극적으로 활용하는 계기가 되기를 기대합니다. 끝으로 본 연구를 수행한 진대용 부연구위원, 강성원 선임연구위원, 한국진 선임전문원, 김진형 연구원, 김도연 연구원, 강선아 연구원에게도 감사를 표합니다. 바쁘신 와중에도 자문을 통해 연구에 도움을 주신 환경부 이두형 과장님, 한국소프트웨어기술협회 박성택 교수님, 내부에서서는 이창훈 선임연구위원, 홍한움 부연구위원 자문에도 감사의 마음을 전합니다. 2019년 3월 한국환경정책·평가연구원 원 장

윤 제 용

(4)
(5)

본 연구는 빅데이터 분석을 통한 생활밀착형 환경 이슈의 수요반영 개선 방안에 대한 연구이다. 시민들의 환경문제에 대한 인식이 높아지면서 미세먼지, 폐기물/쓰레기, 소음, 악취 등 다양한 환경문제가 이슈로 떠오르고 있다. 하지만 시민들이 실제로 해결을 요구하는 환경문제와 환경정책의 대응 사이에는 괴리가 존재한다. 이에 본 연구에서는 이런 시민들의 일상생활과 밀접한 관련이 있는 ‘민원’에서 발생하는 모든 환경 문제를 ‘생활밀착형 환경 이슈’로 정의하고 이에 대한 수요를 반영할 수 있는 방안을 제시하였다. 먼저 환경부 유사민원(국민신문고 공개민원) 분석을 통해 민원에서 나타나는 전반적인 환경이슈들을 분석하였다. LDA 토픽 모델링을 수행하여 ‘생활환경’, ‘건설 및 가축 폐기물’, ‘환경영향평가’, ‘유해화학물질’, ‘대기오염물질 및 배출시설’, ‘폐수’, ‘의료 및 사업장 폐기물’ 7개의 토픽으로 구성하였는데, 전체적으로 볼 때 소음, 쓰레기, 미세먼지 등을 포함하는 ‘생활환경’ 이슈와 관련한 민원이 상대적으로 증가 추세가 있었다. ‘생활환경’ 에서는 2015년 까지는 ‘공사소음, ‘층간소음’, ‘교통소음’, ‘공장소음’ 등의 다양한 소음 문제의 해결을 요구 하는 민원이 대다수 였지만, 2016년 이후는 미세먼지 이슈가 등장하면서 미세먼지가 가장 높은 빈도수를 보였다. 특히 ‘미세먼지’의 경우 ‘아이’들의 건강에 대한 우려와 더불어 관련 대책을 요구하는 민원이 많았다. ‘건설 및 가축 폐기물’ 및 ‘의료 및 사업장 폐기물’ 에서는 처리, 분리수거, 재활용 등에 관련된 내용이 많았으며, 특히 부가가치가 높은 건축 폐기물에 대한 ‘순환 골재’ 등에 대한 인식 개선이 필요한 것으로 나타났다. ‘환경영향평가’에서는 2018년 ‘소규모 환경영향평가’의 수요가 급격하게 증가하였으며, ‘폐수’에서는 폐수(배출 시설), 수질 등과 관련된 민원이 꾸준히 나타나고 있었고, 각종 축산폐수 등으로 인한 ‘지하수’에 대한 내용이 증가하는 추세를 보였다. ‘유해화학물질’ 에서는 설치검사, 안전검사, 설치검사, 영업허가, 취급시설, 신고대상 등에 내용이 많았고, 대기오염물질 및 배출시설’에서는 대기 배출시설, 배출허용기준, 방지시설, 자가측정, 악취배출 허용 및 해당 여부 등의 내용이 많았다.

(6)

소음의 원인을 추적하고 적시에 대응하는 동시에, 도로변에서 발생하는 소음을 막기 위한 방음벽 설치 등의 정책적 지원이 필요할 것으로 사료된다. 악취 문제에 대한 대책도 필요하다. 비료, 쓰레기악취, 축사악취 등으로 인한 악취가 다수 발생하고 있으므로 이에 대한 대처가 필요하다. 또한 단지 내, 아파트, 상가, 그리고 특히 버스정류장 등에서 자주 발생하는 쓰레기 문제에 대응하기 위한 정책 및 전기차 충전소 설치, 및 보조금 지급에 관련한 문제에 대해서도 보다 건설적인 대책이 필요해 보인다. 환경정책의 최종 수요자는 국민이므로, 이들이 해결을 요구하는 환경이슈를 다양한 경로로 파악하는 것이 중요하다. 민원은 환경 텍스트 중 시민들의 실제 생활과 관련성이 높은 환경 문제의 시각을 반영하고 있어 좋은 정책수립의 근거를 찾을 수 있을 것으로 판단된다. 현재 시민 대다수가 많은 환경문제 에서도 미세먼지 이슈에 촉각을 곤두세우고 있다. 그런 한편 으로 실제 민원에서는 이 외에도 공사소음, 쓰레기, 악취 등의 문제에 대한 해결을 요구하는 비중이 높은 것으로 나타나 이에 대한 적극적인 대응이 필요한 실정이다. 미세먼지는 단기 간에 해결할 수 있는 문제가 아니며 국내의 문제해결과 더불어 국제적인 협력을 필요로 한다. 반면에 소음, 쓰레기, 악취 등은 충분한 논의를 통해 규제, 피해보상, 단속강화 등이 이루어진다면 그 피해를 줄일 수 있을 것으로 보인다. 주제어 : 빅데이터, 텍스트 마이닝, 민원, 환경이슈, 생활밀착형

(7)

제1장 서 론 ···1 1. 연구의 필요성 및 목적 ···1 2. 연구의 범위 ···2 3. 연구의 내용 및 수행 체계 ···2 제2장 텍스트 마이닝과 환경연구 ···4 1. 텍스트 마이닝의 정의 및 주요 절차 ···4 2. 민원 텍스트 활용 사례 분석 ···6 3. 주요 텍스트 마이닝 방법론 ···9 제3장 생활밀착형 환경이슈 분석 ···15 1. 환경부 유사민원 분석 ···15 2. 세종시 민원 분석 ···48 3. 분석결과 정리 ···69 4. 지자체 세부사업 내용 분석 ···72 제4장 결론 및 제언 ···74 1. 결론 ···74 2. 민원의 정책적 활용방안 ···76 참고문헌 ···79

(8)

II. 키워드 네트워크 분석 : 지방재정 365 세부사업별 세출 현황 ···85

(9)

<표 2-1> 단어-문서 행렬의 예 ···5 <표 2-2> 명사 인식 문장 예시 ···9 <표 3-1> 환경부 유사민원: 7개 토픽 ···26 <표 3-2> 1번 토픽(생활환경) 연도별 키워드 분석 ···37 <표 3-3> 2번 토픽(건축 및 가축 폐기물) 연도별 키워드 분석 ···38 <표 3-4> 3번 토픽(환경영향평가) 연도별 키워드 분석 ···40 <표 3-5> 4번 토픽(유해화학물질) 연도별 키워드 분석 ···41 <표 3-6> 5번 토픽(대기오염물질 및 배출시설) 연도별 키워드 분석 ···43 <표 3-7> 6번 토픽(폐수) 연도별 키워드 분석 ···44 <표 3-8> 7번 토픽(의료 및 사업장 폐기물) 연도별 키워드 분석 ···46 <표 3-9> 세종시 민원 토픽별 비중 ···58 <표 3-10> 연도별 키워드 분석 – 세종시 ···68

(10)

<그림 2-1> 텍스트 마이닝의 주요 절차 ···4 <그림 2-2> 인천시 환경 카테고리 민원 분석 ···7 <그림 2-3> 민원 빅데이터 분석 서비스 ···8 <그림 2-4> LDA 토픽 모델링 ···10 <그림 2-5> 단어들의 벡터 표현 예시 ···12 <그림 2-6> CBOW와 Skip-gram 모델 구조 ···12 <그림 2-7> 키워드 네트워크 구성방법 ···13 <그림 2-8> 구글 클라우드 감성분석 예시 ···14 <그림 3-1> 환경부 유사민원 ···16 <그림 3-2> 환경부 유사민원 추이 ···17 <그림 3-3> LDA 시각화 결과(환경부 유사민원): 첫 화면 ···18 <그림 3-4> LDA 시각화 결과(환경부 유사민원): 1번 토픽(생활환경) ···19 <그림 3-5> LDA 시각화 결과(환경부 유사민원): 2번 토픽(건설 및 가축 폐기물) ···20 <그림 3-6> LDA 시각화 결과(환경부 유사민원): 3번 토픽(환경영향평가) ···21 <그림 3-7> LDA 시각화 결과(환경부 유사민원): 4번 토픽(유해화학물질) ···22 <그림 3-8> LDA 시각화 결과(환경부 유사민원): 5번 토픽(대기오염 시설 및 물질) ···23 <그림 3-9> LDA 시각화 결과(환경부 유사민원): 6번 토픽(폐수) ···24 <그림 3-10> LDA 시각화 결과(환경부 유사민원): 7번 토픽(의료 및 사업장 폐기물) ···25 <그림 3-11> 네트워크 시각화 결과(환경부 유사민원): 1번 토픽(생활환경) ···28 <그림 3-12> 네트워크 시각화 결과(환경부 유사민원): 2번 토픽(건설 및 가축 폐기물) ···29 <그림 3-13> 네트워크 시각화 결과(환경부 유사민원): 3번 토픽(환경영향평가) ···30 <그림 3-14> 네트워크 시각화 결과(환경부 유사민원): 4번 토픽(유해화학물질) ···31 <그림 3-15> 네트워크 시각화 결과(환경부 유사민원): 5번 토픽(대기오염물질 및 배출시설) ····33 <그림 3-16> 네트워크 시각화 결과(환경부 유사민원): 6번 토픽(폐수) ···34

(11)

<그림 3-20> 세종시, 시민의 창 상담 내역 ···49 <그림 3-21> 세종시 환경민원 추이 ···50 <그림 3-22> LDA 시각화 결과(세종시 민원): 첫 화면 ···51 <그림 3-23> LDA 시각화 결과(세종시 민원): 1번 토픽(공사소음·먼지) ···52 <그림 3-24> LDA 시각화 결과(세종시 민원): 2번 토픽(도로녹지 관리) ···53 <그림 3-25> LDA 시각화 결과(세종시): 3번 토픽(도심지 악취·냄새) ···54 <그림 3-26> LDA 시각화 결과(환경부 유사민원): 4번 토픽(공원시설 관리) ···55 <그림 3-27> LDA 시각화 결과(환경부 유사민원): 5번 토픽(생활 쓰레기/미세먼지) ···56 <그림 3-28> LDA 시각화 결과(환경부 유사민원): 6번 토픽(화장실 관리) ···57 <그림 3-29> LDA 시각화 결과(환경부 유사민원): 7번 토픽(전기차) ···58 <그림 3-30> 네트워크 시각화 결과(세종시 민원): 1번 토픽(공사소음·먼지) ···60 <그림 3-31> 네트워크 시각화 결과(세종시 민원): 2번 토픽(도로녹지 관리) ···61 <그림 3-32> 네트워크 시각화 결과(세종시 민원): 3번 토픽(도심지 악취·냄새) ···62 <그림 3-33> 네트워크 시각화 결과(세종시 민원): 4번 토픽(공원시설 관리) ···63 <그림 3-34> 네트워크 시각화 결과(세종시 민원): 5번 토픽(쓰레기) ···64 <그림 3-35> 네트워크 시각화 결과(세종시 민원): 6번 토픽(화장실 관리) ···65 <그림 3-36> 네트워크 시각화 결과(세종시 민원): 7번 토픽(전기차) ···66 <그림 3-37> 세종시 민원 토픽 시계열 분포 ···67 <그림 3-38> 환경부 유사민원 주요 키워드 추이 정리 ···70 <그림 3-39> 세종시 민원 주요 키워드 추이 정리 ···71 <그림 3-40> 지방재정 365 세부사업별 세출 현황 ···72 <그림 4-1> 민원분석을 반영한 공공정책 수립 절차 ···76 <그림 4-2> 정책 공급자 및 수요자 입장에서의 환경 텍스트 ···78

(12)
(13)

제1장

서 론

1. 연구의 필요성 및 목적

시민들의 환경문제에 대한 인식이 높아지면서 미세먼지, 폐기물/쓰레기, 소음, 악취 등 다양한 환경문제가 이슈로 떠오르고 있다. 하지만 주로 이슈가 되는 환경문제에 대해서만 연구 및 정책개발이 집중되는 경우가 많아 시민들의 실제로 체감하며 해결을 요구하는 환경 문제 사이에 괴리감이 존재하고, 이에 대응하는 다양한 환경정책이 시민들의 요구를 따라가지 못하는 상황이다. 시민들의 다양한 환경정책 수요를 파악하기 위해서는 실태 및 현황 조사, 설문조사 등을 수행해야 하지만, 시·공간적 노력이 많이 필요하고 예산 및 인력 측면에서도 불리한 측면이 있다. 현재 다양한 분야에서 주요 키워드 빈도수 분석, 키워드 네트워크 분석, 단어 임베딩, 토픽 모델링 등의 텍스트 마이닝(text mining) 분석 방법론을 활용하여 다양한 인사이트를 도출 및 활용하고 있다. 환경 분야에서도 다양한 환경 텍스트 데이터를 분석-처리할 수 있는 방법론을 활용하여 기존의 환경정책 수요 조사 방법들을 보완할 필요가 있다. 시민들의 소통창구인 민원은 시민이 행정기관에 어떤 구체적인 문제를 해결해 줄 것을 자발적으로 요청하는 통로이다. 시민들이 일상생활을 하면서 느끼는 다양한 불편 또는 불만 사항을 반영하므로 시민들의 생활개선에 활용할 수 있다. 수년간 환경민원이 축적되어 왔음 에도 불구하고, 환경민원 텍스트 분석을 통해 시민들의 생활과 관련성이 높은 환경이슈를 도출하고 이를 정책에 반영하기 위한 연구는 많지 않다. 따라서 본 연구에서는 민원 텍스트 분석을 통해 실제 시민들의 직접적인 생활과 관련성이 높은 중요 생활밀착형 환경이슈를 도출하여 환경정책 구성에 반영함으로써 기존 환경정책에 보완재의 역할을 하고자 한다.

(14)

텍스트 데이터 분석의 관점에서는 데이터 수집 및 저장을 위한 인프라 구축이 필요하고, 비정형성이 높은 환경 텍스트 데이터 수집-분석-시각화를 위한 알고리즘 구축이 필요한 상황이다. 민원 텍스트는 비정형성이 매우 높아서 이를 효과적으로 분석하고 시각화하는 방법론 연구가 필요하며, 앞으로 다양한 이슈를 보다 효과적으로 분석하기 위한 주요 환경 키워드 사전 구축 등의 작업 또한 필요하다.

2. 연구의 범위

본 연구의 목적인 환경 민원 텍스트 분석을 통해 실제 시민들의 직접적인 생활과 관련성이 높은 중요 생활밀착형 환경이슈를 도출을 위한 주요 연구 내용은 다음과 같다. 먼저 민원 분석을 통해 국민들의 다양한 수요를 파악하는 선행연구를 조사 및 검토한다. 특히 환경정책연구에서 민원의 활용 가능성에 초점을 맞추어 검토하였다. 이는 연구의 범위와 및 방향을 설정하기 위한 사전 작업이라고 할 수 있다. 다음으로 최근 4년 동안의 환경부 유사민원 데이터를 분석하여 민원에서 나타나는 전반 적인 환경이슈 도출 및 추이를 분석한다. 또한 이를 기초로 하여 지방분권 계획도시인 세종 특별자치시 민원 분석을 사례를 통해 지역 환경이슈를 도출하고 정책의 방향성을 제시한다. 추가적으로 민원분석 결과로부터 도출된 환경 이슈와 지자체 세부사업에 예산의 반영 여부 분석을 통해 정책의 수요 및 공급 사이의 차이를 진단 및 보완을 위한 사례를 제시하였다. 마지막으로 환경민원을 포함한 다양한 환경 텍스트의 정책연구에 있어서의 활용 방향에 대해서 제시한다.

3. 연구의 내용 및 수행 체계

본 연구의 제2장에서는 텍스트 마이닝의 기본적인 절차와 민원 데이터 분석을 수행한 국내외 현황 및 사례 분석을 통해 민원 데이터의 분석의 흐름, 활용 방안 등을 검토하여 연구의 방향성을 설정하였다. 또한 본 연구에서 활용한 텍스트 마이닝 방법론에 대해 간략히 기술하였다.

(15)

있는 다양한 환경이슈들을 발굴하고 이에 대한 키워드 네트워크 분석, 트렌드 분석 등을 수행하고 이를 활용하여 세종특별자치시 민원을 분석함으로써 지자체에서 해결해야 할 환경문제를 분석하였다.

제4장에서는 연구내용을 요약하고 생활밀착형 환경이슈의 반영이 필요한 환경정책을 제안하였다.

(16)

제2장

텍스트 마이닝과 환경연구

1. 텍스트 마이닝의 정의 및 주요 절차

텍스트 마이닝(text mining)은 텍스트(text) 데이터에서 유용한 정보를 캐낸다(mining)는 의미로, 비정형 텍스트들에서 각 문서에 포함된 특징(feature)을 추출하고 이들의 패턴이나 연관성을 파악하여 활용하는 비정형 데이터 분석이다. <그림 2-1>은 일반적인 텍스트 마이닝 연구의 과정을 나타낸다.

자료: 저자 작성.

(17)

‘환경부 유사민원’과 세종특별자치시 ‘시민의창 상담내역’ 두 가지를 선정하였다. 다음으로는 ‘형태소 분석(morphological analysis)’은 텍스트 문서를 의미를 지니는 작은 말의 최소 단위인 형태소로 분리하는 만드는 과정이다. 형태소 분석에서는 형태소 분석을 위한 일종의 사전을 활용하는데, 이 사전에는 전문영역인 환경영역에서 사용하는 단어들이 포함되어 있지 않아 명사인식의 과정을 추가적으로 수행하였다. 명사 인식 방법은 제2장 제3절 상세히 설명하였다. 이후 ‘품사 태깅(pos tagging)’을 통해 각 형태소들의 품사를 판별 및 태깅이 이루어진다. 그 이후에는 텍스트 분석에 불필요한 단어를 제거하는 과정을 거친다. 이 과정에서 거의 등장하지 않는 단어나 -을, -를, -에게 등과 같은 조사 등을 제거 한다. 다음으로는 단어-문서 행렬을 구축한다. <표 2-1>은 단어-문서 행렬(TDM: Term- Document matrix)의 예를 나타낸 것이다. 환경 미세먼지 쓰레기 악취 소음 Doc1 5 0 2 2 0 Doc2 2 3 4 0 0 Doc2 1 0 0 0 2 … … … … DocN 2 4 0 1 2 <표 2-1> 단어-문서 행렬의 예 자료: 저자 작성. 이는 문서에 등장한 단어의 빈도수(TF: term frequency)를 중요도로 활용하여 행렬의 형태로 나타낸 것으로, 즉 문서에 빈번하게 나타나는 단어가 중요하다는 것을 의미한다. 각 단어의 중요도를 나타내는 여러 방법은 여러 가지 인데 일반적으로 TF-IDF(Term Frequency-Inverse Document Frequency)를 사용한다. 이는 각 단어의 출현횟수에 단 어가 문서에 나타난 횟수의 역수인 IDF(역문서 빈도)를 곱하여 나타낸 값이다. 즉 단어가 빈번하게 나타날수록 중요도가 높아지지만, 대부분의 문서에서 등장할 경우에는 높은 패널 티를 부여하여 중요도를 측정하는 방법이다. 예를 들면 <표 2-1>에서 ‘환경’ 이라는 단어는

(18)

높은 출현빈도를 보이지만 대부분의 문서에서 등장한다. 이럴 경우에는 높은 패널티가 부여 되어 텍스트 분석시 중요하지 않은 단어로 처리 될 수 있다.

다음으로는 텍스트 마이닝 분석과정이다. 단어-문서 행렬이 구성된 이후에는 일반적인 정형 데이터에서 분석에 사용하는 알고리즘을 어렵지 않게 적용할 수 있다. 본 연구에서는 키워드 빈도수 분석, 토픽 모델링 방법인 LDA(Latent Dirichlet Allocation), Word2vec, 문장 추출방법 등을 활용하였으며 제2장 제3절에 자세히 기술하였다.

2. 민원 텍스트 활용 사례 분석

텍스트 마이닝은 상품의 댓글에 담긴 감성 분석을 통해 매출증진을 도모하고, 논문 데이 터를 활용하여 특정 연구 분야의 주요 이슈 및 트렌드를 분석하며, 뉴스 데이터를 분석하여 정치, 경제, 사회 분야의 주요 이슈를 도출하는 등 다양한 영역에서 활용된다. 인천광역시에서는 민원 빅데이터 분석을 통해 기관 및 분야별로 민원 발생량을 분석하고, 시기별 키워드 분석, 관련 내용 분석 등을 통해 시민들이 요구하는 정책의 수요를 분석하여 이를 정책 수립에 반영하고자 하였다. <그림 2-2>는 인천광역시 환경민원 키워드 빈도 분석 결과를 나타낸 것이다. 환경 카테고리에 나타난 주요 키워드와 관련 내용을 확인 및 분석하여 민원에서 발생하는 주요 환경이슈들을 파악하고, 이에 대한 답변 분석을 통해 각 민원들의 처리 현황과 처리 방법에 대한 분석을 수행하였다. 최종적으로 환경분야에서는 공사소음, 비산먼지 등에 많은 민원이 발생하였는데 공사는 필요하지만 이로 인해 발생하는 ‘소음’, ‘먼지’ 등에 의한 피해를 최소화하는 정책이 필요한 것으로 파악되었다. 또한 층간소음에 대해서도 근본적인 해결은 불가능하지만 이로 인한 피해를 최소화하는 방안이 필요한 것으로 나타났다.

(19)

\ 자료: 인천광역시, “인천광역시 민원 빅데이터 분석 결과 보고서”, 2018.10.24. <그림 2-2> 인천시 환경 카테고리 민원 분석 여러 해에 걸쳐 축적한 텍스트 데이터와 보편화된 텍스트 분석 알고리즘의 활용을 통해 다양한 텍스트 분석을 제공하는 서비스들이 등장하고 있다. 국민권익위원회에서는 <그림 2-2>와 같이 ‘한눈에 보는 민원 빅데이터’ 웹 사이트 운영하며 다양한 이슈를 제시하고 있다. 민원 빅데이터 분석 결과를 분야별, 지역별, 연령별, 성별로 구분하여 실시간으로 제 공하는 것은 물론 주간별, 월별 분석리포트를 제공하며 국정과제로 포함된 주요 환경이슈에 대해서는 민원 데이터의 변화량을 분석하여 그 시급성을 평가하고 있다. 2019년 3월 4일 기준으로는 쓰레기, 허가, 예산, 소음 등이 환경분야 주요 민원 키워드임을 알 수 있다.

(20)

자료: 국민신문고, “한눈에 보는 민원 빅데이터”, 검색일: 2018.10.24.

(21)

가. 명사 인식 형태소 분석을 수행하기 전, 환경과 관련성이 높은 미등록 단어들을 형태소 분석 사전에 포함하기 위해 파이썬 오픈 라이브러리인 ‘soynlp’을 활용하여 명사 인식을 수행하였다.1) 문장 1: 나는 오늘 ‘N’에 갈 예정이야. 문장 2: 9시에 ‘N’에서 만나자 문장 3: 학생들이 ‘N’으로 모였다. <표 2-2> 명사 인식 문장 예시 <표 2-2>의 문장에서 ‘N’ 오른쪽의 글자 분포인 -에,-에서,-로를 보면 ‘N’이 명사임을 추측할 수 있다. 특정 단어의 오른쪽에 등장하는 글자들의 분포를 이용하여 명사를 추출하는 방식이다. 먼저 이를 위해서는 한 개의 어절을 두 개의 단어로 분리한 뒤 왼쪽, 오른쪽 단어의 분포를 보고서 명사인지 판단한다. 예를 들어 ‘도담동’이라는 단어는 여러 문장에서 ‘도담동’에, ‘도담동’에서, ‘도담동’으로 등의 표현이 자주 나타나므로 ‘도담동’은 명사로 인식된다. 하지만 통계적인 방법이라서 항상 오류가 존재하므로, 실제 활용 시에는 연구자의 검증을 거친 뒤 사전에 추가한 후 형태소 분석을 수행하여야 한다. 나. 키워드 빈도 분석 키워드 빈도분석은 <표 2-1>과 같이 각 문서에 등장한 키워드의 출현 회수를 세어서 주요 키워드를 도출하는 방법이다. 본 연구에서는 연도별로 문서를 나눠 TF-IDF 방법으로 키워드의 중요도를 계산하고, 각 키워드를 순위화하여 결과를 도출하였다. 1) Github, “한국어 자연어처리를 위한 파이썬 라이브러리”, 검색일: 2018.11.10.

(22)

다. 토픽 모델링

토픽 모델링(topic modeling)은 통계에 기반을 두고 주어진 문서에 포함된 숨은 토픽을 찾아내는 방법론이다. 본 연구에서는 토픽 모델링 방법 중 현재 가장 널리 사용되고 있는 Blei et al.(2003)이 개발한 Latent Dirichlet Allocation(LDA) 모델을 이용한 토픽 클러 스터링 분석을 활용하여 문서에 포함된 토픽을 도출하였다. LDA 모델은 문서에 수동으로 레이블링 작업을 할 필요가 없는 비지도 학습 알고리즘으로, 문서-토픽-단어 3계층으로 베이지안 모형이며, 기존 토픽 모델링 알고리즘보다 성능이 우수한 것으로 알려져 있다. (Chiru et al., 2014, pp.255-262). 자료 : 저자 작성. <그림 2-4> LDA 토픽 모델링 <그림 2-4>는 LDA 토픽 모델링의 예시를 보여 준 것이다. LDA는 토픽의 개수(K)를 입력하여 문서에 포함된 단어의 분포, 즉 단어-문서 행렬을 가장 잘 설명할 수 있는 문서-토픽 행렬과 문서-토픽-단어 행렬을 계산하는 방법론이다. 이 행렬을 바탕으로 하여 각 문서가 토픽에 포함될 확률 및 각 단어가 토픽에 포함될 확률을 구할 수 있다. 최종 결과로 각 토픽에 포함된 단어들이 나타나며, 이 단어들을 보고 연구자가 주관적으로 판단하여 토픽을 결정하는 방식의 알고리즘이다. 이 외에도 Cao et al.(2009)이 적합한 토픽 개수를 결정하기 위해 토픽들 사이의 거리를 계산하여 토픽들의 연관성을 최소화하는 방법을 제시하고, Zhao et al.(2015)이 적합한

(23)

방법을 제안하는 등 다양한 연구가 이루어지고 있다.

라. word2vec

word2vec은 단어의 의미를 벡터(vector)로 표현하는 계량기법으로, 의미가 유사한 단어 들이 근접하게 위치하는 특성이 있다. 이러한 특성을 이용하면 <그림 2-5>와 같이 문맥의 의미까지 정량화하여 벡터화(vectorization)한 형태로 표현할 수 있다(안주영 외, 2015). 이때 코사인 유사도(Cosine similarity)를 이용하여 word2vec 결과로 나타난 각 단어벡터 로부터 단어들 사이의 유사도를 계산한다(식 2-1 참조). 코사인유사도   

  

 

    

     식(2-1)

 단어벡터 의  번째 요소

 단어벡터 의 번째 요소

<그림 2-5>는 t-SNE(Stochastic Neighbor Embedding) Dimensionality Reduction 기술을 이용하여 단어들 간의 관계를 2차원 벡터공간에 표현한 것으로, 의미론적인 (Semantic)정보가 반영되어 있다(Mikolov, Yih, and Zweig, 2013).

(24)

자료: TensorFlow Korea, “word2vec”, 검색일: 2019.2.25.

<그림 2-5> 단어들의 벡터 표현 예시

<그림 2-6>과 같이 word2vec의 학습모델은 CBOW(Continuous Bag Of Words)와 Skip-gram 두 가지 방식이 있다. CBOW는 주변 단어들로 특정 단어를 예측하는 모델이고, Skip-gram은 특정 단어를 기준으로 주변에 등장하는 단어들을 예측하는 모델이다 (Mikolov et al., 2013). CBOW는 smaller 데이터 셋에 적합하고, Skip-gram은 larger 데이터 셋에 적합하다. 본 연구에서는 코사인 유사도를 이용한 Word2Vec 기법으로 네트 워크 분석을 수행하였다.

자료: Mikolov et al.(2013), p.5.

(25)

키워드 네트워크 시각화를 위해서는 노드와 엣지를 정의해야 한다. 본 연구에서는 각 LDA로부터 나오는 키워드들을 노드로서 활용하였다. word2vec 방법론에 기반하여 노드 (키워드)들 사이의 코사인 유사도(cosine similarity)를 계산하고, 이 중 상위 80% 값을 가지는 노드 사이에만 엣지를 연결하였다. 또한 연구자가 분석 키워드와 연관성이 거의 없다고 판단한 키워드를 제거하여 최종 네트워크를 구성하였다. <그림 2-7>은 ‘쓰레기’ 연관 키워드 네트워크 구성방법의 예시를 나타낸 것이다. ‘처리’, ‘쓰레기봉투’, ‘음식물’은 LDA 분석 결과로 도출된 키워드이고, 각 노드의 크기는 노드로 들어오는 엣지 갯수의 합이다. 이와 같은 방식으로 도출한 결과를 네트워크 시각화 패키지인 R 시각화 패키지 ‘ggplot2’를 활용하여 네트워크로 구성하였다. 자료: 저자 작성. <그림 2-7> 키워드 네트워크 구성방법 바. 감성분석 감성분석(sentiment analysis)은 텍스트에 포함된 주관적인 감성을 추출해 내는 분석 방법론이다. 상품에 달린 댓글에 감성분석을 적용하여 제품에 대한 사용자들의 만족도를 평가하는 것을 예시로 들 수 있다.

(26)

본 연구에서는 감성분석을 위해 구글 클라우드에서 제공하는 감성분석기를 활용하였다. <그림 2-8>은 감성분석의 예를 나타낸 것이다. 텍스트를 입력하면 그 텍스트를 문장 단위로 쪼개서 감성분석을 수행한다. 여기에서 붉은색 (-) -1.0 ~ -0.25 에 해당하는 점수는 부정 적인 감성을 나타낸 것이고, -0.25 ~ 0.25는 중립, 0.25 ~ 1.0은 긍정적인 감성을 나타낸 것이다. 최종적으로 전체 텍스트의 감성점수는 각 문장의 길이를 고려하여 계산한다.

자료: Google Cloud Natural Language API, “감정 분석”, 검색일: 2019.2.10.

(27)

제3장

생활밀착형 환경이슈 분석

1. 환경부 유사민원 분석

가. 환경부 유사민원 데이터 수집 및 범위 환경부 유사민원은 대기, 자원순환, 생활환경, 교통 등 환경과 관련한 다양한 시민들의 질의나 요구사항을 담은 민원들 중 ‘공개’에 동의한 민원들을 정리한 것이다. 본 연구에서는 환경민원 텍스트 분석을 위해 환경부 웹 사이트에 국민소통 > 일반민원 (질의응답) 메뉴 또는 국민권익위원회에서 운영하는 국민신문고의 민원 텍스트를 할용하였다. <그림 3-1>은 환경부 유사민원의 일부를 나타낸 것이며, 이 텍스트 수집을 위해 파이썬 라이브러리인 ‘BeautifulSoup’을 활용하였다.

(28)

자료: 환경부, “유사민원 공개”, 검색일: 2019.2.10. <그림 3-1> 환경부 유사민원 본 연구에서는 2015년 1월 1일부터 2018년 12월 31일까지 축적된 총 12,184건의 환경 민원 텍스트 데이터를 분석하였다. <그림 3-2>와 같이 매해 민원 수가 조금씩 증가하고 있음을 볼 수 있다. 이는 시민들의 환경에 대한 관심도가 점점 높아짐에 따라 미세먼지, 쓰레기 문제 등의 환경문제들이 이슈화한 결과로 사료된다. 각 민원에 대해 담당부서 및 분야별로 분류하여 처리하고 있지만, 활용 여부에 따라 다양 하게 분류될 수 있는 점을 감안하여 본 연구에서는 통계 방법론인 토픽 모델링 분석을 통해 민원을 분류하여 트렌드를 분석하였다.

(29)

자료: 저자 작성.

<그림 3-2> 환경부 유사민원 추이

나. LDA를 이용한 토픽 분석: 환경부 유사민원

본 연구에서는 Latent Dirichlet Allocation(LDA) 모델을 이용하여 환경부 유사민원 데이터의 토픽 클러스터링 분석을 수행하였다. 토픽들 사이의 거리를 기반으로 토픽 개수를 총 7개로 선정하여 LDA 모델을 구축하였으며, 또한 LDA 모델링 결과를 동적(dynamic)으로 시각화하기 위해 HTML 형식으로 시각화 결과를 제공하는 ‘LDAvis2)’ 패키지를 이용하였다. LDA 모델을 구축하기 위해 토픽-단어 분포 행렬, 문서-토픽 분포 행렬, 문서 길이, 단어 빈도수 그리고 토픽 수(K)를 입력하면, <그림 3-3>과 같은 시각화 결과가 산출된다. <그림 3-3>은 토픽 개수를 7개, 상위 단어의 수를 30개로 설정하였을 때 LDA 토픽모델링 시각화 결과의 첫 화면이다. 여기에서 오른쪽은 각 토픽에서 가장 중요하다고 판단된 상위 30개 단어의 빈도를 막대그래프로 나타낸 것이다. 파란색 막대그래프는 코퍼스 내 단어의 전체적인 빈도수를 의미하고 빨간색 막대그래프는 특정 토픽에서 출현한 단어의 빈도수를 의미한다. 여기에서 우측 상단에 있는 감마값은 각 단어에 대해 토픽 내에서의 빈도수와 코퍼스 내에서 희귀성을 조절하는 파라미터로 두 개의

(30)

막대그래프의 비중을 조절할 수 있다. 즉 이 값이 작을수록 각 토픽 내 에서만 빈도수가 높고 코퍼스 내에서는 희귀한 단어에 대해 높은 점수를 부여한다. 본 연구에서는 감마값을 0.15의 작은 값으로 조절하여 빨간색 막대그래프의 비중이 높은 단어를 추출하였다. 왼쪽은 7개의 토픽을 원의 형태로 보여 주는데, 원의 크기는 토픽의 상대적 비율(relative ratio)을 의미한다. 자료: 저자 작성. <그림 3-3> LDA 시각화 결과(환경부 유사민원): 첫 화면 LDA 분석결과, 환경부에서 제공하는 유사민원 데이터에서 ‘폐기물’, ‘화학물질’, ‘폐수’, ‘미세먼지’, ‘소음’ 관련 키워드들이 많이 등장하였음을 알 수 있었다. 또한 4번, 6번 토픽은 2차원 공간에 겹쳐서 표현되었으므로 유사한 주제의 토픽임을 알 수 있다. 7개 토픽별 분석 결과는 다음 절에서 구체적으로 살펴본다. <그림 3-4>에서 1번 토픽은 전체 토픽 중 19.4%로 가장 많은 비중을 차지하고 있다. 주요 키워드로는 미세먼지, 중국, 전기차, 실내공기질, 수치, 매연 등 ‘미세먼지’ 관련 키워

(31)

1번 토픽의 주제를 ‘생활환경’이라고 유추하였으며, 이러한 생활환경문제 해결방안과 관련한 전기차, 인증, 해결, 규제, 검증, 친환경, 세금, 공기청정기, 단속 등의 키워드도 나타났다.

자료: 저자 작성.

(32)

<그림 3-5>에서 2번 토픽은 전체 토픽 중 17.2%로 두 번째로 많은 비중을 차지하고 있다. 순환골재, 비산먼지, 골재, 고철, 특정공사 등 ‘건설 폐기물’ 관련 키워드와 퇴비, 가축 분뇨, 비료, 사육시설 등 ‘가축 폐기물’ 관련 키워드가 주로 나타났다. 이를 통해 2번 토픽의 주제를 ‘건설 및 가축 폐기물’이라고 유추하였으며 이러한 폐기물 처리와 관련한 수집, 운반, 덮개, 재활용시설, 파쇄, 분쇄, 처리업, 「폐기물관리법」 등의 키워드도 나타났다. 자료: 저자 작성. <그림 3-5> LDA 시각화 결과(환경부 유사민원): 2번 토픽(건설 및 가축 폐기물)

(33)

있다. 환경영향평가, 정화조, 「환경영향평가법」, 협의, 상수원보호구역, 원인자부담금, 사후 환경영향조사 등 ‘환경영향평가’ 관련 키워드가 주로 나타났다. 이를 통해 3번 토픽의 주제를 ‘환경영향평가’로 유추하였다.

자료: 저자 작성.

(34)

<그림 3-7>에서 4번 토픽은 전체 토픽 중 14.7%로 네 번째로 많은 비중을 차지하고 있다. 유해화학물질, 취급시설, 화학물질, 「화학물질관리법」, 영업허가, 설치검사, 유독물, 유해화학물질관리자 등의 ‘유해화학물질’ 관련 키워드가 주로 나타났다. 이를 통해 4번 토픽의 주제를 ‘유해화학물질’로 유추하였다. 특히 취급, 영업허가, 영향평가, 안전교육 등 유해화학물질 취급 및 설치 관련 민원이 많음을 확인할 수 있었다. 자료: 저자 작성. <그림 3-7> LDA 시각화 결과(환경부 유사민원): 4번 토픽(유해화학물질)

(35)

있다. 보일러, 대기배출시설, 배출구, 도장시설, 굴뚝, 버너, 건조시설 등 ‘대기배출시설’ 관련 키워드와 대기오염물질, LNG, 질소산화물, 초미세먼지, 특정대기유해물질, 황산화물, 연료, 가스상 물질 등 ‘대기오염물질’ 관련 키워드가 주로 나타났다. 이를 통해 5번 토픽의 주제를 ‘대기오염물질 및 배출시설’로 유추하였다. 자료: 저자 작성. <그림 3-8> LDA 시각화 결과(환경부 유사민원): 5번 토픽(대기오염 시설 및 물질)

(36)

<그림 3-9>에서 6번 토픽은 전체 토픽 중 11.8%로 여섯 번째로 많은 비중을 차지하고 있다. 폐수, 폐수배출시설, 수질, 방류수, 수생태계, 폐수처리시설, 수질유해물질, 수질환경, 수질오염, 「물환경보전법」, 공공하수처리시설 등 ‘폐수’ 관련 키워드가 주로 나타났다. 특히 폐수배출시설, 폐수처리시설, 수질오염방지시설, 공공하수처리시설 등 폐수처리시설 관련 키워드와 수질검사와 관련한 수질기준, 산업기사, 측정대행업, 수질검사, 측정기 등의 키워 드가 많이 출현했다. 이를 통해 6번 토픽의 주제를 ‘폐수’로 유추하였다. 자료: 저자 작성. <그림 3-9> LDA 시각화 결과(환경부 유사민원): 6번 토픽(폐수)

(37)

토픽(건설 및 가축 폐기물) 근처에 위치하여 2번 토픽과 유사한 것으로 나타났다. 의료폐기물, 혈액, 환자, 의료, 병원 등 ‘의료폐기물’ 관련 키워드와 지정폐기물, 석면, 구조물, 건설공사, 철거, 매립, 굴착, 시공사, 콘크리트 등 ‘사업장 폐기물’ 관련 키워드가 주로 나타났다. 이를 통해 7번 토픽의 주제를 ‘의료 및 사업장 폐기물’로 유추하였다. 자료: 저자 작성. <그림 3-10> LDA 시각화 결과(환경부 유사민원): 7번 토픽(의료 및 사업장 폐기물)

(38)

<표 3-1>은 앞에서 살펴본 환경부 유사민원에서 추출한 7개 토픽과 토픽별 비율을 정리한 표이다. 환경부 유사민원에 ‘생활환경’, ‘폐기물’ 관련 주제의 민원이 많음을 확인할 수 있으며, 특히 건설, 가축, 의료 및 사업장 등 다양한 주제의 폐기물 민원이 등장했음을 알 수 있다. <표 3-1> 환경부 유사민원: 7개 토픽 번호 1 2 3 4 5 6 7 토픽 제목 생활환경 건설 및 가축 폐기물 환경 영향평가 유해화학 물질 대기오염물질 및 배출시설 폐수 의료 및 사업장 폐기물 비율 (%) 19.4 17.2 15.2 14.7 12.4 11.8 9.3 자료: 저자 작성.

(39)

1번 토픽(생활환경)의 네트워크 분석결과는 <그림 3-11>과 같다. 매개중심성이 높은 키워드는 ‘시민’, ‘동물’, ‘플라스틱’, ‘학교’, ‘오염’, ‘정화’ 등으로 나타났다. 또한 네트워크 좌측에는 주로 오염원인(미세먼지, 중국, 쓰레기, 소음, 공사 등)과 오염결과(건강, 피해, 발생 등)의 키워드가 많이 나타났다. 네트워크 우측에는 해결 방안(전기차, 재활용, 보호, 인증, 금지, 규제, 과태료, 부과 등)의 키워드가 많이 나타났다. 이를 통해 미세먼지, 소음, 플라스틱 이슈 관련 생활환경 민원이 많이 나타났고, 이러한 이슈와 관련하여 특정 장소(학교, 아파트)와 특정 대상(아이, 주민) 키워드가 주로 같이 나타났음을 확인하였다. 연관 키워드 분석과 문장 추출 및 문서요약 기능을 활용하여 관련 내용을 살펴보면 ‘미세 먼지’ 키워드가 포함된 경우 미세먼지 상황의 심각성 및 대응에 대한 불만, 아이들의 건강 등에 대한 민원이 많았다. ‘쓰레기’의 경우 음식물 쓰레기, 쓰레기 봉투, 쓰레기 재활용, 처리, 소각, 분리수거, 재활용 등의 다양한 민원들이 제기되었다. ‘소음’의 경우 공사소음, 층간소음, 공장 소음, 반려동물 소음, 방음벽 설치, 교통(경적) 소음, 소음 측정, 단속, 규제, 피해보상 등의 관련 내용이 많았다. 그 외에 실내공기질의 경우 교육과 대상 여부 관련 내용이 대부분이었으며, 배출가스의 경우 자동차 배출가스 규제, 배출가스 저감장치에 대한 민원이 많았다. 2019년 3월 기준, 환경부는 국민 대다수가 관심을 보이는 이슈인 미세먼지 해결을 위한 로드맵을 구성하고, 배출허용 기준 신설 및 강화 등의 규제를 강화하는 등의 노력과 더불어, 국제협력을 통해 근본적인 해결을 위한 노력을 기울이고 있다.3) 여기에 적극적인 배출저감 장치 지원, 전기차 도입, 친환경 인증 및 친환경 생활 정책 장려 등의 정책적 보완이 더 필요할 것으로 보인다. 또한 실내공기질 등과 아이들의 건강, 교육기관 공기청정기 설치 등 대한 민원이 많이 제기되고 있어 취약계층 및 사각지대에 대한 보다 조밀하고 신속한 대응이 필요하다. 소음과 관련해서도 교통소음, 도로소음, 층간소음 등 그리고 악취 민원 또한 많이 발생하고 있어 주요 발생지역에 대한 대응이 필요하고, 소음 및 피해에 대한 기준 및 규제를 보다 엄격하게 적용할 필요성이 있다. 3) 환경백서(2018), pp.124-129.

(40)

자료: 저자 작성. <그림 3-11> 네트워크 시각화 결과(환경부 유사민원): 1번 토픽(생활환경) 2번 토픽(건설 및 가축 폐기물)의 네트워크 분석결과는 <그림 3-12>와 같다. 매개중심성이 높은 키워드는 ‘사업장 폐기물’, ‘분뇨’, ‘처리시설’, ‘고철’, ‘폐목재’ 등으로 나타났다. 또한 네트워크 좌측에는 건설 및 가축 폐기물관련 해결방안(법률, 처리시설, 시행규칙, 덮개, 재활용시설, 처분 등)의 키워드가 나타났다. 네트워크 중심에는 폐기물 키워드를 중심으로 수집, 운반, 소각, 처분, 처리, 관리 등이 연관 키워드로 나타났다. 특히 ‘소각’ 키워드가 매개중심성과 연결정도 중심성이 가장 높게 나타났다. 이를 통해 건설 및 가축 폐기물 소각 관련 민원이 다양한 형태로 많이 나타났음을 알 수 있다. 연관 키워드 분석과 문장 추출 및 문서요약 기능을 활용하여 살펴본 관련 내용에서는 ‘폐기물’이 포함된 문장의 경우 생활 폐기물, 사업장 폐기물, 지정 폐기물, 배출시설, 재활용, 처리시설, 수집운반 등의 내용이 많았고, ‘분뇨’가 포함된 문장의 경우 배출시설, 재활용, 축사, 처리시설, 수집운반, 자원화,

(41)

현재 건축 폐기물의 재활용률은 90% 이상으로 높은 수준이지만, 순환 골재에 대한 부정 적인 인식 때문에 실제 부가가치가 높은 부문에서는 40%를 넘지 못하고 있는 상황이다. 따라서 이에 대한 인식의 재고와 더불어 이를 통한 재활용률의 개선과 분뇨 처리, 자원화, 액비 생산을 위한 시설의 확충이 필요하다. 그 외에 가축 폐기물 관련 민원의 경우 대부분 해당 여부에 문의로 이에 대한 가이드라인의 보완이 필요할 것으로 보인다. 자료: 저자 작성. <그림 3-12> 네트워크 시각화 결과(환경부 유사민원): 2번 토픽(건설 및 가축 폐기물) 3번 토픽(환경영향평가)의 네트워크 분석결과는 <그림 3-13>과 같다. 매개중심성이 높은 키워드는 ‘승인’, ‘도로’, ‘토지’, ‘건축’, ‘주택’, ‘상수원보호구역’ 등으로 나타났다. 또한 네트워크 좌측에는 환경영향평가 법 관련 키워드(시행령, 법률, 「수도법」, 「하수도법」 등)가 나타났다. 네트워크 중심에는 환경영향평가 대상 관련 키워드(도로, 토지, 주택, 부지, 건축,

(42)

공장, 상수원보호구역, 상수도, 공공하수도 등)가 주로 나타났다. 네트워크 우측에는 환경영 향평가 부담금 관련 키워드(원인자부담금, 부과, 산정)가 나타났다. 이를 통해 환경영향 평가와 관련하여 다양한 주제의 법, 부담금 관련 민원이 많았음을 알 수 있다. ‘연관 키워드 분석과 문장 추출 및 문서요약 기능을 활용하여 살펴본 관련 내용에서는 소규모/전략 환경 영향평가 대상 여부와 관련한 내용이 대부분이었다. 이에 따르면 도로, 건축, 가축분뇨, 하 수처리 시설, 오수 발생량, 건축 등 다양한 영역에서 민원이 발생함에 따라 위치별, 업종별, 매체별 환경 영향평가 대상기준 그리고 전략 및 소규모 환경영향평가에 대한 가이드라인의 보완이 필요해 보인다. 자료: 저자 작성. <그림 3-13> 네트워크 시각화 결과(환경부 유사민원): 3번 토픽(환경영향평가) 4번 토픽(유해화학물질)의 네트워크 분석결과는 <그림 3-14>와 같다. 매개중심성이 높은 키워드는 ‘유해화학물질’, ‘위험물’, ‘염산’, ‘황산’, ‘약품’ 등의 유해화학물질 관련 키워드와 ‘시행규칙’, ‘안전’, ‘영업허가’, ‘허가’, ‘취급’ 등의 허가 관련 키워드로 나타났다. 또한 네트

(43)

시설 관련 키워드가 주로 나타났다. 네트워크 우측 상단에는 「화학물질관리법」, 「화관법」, 정기검사, 설치검사, 유해화학물질관리자, 안전교육 등 「유해화학물질관리법」, 검사, 교육 등의 키워드가 나타났음을 알 수 있다. 연관 키워드 분석과 문장 추출 및 문서요약 기능을 활용하여 살펴본 관련 내용에서는 ‘유해화학물질’이 포함된 문장의 경우 유해화학물질 관리법, 설치검사, 안전검사, 설치검사, 영업허가, 취급시설, 신고대상 등에 관련된 내용이 많았다. 유해화학물질의 경우 수질, 대기, 토양 등 다매체와 관련성이 높고 실내외, 업종별, 보관시설, 탱크 관리, 누출문제 등에 있어 정밀한 관리가 필요해 보인다. 또한 유독물질의 개수가 계속 늘어나고 기준도 변화하는 추세이므로 관계부처 합동으로 정기검사, 영업허가가 면제된 사업장 등에 등을 포함하여 감시를 강화할 필요가 있다. 자료: 저자 작성. <그림 3-14> 네트워크 시각화 결과(환경부 유사민원): 4번 토픽(유해화학물질)

(44)

5번 토픽(대기오염물질 및 배출물질의 네트워크 분석결과는 <그림 3-15>와 같다. 매개중 심성이 높은 키워드는 ‘대기’, ‘특정대기유해물질’, ‘악취’, ‘굴뚝’, ‘초미세먼지’ 등으로 나타 났다. 또한 네트워크 상단 및 중심에는 대기오염 배출 시설 관련 키워드(대기배출시설, 사업장, 대기방지시설, 굴뚝, 배출구 등)가 주로 나타났고, 네트워크 좌측 하단에는 대기환경법 관련 키워드(시행규칙, 대기환경보전법, 배출허용기준)가 나타났다. 연관 키워드 분석과 문장 추출 및 문서요약 기능을 활용하여 관련 내용을 살펴보면 대기 배출시설, 배출허용기준, 방지시설, 자가측정, 악취배출 허용, 해당 여부와 관련한 내용이 다수 포함되어 있음을 알 수 있다. 현재 오염물질 배출관리가 미흡한 소규모시설 난립 방지를 위해 보일러 시설의 최소 사용량 기준 상향, 대기배출허용기준 강화, 제품 보관·운반·기준 강화 등의 환경관리 강화가 추진될 예정에 있으며, 미세먼지가 국민 최대 현안인 만큼 배출 허용기준을 강화하고, 특히 질소산화물의 경우 초미세먼지의 주범인 만큼 보다 철저하게 관리할 필요가 있다. 또한 보일러, 배출구, 굴뚝 등 대기오염 방지시설을 보다 적극적인 설치 지원하고, 미세먼지 농도가 높은 도심 지역 등을 고려한 정책을 개발할 필요가 있다, 이 외에 업종별 해당 여부, 위치별, 배출량 산정기준 등의 문의가 대부분인 만큼 이에 대한 가이드라인의 보완도 필요해 보인다.

(45)

자료: 저자 작성. <그림 3-15> 네트워크 시각화 결과(환경부 유사민원): 5번 토픽(대기오염물질 및 배출시설) 6번 토픽(폐수)의 네트워크 분석결과는 <그림 3-16>과 같다. 매개중심성이 높은 키워드는 ‘방지시설’, ‘방류수’, ‘개인하수처리시설’, ‘수질검사’, ‘처리시설’, ‘폐수처리’ 등으로 나타 났다. 네트워크 상단 및 중심에는 폐수 시설 관련 키워드(폐수배출시설, 공공하수처리시설, 방지시설, 처리시설, 개인하수처리시설)가 주로 나타났다. 또한 시험, 자격, 면허 키워드가 ‘수질검사’, ‘측정기’ 등의 키워드와 함께 나타났다. 이를 통해 수질 자격 또는 면허와 관련한 민원이 많음을 알 수 있다. ‘연관 키워드 분석과 문장 추출 및 문서요약 기능을 활용하여 관련 내용을 살펴보면 ‘폐수’가 포함된 문장의 경우 폐수 배출 시설, 폐수 처리, 방지시설, 폐수 발생량과 관련한 민원이 많았다. 현재 생활하수, 산업폐수, 가축분뇨 등에 대한 오염물질 기준을 수질관리목표의 달성 수단으로 규정하고 있으므로 공장폐수 발생량, 축산폐수 발생량, 특히 이에 대한 지하수 수질관리 및 배출 등 지하수의 오염을 철저하게 관리할 필요가 있다.

(46)

수질검사와 (개인)하수처리 및 방지시설 설치 지원, 수질개선 협조에 따른 인센티브 제도 도입 등을 통한 보다 적극적인 대응도 필요해 보인다. 자료: 저자 작성. <그림 3-16> 네트워크 시각화 결과(환경부 유사민원): 6번 토픽(폐수) 7번 토픽(의료 및 사업장 폐기물)의 네트워크 분석결과는 <그림 3-17>과 같다. 매개중심 성이 높은 키워드는 ‘건설현장’, ‘토사’, ‘폐기물처리’, ‘폐유’, ‘생활폐기물’ 등으로 나타났다. 네트워크 상단에는 사업장 폐기물 관련 키워드(공사, 구조물, 콘크리트, 현장, 업체, 건설폐 기물, 건설공사)가 주로 나타났다. 네트워크 하단에는 의료 폐기물 관련 키워드(환자, 병원, 의료폐기물, 의료)가 주로 나타났다. 또한 네트워크 중심에는 폐기물 처리 관련 키워드(재활용, 소각, 처리업체)가 주로 나타났다. 이를 통해 의료 및 사업장 폐기물 처리와 관련한 민원이

(47)

의견을 적극 수렴을 통해 적정처리 위한 의료폐기물 관리제도를 정비해 나갈 계획에 있는 상황이다, (격리)의료폐기물, 처리(방법), 배출, 의료폐기물 분류 여부, 전용용기 처리, 혈액 오염 문제, 폐혈액 문제, 2차 감영 위험 요소 등을 고려할 때 조속한 의료폐기물 관리제도 정비가 필요해 보인다. 자료: 저자 작성. <그림 3-17> 네트워크 시각화 결과(환경부 유사민원): 7번 토픽(의료 및 사업장 폐기물)

(48)

다. 토픽 분포 시계열 분석 : 환경부 유사민원 <그림 3-18>은 연도별 토픽 시계열 분포(비율)를 나타낸 그림이다. 의료 및 사업장 폐기물 그리고 건축 및 가축 폐기물 토픽은 꾸준한 분포를 보였다. 그리고 생활환경 토픽의 비율이 증가하였고, 환경영향평가 토픽의 비율 또한 소폭 증가하였다. 반면에 대기오염물질 및 배출시설, 폐수, 유해화학물질에 대한 토픽 비율은 감소하는 경향을 보였다. 이에 대해서는 다음 절에서 연도별 키워드 빈도수 분석을 통해 자세히 분석하였다. 자료: 저자 작성. <그림 3-18> 환경부 유사민원 토픽 시계열 분포

(49)

1번 토픽(생활환경)의 연도별 키워드 빈도수 분석결과는 <표 3-2>와 같다. 빈도수 분석 결과 생활환경 이슈에서는 2015년 이전에는 ‘소음’ 키워드가 가장 중요한 이슈로 파악된다, 그 이후에도 ‘소음’은 꾸준한 비중을 차지하지만 2015년에는 빈도수가 낮았던 ‘미세먼지’ 키워드가 2016년에 갑자기 나타난 것을 확인할 수 있다. 또한 TF-IDF값에서 보듯 2017년 에는 ‘미세먼지’ 키워드의 빈도수가 다른 키워드들에 비해서 매우 높음을 확인할 수 있다. 또한 건설 및 생활 폐기물 토픽이 따로 추출되었음에도 불구하고 2018년에는 시민들의 생활과 직접 연관된 폐기물/쓰레기 관련 이슈가 떠오르면서 생활환경 토픽 내에서 ‘폐기물’, ‘재활용’, ‘쓰레기’, ‘플라스틱’ 등의 키워드가 급증했음을 확인할 수 있다. 순위 2015 2016 2017 2018

단어 TF-IDF 단어 TF-IDF 단어 TF-IDF 단어 TF-IDF

1 문의 32.533 미세먼지 33.410 미세먼지 65.997 문의 32.167 2 소음 22.393 소음 31.761 문의 27.842 차량 29.083 3 발생 15.287 문의 25.410 소음 27.260 미세먼지 27.285 4 질의 15.167 차량 20.029 차량 24.769 소음 24.209 5 제품 14.926 제품 16.361 질의 19.342 폐기물 22.207 6 지역 12.608 지역 15.939 업체 19.233 질의 20.394 7 규제 12.440 질의 15.486 아이 18.817 발생 20.067 8 업체 12.257 발생 14.377 중국 18.716 규제 19.949 9 차량 11.736 인증 13.192 자동차 17.243 재활용 19.326 10 아파트 11.236 아이 13.157 발생 15.415 제품 19.254 11 자동차 10.309 업체 12.297 지역 15.306 쓰레기 18.759 12 주민 9.888 판매 11.807 제품 14.504 업체 18.398 13 오염 9.860 피해 11.452 공사 14.108 지역 18.253 14 공장 9.847 중국 11.149 공장 13.216 허가 18.061 15 공사 9.714 아파트 10.884 폐기물 12.916 자동차 16.508 16 피해 9.434 자동차 10.745 재활용 12.819 피해 15.791 17 회사 9.181 정수기 10.717 주민 12.729 아파트 15.661 <표 3-2> 1번 토픽(생활환경) 연도별 키워드 분석 (단위: TF-IDF)

(50)

순위 2015 2016 2017 2018

단어 TF-IDF 단어 TF-IDF 단어 TF-IDF 단어 TF-IDF

18 허가 8.818 정화 10.266 수치 12.725 플라스틱 15.046 19 쓰레기 8.396 생활 10.218 피해 12.284 전기차 14.828 20 소리 8.363 허가 10.147 해결 11.874 판매 14.243 21 운영 8.299 재활용 10.048 규제 11.820 과태료 13.697 22 판매 8.137 필터 9.735 개선 11.631 인증 13.387 23 생활 7.928 공사 9.596 전기차 11.172 충전기 13.005 24 인증 7.888 기관 9.561 실내 공기질 11.081 공사 12.634 25 악취 7.507 과태료 9.501 중국발 10.969 시행 12.437 <표 3-2>의 계속 자료: 저자 작성. 2번 토픽(건설 및 가축 폐기물)의 연도별 키워드 분석결과는 <표 3-3>과 같다. 빈도수 분석결과 가축 및 건설 페기물 이슈에서는 ‘폐기물’, ‘재활용’, ‘허가’ 키워드가 가장 높은 빈도수를 보였다. 또한 ‘가축분뇨’ 키워드의 빈도수가 소폭이지만 꾸준한 증가를 보였다. 2018년에 들어와서 ‘선별’, ‘법률’ 키워드가 높은 순위를 기록하고 있다. 하지만 <그림 3-18>과 같이 비율의 변화가 크지 않고, 전반적으로 큰 변화 없이 꾸준히 ‘허가’ 및 ‘질의’, ‘문의’ 등의 형태로 환경민원이 꾸준히 발생하는 이슈이다. 순위 2015 2016 2017 2018

단어 TF-IDF 단어 TF-IDF 단어 TF-IDF 단어 TF-IDF

1 폐기물 64.781 폐기물 71.157 폐기물 74.253 폐기물 72.833 2 재활용 49.134 재활용 43.304 재활용 51.398 재활용 48.740 3 허가 33.273 허가 32.592 허가 32.709 허가 32.273 4 질의 29.103 질의 31.203 발생 29.521 질의 31.174 5 사업장 27.388 발생 30.231 질의 28.202 문의 29.937 6 발생 27.075 문의 29.124 업체 26.936 발생 26.981 7 업체 24.513 건설 폐기물 25.095 문의 26.158 사업장 25.221 <표 3-3> 2번 토픽(건축 및 가축 폐기물) 연도별 키워드 분석 (단위: TF-IDF)

(51)

순위 2015 2016 2017 2018

단어 TF-IDF 단어 TF-IDF 단어 TF-IDF 단어 TF-IDF

8 문의 23.720 업체 24.209 사업장 23.201 업체 22.974 9 폐기물 관리법 20.014 차량 21.873 폐기물 관리법 22.459 건설 폐기물 22.026 10 건설 폐기물 19.353 사업장 21.315 건설폐기물 21.769 폐기물 관리법 21.908 11 시행규칙 17.347 운반 20.708 차량 19.608 운반 20.778 12 운반 16.908 폐기물 관리법 17.897 운반 18.880 차량 18.923 13 차량 15.495 제품 16.108 시행규칙 17.352 가축분뇨 17.023 14 제품 14.662 수집 15.739 순환골재 17.052 시행규칙 15.886 15 수집 14.474 시행규칙 15.648 가축분뇨 14.855 수집 15.048 16 비산먼지 12.701 가축분뇨 13.524 수집 13.855 제품 14.851 17 생산 12.265 수집운반 13.150 제품 13.698 선별 14.367 18 가축분뇨 11.990 덮개 12.404 처리시설 10.718 순환골재 13.513 19 원료 11.479 순환골재 12.170 수집운반 10.315 법률 13.113 20 처리시설 11.369 생산 11.479 폐기물처리 10.277 처리시설 11.431 21 순환골재 10.566 사업장 폐기물 11.454 폐기물 처리업 10.220 파쇄 11.169 22 배출 10.474 합성수지 10.228 고철 10.216 배출 10.682 23 고철 9.991 선별 10.102 원료 10.181 현장 10.265 24 운영 9.765 원료 9.988 골재 9.876 폐기물 처리시설 9.915 25 사업장 폐기물 9.641 파쇄 9.937 현장 9.852 운영 9.890 자료: 저자 작성. 3번 토픽(환경영향평가)의 연도별 키워드 분석결과는 <표 3-4>와 같다. <그림 3-18>에서 보듯이 환경영향평가 이슈는 꾸준한 증가세를 보이고 있다. 환경영향평가 토픽에서는 ‘환경 영향평가’와 관련성이 높은 키워드들이 높은 빈도수를 나타냈다. 특히 ‘전략환경평가’ 키워 드의 비중이 많이 줄어들고, ‘소규모환경영향평가’ 키워드의 빈도수가 크게 증가하였다. ‘소규모환경영향평가’는 환경보전이 필요하거나 난개발의 우려를 고려하여 이에 대한 입지와

(52)

환경에 미치는 영향을 미리 조사·예측·평가하여 환경보전방안을 마련하는 것인데 이에 대한 ‘질의’, ‘협의’, ‘허가’, ‘계획’ 등의 내용이 증가하고 있는 것으로 보인다. 그 외에 ‘축사’와 ‘사후환경영향조사’와 관련된 내용도 최근에 들어와서 빈도수가 증가하였음을 확인할 수 있다.

순위 2015 2016 2017 2018

단어 TF-IDF 단어 TF-IDF 단어 TF-IDF 단어 TF-IDF

1 질의 25.314 질의 27.585 질의 28.397 질의 38.137 2 문의 21.186 정화조 19.376 계획 23.063 환경영향 평가 35.865 3 산정 18.915 문의 18.141 문의 20.862 소규모 환경영향 평가 30.109 4 전략환경 영향평가 15.886 전략환경 영향평가 17.756 건축물 19.487 면적 29.033 5 정화조 15.674 건물 17.348 전략환경 영향평가 19.220 협의 25.582 6 계획 15.673 면적 16.917 면적 18.171 허가 24.124 7 건축물 15.161 건축물 16.538 환경영향 평가 16.619 계획 23.130 8 면적 14.943 지역 16.478 소규모 환경영향 평가 16.009 문의 22.117 9 오수처리 시설 14.074 공사 16.282 지역 15.421 지역 21.620 10 건물 13.841 계획 16.061 협의 14.992 건축물 19.439 11 지역 13.061 산정 15.523 산정 13.667 소규모 18.668 12 오수 11.407 시행령 15.168 허가 13.643 공사 18.655 13 시행령 10.991 허가 13.795 부지 12.916 환경영향 평가법 17.924 14 원인자부 담금 10.843 환경영향 평가 13.671 주택 12.014 시행령 17.784 15 법률 10.021 협의 12.914 시행령 11.905 전략환경 영향평가 16.420 <표 3-4> 3번 토픽(환경영향평가) 연도별 키워드 분석 (단위: TF-IDF)

(53)

순위 2015 2016 2017 2018

단어 TF-IDF 단어 TF-IDF 단어 TF-IDF 단어 TF-IDF

16 오수 발생량 9.940 공장 11.393 건물 11.316 축사 15.680 17 부과 9.928 제곱미터 11.109 신축 11.265 부지 15.109 18 발생 9.734 하수도법 11.101 공장 11.242 제곱미터 13.722 19 하수도 9.708 오수처리 시설 10.961 상수원 보호구역 11.089 공장 13.265 20 환경영향 평가 9.617 저수조 10.221 소규모 11.026 시행 13.194 21 하수도법 9.528 하천 10.030 공사 10.591 사후환경 영향조사 12.854 22 허가 9.267 준공 10.024 시행 10.580 승인 11.930 23 공사 9.246 소규모환 경영향평 가 9.945 법률 10.527 도로 11.865 24 협의 9.034 부지 9.786 토지 10.376 구역 11.480 25 공장 8.988 치하 9.677 축사 10.291 사업자 10.823 자료: 저자 작성. 4번 토픽(유해화학물질)의 연도별 키워드 분석결과는 <표 3-5>와 같다. <그림 3-18>에서 보듯이 유해화학물질 이슈는 꾸준히 감소세를 보이고 있다. 유해화학물질에 대한 ‘문의’, ‘질의’, ‘취급시설’이 꾸준히 가장 높은 빈도수를 보이고 있고, 2016년에 ‘설치검사’의 순위가 크게 상승하여 꾸준히 높은 순위를 차지하고 있음을 알 수 있다. 순위 2015 2016 2017 2018

단어 TF-IDF 단어 TF-IDF 단어 TF-IDF 단어 TF-IDF

1 유해화학 물질 73.416 유해화학 물질 67.640 유해화학 물질 67.316 유해화학 물질 66.098 2 문의 39.805 문의 36.284 질의 34.477 문의 36.939 3 질의 35.153 질의 33.994 문의 34.320 질의 35.131 4 화학물질 28.779 취급시설 27.983 취급시설 29.772 취급시설 33.312 <표 3-5> 4번 토픽(유해화학물질) 연도별 키워드 분석 (단위: TF-IDF)

(54)

순위 2015 2016 2017 2018

단어 TF-IDF 단어 TF-IDF 단어 TF-IDF 단어 TF-IDF

5 취급시설 28.664 화학물질 26.333 화학물질 26.426 설비 30.065 6 유독물 26.969 사업장 21.950 설비 24.055 화학물질 25.563 7 화학물질 관리법 26.467 화학물질 관리법 21.656 설치검사 22.842 설치검사 24.616 8 취급 23.923 설치검사 20.669 영업허가 21.902 사업장 20.721 9 사업장 23.178 영업허가 20.201 사업장 21.844 취급 19.891 10 영업허가 22.307 설비 20.134 화학물질 관리법 20.625 화학물질 관리법 19.218 11 장외영향 평가서 19.488 취급 17.856 탱크 19.432 제조 17.906 12 제조 19.233 유독물 17.331 제품 18.247 방류벽 17.357 13 허가 19.050 제품 16.591 취급 18.110 배관 17.332 14 안전교육 19.040 탱크 16.260 방류벽 17.167 제품 15.593 15 제품 18.390 시행규칙 15.932 허가 16.903 탱크 15.421 16 화관법 17.827 유독물질 15.909 제조 15.948 정기검사 15.320 17 사고대비 물질 17.172 화관법 15.446 사고대비 물질 15.487 장외영향 평가서 15.273 18 시행규칙 15.096 허가 15.387 장외영향 평가서 15.265 저장탱크 14.012 19 유독물질 14.685 장외영향 평가서 15.334 정기검사 14.365 화관법 13.696 20 설비 14.346 제조 14.860 저장 14.197 저장 12.503 21 정기검사 13.733 사고대비 물질 14.800 장외영향 평가 13.754 장외영향 평가 12.386 22 업체 13.503 저장 13.773 화관법 13.749 치하 12.364 23 장외영향 평가 13.374 정기검사 13.404 유독물질 13.736 사고대비 물질 12.254 24 공장 12.944 장외영향 평가 12.273 치하 13.135 유독물 12.179 25 저장 12.913 공장 12.259 배관 12.995 시행규칙 12.009 <표 3-5>의 계속 자료: 저자 작성.

(55)

3-18>에서 보듯이 대기오염물질 및 배출시설 이슈는 꾸준한 감소세를 보이고 있다. ‘대기배 출시설’, ‘보일러’, ‘방지시설’, ‘자가측정’ 등에 대한 ‘문의’, ‘질의’, ‘허가’ 등이 대부분이다.

순위 2015 2016 2017 2018

단어 TF-IDF 단어 TF-IDF 단어 TF-IDF 단어 TF-IDF

1 보일러 59.379 보일러 40.344 보일러 32.868 대기배출 시설 31.528 2 대기배출 시설 34.787 대기배출 시설 35.112 대기배출 시설 32.155 문의 28.717 3 문의 28.442 방지시설 28.633 방지시설 29.530 보일러 28.370 4 방지시설 28.309 질의 27.342 문의 26.588 질의 27.804 5 질의 23.833 문의 26.311 질의 25.413 방지시설 26.360 6 사업장 18.646 사업장 23.126 자가측정 22.292 자가측정 21.403 7 대기 18.521 자가측정 22.454 사업장 20.250 가동 20.752 8 배출허용 기준 17.941 대기 19.402 대기 19.513 사업장 20.532 9 배출 16.674 배출허용 기준 19.176 대기오염 물질 18.571 대기오염 물질 18.131 10 허가 16.425 배출 18.486 배출허용 기준 17.471 대기환경 보전법 18.115 11 대기환경 보전법 16.183 대기오염 물질 17.489 배출 17.135 대기 17.582 12 가동 15.749 대기환경 보전법 17.423 공정 15.472 배출허용 기준 17.120 13 대기오염 물질 15.705 허가 16.512 대기환경 보전법 15.024 배출 15.450 14 자가측정 14.844 가동 15.959 발생 14.017 공정 14.719 15 공정 13.798 연료 14.453 제품 13.199 시행규칙 14.056 16 연료 13.661 공정 14.306 연료 13.118 허가 14.026 17 제품 13.599 제품 13.414 시행규칙 13.002 제품 13.165 18 오염물질 12.875 시행규칙 12.696 허가 12.507 발생 12.631 19 시행규칙 12.622 발생 12.632 오염물질 12.139 오염물질 12.215 20 가스 11.601 설비 11.082 설비 11.668 연료 12.072 <표 3-6> 5번 토픽(대기오염물질 및 배출시설) 연도별 키워드 분석 (단위: TF-IDF)

(56)

순위 2015 2016 2017 2018

단어 TF-IDF 단어 TF-IDF 단어 TF-IDF 단어 TF-IDF

21 발생 11.354 면제 10.700 가동 11.660 먼지 11.224 22 업체 10.854 배출구 10.640 면제 10.635 배출구 11.161 23 lng 10.572 오염물질 10.615 특정대기 유해물질 10.621 운영 10.563 24 면제 10.262 운영 10.409 운영 9.543 가스 10.213 25 저장 12.913 공장 12.259 배관 12.995 시행규칙 12.009 <표 3-6>의 계속 자료: 저자 작성. 6번 토픽(폐수)의 연도별 키워드 분석결과는 <표 3-7>과 같다. <그림 3-18>에서 보듯이 폐수 관련 이슈는 2018년에 들어와서 소폭 감소하였다. 하지만 ‘지하수’의 빈도수가 급격하게 증가했는데, 이는 word2vec을 통해 지하수와 관련된 연관 키워드를 분석한 결과 ‘수질오염 물질’, ‘오염’, ‘수질기준’ 등으로 나타난 것으로 보아 ‘수질’ 문제로 인해 ‘지하수’의 빈도수가 증가한 것으로 보인다. 순위 2015 2016 2017 2018

단어 TF-IDF 단어 TF-IDF 단어 TF-IDF 단어 TF-IDF

1 폐수 31.077 폐수 31.255 폐수 35.772 폐수 35.269 2 문의 22.016 폐수배출 시설 23.553 문의 24.032 사업장 23.795 3 사업장 21.504 사업장 21.980 수질 23.173 문의 23.164 4 질의 19.718 질의 21.766 폐수배출 시설 23.154 폐수배출 시설 20.770 5 폐수배출 시설 19.086 문의 21.393 사업장 21.947 질의 19.208 6 수질 18.225 수질 20.132 질의 20.824 수질 18.641 7 업체 15.398 배출 15.578 운영 15.270 발생 16.833 8 발생 14.878 발생 13.258 발생 15.059 운영 14.594 9 운영 12.555 방류 12.328 배출 14.821 배출 13.415 10 대기 11.400 운영 12.263 방류 14.166 업체 12.972 <표 3-7> 6번 토픽(폐수) 연도별 키워드 분석 (단위: TF-IDF)

참조

관련 문서

빅데이터 관련 시장이 성장기에 있고, 이를 활용한 다양한 분석 기술, 장비 및 신규 비즈니스 모델이 개발되는 과정에 있으므로 사업유형을 명확히 구분하기 어렵고, 기존

④ 안전행정부장관은 다른 행정기관이나 농협 또는 새마을금고를 통하여 접수ㆍ처리할 수 있 는 민원사항의 종류, 접수ㆍ교부 기관 및 추가비용 등을 관계

농촌지역, 특히 농촌재생과 관련된 전국적 단위의 통계자료 구축이 미흡한 상황에서 일반적인 논 의의 시도를 위해 빅데이터를 활용한 텍스트 네트워크 분석은 현시점의

농업기술 혁신・보급체계 구축, 농업기계화 추진 강화, 농업과 IT기술의 융합 강화 등을 통해 스마트농업의... 2015년에는 ‘농업농촌

본 연구의 목적은 문헌 분석을 통해 우리나라 문화다양성 정책이 정권에 따라 어떻게 변화하는가를 각 정권 2년차를 중심으로 고찰하고, 텍스톰과 유씨아이넷

전국 도서관이 보유하고 있는 정보를 활용한 도서관 분야 빅데이터 분석 및 활용에 대한 요구사항 증대..

학교 본관내 G은행의 주간시간대 시뮬레이션 결과 분석 및 개선 방향 ... 학교 본관내 G은행의 야간시간대 시뮬레이션 결과 분석

ㅇ (정보화) 우리시가 보유하고 있는 행정정보와 지역통계 등 빅데이터 를 분석하고 , ICT 트렌드에 부합한 사물인터넷(IoT), 클라우드 컴 퓨팅 , 모바일 오피스 환경