• 검색 결과가 없습니다.

가. 환경부 유사민원 데이터 수집 및 범위

환경부 유사민원은 대기, 자원순환, 생활환경, 교통 등 환경과 관련한 다양한 시민들의 질의나 요구사항을 담은 민원들 중 ‘공개’에 동의한 민원들을 정리한 것이다.

본 연구에서는 환경민원 텍스트 분석을 위해 환경부 웹 사이트에 국민소통 > 일반민원 (질의응답) 메뉴 또는 국민권익위원회에서 운영하는 국민신문고의 민원 텍스트를 할용하였다.

<그림 3-1>은 환경부 유사민원의 일부를 나타낸 것이며, 이 텍스트 수집을 위해 파이썬 라이브러리인 ‘BeautifulSoup’을 활용하였다.

자료: 환경부, “유사민원 공개”, 검색일: 2019.2.10.

<그림 3-1> 환경부 유사민원

본 연구에서는 2015년 1월 1일부터 2018년 12월 31일까지 축적된 총 12,184건의 환경 민원 텍스트 데이터를 분석하였다. <그림 3-2>와 같이 매해 민원 수가 조금씩 증가하고 있음을 볼 수 있다. 이는 시민들의 환경에 대한 관심도가 점점 높아짐에 따라 미세먼지, 쓰레기 문제 등의 환경문제들이 이슈화한 결과로 사료된다.

각 민원에 대해 담당부서 및 분야별로 분류하여 처리하고 있지만, 활용 여부에 따라 다양 하게 분류될 수 있는 점을 감안하여 본 연구에서는 통계 방법론인 토픽 모델링 분석을 통해 민원을 분류하여 트렌드를 분석하였다.

자료: 저자 작성.

<그림 3-2> 환경부 유사민원 추이

나. LDA를 이용한 토픽 분석: 환경부 유사민원

본 연구에서는 Latent Dirichlet Allocation(LDA) 모델을 이용하여 환경부 유사민원 데이터의 토픽 클러스터링 분석을 수행하였다.

토픽들 사이의 거리를 기반으로 토픽 개수를 총 7개로 선정하여 LDA 모델을 구축하였으며, 또한 LDA 모델링 결과를 동적(dynamic)으로 시각화하기 위해 HTML 형식으로 시각화 결과를 제공하는 ‘LDAvis2)’ 패키지를 이용하였다. LDA 모델을 구축하기 위해 토픽-단어 분포 행렬, 문서-토픽 분포 행렬, 문서 길이, 단어 빈도수 그리고 토픽 수(K)를 입력하면,

<그림 3-3>과 같은 시각화 결과가 산출된다. <그림 3-3>은 토픽 개수를 7개, 상위 단어의 수를 30개로 설정하였을 때 LDA 토픽모델링 시각화 결과의 첫 화면이다. 여기에서 오른쪽은 각 토픽에서 가장 중요하다고 판단된 상위 30개 단어의 빈도를 막대그래프로 나타낸 것이다.

파란색 막대그래프는 코퍼스 내 단어의 전체적인 빈도수를 의미하고 빨간색 막대그래프는 특정 토픽에서 출현한 단어의 빈도수를 의미한다. 여기에서 우측 상단에 있는 감마값은 각 단어에 대해 토픽 내에서의 빈도수와 코퍼스 내에서 희귀성을 조절하는 파라미터로 두 개의

2) Sievert and Shirley(2014), pp. 63-70.

막대그래프의 비중을 조절할 수 있다. 즉 이 값이 작을수록 각 토픽 내 에서만 빈도수가 높고 코퍼스 내에서는 희귀한 단어에 대해 높은 점수를 부여한다. 본 연구에서는 감마값을 0.15의 작은 값으로 조절하여 빨간색 막대그래프의 비중이 높은 단어를 추출하였다. 왼쪽은 7개의 토픽을 원의 형태로 보여 주는데, 원의 크기는 토픽의 상대적 비율(relative ratio)을 의미한다.

자료: 저자 작성.

<그림 3-3> LDA 시각화 결과(환경부 유사민원): 첫 화면

LDA 분석결과, 환경부에서 제공하는 유사민원 데이터에서 ‘폐기물’, ‘화학물질’, ‘폐수’,

‘미세먼지’, ‘소음’ 관련 키워드들이 많이 등장하였음을 알 수 있었다. 또한 4번, 6번 토픽은 2차원 공간에 겹쳐서 표현되었으므로 유사한 주제의 토픽임을 알 수 있다. 7개 토픽별 분석 결과는 다음 절에서 구체적으로 살펴본다.

<그림 3-4>에서 1번 토픽은 전체 토픽 중 19.4%로 가장 많은 비중을 차지하고 있다.

주요 키워드로는 미세먼지, 중국, 전기차, 실내공기질, 수치, 매연 등 ‘미세먼지’ 관련 키워

1번 토픽의 주제를 ‘생활환경’이라고 유추하였으며, 이러한 생활환경문제 해결방안과 관련한 전기차, 인증, 해결, 규제, 검증, 친환경, 세금, 공기청정기, 단속 등의 키워드도 나타났다.

자료: 저자 작성.

<그림 3-4> LDA 시각화 결과(환경부 유사민원): 1번 토픽(생활환경)

<그림 3-5>에서 2번 토픽은 전체 토픽 중 17.2%로 두 번째로 많은 비중을 차지하고 있다. 순환골재, 비산먼지, 골재, 고철, 특정공사 등 ‘건설 폐기물’ 관련 키워드와 퇴비, 가축 분뇨, 비료, 사육시설 등 ‘가축 폐기물’ 관련 키워드가 주로 나타났다. 이를 통해 2번 토픽의 주제를 ‘건설 및 가축 폐기물’이라고 유추하였으며 이러한 폐기물 처리와 관련한 수집, 운반, 덮개, 재활용시설, 파쇄, 분쇄, 처리업, 「폐기물관리법」 등의 키워드도 나타났다.

자료: 저자 작성.

<그림 3-5> LDA 시각화 결과(환경부 유사민원): 2번 토픽(건설 및 가축 폐기물)

있다. 환경영향평가, 정화조, 「환경영향평가법」, 협의, 상수원보호구역, 원인자부담금, 사후 환경영향조사 등 ‘환경영향평가’ 관련 키워드가 주로 나타났다. 이를 통해 3번 토픽의 주제를

‘환경영향평가’로 유추하였다.

자료: 저자 작성.

<그림 3-6> LDA 시각화 결과(환경부 유사민원): 3번 토픽(환경영향평가)

<그림 3-7>에서 4번 토픽은 전체 토픽 중 14.7%로 네 번째로 많은 비중을 차지하고 있다. 유해화학물질, 취급시설, 화학물질, 「화학물질관리법」, 영업허가, 설치검사, 유독물, 유해화학물질관리자 등의 ‘유해화학물질’ 관련 키워드가 주로 나타났다. 이를 통해 4번 토픽의 주제를 ‘유해화학물질’로 유추하였다. 특히 취급, 영업허가, 영향평가, 안전교육 등 유해화학물질 취급 및 설치 관련 민원이 많음을 확인할 수 있었다.

자료: 저자 작성.

<그림 3-7> LDA 시각화 결과(환경부 유사민원): 4번 토픽(유해화학물질)

있다. 보일러, 대기배출시설, 배출구, 도장시설, 굴뚝, 버너, 건조시설 등 ‘대기배출시설’

관련 키워드와 대기오염물질, LNG, 질소산화물, 초미세먼지, 특정대기유해물질, 황산화물, 연료, 가스상 물질 등 ‘대기오염물질’ 관련 키워드가 주로 나타났다. 이를 통해 5번 토픽의 주제를 ‘대기오염물질 및 배출시설’로 유추하였다.

자료: 저자 작성.

<그림 3-8> LDA 시각화 결과(환경부 유사민원): 5번 토픽(대기오염 시설 및 물질)

<그림 3-9>에서 6번 토픽은 전체 토픽 중 11.8%로 여섯 번째로 많은 비중을 차지하고 있다. 폐수, 폐수배출시설, 수질, 방류수, 수생태계, 폐수처리시설, 수질유해물질, 수질환경, 수질오염, 「물환경보전법」, 공공하수처리시설 등 ‘폐수’ 관련 키워드가 주로 나타났다. 특히 폐수배출시설, 폐수처리시설, 수질오염방지시설, 공공하수처리시설 등 폐수처리시설 관련 키워드와 수질검사와 관련한 수질기준, 산업기사, 측정대행업, 수질검사, 측정기 등의 키워 드가 많이 출현했다. 이를 통해 6번 토픽의 주제를 ‘폐수’로 유추하였다.

자료: 저자 작성.

<그림 3-9> LDA 시각화 결과(환경부 유사민원): 6번 토픽(폐수)

토픽(건설 및 가축 폐기물) 근처에 위치하여 2번 토픽과 유사한 것으로 나타났다. 의료폐기물, 혈액, 환자, 의료, 병원 등 ‘의료폐기물’ 관련 키워드와 지정폐기물, 석면, 구조물, 건설공사, 철거, 매립, 굴착, 시공사, 콘크리트 등 ‘사업장 폐기물’ 관련 키워드가 주로 나타났다. 이를 통해 7번 토픽의 주제를 ‘의료 및 사업장 폐기물’로 유추하였다.

자료: 저자 작성.

<그림 3-10> LDA 시각화 결과(환경부 유사민원): 7번 토픽(의료 및 사업장 폐기물)

<표 3-1>은 앞에서 살펴본 환경부 유사민원에서 추출한 7개 토픽과 토픽별 비율을 정리한

1번 토픽(생활환경)의 네트워크 분석결과는 <그림 3-11>과 같다. 매개중심성이 높은

자료: 저자 작성.

<그림 3-11> 네트워크 시각화 결과(환경부 유사민원): 1번 토픽(생활환경)

2번 토픽(건설 및 가축 폐기물)의 네트워크 분석결과는 <그림 3-12>와 같다. 매개중심성이 높은 키워드는 ‘사업장 폐기물’, ‘분뇨’, ‘처리시설’, ‘고철’, ‘폐목재’ 등으로 나타났다. 또한 네트워크 좌측에는 건설 및 가축 폐기물관련 해결방안(법률, 처리시설, 시행규칙, 덮개, 재활용시설, 처분 등)의 키워드가 나타났다. 네트워크 중심에는 폐기물 키워드를 중심으로 수집, 운반, 소각, 처분, 처리, 관리 등이 연관 키워드로 나타났다. 특히 ‘소각’ 키워드가 매개중심성과 연결정도 중심성이 가장 높게 나타났다. 이를 통해 건설 및 가축 폐기물 소각 관련 민원이 다양한 형태로 많이 나타났음을 알 수 있다. 연관 키워드 분석과 문장 추출 및 문서요약 기능을 활용하여 살펴본 관련 내용에서는 ‘폐기물’이 포함된 문장의 경우 생활 폐기물, 사업장 폐기물, 지정 폐기물, 배출시설, 재활용, 처리시설, 수집운반 등의 내용이 많았고, ‘분뇨’가 포함된 문장의 경우 배출시설, 재활용, 축사, 처리시설, 수집운반, 자원화,

현재 건축 폐기물의 재활용률은 90% 이상으로 높은 수준이지만, 순환 골재에 대한 부정 적인 인식 때문에 실제 부가가치가 높은 부문에서는 40%를 넘지 못하고 있는 상황이다.

따라서 이에 대한 인식의 재고와 더불어 이를 통한 재활용률의 개선과 분뇨 처리, 자원화, 액비 생산을 위한 시설의 확충이 필요하다. 그 외에 가축 폐기물 관련 민원의 경우 대부분 해당 여부에 문의로 이에 대한 가이드라인의 보완이 필요할 것으로 보인다.

자료: 저자 작성.

<그림 3-12> 네트워크 시각화 결과(환경부 유사민원): 2번 토픽(건설 및 가축 폐기물)

3번 토픽(환경영향평가)의 네트워크 분석결과는 <그림 3-13>과 같다. 매개중심성이 높은 키워드는 ‘승인’, ‘도로’, ‘토지’, ‘건축’, ‘주택’, ‘상수원보호구역’ 등으로 나타났다. 또한 네트워크 좌측에는 환경영향평가 법 관련 키워드(시행령, 법률, 「수도법」, 「하수도법」 등)가 나타났다. 네트워크 중심에는 환경영향평가 대상 관련 키워드(도로, 토지, 주택, 부지, 건축,

공장, 상수원보호구역, 상수도, 공공하수도 등)가 주로 나타났다. 네트워크 우측에는 환경영 향평가 부담금 관련 키워드(원인자부담금, 부과, 산정)가 나타났다. 이를 통해 환경영향 평가와 관련하여 다양한 주제의 법, 부담금 관련 민원이 많았음을 알 수 있다. ‘연관 키워드

공장, 상수원보호구역, 상수도, 공공하수도 등)가 주로 나타났다. 네트워크 우측에는 환경영 향평가 부담금 관련 키워드(원인자부담금, 부과, 산정)가 나타났다. 이를 통해 환경영향 평가와 관련하여 다양한 주제의 법, 부담금 관련 민원이 많았음을 알 수 있다. ‘연관 키워드

관련 문서