• 검색 결과가 없습니다.

질문중심 데이터베이스: 미세먼지 질문중심 데이터베이스

구분 파일 내용

예측결과 재생

` labs(size = "클로로필_A 예측치",x="",y="",title="녹조 위험 예고 지역") + theme(axis.ticks.x=element_blank(),

axis.text.x=element_blank(), axis.ticks.y=element_blank(), axis.text.y=element_blank())

```

```{r Reportmap2,include=FALSE}

ggsave("Highchol_P.png",p)

```

![녹조 위험 예고 지역](Highchol_P.png)

예측결과 해석

```{r ReporNacdong,echo=FALSE}

WARNING_NACDONG=WARNINGSPOT %>% filter(`수계`=="낙동강")

WARNING_NACDONG_BO=WARNINGSPOT %>% filter(`수계`=="낙동강") %>%

filter(`보`=="YES")

```

지도에서 알 수 있듯이 녹조 농도가 높다고 예측되는 측정소는 낙동강 수계에 집중적으로 분포하였다. 녹조의 농도가 높을 것으로 예측된 ‘r dim(WARNINGSPOT)[1]’개 측정소 중 ‘r dim(WARNING_NACDONG)[1]’개 측정소가 낙동강 수계에 위치하였다. 그리고 그중 ‘r dim(WARNING_NACDONG_BO)[1]’개 측정소가 보에 설치된 측정소였다.

자료: 저자 작성.

<표 5-2>의 계속

제5장 환경 빅데이터 플랫폼 뉴스레터 개발 ∣ 75

있도록 하였고, 개별 이슈에 필요한 답을 도출하기 위해 수집한 데이터를 가공하는 작업도 데이터 수집 시에 실시간으로 진행할 수 있도록 하였다. 따라서 데이터의 수집 및 전처리 과정은 2022년 현재 모두 자동화되어 있다.

현재 질문중심 데이터베이스는 ‘KEI_1-3차년도(수정중).ipynb’이라는 jupyter notebook 파일 형태로 관리되고 있다. 그리고 질문중심 데이터베이스를 관리하는 서울대학교 행정대 학원 고길곤 교수 연구진과 KEI 연구진이 Google Colab에서 이 파일을 공유6)하고 있어 수정에 대한 요청과 수정결과를 실시간으로 확인할 수 있다. 이 notebook은 계층화된 질 문, 질문과 관련된 데이터 수집 및 연산 그리고 데이터 수집 및 연산결과를 반영한 질문에 대한 대답으로 구성되어 있다. 여기서 데이터 수집 및 연산은 뉴스레터의 분석결과 재생기 능을, 질문 및 대답은 뉴스레터의 분석결과 해석 기능을 담당하고 있다. 따라서 질문중심 데이터베이스는 이미 뉴스레터 형태로 구성되어 있다.

질문중심 데이터베이스 뉴스레터는 질문중심 데이터베이스에 수록된 내용 중 뉴스레터 발간 시점에 시의성이 높은 내용을 추출하여 뉴스레터에 이식하는 방식으로 구축하였다.

우선 질문중심 데이터베이스로부터 시험적으로 뉴스레터에 기재할 질문을 추출하여 뉴스레 터에 기입하고, 질문중심 데이터베이스에서 그 질문에 관계되어 출력하는 그래프를 .png 양식으로 추출하였다. 그런 다음 이렇게 부분적으로 출력한 결과 파일들을 입력자료로 사용 하는 뉴스레터 양식을 구축하였다.

질문중심 데이터베이스의 뉴스레터 양식은 각 질문별로 3가지 요소로 구성된다. 가장 먼저 이식된 질문을 표기한다. 그리고 질문중심 데이터베이스에서 출력하는 데이터와 그래프를 해 석하여 질문에 대한 대답을 작성한다. 마지막으로는 질문중심 데이터베이스에서 추출한 그래 프를 삽입하여 대답에 대한 근거를 제시한다. 2022년 10월 현재 질문중심 데이터베이스의 결과를 전달하는 뉴스레터는 R 마크다운 언어로 작성한 QbaseDB_pdf_0824.rmd와 QbaseDB_html_0824.rmd의 두 파일로 관리하고 있다. QbaseDB_html_0824.rmd는 결 과를 html 파일인 QbaseDB_html_0824.html 파일로 출력하고, QbaseDB_pdf_0824.rmd 파 일은 결과를 pdf 파일인 QbaseDB_pdf_0824.pdf 파일로 출력한다. 질문중심 데이터베이스에 서 출력한 그래프를 삽입하는 부분은 R coding을 이용하여 문서 작성 시마다 갱신되도록

6) https://colab.research.google.com/drive/1gNqwuAry9U69rRoPcSUjpZBwfvhTe7yX

하였고, 질문을 선택하고 결과에 대한 해석을 전달하는 부분은 연구자가 작성하도록 하였다.

QbaseDB_html_0824.rmd 파일의 내용 중 일부는 <표 5-3>에 소개하였다.

<그림 5-3>은 QbaseDB_pdf_0824.pdf 중 ‘미세먼지는 시간에 따라 차이를 보이는가?’

라는 질문중심 데이터베이스의 질문에 대해 해답을 제시하는 부문과 질문중심 데이터베이 스에서 출력한 그래프를 삽입하여 다시 보여주는 부문을 나타낸다.

자료: 저자 작성.

<그림 5-3> 질문중심 데이터베이스 뉴스레터 구성(예시)

구분 파일 내용

질문 삽입 및 해답

작성

1. Qusetion: 미세먼지는 시간에 따라 차이를 보이는가

* 전체적으로 전국 평균 PM10 미세먼지 오염도 및 전국 평균 PM2.5 오염도는 2010년 이후 감소하는 추세를 보이고 있는 상황임

* 2022년 7~9월에도 전국 평균 PM10 미세먼지 오염도 및 전국 평균 PM2.5 오염도 감소 추세는 지속될 전망임

그래프 삽입 <center>

![**PM10 전국 월평균 농도: 추세 및 예측**](PM10trend.png) 자료: 저자 작성.

<표 5-3> 질문중심 데이터베이스 뉴스레터 QbaseDB_htm_0824.rmd 파일 내용

제5장 환경 빅데이터 플랫폼 뉴스레터 개발 ∣ 77