• 검색 결과가 없습니다.

Model time-step, lag RMSE RMSE/std

ICNN (1,1) 4.83 0.226

ICNN-ViT (1,1) 6.24 0.293

ICNN (12,1) 4.00 0.188

ICNN-ViT (12,1) 5.92 0.278

자료: 저자 작성.

<표 2-2> 모델별 미세먼지 예측 성능

<표 2-2>는 본 연구에서 제시한 ICNN-ViT와 ICNN 예측 모델의 time-step별 RMSE와 RMSE/std이다. Time-step은 1과 12로 1시간의 데이터를 활용한 모델과 12시간의 데이 터를 활용한 모델을 의미한다. lag는 1로 1시간 뒤 미세먼지 예측에 대한 결과이다. 기존 ICNN에 비해 ICNN-ViT의 예측 성능이 더 뛰어나지는 않은 것으로 판단된다. ViT의 경우 도 RMSE 및 표준편차 대비 RMSE를 비교해볼 때 높은 예측 정확도를 보였다. 이는 단지 대조군 ICNN이 시공간 정보가 효과적으로 학습되어 반영됨에 따라 뛰어난 예측 정확도를 보였기 때문이다. 한편 ViT를 활용하면 attention score가 추출 가능하기 때문에 설명 가능한 인공지능으로 활용할 수 있다. <그림 2-4>는 추출한 PM10 단기 예측에서 attention score를 1시간 간격으로 heat-map 형태로 시각화한 그림이다.

자료: 저자 작성.

<그림 2-4> PM10 예측결과에 대한 attention score 시각화

<그림 2-4>는 2018년 3월 5일 13:00~20:00까지의 예측결과에 대한 attention score 를 시각화한 것이다. 색이 빨간색에 가까울수록 attention score가 큰데, 이는 결과에 큰 영향을 미쳤음을 의미하고, 초록색에 가까울수록 결괏값에 영향을 적게 미쳤음을 의미한다.

zero padding을 적용한 부분은 초록색으로 표현된 것으로 미루어보아 zero padding이 정상적으로 적용되었음을 알 수 있다. 해당 그림에서 수도권과 부산 지역의 attention score가 높게 나왔음을 알 수 있다. 이는 인구수가 많은 수도권과 부산 지역에서 오염원의 배출량이 높을 수 있기 때문에 그에 따라 미세먼지가 높게 나온 것을 반영하였다고 볼 수 있다. 또한 전반적으로 주간에 비해 야간에 전체적인 score가 낮은 것으로 미루어보아 시간 이 지남에 따라 자동차 통행량이 줄어드는 것에 따른 현상으로 볼 수 있다.

제2장 설명 가능한 인공지능 기반 새로운 미세먼지 예측 모듈 개발 ∣ 17

자료: 저자 작성.

<그림 2-5> PM10 단기 예측결과에 대한 shapely value 시각화

<그림 2-5>는 time-step과 lag를 1로 PM10을 예측한, 즉 PM10 단기 예측을 진행한 ViT-ICNN 모델의 shapely value를 시각화한 것이다. x축은 shapely value를 의미하며, y축은 변수를 의미한다. 해당 그림에서 파란색은 예측결과에 있어 긍정적인 영향을, 빨간색 은 부정적인 영향을 의미하며, shapely value의 크기는 영향도를 의미한다.

변수 shapely value

강수량(mm)   ×  

풍속(m/s)   ×  

wind_y  ×  

wind_x  ×  

기온(℃)  ×  

SO2(ppm)   ×  

PM2.5(㎍/m3)   ×   PM10(㎍/m3)  ×  

O3(ppm)   ×  

NO2(ppm)  ×  

CO(ppm)   ×  

자료: 저자 작성.

<표 2-3> PM10 단기 예측결과에 대한 shapely value

<표 2-3>은 동일한 환경에서 진행한 shapely value의 측정값이다. NO2, O3, SO2, 풍향 의 경우 표에서 볼 수 있듯이 중요도가 상당히 작아 그림에서는 거의 없는 것으로 시각화되 어 있다. 영향도가 가장 큰 3개의 변수는 PM10, 기온, 풍속이며, 풍속을 제외한 PM10과 기온 변수는 부정적인 영향을 미쳤다. PM10 예측에 있어서 PM10이 가장 큰 영향을 미친 것으로 미루어보아 합리적인 결과로 추론할 수 있다. 기온의 경우 두 번째로 shapely value 가 크게 나온 것을 볼 수 있다. 이는 계절 변동에 따른 기온 변동과 지표면 가열에 연관이 있는 것으로 보인다. 즉, 이는 기온이 상승하여 지표면이 가열되면 대류가 변동하여 대기의 정체 수준이 달라지는 것이 반영된 결과로 추측된다. 세 번째로 큰 값은 풍속인데, 풍속 역시 대기의 정체 수준과 밀접한 연관이 있으므로 미세먼지에 직접적인 영향을 미치는 것으 로 보인다. 풍속이 증가할수록 미세먼지 농도는 점차 감소하는데(Chae, 2009), 이로 인해 shapely value 값이 음의 방향으로 크게 나온 것임을 알 수 있다. CO의 경우 PM10, PM2.5

를 제외한 대기질 데이터 중 shapely value가 가장 크게 나타났다. 이는 CO가 미세먼지 농도와 큰 상관관계가 있을 뿐만 아니라 영향력을 가진다는 점에(Won et al., 2021) 기인

제2장 설명 가능한 인공지능 기반 새로운 미세먼지 예측 모듈 개발 ∣ 19

한 것으로 볼 수 있다. 미세먼지 농도에 영향을 주는 강수의 경우 부정적인 영향을 미쳤다는 점에서는 합리적이지만 영향력은 크지 않은 것을 볼 수 있다. 이는 비가 오는 날 자체가 적기 때문에 감소에 영향을 미쳤지만, 전체 미세먼지 예측에서의 영향을 미친 정도는 낮은 것으로 해석할 수 있다.