• 검색 결과가 없습니다.

서울 미세먼지(PM10) 농도의 시공간통계분석 활용방안 연구

N/A
N/A
Protected

Academic year: 2021

Share "서울 미세먼지(PM10) 농도의 시공간통계분석 활용방안 연구"

Copied!
60
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)
(2)

❚연구자문위원 (가나다 순) 강성원 (한국환경정책․평가연구원 선임연구위원) 공성용 (한국환경정책․평가연구원 선임연구위원) 임예지 (중앙대학교 응용통계학과 교수) ⓒ 2018 한국환경정책・평가연구원 발행인 조 명 래 발행처 한국환경정책・평가연구원 (30147) 세종특별자치시 시청대로 370 세종국책연구단지 과학・인프라동 전화 044-415-7777 팩스 044-415-7799 http://www.kei.re.kr 인 쇄 2018년 9월 26일 발 행 2018년 9월 30일 등 록 제 2015-000009호 (1998년 1월 30일) ISBN 979-11-5980-223-2 93530 이 보고서를 인용 및 활용 시 아래와 같이 출처를 표시해 주십시오. 홍한움(2018), 「서울 미세먼지(PM10) 농도의 시공간 통계분석 활용방안 연구」, 한국환경정책·평가연구원.

(3)

대부분의 환경 자료는 시간 의존성과 ᠂공간 의존성을 모두 가지고 있음에도 분석 방법론의 한계로 인해 그동안 둘 중 하나의 의존성을 포기하는 분석이 이루어져 왔습니다. 최근 10 년간 시공간 통계학이 크게 발전함에 따라 기존보다 강력한 방법론을 통해 환경 자료를 분석할 수 있게 되었습니다. 본 연구는 시공간 통계학의 최신 연구 방법론을 대기질 자료에 적용한 해외 연구 사례들 을 살펴보고, 서울시 미세먼지 농도 예측에 실제 적용하였습니다. 불확실성을 고려한 통계 학적 방법론을 통해 국민적 관심사인 미세먼지 농도를 단순 수치가 아닌 분포로 예측 할 수 있는 방법론을 제시하였습니다. 본 연구에서 제시한 방법론을 전국 단위로 확장하여 앞 으로 있을 미세먼지 관련 연구에 주요한 참고자료로 활용할 수 있기를 기대합니다. 본 연구를 수행한 한국환경정책᠂·평가연구원 홍한움 박사에게 감사의 뜻을 표합니다. 바 쁘신 와중에도 자문을 통해 연구에 도움을 주신 중앙대학교 응용통계학과 임예지 교수에게 도 깊이 감사드립니다. 2017년 9월 한국환경정책․평가연구원 원 장

조 명 래

(4)
(5)

미세먼지에 대한 사회적인 관심이 증대되면서 다양한 분야에서 미세먼지에 대한 연구가 이루어지고 있으나 통계적 방법론은 제한적으로만 사용되어 왔다. 미세먼지 자료는 시간의 존성과 공간의존성을 동시에 가지는 시공간 자료이다. 최근 10년간 통계학 분야에서 시공간 자료를 통계적으로 분석하기 위한 시공간통계 기법이 크게 발전하여 미세먼지 자료에 시공 간통계를 적용한 연구결과들이 발표되고 있다. 본 연구의 목적은 서울 미세먼지(PM10) 농 도의 리스크를 최신 시공간통계 기법을 이용하여 예측하는 것이다. 먼저 시공간통계 모형을 소개하고 미세먼지 예측에 널리 사용되는 방법론인 물리 모형과 비교하여 장단점을 조사하였다. 시공간통계 분석에 있어서 가장 어려운 점은 시간의존성과 공간의존성이 맞아야 하는 것이다. 두 의존성의 균형이 맞아야 과적합이나 지나친 단순화의 문제를 피할 수 있다. 주어진 공간해상도에 맞는 최적 시간해상도를 사전에 알 수 없기 때문 에 실제 분석은 다양한 시간해상도별로 적용해야 한다. 먼저 시공간통계 모형을 대기질에 적용한 해외 연구 사례를 검토하고 서울시 PM10에 실증 적용하였다. 분석 적용범위는 2016년 서울시 PM10 자료이며, 1시간, 3시간, 8시간별로 모형을 적합하였다. 가장 불안정 적인 4월, 가장 안정적인 7월, 다른 월과 큰 차이 없는 10월 자료를 대상으로 분석하였다. 적용 결과 최댓값에 대한 예측 및 VaR(Value at Risk)예측에 준수한 성능을 보였다. 시공간통계 모형은 전국 단위로의 확장이 용이하며, 수용체 중심 연구에 활용할 수 있다. 관측소가 넓게 퍼져 있는 농·어촌지역을 대상으로도 하면 효과적으로 분석할 수 있을 것으 로 기대된다. 주제어 : 미세먼지, PM10, 통계, 시공간통계, 시공간예측, 리스크예측

(6)
(7)

제1장 서 론 ···1 1. 연구의 필요성 및 목적 ···1 2. 연구의 범위 ···2 3. 연구의 내용 및 구성 ···3 제2장 시공간통계 모형 ···4 1. 개요 ···4 2. 기존 분석 사례 ···7 3. 물리 모형과의 차이점 및 시공간통계의 문제점 ···11 제3장 국외 시공간통계 모형 대기질 적용 사례 ···16 1. 미국 뉴욕주 오존농도 ···16 2. 이탈리아 피에몬테주 PM10 ···18 3. 미국 LA군 질산화물 배출량 ···22 제4장 서울시 PM10 분석 결과 ···27 1. 개요 ···27 2. 통계 분석 결과 ···30 제5장 요약 및 결론 ···42 참고문헌 ···45 Abstract ···47

(8)

<표 3-1> 미국 뉴욕주 오존농도 분석변수 ···17 <표 3-2> 이탈리아 피에몬테주 PM10 분석변수 ···19 <표 3-3> 미국 LA군 질산화물 배출량 분석변수 ···23 <표 4-1> 서울 PM10 농도 시공간통계 분석변수 ···28 <표 4-2> 모형 적합용 서울시 27개 대기질 관측소 ···29 <표 4-3> 모형 검증용 서울시 12개 대기질 관측소 ···30 <표 4-4> 4월, 7월, 10월 PM10 농도의 39개 관측소 전체 요약 통계량 ···32 <표 4-5> 4월 자료 분석 결과(시간해상도: 1시간) ···37 <표 4-6> 4월 자료 분석 결과(시간해상도: 3시간) ···37 <표 4-7> 4월 자료 분석 결과(시간해상도: 8시간) ···37 <표 4-8> 7월 자료 분석 결과(시간해상도: 1시간) ···38 <표 4-9> 7월 자료 분석 결과(시간해상도: 3시간) ···38 <표 4-10> 7월 자료 분석 결과(시간해상도: 8시간) ···38 <표 4-11> 10월 자료 분석 결과(시간해상도: 1시간) ···39 <표 4-12> 10월 자료 분석 결과(시간해상도: 3시간) ···39 <표 4-13> 10월 자료 분석 결과(시간해상도: 8시간) ···39

(9)

<그림 2-1> 서울 PM10 39개 관측소의 공간 자료/시계열 자료 예시 ···5 <그림 2-2> 서울 PM10 39개 관측소의 시공간 자료 예시 ···5 <그림 2-3> 2005년 임의로 추출된 8일 독일 일평균 PM10 농도 ···8 <그림 2-4> 2005년 독일 PM10 농도 시공간 베리오그램 ···10 <그림 2-5> 2005년 독일 PM10 농도 모형 베리오그램과 단순 경험 베리오그램의 차이 ··· 10 <그림 2-6> CMAQ 모형의 구성 및 작동원리 ···12 <그림 2-7> 시공간 통계분석의 문제점 ···13 <그림 3-1> 뉴욕주 28개 오존농도 관측지점 ···16 <그림 3-2> 이탈리아 피에몬테주 34개 PM10 관측지점 ···19 <그림 3-3> 142개 꼭짓점을 사용한 피에몬테주 삼각형 분할 ···20 <그림 3-4> 이탈리아 피에몬테주 PM10 분석 결과 ···21 <그림 3-5> LA군 25개 대기질 관측지점 ···22 <그림 3-6> 3개 AQS 관측지점의 NOx 관측값 및 시간기저 함수 ···24 <그림 3-7> A1 도로와의 거리변수를 이용한 경우와 이용하지 않은 경우의 교차검증 결과 ··· 25 <그림 3-8> LA군 질산화물 배출량 4개 관측지점에서의 교차검증 결과 ···26 <그림 4-1> 서울시 39개 대기질 관측소 위치 ···28 <그림 4-2> 2016년 PM10의 월별, 시간대별 상자 그림 ···30 <그림 4-3> 2016년 제곱근 스케일 PM10의 월별, 시간대별 상자 그림 ···31 <그림 4-4> 2016년 로그 스케일 PM10의 월별, 시간대별 상자 그림 ···31 <그림 4-5> 4월, 7월, 10월 제곱근 스케일 PM10 시계열 그림 ···33

(10)

PM10 Particulate Matter 10㎛ (미세먼지) PM2.5 Particulate Matter 2.5㎛ (초미세먼지)

CMAQ Community Multiscale Air Quality Modeling System (집단 다측도 공기품질 모델링 시스템)

IDW Inverse Distance Weighted method (역거리가중법) EPA Environmental Protection Agency (환경보호국) GAM Generalized Additive Model (일반화가법 모형) GLM Generalized Linear Model (일반화선형 모형) AR Auto Regressive (자기상관)

GP Gaussian Process (가우시안 과정)

MCMC Markov Chain Monte Carlo (마코프 체인 몬테 카를로) MSE Mean Square Error (평균제곱오차)

RMSE Root Mean Square Error (제곱근평균제곱오차)

SPDE Stochastic Partial Differential Equations (확률편미분방정식) AQS Air Quility System (대기질 시스템)

MESA Air The Multi-Ethnic Study of Atherosclerosis and Air Pollution (죽상동맥경화증과 대기 오염에 대한 다민족 연구)

(11)

제1장

서 론

1. 연구의 필요성 및 목적

미세먼지에 대한 사회적 관심이 증대되면서 환경, 경제, 사회, 보건 등 다양한 분야에서 미세먼지에 대한 연구가 이루어지고 있다. 전국 97개 시᠂·군의 323개 측정소에서 관측한 미세먼지(PM10)와 초미세먼지(PM2.5)의 예보 및 경보는 한국환경공단 에어코리아 (http://www.airkorea.or.kr/index)에서 한 시간 단위로 제공하며, 2001년부터의 과거 PM10 최종 확정 자료 또한 동 사이트에서 손쉽게 다운로드할 수 있다. 다양한 분야에서 미세먼지 자료를 분석한 연구 결과가 발표되고 있으나 대부분의 연구에서 통계 기법은 단순 기술통계 수준으로만 사용하고 통계적 추론 기법은 제한적으로만 이용되었다. 한편 최근의 환경정책 기조가 매체 중심에서 수용체 중심으로 전환됨에 따라 적합한 공간 예측의 필요성이 대두되고 있다. 상술하였듯 현 323개 측정소에서 PM10 농도를 관측하여 제공하고 있는데, 서울시의 경우 행정구 하나당 한 개에서 두 개의 관측소가 있다. 특수한 경우를 제외하고는 수용체의 활동지역이 관측지점과는 다를 것이므로 이에 대한 보정이 필요하다. 역거리가중법(IDW)이나 크리깅과 같은 보간법으로 보간이 가능하나 이 방법들 은 공간의존성만 사용하는 보간법이기 때문에 한 시간 단위로 세밀하게 관측되는 시간의존 성 정보를 활용할 수 없는 한계가 있다. PM10 자료는 시간의존성과 공간의존성을 동시에 가진다. 예를 들어 서울시 종로구 종묘 주차장 앞 관측소의 2018년 5월 1일 12시 PM10 농도는 시간적으로 동 관측지점의 2018 년 5월 1일 11시 PM10 농도와, 공간적으로 서울시 종로구 종로 5, 6가동 주민센터 관측소 의 2018년 5월 1일 12시 PM10 농도와 강한 상관관계가 있다. 따라서 시간의존성과 공간

(12)

의존성을 함께 고려하는 통계적 추론 기법을 이용하면 PM10 농도를 더욱 효과적으로 예측할 수 있을 것이라 기대할 수 있다. PM10 예측에 가장 많이 쓰는 방법론은 CMAQ(Community Multiscale Air Quality Modeling System)와 같은 물리 모형 방법 론이다. 물리 모형은 시간의존성과 공간의존성을 동시에 고려하는 효과적인 모형이지만 불 확실성에 대한 고려가 없기 때문에 통계 모형에서와 같은 분포추론이 어려울 뿐더러, 모형 이 요구하는 세밀한 공간해상도를 만족하는 자료를 구하는 것에 한계가 있고, 모형에 여러 미분방정식이 복잡하게 얽혀 있어 계산도 오래 걸리는 단점이 있다. 때문에 단순 예측 목적 을 넘어선 타 분야의 연구에서 물리 모형의 예측 결과를 활용해서 연구하기에 제약이 있다. 통계적 추론 기법은 가지고 있는 자료만 사용하여 효과적으로 예측 하기 위한 방법론이기 때문에 물리 모형에 비해 손쉽게 응용할 수 있다. 최근 통계학 분야에서 시간의존성과 공간 의존성을 동시에 고려하는 시공간통계학(spatio-temporal statistics)이 크게 발전하고 있 다. 기존에는 관심변수만 단변수(univariate)로 하여 자료의 공간적·시간적 변동성만 분석 하였으나, 최근의 시공간통계학은 관심변수에 영향을 주는 여러 독립변수를 활용하여 시간· 공간 정보와 함께 회귀분석 형식으로 직접적인 예측 효율성을 높이는 방향으로 발전하고 있다. 서울시는 대한민국의 수도이고 605.2의 좁은 면적에 대한민국 인구의 20%가 몰려 있어 미세먼지에 대해서도 관심도가 가장 높은 지역이다. 대기질 관측소도 39개로 여타 지역과 비교하여 좁은 면적에 촘촘히 분포되어 있다. 본 연구의 목적은 서울시 지역을 시공 간통계 분석 시범 적용대상으로 선정하여 최신 연구 성과를 이용, PM10 리스크를 효과적으 로 예측하는 것이다.

2. 연구의 범위

본 연구에서는 에어코리아(http://www.airkorea.or.kr/index)에서 제공하는 PM10 자료를 대상으로 시간의존성과 공간의존성을 동시에 고려하여 통계적으로 추론하였다. PM10이란 대기 중에 떠다니는 지름 10㎛ 이하의 부유물질을 뜻한다. 서울시를 대상으로 하고, 2016 년의 최종 확정 자료를 이용하여 분석하였다.

(13)

PM10 분석을 위한 독립변수로 동 기간 서울시의 다음 변수를 사용하였다. - 대기질: 아황산가스, 이산화질소, 일산화탄소 농도 - 기상 자료: 기온, 강수량, 풍속 - 공간정보: 관측지점의 UTM-K 좌표

3. 연구의 내용 및 구성

본 연구는 서울시 PM10을 대상으로 시공간통계 모형을 적용하고 활용방안을 모색하였다. 연구의 주요 내용 및 구성은 아래와 같다 제2장에서는 시공간통계학이 크게 발전하기 이전의 시공간통계 모형을 소개한다. 제3장에서는 최신 시공간통계 모형을 이용해 대기질을 분석한 해외 연구 사례를 검토한다. 제4장에서는 제3장에서 소개한 시공간통계 모형 중 한 가지 기법을 서울 PM10에 실제 적용하였다. 제5장에서는 주요 결과를 요약하고 앞으로의 과제를 제시하였다.

(14)

제2장

시공간통계 모형

1. 개요

시공간통계 모형(spatio-temporal statistical model)이란 시공간 자료(spatio temporal data)를 통계적 추론방법을 이용하여 분석하기 위한 모형을 말한다. 공간의존성 만 가지는 자료는 공간 자료(spatial data)라 하고, 시간의존성만 가지는 자료는 시계열 자료(time series data)라 한다. 시공간 자료란 시·공간 의존성을 동시에 가지는 자료를 말한다. <그림 2-1>은 서울특별시 PM10 농도의 공간 자료와 시계열 자료 예시를 시각화한 그림이다. <그림 2-1> 왼쪽의 공간 자료는 2016년 4월 9일 14시 시점에서 39개 관측소의 PM10 농도(단위:)를 ‘좋음(0-30)’, ‘보통(31-80)’, ‘나쁨(81-100)’, ‘매우 나쁨 (100-150)’, ‘크게 나쁨(150 이상)’으로 분류하여 서울시 지도 위에 시각화하였다. 하나의 관측시점만을 대상으로 하기 때문에 자료의 시간의존성은 알 수 없지만 관측지점의 위치정 보가 표현되어 있어 거리가 가까운 관측지점끼리 비슷한 분류임을 확인할 수 있다. 즉, 공간 의존성을 가진다. <그림 2-1>의 오른쪽의 시계열 자료는 39개 관측소의 2016년 4월 1일 0시부터 2016년 4월 31일 23시 시간별 PM10 자료를 시계열 그림으로 표현한 것이다. 그림에서 자료가 시간적으로 무작위하지 않다. 예를 들면 4월 4일부터 11일까지의 구간, 4월 20일부터 24일까지의 구간에서 증가하는 추세를 보인다. 따라서 시간의존성을 가진다. 하지만 시계열 그림만으로는 관측지점 간의 거리 같은 공간정보는 알 수 없기 때문에 공간 의존성은 알 수 없다.

(15)

주: 기준은 좋음(0-30), 보통(31-80), 나쁨(81-100), 매우 나쁨(100-150), 크게 나쁨(150 이상) 자료: 저자 작성. <그림 2-1> 서울 PM10 39개 관측소의 공간 자료/시계열 자료 예시 주: 분류 기준은 <그림2-1>과 같음. 자료: 저자 작성. <그림 2-2> 서울 PM10 39개 관측소의 시공간 자료 예시

(16)

<그림 2-2>는 2016년의 시간대별 서울시 PM10 자료를 시공간적으로 시각화하기 위하 여 무작위로 8개 시점을 뽑아 해당 시점의 모든 관측소에서 관측된 PM10 농도 분류를 서울시 지도 위에 표현한 것이다. <그림 2-1>과 <그림 2-2>를 통해 서울시 PM10 농도는 시·공간 의존성을 동시에 가지는 시공간 자료임을 알 수 있다. 관심 있는 시공간 자료를 라 하자. 는 관측지점의 위치와 같은 공간정보를 나타내 는 색인(index)이고, 는 관측 시점을 나타내는 색인이다. 시공간 자료를 통계적으로 분석 하기 위한 모형 식은 아래와 같다.     식(2-1) 는 평균과정을 의미하고 는 불확실성을 나타내는 오차과정을 의미한 다. 기존의 시공간통계 모형은 는 단순화하고 의 공분산구조를 분석하는 방향으로 발전하였다. 한 예로, 는 다음과 같이 단순화한다.      식(2-2) 는 전체 평균, 는 지점 평균과 전체 평균의 차, 는 시점 평균과 전체 평균의 차이이다. 예를 들어, (= 종로 관측소), (=2017년 9월 18일 14시)라 하고, 2017년 연간 서울시 39개 관측지점의 시간별 전체 341,640(관측소 × 일 × 시간 )개 PM10의 평균이 50, 종로 관측소의 2017년 시간별 전체 8,760(일 × 시간)개 평균이 52, 2017년 9월 18일 14시의 모든 관측소 자료 39개 평균이 21이라고 하면   ,    ,   가 되어 평균과정은         이 된다. 실제 종로 관측소의 2017년 9월 18일 14시 PM10 농도 는 이므로 이때의 오차과정은   이 된다.

(17)

오차과정 의 일반적인 공분산 구조

는 식(2-3)과 같다.

  Cov′′ 식(2-3) 여기서 는 관측지점 와 ′의 공간적 거리, 는 관측 시점 와 ′의 시간적 거리를 의미한다. 일반적 형태의

는 지나치게 복잡하므로 여러 가지 방법으로

 를 단순화하여 오차과정의 공분산구조를 파악한다. 다음 절에서

을 여러 가지 다 양한 방법으로 모형화하여 PM10을 분석한 해외 연구 사례를 소개한다.

2. 기존 분석 사례

Gräler el al.(2016)는 다양한 방법으로 시공간 공분산을 모형화하여 독일의 2005년 일평균 PM10 농도의 시공간 구조를 파악하였다. <그림 2-3>은 분석에 사용한 자료 중 8개의 날짜를 임의로 추출하여 시각화한 것이다. 아래의 가)-라)는 분석에 사용한 시공간 공분산 모형을 정리한 것이다.

가) 분리 공분산 모형(separable covariance model); 시공간 공분산을 공간공분산과 시간공분산의 곱으로 표현;

sep 



 식(2-4)

나) 곱-합 공분산 모형(product sum covariance model)1)

시공간 공분산을 공간공분산과 시간공분산의 곱, 각 공분산의 합으로 표현;

(18)

자료: Gräler, Pebesma, and Heuvelink(2016). Figure 2.

<그림 2-3> 2005년 임의로 추출된 8일 독일 일평균 PM10 농도()

ps  







 식(2-5)

다) 메트릭 공분산 모형(metric covariance model)2)

단일분산 모형

j oint와 비등방성 보정 계수 로 시공간의존성 표현;

m 

j oint

  ∙ 식(2-6)

(19)

라) 합-메트릭 공분산 모형(sum-metric covariance model)3) 시간 공분산, 공간공분산, 메트릭 공분산 모형을 결합한 모형;

sm 





j oint

 ∙ 식(2-7) <그림 2-4>는 위에서 소개한 각 모형뿐 아니라 모형 가정 없이 순수하게 자료만을 이용하 여 구한 단순 경험 베리오그램과, 가)-라) 모형을 섞고 너젯 효과(nugget effect)로부터 자유롭도록 설정한 단순합-메트릭 모형을 추가하여 공분산 분석한 베리오그램을 추가하였 다. 너젯 효과는 측정 오차로 인해 발생하는 효과를 의미하고, 베리오그램은 공분산 구조를 시각화하여 나타낸 그림을 말한다. 공분산 구조

는 공간 거리 와 시간 거리 의 식이므로 시공간 베리오그램은 공간 거리를 나타내는 축, 시간 거리를 나타내는 축, 자료 변동성 크기의 3개 축을 가진 3차원 그림으로 시각화한다. 공분산 <그림 2-4>의 simple은 단순 경험 베리오그램, seperable은 분리 공분산 모형, productSum은 곱-합 공분산 모형, metric은 메트릭 공분산 모형, sumMetric은 합-메트릭 공분산 모형, simpleSumMetric 은 단순합-메트릭 모형을 이용한 베리오그램을 의미한다. 모든 그림에서 시간 거리와 공간 거리가 커질수록 공분산값이 커진다. 시간축에 대한 공분산의 변화가 공간축에 대한 공분산 변화보다 상대적으로 큰 경향이 있다. 즉, 동 시점 100km 떨어진 두 지점의 연관성이 같은 지점 2일 간격의 연관성보다 크다. <그림 2-5>는 각 모형과 단순 경험 모형의 차이를 나타 낸 그림이다. 분리 공분산 모형, 곱-합 공분산 모형, 메트릭 공분산 모형의 베리오그램은 단순 경험 베리오그램과 비교했을 때 가까운 공간 거리에서의 시간변동성을 과대평가하는 경향을 보인다. 합-메트릭 모형과 단순합-메트릭 모형은 단순 경험 베리오그램과 큰 차이가 없다.

(20)

자료: Gräler, Pebesma, and Heuvelink(2016). Figure 3.

<그림 2-4> 2005년 독일 PM10 농도 시공간 베리오그램

자료: Gräler, Pebesma, and Heuvelink(2016). Figure 4.

<그림 2-5> 2005년 독일 PM10 농도 모형 베리오그램과 단순 경험 베리오그램의 차이

(21)

상술한 분석 사례에서 볼 수 있듯이, 기존의 시공간 분석 모형은 식(2-8)과 같다.     식(2-8) 기존 시공간 분석 모형은 여기서 는 단순화하고 의 공분산 구조를 어떻게 모형화할 것인가에 대해 집중해서 이루어졌다. 를 어떻게 모형화하든 시간정상 성, 공간정상성에 대한 가정이 필요하다. 시간정상성이란 자료의 시간의존도가 시점에 상관 없이 시간적 거리에만 의존함을 뜻하고, 공간정상성이란 자료의 공간의존도가 위치에 상관 없이 공간적 거리에만 의존함을 뜻한다. PM10 농도를 예로 들면 공장 밀집지역에서의 인접 지역 간 시공간적 상관관계와 농어촌 지역에서의 인접지역 간 시공간적 상관관계가 같다고 가정하는 것이다. 그런데 를 지나치게 단순화하면 정상성에 대한 가정을 만족할 수 없다. 또한 의 시간적, 공간적 예측은 평균과정 로 이루어진다. 이러한 이 유로 최근의 시공간통계학의 연구는 를 발전시키는 방향으로 진행되어 왔다.  의 모형화를 통해 대기질을 시공간적으로 예측한 최근 연구 사례들은 제 3장에서 소개한다. 그에 앞서 시공간 통계 모형이 물리 모형과 대비해 가지는 차이점과 시공간구조를 통계적으 로 파악할 때 발생하는 문제점에 대해 살펴본다.

3. 물리 모형과의 차이점 및 시공간통계의 문제점

PM10 예측을 위해 가장 널리 쓰이는 방법은 물리적 모형을 활용하는 것이다. 그중 가장 많이 활용되고 있는 물리적 모형은 미국 EPA(Environmental Protection Agency)에서 제공하는 CMAQ4)로, 2018년 9월 현재, 가장 최신 버전은 2018는 3월 16일 제공된 CMAQv5.2.1이다. <그림 2-6>은 CMAQ 모형의 구성 및 작동 원리를 그림으로 간단히

(22)

자료: CMAQ 홈페이지, 검색일: 2018.9.6. <그림 2-6> CMAQ 모형의 구성 및 작동원리 나타낸 것이다. CMAQ 모형은 크게 투입 부분과 대기질 추정 부분으로 나눈다. 투입 부분은 대기질에 영향을 주는 기상정보와 오염물질 배출량 정보를 대기질 추정의 입력변수로 사용 하기 위해서 대기질 추정 부분이 요구하는 시간 및 공간해상도로 세밀화하는 역할을 한다. 대기질 추정 부분은 투입 부분에서의 결과와 초기조건, 경계조건을 조합하여 대기질을 추정 하기 위한 미분방정식을 계산한다. CMAQ 모형을 적용하기 위해서는 가능한 한 세밀한 공간해상도에서의 대기오염 배출량에 대한 정보가 필요하다. 하지만 강성원, 김민준(2014) 에 의하면 배출 부문에서 생성된 자료를 대기질 모형의 투입 자료로 직접 사용하기에는 배출원별·지역별 세분화 수준이 매우 낮다.5) 따라서 CMAQ를 활용한 대기질 연구는 대부 분 지역 단위에서만 이루어지고 있다. 더군다나 투입 부분의 지역적 특성이 모두 다르기 때문에 지역 단위에서의 연구를 전국 단위로 일반화하기 어렵다. 또한 불확실성에 대한 고 려 없이 결정론적 방정식을 계산하여 대기질을 추정하므로 확률 이론을 이용한 분포 추정을 할 수 없다. 따라서 ‘PM10 농도가 150 이상의 매우 나쁨일 확률’과 같은 분포 추정 을 할 수 없다. 5) 강성원, 김민준(2014), p.21.

(23)

반면 시공간통계 모형은 비교적 쉽게 얻을 수 있는 자료를 활용하여 최대한의 예측 효율 성을 꾀하는 방법론이다. 통계 이론을 통해 불확실성을 고려한 분포 추정이 가능하기 때문 에 물리 모형에서 할 수 없는 ‘PM10 농도가 150 이상의 매우 나쁨일 확률’과 같은 값을 이론적 근거와 함께 수치적으로 제시할 수 있다. 시공간통계 모형이 물리 모형과 비교 했을 때 가지는 장단점은 다음과 같다. ◦ 장점 - 쉽게 얻을 수 있는 자료만으로 분석 가능. 오염물질 배출량 정보 없이도 분석 가능 - 지역 단위에서 사용한 방법론을 그대로 전국 단위로 확장 적용 용이 - 확률 이론을 통한 분포 추정 가능 - 상대적으로 쉬운 계산 ◦ 단점 - 오염물질 배출량 정보가 세밀한 공간 해상도 단위에서 확보될 경우, 물리 모형의 예측 정확도를 따라잡기 어려움 시공간통계 모형은 현재진행형으로 크게 발전하고 있는 통계학 분야이므로, 앞으로의 학 계 연구성과에 따라 물리 모형과 비교해 가지는 예측력 부문의 단점을 극복할 수 있을 것으 로 기대된다. 자료: 저자 작성. <그림 2-7> 시공간 통계분석의 문제점

(24)

시간의존성과 공간의존성을 동시에 가진 시공간 자료를 통계적으로 분석하는 데 있어서 가장 어려운 점은 지나친 단순화와 과적합이 발생되지 않도록 균형을 맞추는 데 있다. 지나 친 단순화의 예는 식(2-2)에서 소개한 평균과정을     로 단순화한 모형을 들 수 있고, 과적합 모형의 예는 일반화가법 모형(GAM: Generalized Additive Model)을 들 수 있다. 일반화가법 모형은 일반화선형 모형(GLM: Generalized Linear Model)에서 선형 가정을 일반적인 매끈 함수(Smooth Function)로 일반화한 모형으로, 선형 함수가 아닌 일반 함수를 가정하기 때문에 모형을 적용할 수 있는 분야가 넓기 때문에 보건 등의 다양한 분야에서 활용하고 있는 통계 모형이다. 하지만 지나친 복잡성으로 인해 주어진 자료에만 과적합되기 쉽기 때문에 자료범위를 넘어선 예측 효율성이 크게 떨어진다. 시공간 자료에도 GAM을 적용하면 공간좌표, 시간좌표에 대한 예측 함수를 만들 수 있으나 과적합되는 GAM의 특성상 예측에 활용하기에 한계가 크다. 지나친 단순화와 과적합 사이 의 균형을 찾아야 하는 것은 시공간통계뿐 아니라 일반적인 다른 통계 분야에서도 공통적으 로 적용되는 문제이지만 시공간 자료의 분석에서는 문제가 더 커진다. 시·공간 의존성을 동시에 고려해 자료를 더욱 잘 설명하고 예측력을 높이고자 하는 것이 시공간통계의 의의인 데, 시간의존성과 공간의존성 중 하나가 다른 것보다 상대적으로 매우 클 경우 시공간 모형 을 적용하는 것이 과적합되기 쉽다. 자료의 시간의존성이 공간의존성에 비해 매우 크면 시 계열통계 모형을 적용하면 충분하고, 반대로 공간의존성이 시간의존성에 비해 매우 크면 IDW 보간을 하거나 크리깅(kriging)과 같은 공간통계 모형을 적용하면 충분하다. 자료의 시·공간 의존성의 균형이 어느 정도 맞아야만 과적합 문제를 피할 수 있다. 이러한 이유로 두 의존성의 균형을 맞추기 위해 자료의 공간해상도와 시간해상도를 조정해야 한다. PM10 과 같은 대기질 자료의 경우 공간적으로는 세밀하게 관측되지 않지만 시간적으로는 1시간 단위로 세밀하게 관측되기 때문에 공간해상도는 고정한 상태에서 시간해상도를 점점 넓혀 가며 시공간 모형에 적합한 최적 해상도를 찾아야 한다. 문제는 분석하고자 하는 자료의 시간의존성과 공간의존성의 상대적 크기를 사전에 파악할 수 있는 방법론은 아직 개발되어 있지 않아 다양한 시간해상도별로 모형을 하나씩 직접 적합해 보면서 최적 해상도를 찾는 수밖에 없다는 점이다. 또한 시·공간 의존성의 균형이 자료마다 천차만별이기 때문에 한 자료를 위한 시공간 모형을 개발하더라도 그 모형을 다른 자료에 적용하면 지나친 단순화나

(25)

과적합의 문제가 드러나기 쉽다. 이런 이유로 최근 10년간 시공간 모형이 크게 발전하였음 에도 불구하고 일반적인 자료에 대해 무난한 적합성을 보이는 통일된 시공간 모형은 아직 개발되지 않았다. 이러한 어려움에도 불구하고 대기질을 시공간 통계를 이용해 분석하려는 여러 노력이 있었다. 다음 장에서는 이러한 노력의 성과 중 몇 가지를 소개한다.

(26)

제3장

국외 시공간통계 모형 대기질 적용 사례

1. 미국 뉴욕주 오존농도

자료: Sahu and Baker(2012). p.152.

<그림 3-1> 뉴욕주 28개 오존농도 관측지점

Sahu and Baker(2012)는 베이지안 시공간통계 모형을 이용해 미국 뉴욕주의 오존농도 를 시공간 분석하였다. 뉴욕주 오존농도 28개 관측지점은 <그림 3-1>과 같다. 그림에서 숫자로 표시된 지점은 모형 적합에 이용한 관측소이고, A, B, C, D 알파벳으로 표시된 지점 은 모형 검증에 사용한 관측소이다. 관측기간은 2006년의 7, 8월이고, 분석 시간해상도는 8시간이다.

(27)

변수 비고 오존 농도 종속변수 기온 기상 독립변수 풍속 기상 독립변수 상대습도 기상 독립변수 관측지점 경도 좌표 공간 독립변수 관측지점 위도 좌표 공간 독립변수 <표 3-1> 미국 뉴욕주 오존농도 분석변수 자료: 저자 작성. 분석에 사용한 모형식은 아래와 같다.

 

 

  

  

   식(3-1)

는 지점 , 시점 에서의 오존농도,

는 같은 지점, 시점에서의 독립변수들 이다. 분석에 사용한 변수는 <표 3-1>과 같다.

는 랜덤 효과를 나타내는 잠재변수 (Latent Variable), 는 시간적 효과를 나타내기 위한 AR(Auto Regressive)계수, 는 독립변수에 대한 계수이다. 자료의 공간의존성은 error의 분산을 Matérn 상관함수에 관한 식으로 가정하여 나타난다. Matérn 상관함수의 정의는 아래와 같다. ′       

   ′



   ′       식(3-2) 단, 는 표준 감마 함수(Standard Gamma Function),

는 수정된 베셀 함수 (Modified Bessel Function)이다. 와 는 Matérn 상관함수를 정의하기 위해 필요한 모수(parameter)이다. 는 두 공간좌표 사이의 거리   ′가 커짐에 따른 상관관계의 감소 정도를 조정하는 역할을 한다. 는 임의 장(random field)6)의 매끈도(smoothness)

(28)

를 조정하는 역할을 하며, 추정하지 않고 사전에 고정된 값을 사용한다. Sahu and Baker(2012)는 베이지안 통계기법을 통해 잠재변수

와 계수  , 공간 분산 모수

를 추정하였다. 가우시안 과정(GP: Gaussian Process)의 깁스(Gibbs) 샘플링 MCMC (Markov Chain Monte Carlo)를 이용하여 모수 및 잠재변수의 사후분포를 추정하였다. 시공간 통계모형 중 가장 복잡하다 할 수 있는 GAM 모형과의 비교를 통해 식(3-1)의 예측 효율성을 판단하였는데, GAM 모형 대비 MSE(Mean Square Error; 평균제곱오차)를 상대 적으로 56% 줄이는 성과를 보였다.

2. 이탈리아 피에몬테주 PM10

Cameletti et al.(2013)은 베이지안 통계 모형을 이용하여 이탈리아 피에몬테주의 일별 PM10 농도를 시공간분석하였다. <그림 3-2>는 피에몬테주의 34개 PM10 관측지점을 나 타낸 것이다. 빨간색 점은 모형 적합에 이용한 관측지점이고, 파란색 점은 모형 검증에 이용 한 관측지점이다. 2005년 10월부터 2006년 3월까지의 자료를 이용하여 분석하였다. 분석 모형은 다음과 같다.

 

 

 

  

    식(3-3) 식(3-2)와는

항의 위치가 다른 것을 볼 수 있다. 여기서

는 대기오염도를 나타내는 잠재변수이다.

에 계수 를 통해 자기 상관관계를 부여하여 시간의존성을 적용하였고, 의 공분산에는 3.1절 사례와 같이 Matérn 상관함수를 적용하여 공간의 존성을 표현하였다. 분석에 사용한 변수는 <표 3-2>와 같다.

(29)

자료: Cameletti et al.(2013), p.113 <그림 3-2> 이탈리아 피에몬테주 34개 PM10 관측지점 변수 비고 PM10 종속변수 기온 기상 독립변수 강수량 기상 독립변수 풍속 기상 독립변수 하루 혼합층 최고 높이 기상 독립변수 UTM X축 좌표 공간 독립변수 UTM Y축 좌표 공간 독립변수 고도 공간 독립변수 <표 3-2> 이탈리아 피에몬테주 PM10 분석변수 자료: 저자 작성.

(30)

Cameletti et al.(2013)은 Sahu and Baker(2012)처럼 베이지안 통계 추정법을 이용하 였으나 MCMC 계산이 아닌 SPDE(Stochastic Partial Differential Equations) 계산을 통해 잠재변수

와 계수  , 공간 분산 모수 를 추정하였다. SPDE 계산은 관측공 간 대상지역을 여러 개의 삼각형으로 나누어 각 지역에 대해 시공간분석한다. Cameletti et al.(2013)은 피에몬테주를 <그림 3-3>과 같이 나누었다. R 소프트웨어의 INRA 패키지 에는 이와 같이 자동으로 삼각형을 나누어 주는 기능이 있다. 이때 관측지점은 자동 꼭짓점 으로 반드시 들어간다. MCMC는 베이지안 통계 추정에서 가장 널리 사용하는 방법론으로, 자료가 많아지면 실제 값에 수렴하는 수학적으로 좋은 성질을 가지는 데 반해 계산이 매우 힘든 단점이 있다. 반면 SPDE 계산은 수렴성에 대한 이론적 배경이 없는 근사계산 방법론 이지만 계산이 비교적 간단하다는 장점이 있다. 따라서 MCMC는 계산만 성공적으로 이루 어지면 결과를 신뢰할 수 있으나 SPDE 계산 결과는 잘 계산된 MCMC 결과에 비해 신뢰할 수 없다. 이론적 배경이 부족함에도 불구하고, SPDE 알고리듬 이용자들은 경험적으로 결과 의 신뢰성에 큰 문제가 없음을 주장하고 있다. 자료: Cameletti et al.(2013), p.118. <그림 3-3> 142개 꼭짓점을 사용한 피에몬테주 삼각형 분할

(31)

Cameletti et al.(2013)이 SPDE 계산을 통해 PM10 농도를 시공간 통계분석한 결과는 <그림 3-4>와 같다. 왼쪽 그림은 추정한 로그 PM10의 사후평균(posterior mean)을 시각 화하여 나타낸 것이고 오른쪽 그림은 PM10 농도가  이상일 확률을 사후분포로부 터 계산하여 시각화한 것이다. 여기서 미세먼지 위험이 특히 높은 지역이 어딘지 시각적으 로 확인할 수 있다. [동좌표 500, 북좌표 5000] 부근에서 PM10 위험이 큰 것으로 나타나는 데, 자료 관측범위를 넘어감에도 불구하고 PM10 위험의 레드 존이 어디인지 상세하게 확인 할 수 있다. 자료: Cameletti et al.(2013), p.129. <그림 3-4> 이탈리아 피에몬테주 PM10 분석 결과

(32)

3. 미국 LA군 질산화물 배출량

Lindström et al.(2014)은 미국 LA군(county)의 질산화물 배출량을 시공간 통계로 분석 하였다. LA군의 25개 대기질 관측지점은 <그림 3-5>와 같다. 파란색 다이아몬드로 표시된 지점은 EPA 대기질 시스템(AQS: Air Quility System)의 관측위치이고, 빨간색 오각형으로 표시된 지점은 MESA Air(The Multi-Ethnic Study of Atherosclerosis and Air Pollution)에서 코호트 연구를 위해 추가로 설치한 고정 관측지점이다. 분석 대상기간은 1999년 1월부터 2009년 9월까지이고, 분석 시간해상도는 2주일이다. 앞의 두 연구에 비해 장기간의 자료를 대상으로 하고 시간해상도를 크게 두고 분석하였다. 또한 앞의 두 연구는 베이지안 통계기법을 이용하였으나 Lindström et al.(2014)은 빈도주의(frequentist)적 통 계기법을 사용하여 분석하였다.

자료: Lindström et al.(2014), Figure 2.

(33)

분석에 사용한 모형은 다음과 같다.   



      식(3-4) 는 종속변수,

는 시공간 독립변수, 는 공간의존성을 나타내는 함수, 는 시간기저 함수이다. 앞의 두 연구에서는 시간의존성은 모형에 AR 구조를 부여하여 처리하고 공간의존성은 의 공분산 구조를 통해 처리한 것과 달리, Lindström et al.(2014)은 직접적으로 와  함수를 추정하여 시·공간 의존성을 처리하였다. 시간 기저 함수 를 먼저 데이터기반 추정하여 구하고, 추정한 를 고정기저 함수로 보고 를 추정하였다. <그림 3-6>은 3개 AQS 관측지점에서의 시간기저 함수를 나타낸 그림 이다. 또한 자료의 공간정보로 경위도 좌표나 UTM 좌표, 고도와 같은 위치적 정보를 사용하 지 않고 가까운 해변으로부터의 거리, A1 도로와의 거리, 관측지점 주변 2km 반경의 인구밀 도를 사용하였다. 이 중 A1 도로와의 거리는 공간 독립변수로서 사용한 경우와 사용하지 않은 경우를 모두 분석하여 결과를 비교하였다. 시공간 독립변수

로는 물리 모형의 하나인 Caline 예측값을 이용하였다. 분석에 이용한 변수를 정리하면 <표 3-3>과 같다. 변수 비고 질산화물 배출량(NOx) 종속변수 해변으로부터의 거리 공간정보 독립변수 A1 도로와의 거리 공간정보 독립변수 주변 2km 인구밀도 공간정보 독립변수 하루 혼합층 최고 높이 기상 독립변수 <표 3-3> 미국 LA군 질산화물 배출량 분석변수 자료: 저자 작성.

(34)

자료: Lindström et al.(2014), Figure 3.

(35)

식(3-4)의 모형을 이용해 LA군 질산화물 배출량을 시공간분석한 결과는 <그림 3-7>, <그림 3-8>에 정리되어 있다. Lindström et al.(2014)은 Caline 추정값을 시공간 독립변수 로 활용하는 것이 공간 예측력에 큰 도움이 되지 않음을 확인하였다. 상술하였듯 Lindström et al.(2014)의 시공간 모형은 자료의 시간의존성을 데이터에 기 반해 계산한 시간기저 함수를 고정시키는 것으로 모두 처리한다. 이는 시간적 자료 관측범위 안에서는 효과적으로 기능하나 관측범위를 조금이라도 벗어나는 시간 좌표에는 활용할 수 없다. 즉 Lindström et al.(2014)의 시공간 모형은 대기질에 대해 공간적으로만 예측할 수 있을 뿐 시간적으로는 예측할 수 없는 한계가 있다.

자료: Lindström et al.(2014), Figure 5.

(36)

자료: Lindström et al.(2014), Figure 6.

(37)

제4장

서울시 PM10 분석 결과

1. 개요

이 장에서는 서울시 PM10 농도를 시공간통계 모형으로 실증 분석한 결과를 나타내었다.

전국 PM10 농도는 에어코리아7)에서 시간해상도 한 시간 자료를 다운로드할 수 있다. PM10

예측을 위한 독립변수로 아황산가스(SO2), 이산화질소(NO2), 일산화탄소(CO)의 대기질 자

료, 기온(Temp), 강수량(Precip), 풍속(WS)의 기상 자료, 관측지점의 UTM-K 좌표의 공간 정보를 이용하였다. <표 4-1>은 분석에 사용한 변수이다. 분석 대상기간은 2016년의 시간별 자료이다. 대기질 독립변수는 PM10과 마찬가지로 에어코리아에서 구하였고, 기상 독립변수 는 기상자료개방포털8)에서 구하였다. 서울시에는 39개의 도시대기, 도로변대기 관측소가 있다. 관측지점의 UTM-K 좌표는 에어코리아에서 관측소의 주소를 얻어 지오코딩 툴(Geocoding Tool) 프로그램을 이용하여 구하였다. 39개 관측소를 서울시 지도 위에 나타내면 <그림 4-1>과 같다. 검은색 점으로 표시한 관측위치는 모형 적합에 이용한 관측위치이고 파란색 점으로 표시한 관측위치는 모형 검증에 이용한 관측위치이다. <표 4-2>는 모형 적합에 이용한 27개 관측소의 관측소 코드, 경·위도 좌표 및 UTMK 좌표이고, <표 4-3>은 모형 검증에 이용한 12개 관측소의 관측소 코드, 경·위도 좌표 및 UTMK 좌표이다. 7) 에어코리아, “최종확정자료 다운로드”, 검색일: 2018.5.6. 8) 기상자료개방포털, “종관기상관측”, 검색일: 2018.5.7.

(38)

변수명 자료명 비고 PM10 미세먼지 종속변수 SO2 아황산가스 대기질 독립변수 NO2 이산화질소 대기질 독립변수 CO 일산화탄소 대기질 독립변수 Temp 기온 기상 독립변수 Precip 강수량 기상 독립변수 WS 풍속 기상 독립변수 UTMK.X 관측지점 UTM-K 가로좌표 공간 좌표 UTMK.Y 관측지점 UTM-K 세로좌표 공간 좌표 <표 4-1> 서울 PM10 농도 시공간통계 분석변수 자료: 저자 작성. 자료: 저자 작성. <그림 4-1> 서울시 39개 대기질 관측소 위치

(39)

관측소명 관측소 코드 경도 위도 UTMK.X UTMK.Y 강남구 111261 127.0476 37.51749 960066 1946537 강남대로 111264 127.0358 37.48181 958961 1942612 강북구 111291 127.0118 37.64787 956941 1961051 강서구 111212 126.8496 37.55097 941271 1949691 공항대로 111213 126.8285 37.55965 940694 1951359 광진구 111141 127.0929 37.54726 964095 1949646 구로구 111221 126.8897 37.49854 946059 1944538 금천구 111281 126.9083 37.4524 947667 1939410 노원구 111311 127.0679 37.65749 961883 1962086 도봉구 111171 127.0291 37.65416 958463 1961738 도산대로 111263 127.0203 37.51604 957611 1946418 동대문구 111152 127.0288 37.57585 958396 1953046 동작구 111241 126.9716 37.48095 953287 1942548 동작대로 111242 126.9819 37.48846 954213 1943447 마포구 111201 126.9455 37.54986 951021 1950203 서대문구 111191 126.9378 37.57671 950361 1953185 성동구 111142 127.0418 37.54304 959523 1949404 신촌로 111202 126.936 37.55516 950191 1950800 영등포로 111232 126.9047 37.51942 947393 1946847 용산구 111131 127.0048 37.54005 956258 1949084 은평구 111181 126.9331 37.61013 949968 1956896 정릉로 111162 127.0049 37.60678 956300 1956487 종로구 111123 127.005 37.57201 956293 1952635 중랑구 111151 127.094 37.58488 964158 1954024 천호대로 111275 127.1393 37.53409 968137 1948377 청계천로 111124 126.9982 37.56858 955685 1952260 화랑로 111312 127.0751 37.61776 962508 1957680 <표 4-2> 모형 적합용 서울시 27개 대기질 관측소 자료: 저자 작성.

(40)

관측소명 관측소 코드 경도 위도 UTMK.X UTMK.Y 강동구 111274 127.1368 37.54501 967916 1949582 강변북로 111143 127.0402 37.54376 959383 1949484 관악구 111251 126.9271 37.48734 949352 1943275 서초구 111262 126.9944 37.50454 955318 1945152 성북구 111161 127.0273 37.60671 958276 1956471 송파구 111273 127.1154 37.52032 966015 1946854 양천구 111301 126.8566 37.52593 943149 1947600 영등포구 111231 126.8974 37.52492 946751 1947461 종로 111125 126.9965 37.5709 956300 1956487 중구 111121 126.9745 37.56423 953590 1951782 한강대로 111122 126.9717 37.55484 953340 1950742 홍릉로 111154 127.0444 37.58052 959778 1953558 <표 4-3> 모형 검증용 서울시 12개 대기질 관측소 자료: 저자 작성.

2. 통계 분석 결과

가. 기술 통계 분석 자료: 저자 작성. <그림 4-2> 2016년 PM10의 월별, 시간대별 상자 그림

(41)

자료: 저자 작성.

<그림 4-3> 2016년 제곱근 스케일 PM10의 월별, 시간대별 상자 그림

자료: 저자 작성.

(42)

<그림 4-2>, <그림 4-3>, <그림 4-4>는 2016년 전 관측소의 서울 PM10 농도를 월별 (1-12월)/시간대별(00시-23시)로 그린 상자 그림이다. <그림 4-2>는 원 PM10 자료 그림 이다. <그림 4-2>의 원 자료 그림에서 알 수 있듯, 자료에 이상점이 많을 뿐 아니라 이상점 들이 중간값보다 큰 쪽으로만 치우쳐서 분포되어 있다. 다시 말해 자료가 안정화되어 있지 않고 대칭성도 만족하지 않는다. 시공간통계 분석을 시작하기 전에 자료의 분산안정화를 위해 제곱근 스케일이나 로그 스케일 변환이 필요하다. <그림 4-3>과 <그림 4-4>는 각각 제곱근 스케일과 로그 스케일에서의 그림이다. 원 자료에 비하면 상대적으로 분산이 안정화 되어 있다. 두 변환 사이에는 분산안정화 정도가 큰 차이가 없는데, 제곱근 스케일에서는 자료가 큰 쪽으로 치우쳐 있고, 로그 스케일에서는 작은 쪽으로 치우쳐 있다. 본 연구에서는 자료의 불확실성이 가장 큰 4월, 상대적으로 가장 안정화되어 있는 7월, 분포가 다른 월과 큰 차이가 없는 10월 자료를 분석 대상으로 선정하였다. 특히 4월 자료는 PM10 농도가  이상으로 매우 크게 나쁠 때도 있어 통계적 방법으로나 물리 모형 으로나 예측이 어려운 때이다. <표 4-4>는 분석 대상인 4월, 7월, 10월 자료의 39개 관측소 전체 요약 통계값이다. 분석 시에는 제곱근 변환하여 PM10을 분석하고, 예측값은 원 스케일 로 재변환하여 시공간 모형의 예측력을 검토하였다. 제곱근 변환이 로그 스케일보다 상대적 으로 자료 왜곡이 적어 모형 적합 후 예측값을 원 스케일로 다시 변환할 시 차이가 적다. <그림 4-5>는 분석 대상자료인 4, 7, 10월의 제곱근 스케일 PM10 농도의 노원, 양천, 강남, 서대문 관측소 시계열 그림이다. 구분 하위 25% 중간값 평균 상위 25% 최댓값 표준편차 4 월 47.00 63.36 73.30 86.00 540.00 47.03 7 월 23.00 34.00 35.39 45.00 160.00 18.25 10 월 24.00 36.00 40.48 52.00 194.00 22.50 <표 4-4> 4월, 7월, 10월 PM10 농도의 39개 관측소 전체 요약 통계량 자료: 저자 작성.

(43)

주: 관측소: 노원, 양천, 강남, 서대문 자료: 저자 작성.

(44)

나. 시공간통계 분석

본 연구에서 사용한 시공간분석 모형은 제3장 1절에서 소개한 Sahu and Baker(2012)의 모형이다. <표 4-1>의 분석변수에 대해 모형 식을 다시 쓰면 다음과 같다.



 

 

  

   Temp Precip WS

 SO NO CO 

식(4-1)

는 랜덤 효과를 나타내는 잠재변수이고,

의 사후분포 추정을 통해

를 공간적·시간적으로 예측할 수 있다. 자료의 시간의존성은  에 AR 구조를 부여하는 것으로 나타난다. 부여한 AR 구조는 식(4-1)의    을 통해 나타난다. 통계분석 결과 값이 유의하지 않다면 모형에 시간의존성을 고려하는 것이 의미가 없다는 뜻이다. 의 공분산 함수인 Matérn 상관함수 식은 다음과 같다. ′      

   ′



   ′       식(4-2) 가우시안 과정(GP: Gaussian Process)의 깁스(Gibbs) 샘플링 MCMC(Markov Chain Monte Carlo)를 이용하여 모수 및 잠재변수

의 사후분포를 추정하였다. 추정하고 자 하는 모수는 독립변수의 계수 -와 AR 계수 , Matérn 상관함수 식의 모수 이다. 분석 프로그램은 통계 소프트웨어 R의 ‘spTimer’패키지를 이용하였다. 제2장 3절에서 설명하였듯이 시공간통계 모형을 적합에는 지나친 단순화 및 과적합의 문제를 피하기 위하여 시간의존성과 공간의존성의 균형이 맞는 시간해상도를 찾는 작업이 필수적이다. 본 연구에서는 1시간 / 3시간 / 8시간의 시간해상도에서 분석하였다. 원 자료의 시간해상도는 1시간이고, 시간해상도를 3시간 / 8시간으로 넓힐 때는 각 변수에 대해 다음과 같이 자료를 정리하였다.

(45)

- PM 10 : 3시간 / 8시간별 최댓값 - 강수량 : 3시간 / 8시간별 총 강수량 - 나머지 변수 : 3시간 / 8시간별 평균값 3시간 (혹은 8시간) 해상도에서의 분석 대상변수는 해당 시간 동안의 최대 PM10 농도이 다. PM10 농도의 평균 농도보다는 최대 농도에 더 관심이 많으므로 평균 농도가 아닌 최대 농도로 정하였다. 자료 결측값은 시간축에 대해 칼만 필터(Kalman filter)를 적용하여 보간 후 분석하였다.

<표 4-2>의 모형 적합용 관측소에서 관측된 분석변수에 대해 Sahu and Baker(2012) 의 시공간분석 모형을 적용하여 <표 4-3> 모형 검증 관측소에서의 시공간 예측을 수행하였 다. PM10 예측값 



은 예측된

 사후분포의 중간값으로 하고 원 PM10 자료와 비교해 다음과 같이 RMSE(Root Mean Square Error)를 계산하였다.

RMSE

∈′









 식(4-3) (단,

′은 <표 4-3> 모형검증 관측소의 집합) 또한, IDW 보간법으로 공간예측을 수행하고 원 PM10 자료와 비교한 RMSE 를 계 산하여, 시공간모형 예측값의 상대적 정확도를 구하였다. IDW 보간 대비 정확도는 아래와 같이 계산한다.

(46)

통계적 방법론은 값을 점으로만 예측하지 않고 분포를 추정한다. 분포 추정을 통해 의 점 예측값뿐 아니라 VaR(Value at Risk)이나 “농도 81 이상의 나쁨일 확률” 등을 계산할 수 있다. 본 연구에서는 사후분포 예측을 통해 97.5% VaR을 추가 계산 하고 원 자료와 비교해 리스크 예측 정확성을 검토하였다. (100-)% VaR의 의미는 관측된 PM10이 VaR 값보다 클 확률이 %라는 뜻이다. VaR 오차율은 다음과 같이 계산한다.  오차율    보다 큰 자료 수 전체 자료 수  식(4-5)  오차율은 작을수록 좋은 것이 아닌 에 가까울수록 모형이 잘 적합된 것이다. VaR 값을 큰 수로 예측하면 오차율을 0%로 만들 수 있기 때문이다. 본 연구에서는 97.5% VaR 을 계산하였으므로, VaR 오차율이 2.5%에 가까울수록 리스크 예측이 잘 된 것으로 볼 수 있다. 자료 분석 결과는 <표 4-5>~<표4-13>에 정리되어 있다.

(47)

(1) 4월 자료 분석 결과 계수 평균 중간값 표준편차 2.5% 값 97.5% 값 (절편) 0.2416 0.2419 0.0476 0.1458 0.3330 Temp 0.0384 0.0384 0.0029 0.0328 0.0440 Precip -0.0792 -0.0792 0.0134 -0.1059 -0.0527 WS -0.0533 -0.0534 0.0110 -0.0748 -0.0319 SO2 59.9737 59.9776 4.3687 51.7204 68.6076 NO2 2.4017 2.4290 0.5670 1.2664 3.4951 CO 1.1784 1.1779 0.0548 1.0736 1.2877  0.7907 0.7907 0.0041 0.7826 0.7989  0.0086 0.0086 0.0004 0.0080 0.0095 <표 4-5> 4월 자료 분석 결과(시간해상도: 1시간)

주: RMSE: 44.16, IDW 보간 대비 정확도: 43%, VaR 오차율: 8% 자료: 저자 작성. 계수 평균 중간값 표준편차 2.5% 값 97.5% 값 (절편) 1.1145 1.1145 0.1604 0.8017 1.4291 Temp 0.0735 0.0733 0.0130 0.0483 0.0993 Precip -0.1458 -0.1455 0.0214 -0.1879 -0.1036 WS -0.0553 -0.0550 0.0490 -0.1526 0.0383 SO2 -10.3387 -10.3310 3.8527 -17.7647 -2.6726 NO2 7.3311 7.3381 0.6640 6.0099 8.6318 CO 0.3159 0.3154 0.0604 0.1998 0.4352  0.7269 0.7269 0.0082 0.7108 0.7428  0.0010 0.0010 0.0000 0.0010 0.0010 <표 4-6> 4월 자료 분석 결과(시간해상도: 3시간)

주: RMSE: 21.70, IDW 보간 대비 정확도: 268%, VaR 오차율: 5.3% 자료: 저자 작성. 계수 평균 중간값 표준편차 2.5% 값 97.5% 값 (절편) -0.0030 -0.0040 0.3621 -0.7197 0.7001 Temp 0.1918 0.1918 0.0267 0.1396 0.2433 Precip -0.0998 -0.0998 0.0177 -0.1342 -0.0650 WS 0.0655 0.0645 0.0984 -0.1244 0.2597 SO2 -18.2820 -18.3369 7.5641 -32.9925 -3.3289 NO2 10.1319 10.1381 1.3726 7.4230 12.8108 CO 0.4696 0.4704 0.1253 0.2223 0.7146  0.6589 0.6588 0.0145 0.6308 0.6874  0.0010 0.0010 0.0000 0.0010 0.0010 <표 4-7> 4월 자료 분석 결과(시간해상도: 8시간)

주: RMSE: 26.73, IDW 보간 대비 정확도: 230%, VaR 오차율: 3.7% 자료: 저자 작성.

(48)

(2) 7월 자료 분석 결과 계수 평균 중간값 표준편차 2.5% 값 97.5% 값 (절편) -0.5093 -0.5084 0.4296 -1.3622 0.3468 Temp 0.1739 0.1740 0.0194 0.1360 0.2122 Precip -0.0276 -0.0276 0.0087 -0.0448 -0.0105 WS -0.4526 -0.4522 0.0820 -0.6137 -0.2924 SO2 13.7668 13.7832 11.5398 -8.5184 36.0026 NO2 15.5013 15.5054 1.2851 12.9877 18.0130 CO 0.2177 0.2183 0.1276 -0.0316 0.4657  0.4581 0.4582 0.0161 0.4265 0.4901  0.0022 0.0022 0.0001 0.0020 0.0025 <표 4-8> 7월 자료 분석 결과(시간해상도: 1시간)

주: RMSE: 14.25, IDW 보간 대비 정확도: 67%, VaR 오차율: 4.8% 자료: 저자 작성. 계수 평균 중간값 표준편차 2.5% 값 97.5% 값 (절편) -0.5164 -0.5132 0.4268 -1.3590 0.3146 Temp 0.1743 0.1744 0.0194 0.1366 0.2124 Precip -0.0272 -0.0270 0.0084 -0.0441 -0.0106 WS -0.4553 -0.4557 0.0822 -0.6161 -0.2932 SO2 13.6979 13.6517 11.6297 -8.8743 36.5462 NO2 15.4792 15.4799 1.2870 12.8842 17.9959 CO 0.2211 0.2211 0.1288 -0.0292 0.4680  0.4581 0.4581 0.0165 0.4260 0.4896  0.0022 0.0022 0.0001 0.0020 0.0025 <표 4-9> 7월 자료 분석 결과(시간해상도: 3시간)

주: RMSE: 10.34, IDW 보간 대비 정확도: 225%, VaR 오차율: 4.4% 자료: 저자 작성. 계수 평균 중간값 표준편차 2.5% 값 97.5% 값 (절편) -0.4914 -0.4970 0.4234 -1.3073 0.3466 Temp 0.1730 0.1730 0.0192 0.1356 0.2103 Precip -0.0277 -0.0277 0.00874 -0.0444 -0.0108 WS -0.4513 -0.4510 0.0831 -0.6132 -0.2888 SO2 13.8744 13.6571 11.5816 -8.6493 36.4979 NO2 15.4465 15.4410 1.2729 13.0013 17.9369 CO 0.2218 0.2213 0.1274 -0.0327 0.4728  0.4586 0.4585 0.0164 0.4265 0.4908  0.0022 0.0022 0.0001 0.0020 0.0024 <표 4-10> 7월 자료 분석 결과(시간해상도: 8시간)

주: RMSE: 11.00, IDW 보간 대비 정확도: 209%, VaR 오차율: 3.4% 자료: 저자 작성.

(49)

(3) 10월 자료 분석 결과 계수 평균 중간값 표준편차 2.5% 값 97.5% 값 (절편) 0.6705 0.6702 0.0489 0.5716 0.7666 Temp 0.0138 0.0138 0.0019 0.0101 0.0174 Precip -0.0782 -0.0781 0.0100 -0.0977 -0.0583 WS -0.1218 -0.1221 0.0123 -0.1461 -0.0979 SO2 185.8429 185.7179 6.6371 172.7636 198.9356 NO2 11.1693 11.1722 0.5476 10.0784 12.2470 CO 1.2359 1.2350 0.0428 1.1513 1.3205  0.5798 0.5797 0.0048 0.5706 0.5892  1.6824 1.3652 1.2875 0.1879 4.9969 <표 4-11> 10월 자료 분석 결과(시간해상도: 1시간)

주: RMSE: 16.06, IDW 보간 대비 정확도: 65%, VaR 오차율: 8% 자료: 저자 작성. 계수 평균 중간값 표준편차 2.5% 값 97.5% 값 (절편) 1.3057 1.3064 0.1024 1.1071 1.5068 Temp 0.0268 0.0269 0.0051 0.0170 0.0367 Precip -0.0193 -0.0192 0.0097 -0.0382 -0.0004 WS -0.2035 -0.2037 0.0318 -0.2659 -0.1410 SO2 2.8888 2.8876 6.6693 -10.4160 16.0125 NO2 7.8028 7.7962 0.7042 6.4311 9.1617 CO 0.2817 0.2818 0.0465 0.1914 0.3730  0.7193 0.7193 0.0081 0.7037 0.7351  0.0021 0.0021 0.0001 0.0020 0.0023 <표 4-12> 10월 자료 분석 결과(시간해상도: 3시간)

주: RMSE: 12.08, IDW 보간 대비 정확도: 243%, VaR 오차율: 7.5% 자료: 저자 작성. 계수 평균 중간값 표준편차 2.5% 값 97.5% 값 (절편) 2.2294 2.2273 0.2602 1.7262 2.7411 Temp 0.0516 0.0515 0.0131 0.0259 0.0775 Precip -0.0244 -0.0244 0.0102 -0.0449 -0.0045 WS -0.3767 -0.3771 0.0792 -0.5309 -0.2211 SO2 -8.5582 -8.3469 13.7385 -35.6543 17.9126 NO2 13.7550 13.7207 1.5161 10.8197 16.7589 CO 0.3266 0.3267 0.0959 0.1392 0.5156  0.5689 0.5688 0.0153 0.5390 0.5993  0.0017 0.0017 0.0001 0.0015 0.0019 <표 4-13> 10월 자료 분석 결과(시간해상도: 8시간)

주: RMSE: 13.04, IDW 보간 대비 정확도: 333%, VaR 오차율: 3.5% 자료: 저자 작성.

(50)

분석 결과를 살펴보면, 원 자료의 불확실성이 큰 4월은 불안정한 결과가 나왔고 가장 안정적인 7월과 다른 월과 비슷한 10월은 안정적인 결과가 나왔다. 변수별로 살펴보면 기온 (Temp), 강수량(Precip), 풍속(WS)의 기상변수에 대한 계수는 같은 월에서 시간해상도가 바뀌더라도 일정한 값을 유지하는 반면 아황산가스(SO2), 이산화질소(NO2), 일산화탄소 (CO)의 계수는 불안정한 값을 보인다. 추정값의 유의성은 2.5% 값과 97.5% 값 사이에 0이 없으면 유의한 것으로 해석한다. SO2의 계수는 유의하지 않은 경우가 많았다. 모형의 시간의존성을 나타내는 계수 는 모든 분석 결과에서 유의한 값을 가지므로 통계 모형에 시간의존성을 고려하는 것이 의미가 있음을 확인하였다. 시간해상도 1시간일 때의 분석 결과는 해상도를 넓혔을 때보다 RMSE 값과 IDW 보간 대비 정확도, VaR 오차율이 좋지 못하다. 4월 자료의 1시간해상도에서의 RMSE는 44.16 으로 의미 없는 예측이 되었다. 또한 IDW 보간보다 시공간통계 분석의 예측 결과가 더 나쁘다. 시간의존성을 무시하는 IDW 예측보다도 결과가 좋지 않다는 것은 1시간해상도 자료에는 시공간통계 모형이 적절하지 않음을 뜻한다. 서울시 관측소는 비교적 좁은 지역에 촘촘하게 있어 공간의존성만으로 자료 대부분의 변동이 설명된다고 해석할 수 있다. 자료가 안정적인 7월을 제외하고는 VaR 오차율도 8%의 좋지 않은 리스크 예측을 보였다. 시간해상도를 3시간과 8시간으로 넓히면 1시간해상도일 때의 결과에 비해 RMSE 값도 작아져 예측력이 더 좋아진다. 자료가 불안정한 4월 자료에서도 RMSE 값이 3시간해상도에 서 21.70, 8시간 해상도에서 26.73을 보였는데, 1시간해상도에서의 44.16과 비교하면 준 수한 예측 성능을 보인다. 3시간해상도와 8시간해상도에서의 RMSE 값은 큰 차이가 없다. <표 4-4>에서 확인할 수 있는 전체 자료의 표준편차값과 비교하면 4월, 7월, 10월 자료 모두 3시간과 8시간 해상도에서 전체 표준편차 대비 50% 내외의 RMSE 값을 가진다. 이는 단순 평균 예측에 비해 예측 효율성이 2배 이상임을 의미한다. 또한 넓힌 해상도의 모든 월에서 IDW 예측보다 2배 이상의 예측 정확도를 보인다. 따라서 넓힌 시간해상도에서의 최대 PM10 농도 분석에는 시간의존성을 추가 고려하는 시공간통계 분석이 의미가 있다. 모든 월의 시간해상도 8시간에서 VaR 오차율은 3.4~3.7%로 가장 좋은 오차율을 보였 다. 97.5% VaR을 계산하였기에 오차율이 2.5%에 가까울수록 리스크 예측이 잘 된 것이므 로 리스크 예측이 준수하다고 할 수 있다. 특히 자료가 크게 불안정한 4월 자료에서도 VaR

(51)

오차율 3.7%의 준수한 예측을 하였다. 종합하면 서울 PM10의 시공간통계 모형 분석에 있어 기상정보는 안정적인 독립변수로 작용하고 대기질정보는 불안정적으로 작용하여 예측에 큰 도움이 되지 않았다. 1시간해상 도에서는 IDW 보간보다 못한 예측력을 보여 시공간 모형을 적용하는 것이 의미가 없다고 할 수 있으나, 3시간과 8시간 해상도에서는 IDW 보간보다 좋은 예측력을 보여 시간의존성 에 대한 고려가 의미가 있음을 확인하였다. 시간해상도를 넓힐 때 분석변수를 해당 시간대 의 PM10 최댓값으로 하였으므로, PM10 최댓값의 예측에 있어서는 시공간 모형이 잘 기능 한다고 볼 수 있다. 또한 8시간해상도에서 VaR 예측에 준수한 성능을 보여 시공간통계 모형이 리스크 예측에 효과가 있음을 확인하였다. 자료가 불안정한 4월에서도 넓힌 시간해 상도에서 표준편차 대비 50% 내외의 RMSE 값을 보였고 VaR 예측이 정상적으로 기능하였 다. 결론적으로 시공간 통계모형은 최댓값 예측과 리스크 예측에 잘 기능한다고 볼 수 있다.

(52)

제5장

요약 및 결론

시공간통계 모형은 시간의존성과 공간의존성을 동시에 고려하여 자료를 분석 및 예측하 는 통계적 방법론이다. 대기질 자료는 시간의존성과 공간의존성을 동시에 가지는 자료이므 로 시공간통계 모형을 통해 분석할 수 있다. 대기질 자료에 대한 점 예측값은 CMAQ와 같은 물리 모형을 이용할 수도 있으나 분포 추정을 통한 리스크 예측은 통계 모형을 이용할 때만 가능하다. 통계 모형은 확률 이론을 통해 분포를 추정하기 때문에 점 예측값 뿐 아니라 ‘최댓값 예측’, ‘81 이상의 나쁨일 확률’, ‘VaR(Value at Risk) 예측’과 같은 정량 분석을 할 수 있다. 제3장의 해외 연구 사례에서 볼 수 있듯, 시공간통계는 다양한 방식으로 적용할 수 있다. 하지만 제2장에서 설명했듯이 시공간통계를 적용하기 위해서는 자료의 공간의존성과 시간 의존성의 균형이 맞아야 한다. 어려운 점은 적용 방법론이 달라지면 거기에 맞는 균형적인 공간의존성 및 시간의존성도 달라진다는 것이다. 같은 자료에 대해 특정한 시공간통계 방법 을 성공적으로 적용하였더라도, 다른 방법을 적용하면 모형 적합이 불가능할 수 있다. 실제 로 제3장 3절에서 소개한 Lindström et al.(2014)의 모형을 서울 PM10에 같이 적용하여 비교 분석할 계획이었으나 해당 방법론의 관점에서는 자료의 공간의존성이 너무 강하여 모형 적합이 불가능하였다. Lindström et al.(2014)의 모형은 LA군(크기: 12,305)을

대상으로 장기간에 걸쳐 2주일의 넓은 해상도로 모형을 적합한 것에 반해, 서울시(크기: 605.2)는 좁은 지역, 짧은 기간, 최대 8시간의 해상도로 자료를 분석하였기 때문에

LA군의 분석에 최적화된 모형 관점에서 공간의존성이 매우 커 서울 PM10 자료를 분석할 수 없었다. 최근 통계학 분야에서 시공간통계 모형이 크게 발전하였음에도 일반적인 상황에

(53)

준수하게 적용할 수 있는 일반 시공간 모형이 아직 없는 것도 이런 어려움 때문이다. 실제 서울 PM10 자료를 분석한 결과 1시간해상도에서는 효과적인 예측을 할 수 없었으 나 3시간과 8시간으로 넓힌 해상도에서의 최댓값 예측과 VaR 리스크 예측에는 준수한 성 능을 보였다. 또한 시간해상도를 넓힐수록 VaR 예측성능이 좋았다. 자료가 크게 불안정하 여 분석에 어려움이 있는 4월 PM10의 분석에서도 8시간해상도에서의 VaR 예측만큼은 준수한 성능을 보였다. 상술하였듯, 서울 지역은 다른 해외 사례 연구들과 비교해 상대적으로 좁은 공간에 관측 소가 촘촘히 분포되어 있다. 서울시 면적은 605.2인 데 반해 제3장에서 소개한 해외 연구 대상지역의 면적은 미국 뉴욕주가 141.300, 이탈리아 피에몬테주가 25.402 이고, 미국 LA군이 12,305이다. 관측지점 수도 미국 뉴욕주가 28개, 이탈리아 피에몬 테주가 34개, 미국 LA 군이 25개인 데 반해 서울 관측소는 훨씬 좁은 지역에 39개의 관측소 가 있다. 국내 PM10에 대한 시공간 모형 적용을 관측소 간 거리가 큰 농·어촌지역이나, 전국 단위를 대상으로 할 경우 효과적인 분석이 될 것으로 기대된다. 농·어촌 혹은 전국 단위를 대상으로는 CMAQ 같은 물리 모형 적용이 어렵다. 모형에서 요구하는 세밀한 공간 해상도를 만족하는 배출원 자료를 구하기 어렵기 때문이다. 이때 시공간통계 모형이 좋은 대안이 될 수 있다. 시공간통계 모형을 활용한 공간 예측은 수용체 중심 연구에 활용할 수 있다. 특히 농·어촌 지역에 시공간통계 모형을 적용하면 농·어촌 취약계층의 미세먼지 보건영향분석 같은 수용 체 중심 연구에 활용할 수 있다. 시공간통계 모형을 활용한 농·어촌지역의 미세먼지 리스크 예측은 차후 과제로 남긴다.

(54)

참조

관련 문서

그리고 미세먼지 농도가 심한 지역이 미세먼지 농도가 낮은 지역에 비하여 미 세먼지에 대한 지식과 태도가 미세먼지에 대한 실천으로 이어지는 정도가 더 높은

질적연구의 근거이론과 양적연구의 구조방정식 모형은 대표적인 통합적인 연구 접근방법의 하나로서 양측이 지니고 있는 장점을 극대화하면서 상호작 용과

, 관련 정책을 연계하는 효과적인 방안에 대한 논의가 이루어져야 한다 본 연구에서 다루고 있는 모형은 이러한 필요성을 해결하기 위한 과정에 있다... 러한

4차 산업혁명을 주도할 창의융합인재 양성을 위한 3D프린터 활용방안 연구.. 창의력 배양을 위한 3D프린터를 활용한 기초디자인

공간문화콘텐츠는 이러한 물리적인 문화시설을 기반으로 ‘ 문화활동’ 을 촉진시 키기도 한다.공간문화콘텐츠의 체험적인 특성을 이용하여 문화자원 자체를 도시

로시니 주제에 의한 첼로와 피아노를 위한 변주곡 연구 서울 낭만음악사... 전하며 각 변주들은 주제와 연관성을 잃어간다

R95 필터에서 다른 필터를 제거하 고 ACF 필터만을 사용하면 여과 성능이 매우 떨어져서 ACF 필터 단독만으로 미세먼지 방지용 마스크 필터로 제안하기는

특히 , TC 의 농도에 대한 HDL-C 농도의 비율과 관상동맥 질환 발병율과는 높은 역 상관관계에 있으며 관상동맥질환 예방을 위해서는 콜레스테롤의 균형을 이루는 것이