• 검색 결과가 없습니다.

JJaaccqquueelliinnee HHuugghheess--OOlliivveerr - interview

N/A
N/A
Protected

Academic year: 2022

Share "JJaaccqquueelliinnee HHuugghheess--OOlliivveerr - interview"

Copied!
15
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

J

J aa cc qq uu ee ll ii nn ee HH uu gg hh ee ss -- OO ll ii vv ee rr

대담 | 허태영

충북대학교 정보통계학과를 졸업하고, 미국 노스캐롤라이나주립대학(North Carolina State University) 통계학과에서 석∙박사 학 위를 취득하였다. 세부 전공은 공간통계학을 활용한 교통통계 및 환경통계다. “교통량 자료에 대한 공간적 수정과 검증에 관한 연 구(A Spatial Editing and Validation Process for Short Count Traffic Data)”보고서를 미국 교통부(USDOT)에 제출하였으며, 현재 교통분야와 환경분야를 비롯한 여러 통계분야에 걸쳐 십여 편의 논문을 주요 학술지에 투고 중이다. 현재 주요 관심사는 교통/도 시계획 및 장기적인 교통량 예측을 위한 여러 가지 통계적 기법의 접목을 시도하고 있으며, 지능형 교통체계(Intelligent Transport

Systems: ITS) 자료에 대한 공간통계모형을 구축함과 동시에 구축된 공간통계모형을 통하여 보다 정확한 결측치 보정(Missing value imputation)에 관해 연구 중이다. 교통과 환경분야 외에도 공간통계학을 통한 남한의 홍수와 가뭄예측과 시스템 개발에 대한

연구도 진행 중에 있다.

현재 미국 노스캐롤라이나주립대학(North Carolina State University)의 통계학과 교수로 재직 중이며, SAMSI(Statistical and Applied Mathematical Sciences Institute) 연구소의 연구위원(Faculty Fellow)으로 활동하고 있다.

휴즈올리버 교수는 공간 통계학을 활용한 교통모델링(Transportation Modeling)과 점 오염원 모델링(Point source modeling) 등의 모형 발전론과 제약분야의 신약개발(Drug discovery)과 그룹 검정론(Group testing) 등 다양한 연구분야에 관심을 두고 있다. 최근 휴즈 올리버 교수는 통계학자로서 미국 교통부(US Department of Transportation)와 환경보호청(US Environmental Protection Agency)을 비롯한 여러 정부 연구소의 연구과제 책임자로 있으며, 동시에 여러 제약회사의 신약개발 연구과제도 수행하고 있다.

휴즈올리버 교수는 다양한 연구분야 중에서도 교통모델링과 환경모델링의 분야에 공간통계학의 접목을 처음으로 시도하였으며, 20여 개의 연구과제를 수행한 경험을 바탕으로 30여 편의 논문을 주요 학술연구지에 발표하였다. 최근에는 사회-공간적 분석(Socio-Spatial Analysis)을 바탕으로 범죄자료에 대한 분석을 시도하고 있으며, 교통모델링에 대한 확장에 대한 연구를 계획하고 있다.

- interview

Jacqueline

Hughes-Oliver

(2)

허태영(이하‘허’): 먼저‘월간 국토’와의 인터뷰에 응해 주셔서 감사 드립 니다. 본 인터뷰에서는 교수님의 다양한 통계학 연구분야들 중에 교통모델링 (Transportation Modeling)과 환경분야에 대한 공간통계학(Spatial Statistics)의 적용 분야에만 국한하여 인터뷰를 하도록 하겠습니다. 일단 교수님께서 교통 과 환경분야에 어떻게 공간통계학을 접목시키셨는지 자세하게 교수님의 연구 주제에 대하여 말씀해 주시겠습니까?

▶▶재클라인 휴즈올리버(이하‘휴즈올리버’): ‘월간 국토’와 인터뷰를 할 수 있게 되어 영광입니다. 교통과 환경분야에 대한 저의 통계학적 접근방법의 연 구주제를 간략하게 설명하면, 먼저 교통모델링 연구에서는 지난 몇 년 전부터 미국의 노스캐롤라이나(North Carolina)주에서 발생하는 교통량 자료에 대한 통계적 검증모형을 개발하는 연구를 하고 있습니다. 노스캐롤라이나주는 교통 의 흐름을 관찰하기 위한 목적으로 상시 지점 및 수시 지점을 포함하여 매년 3만 5천 개의 측정지점에서 교통량이 측정되고 있습니다. 이러한 교통량 자료 는 교통에 관련된 시설(Traffic Infrastructure)의 유지, 보수 및 확장 등에 아주 중요한 역할을 하고 있습니다. 따라서, 신뢰(Reliable)할 수 있고, 올바르게 수 정(Edited)되고, 검증된(Validated) 교통량 자료의 필요성은 교통부 당국에 의 하여 인지되었음에도 불구하고, 여러 가지 단점들이 있어 신뢰성 높은 교통량 자료가 확보되기 어려웠습니다. 그 단점들로는 첫째, 교통량을 측정하는 데 있 어서 오류가 발생할 수 있으며, 오류가 발견되면 직접 조사자가 지점을 방문하 여 재조사를 해야 하는 번거로움이 있습니다. 둘째, 어느 조사지점의 교통량

재클라인 휴즈올리버:

교통∙환경과 공간통계학의 접목

대담, 정리|허태영(노스캐롤라이나주립대학 통계학과 박사과정 수료)

허태영

(3)

Tae-Young Heo(‘Heo’): Thank you for accepting the request for “e-

interview”. Among your various statistics research fields, I would like to focus this interview on your research in applying spatial statistics to transportation modeling and environmental science.

What are your specific research topics to apply spatial statistics in transportation and environmental science areas?

▶▶ Jacqueline Hughes-Oliver(‘Hughes-Oliver’): It is my pleasure to

participate in this “e-interview”. Regarding research in transportation modeling, for the last several years I have been working towards developing a model for validating traffic counts in the state of North Carolina within the United States. Within North Carolina, approximately 35,000 traffic counts are recorded annually for the purpose of monitoring the flow of traffic. These counts play a crucial role in allocation of resources for the maintenance, upgrade, and expansion of traffic infrastructure.

The need for reliable, edited, and validated traffic count data is well acknowledged by transportation officials, but ‘best practices’ are not typically available for: 1. deciding which counts are possibly in error and need to be re-observed; 2. accounting for spatial correlation and continuity along roadway networks when trying to determine which counts are in error;

and 3. determining how to edit counts when re-counting is not feasible. The

Jacqueline Hughes-Oliver:

Applying Spatial Statistics to

Transportation and Environmental Science

Jacqueline

Hughes-Oliver

(4)

측정에 오류가 발생되었는지 알고자 할 때 교통망의 연속성과 교통량 자료의 공간적 상관성을 고려하지 않는다는 단점이 있습니다. 셋째, 교통량의 재조사가 쉽지 않은 조사지점에서 어떻게 그 지점의 교통량을 수정할 수 있는지에 대한 명확한 해답을 줄 수 없습니다. 이러한 단점들을 극복하기 위하여, 제가 수행한 교통모델링의 목적은 교통량 자료수집과 수집된 자료를 데이터 베이스로 구축하고, 구축된 데이터 베이스를 통해 노스캐롤라이나 교통국(NCDOT)과 주민들 에게 올바른 교통량을 쉽게 제공할 수 있으며, 또한 공간적 상관성(Spatial Correlation)을 고려하 여 관측된 교통량의 정확도를 높이면서 교통량의 수정과 검증과정을 개선시키는 데 있습니다.

환경분야에서 통계학적 접근연구는‘점 오염원(Point Source)’에서 기인한 변동적 공간 과정 (Nonstationary Spatial Processes)을 모수적 모형화(Parametric Modeling) 구축을 통해 비정상적 인 환경자료를 쉽게 분석할 수 있는 모형을 제공하고, 개발하며, 평가하는 데 있습니다. 특히, 대기오염 물질을 배출하는 점 오염원에서 오염물질이 대기 중으로 퍼져 나올 때 점 오염원이 대기오염에 미치는 영향을 공간과정(Spatial Processes)을 통하여 측정할 수 있다는 것입니다.

구체적인 환경분야에서 현재 연구하고 있는 통계학적 접근은 아래와 같습니다. 첫째, 점 오염 원의 효과를 통계적으로 검정할 수 있으며, 둘째로 최적으로 설계된 과정 또는 실제 오염 정도 의 측정과정을 통해 대기오염의 예측값을 좀 더 정확하게 예측할 수 있고, 여러 가지 이유로 발 생하는 편의(Bias)를 줄일 수 있도록 하는 가장 합리적이며 올바른 조치를 취하고 결정하는 데 도움이 될 수 있는 모형을 제공하였습니다. 셋째, 점 오염원의 효과를 동반한 모형을 통해 측정 되지 않은 지점의 예측값과 그 예측값에 대한 불확실성(Uncertainty)을 측정할 수 있는 수단을 제공할 수 있습니다.

허: 교통모델링에서, 교통량 자료에 대한 품질관리(Quality Control)는 자료 자체 및 분석의 결과의 정확성과 신뢰성을 보장하기 위한 자료의 수집 및 기초 분석의 모든 단계에서 매우 중 요합니다. 이런 점에서 교통량 자료의 오류가 감지된다면, 자료에 대한 세심한 관찰이 필요하 기도 합니다. 교통량 자료의 품질관리 구축을 위하여 교수님의 교통모델링은 어떻게 사용할 수 있습니까?

▶▶휴즈올리버: 교통량 자료의 수정과 검증을 위한 일반적인 방법은 조사자가 직접 교통량 측 정지점에서 직접 측정하여 전년도와 주변 검지기들의 교통량에서 현재 지점의 교통량을 비교 하여 교통량 자료를 검증하고 그에 따라 수정을 하도록 되어 있습니다. 만약 교통량이 올바르 게 측정되지 않은 것으로 판단된다면, 그 지점의 교통량은 주변의 교통량 측정지점의 교통량과 비슷하게 수정시키는 방법을 사용하였습니다. 하지만 이러한 과정들처럼 조사자가 직접 검지 기를 방문하거나 주변의 교통량을 통한 임의의 교통량 수정과정들은 매우 효과적이지 못하며,

(5)

goal of our project is to improve the entire editing and validation process by increasing the accuracy of reported counts, by reducing the time delay between data collection and reporting, and by providing easily customized reports of traffic counts to North Carolina Department of Transportation (NCDOT) departments and customers.

My work in environmental science is to develop, assess, and provide convenient tools for implementing parametric modeling of nonstationary spatial processes that are driven by point sources. A pollution point source as any discernible, confined, and discrete conveyance from which a pollutant may be discharged. Specifically, our goals are to: 1.

statistically test the impact of a point source; 2. provide models that are useful for determining appropriate corrective action for altering an observed process or for optimizing a designed process; and 3. provide predictions, and appropriate measures of prediction uncertainties, at unsampled sites by accounting for the effects of point sources.

Heo: In relation to transportation modeling, data quality control is very important at

all stages of data collection and analysis to ensure that the data and analysis results are accurate and reliable. At any point, if errors are detected, a more careful screening of the data may be required. How are your transportation models used for implementing quality control of traffic count data?

▶▶Hughes-Oliver: The common practice for editing and validating count data is to

manually and visually compare current counts to counts from previous years and neighboring stations. If a count is considered unusual, it is often modified to make it more similar to neighboring counts. This process is very slow, is prone to individual subjectivity and bias, encourages excessive adjustments to counts, and does not conform to United States government recommendations for incorporating spatial analysis.

We developed a statistical model that characterizes traffic counts as a function of route characteristics for the count station, route interconnectivity and distances to other count stations, land use surrounding the count station, and census demographics in the area surrounding the count station.

This model can provide predictions of traffic counts, which are actually annual average daily traffic counts (AADT), at any location along a primary (interstate, US route, or North Carolina route) or secondary road segment in North Carolina. It can even provide

(6)

교통량을 측정하는 조사자의 주관성과 편의(Subjectivity and Bias)를 발생시킨다는 단점이 있 습니다. 이러한 합리적, 객관적이지 못한 과정들은 교통량 수정에 있어서 너무 과도한 교통량 조정을 야기할 수 있으며, 교통량 수정을 위하여 공간분석(Spatial Analysis)을 반영하라는 미 정부(United States Government)의 추천에도 부합하지 않습니다.

교통모델링에서는 교통량을 검지기가 설치되어 있는 도로의 특성과 도로망의 연결성(Route Interconnectivity), 검지기와 검지기 사이의 거리를 통한 공간 상관성, 검지기가 포함된 토지이 용 및 센서스 자료(Census Demographics)의 함수로서 교통량 자료의 특성을 기술할 수 있는 통 계적 모형을 개발하였습니다. 이렇게 제시된 모형을 통해 노스캐롤라이나주의 도로에 설치되 어 있는 모든 교통량 검지기들의 연평균 일 교통량(AADT)을 예측할 수 있습니다. 또한 제시된 모형은 교통량이 관측되지 않은 지점의 연평균 일 교통량도 예측할 수 있다는 장점을 가지고 있으며, 같은 조사지점에서 실제 연평균 일 교통량의 관측값과 모형에서 예측된 예측값의 차이 를 비교함으로써, 실제로 관측된 교통량이 올바르게 관측되었는지를 판별할 수 있는 교통량 자 료에 대한 품질관리(Quality Control)를 실시할 수 있습니다. 실제 교통량과 예측된 교통량의 큰 차이는 실제 관측된 교통량이 교통량 검지기의 불량 및 고장 등으로 인하여 교통량이 잘못 관 측될 수 있었다는 추론을 할 수 있습니다.

교통모델링에서는 실제 교통량과 예측된 교통량과의 차이를 정량화하기 위하여, 제시한 교 통량 모델링은 교통량 관측지점의 예측값에 대한 예측간격(Prediction Interval)을 제공할 수 있 습니다. 교통량 예측값에 대한 신뢰구간은 예측값의 불확실성을 고려한 예측된 값을 신뢰할 수 있는 범위를 의미합니다. 좁은 예측간격은 모형으로부터 예측된 값을 더욱 신뢰할 수 있음을 나타내고 있습니다. 제시된 교통모델링 시스템 구축을 통해 여러 가지 예측간격을 제공할 수 있으며, 특히, 95%와 99% 신뢰구간을 통하여 관측된 연평균 일 교통량이 95% 신뢰구간 밖에 있는 반면에, 99% 신뢰구간 안에 있으면 상대적으로 낮은 우선순위를 두어 실제로 교통량을 조 사하게 됩니다. 관측된 연평균 일 교통량이 95%와 99% 신뢰구간 밖을 모두 벗어난다면 그 교 통량 관측지점들에 높은 우선순위를 주어 교통량을 재조사하게 하는 시스템을 구축하였습니다.

허: 교통모델링은 각 지역사회간 교통자원을 공평하게 할당하기 위해 교통량 측정의 정확성 을 개선하는 역할을 하고 있습니다. 교통계획에 관련된 연구자들이 제시한 교통모델링을 교통 계획에 적용하려면 어떤 방법이 있습니까?

▶▶휴즈올리버: 노스캐롤라이나주의 총 연장 도로는 7만 8천 마일이며, 도로의 교통량은 교통 에 관련된 시설의 유지 및 보수 그리고 확장을 위해 자원을 할당할 때 가장 중요한 요인이기도 합니다. 좋은 예로서, 고속도로의 포장이 필요할 때 해당 고속도로의 교통량이 도로포장시 포

(7)

predicted AADTs at sites that have never been sampled. For the purpose of quality control, a simple approach is to compare an observed AADT with the prediction obtained from our model for that same count station. ‘Large’ differences may suggest a problem with the count.

In order to quantify the term ‘large’ differences, our model can also provide prediction intervals along with each prediction. A prediction interval is a range of likely prediction values such that the uncertainty in the prediction is accounted for; narrow intervals are associated with greater certainty in the prediction. Our model also provides intervals of varying confidence. In particular, we focus on two sets of intervals such that if an observed AADT falls outside the first interval but within the second interval, we flag that AADT with a low severity score. On the other hand, if an observed AADT falls outside both intervals then we flag it with a high severity score.

Heo: Transportation modeling involves improving the accuracy of traffic counts to

more fairly allocate transportation resources among regions and communities.

How can a transportation planner apply your ‘transportation modeling’ to transportation planning?

▶▶Hughes-Oliver: The volume of traffic on North Carolina’s 78,000 miles of state roads

is of premier importance when it comes to allocating resources for the maintenance, upgrade, and expansion of traffic infrastructure. An excellent illustration of this comes from considering pavement requirements for Interstate routes. Increased traffic on interstates leads to tougher requirements on thickness levels of pavement. More specifically, a doubling of traffic volume requires an additional 1-2 inches of pavement, at a cost of about $30,000 per lane mile of pavement. Pavement planning cannot proceed without knowledge of traffic volume.

If traffic volume on an interstate is mistakenly recorded too high, then unnecessary adjustments may occur, causing extreme fiscal waste. On the other hand, if traffic volume is mistakenly recorded too low, then needed adjustments will not be initiated and the pavement will deteriorate more quickly than expected; repair costs exceed rehabilitation costs, so again there is fiscal waste.

There are many other possible uses of traffic counts in transportation planning.

(8)

장 두께에 중요한 요인이 됩니다. 고속도로의 교통량이 증가된다면, 포장의 두께도 교통량에 따라 증가되어야만 합니다. 좀 더 자세하게 살펴보면, 교통량의 두 배 증가는 1마일당 3만 달러 가 소요되는 도로포장에 있어서 1~2인치 정도의 포장 두께를 더 필요로 합니다. 따라서 도로 포장 계획은 교통량에 대한 선행 정보 없이 추진할 수 없다는 필연적인 결과를 초래하게 됩니 다. 만약 고속도로의 교통량이 실수로 너무 높게 측정된다면, 불필요한 교통/포장계획으로 인 하여 예산을 낭비하는 결과를 초래합니다. 반대로 실수로 너무 낮게 교통량이 측정된다면 꼭 필요한 교통/포장계획을 하지 못하게 하며, 도로포장이 예상보다 빨리 노후되어, 이에 따른 보 수비용으로 인하여 또 다시 예산을 낭비하게 됩니다.

교통량 자료는 교통계획에 있어서 여러 분야에 적용할 수 있고 중요한 자료입니다. 예를 들 어, 만약 연평균 일 교통량이 두 개의 레인을 가진 도로와 네 개의 레인을 가진 도로가 비슷하 다면 교통과 관련된 시설의 확장(예: 도로 레인수의 증가)이 필요하다고 할 수 있습니다. 또한 연평균 일 교통량이 높은 지역에서 새로운 학교를 세우고자 하는 계획이 있다면, 안전한 학교 지역을 만들기 위하여 운전자들로 하여금 학교지역에서의 운전 가능성을 줄이고 이를 통하여 궁극적으로 학교지역의 전체 교통량을 줄이기 위하여 자동차 속도제한을 아주 낮게 책정하는 데 이용될 수 있습니다. 연평균 일 교통량이 급격히 증가한 어떤 교차로에서는 네 방향에 설치 되어 있는 정지표지판(Stop Sign)을 신호등으로 바꿀 필요가 있다는 것을 보여줍니다.

허: 일반적으로, 예산상의 문제로 인하여 제한된 시설(예: 교통량 검지기)에서만 자료수집이 가능하다고 한다면, 사람들은 관측 또는 수집되지 않은 시설에 대해서는 자료의 예측이 필요합 니다. 따라서 관측되지 않은 시설의 자료예측을 위해, 공간통계학에서는 크리깅(Kriging)이라 는 기법을 많이 쓰고 있습니다. 크리깅에 대한 간단한 설명과 장점을 설명해 주시겠습니까?

▶▶휴즈올리버: 크리깅이란 주변에서 관측된 지점들의 값들에서 가중 평균을 이용하여 관측되 지 않은 지점의 값을 예측하는 방법입니다. 가중치들은 관측된 지점들과 관측되지 않은 지점들 사이의 거리가 가장 가까울 때 즉, 두 지점 사이의 상관성이 가장 커질 때, 가장 커지게 됩니다.

이러한 이유로 크리깅은 또한 선형공간 내삽법(Linear Spatial Interpolator)이라고도 생각할 수 있습니다.

공간예측(Spatial Prediction)을 위한 크리깅 방법은 여러 가지 장점이 있습니다. 첫째로, 크 리깅 예측값은 선형 불편 예측값들 중에 가장 작은 평균제곱 예측오차(Mean Squared Prediction Error)를 가지는 선형의 불편 예측값(Linear Unbiased Predictor)을 제공합니다. 둘째로, 크리깅 값은 대부분의 통계적 소프트웨어(Statistical Software)를 통해 구할 수 있습니다. 환경분야에 서, 크리깅은 상대적으로 적은 수의 불규칙하게 떨어진 자료들(관측소)을 통하여 얻은 적은 자

(9)

Expansion of traffic infrastructure (for example, adding more lanes) may be necessary if AADT along a two-lane road segment rises to levels comparable to those of AADT along a four-lane road segment. If plans are in place to build a new school at a location with high AADTs, speed limits might need to be substantially lowered in order to reduce the desirability of traveling along that road segment with the ultimate goal being to reduce the overall traffic on the road for making it a safe school zone. Substantially increased AADTs at a particular intersection may indicate that a traffic light needs to be installed to replace the current four-way stop sign that exists at that location.

Heo: As a general rule, many budgets only permit data collection to occur at a limited

number of facilities, but one may need predictions at many other (unsampled) facilities. In order to make predictions at unsampled facilities, one may usually do ‘Kriging’ to obtain these prediction. Could you explain briefly what is ‘Kriging’ and what are its advantages?

▶▶Hughes-Oliver: Kriging is a method for predicting the unknown value of a variable at

an unsampled site by using a weighted average of values of the same variable as observed at ‘nearby’ sampled sites.

Weights are largest for those sampled sites that are assumed to be most correlated with (and usually closest to) the targeted unsampled site. For this reason, kriging is also considered to be a linear spatial interpolator.

Kriging has several advantages. First, it provides linear unbiased predictors that have the smallest mean squared prediction errors among the class of linear unbiased predictors;

for this reason, they are called best linear unbiased predictors. Second, kriging is readily available through a number of statistical software packages. In environmental science, kriging is used quite often to obtain a smooth spatial surface from using only data from a relatively small set of irregularly spaced sampling sites. The smooth surface provided by kriging is subsequently often used as ‘observational data’ obtained from a large set of regularly spaced sampling sites.

Heo: This question is for point source modeling. In relation to environmental science area, most industrial pollution is discharged vertically from a stack into the open air.

Point source modeling and spatial modeling to track pollutants emitted by power plants

(10)

료들로부터 많은 관측되지 않은 지점의 예측값을 도출할 수 있으며, 내삽법 기법이기에 매끄러 운 공간표면(Smooth Spatial Surface)값을 얻을 수 있습니다. 이러한 크리깅을 통하여 얻어진 매끄러운 공간 표면은 많은 수의 규칙하게 떨어진 자료들로부터 얻어진‘실제 관측값’처럼 사 용될 수 있다는 장점이 있습니다.

허: 이번 질문은 환경분야에 관련한 점 오염원 모델링(Point Source Modeling)에 관한 것입니 다. 대부분의 대기오염 물질들은 공장의 굴뚝, 원자력 발전소 그리고 자동차 등을 통하여 대기 중으로 방출되게 됩니다. 공장이나 발전소 등에서 배출되는 대기오염 물질에 대한 점 오염원 모델링이나 공간모델링(Spatial Modeling) 등은 대기오염에 따른 위험평가 계획에 아주 유용합 니다. 구체적으로 점 오염원의 영향을 예측하고 평가하는 데 사용된 점 오염원 모델링의 주요 한 장점은 무엇이며, 도시계획 연구자가 점 오염원 모델링을 도시계획에 적용하려면 어떻게 해 야 합니까?

▶▶휴즈올리버: 점 오염원들의 영향을 측정하고자 개발된 모형의 중요성은 여러 많은 분야에 걸쳐 있으며, 이렇게 개발된 점 오염원 모델링은 인간생활에 직접적(예를 들어 규제를 통해), 혹은 간접적으로든 영향을 미치고 있습니다. 우리 연구의 결과는 오렴관련 예산 및 범칙금에 대한 지침을 주어 점 오염원의 규제에 영향을 줄 수 있으며, 생태학적인 재해나 환경재해가 발 생한 장소의 근처에 있는 점 오염원들도 재해에서 발생한 오염과 더불어 환경오염에 영향을 끼 칠 수 있습니다. 따라서 재해에서 발생한 환경오염 대처시 근처에 있는 점 오염원들의 영향을 고려하여 적합한 수정정책을 결정하는 데 도움을 줄 수 있습니다.

매우 정교하게 만들어진 결정적 모형은 컴퓨터를 통해 수치적으로 대기오염의 영향을 분석 할 수 있게 된 후 환경분야에서는 실제적이고 복잡한‘결정적 컴퓨터 모형(Deterministic Computer Models)’을 더욱 보편화되도록 하였습니다.

하지만 이러한‘결정적 대기확산 모형(Deterministic Atmospheric Dispersion Model: ADM)’

은 입력자료 또는 가정조건의 부정확성으로 인해 불확실성을 제대로 나타내지 못하고, 그래서 이 모델들이 오염물질 집중도 예측값의 불확실성을 정량화할 수 없는 단점을 갖고 있습니다.

따라서 환경분야에서 첫 번째 연구주제는 우리가 새롭게 제안한‘자기회귀 점 오염원 과정 (Autoregressive Point Source Process)’이라는 임의효과(Random Effect)를 통하여 오염원이 제 공하는 부가정보를 이용하여 공간에 존재하는 확률적 현상에 대한 모형을 통해 기존의 모형이 가지고 있던 단점을 개선할 수 있었습니다. 또한 자기 회귀 점 오염원 과정을 통해 변동적 에러 탐색 모델(Nonstationary Modeling of Error Processes)을 가진 자료의 모델링을 간단하게 표현 할 수 있으며, 모형에 포함된 모수들을 통하여 통계적 추론이 용이하고, 실제 자료에 쉽게 적용

(11)

and factories are useful for risk assessment planning for air pollution.

Specifically, what are the main advantages of point source modeling to capture the effect of point source? How can urban planners apply ‘point source modeling’ to urban planning?

▶▶Hughes-Oliver: The significance of modeling the effects of point sources cuts across

many disciplines. It can impact humans either directly, e.g., through regulations, or indirectly, e.g., through a strong industrial market. Our project results can impact the regulation of point sources through directives on pollution budgets and fines, the assignment of equitable consequences to several point sources within the vicinity of an ecological or environmental disaster, and can help in determining appropriate corrective actions.

The need for realistically complex models in environmental science has made deterministic computer models more popular, since it is possible to numerically analyze quite elaborate deterministic models. Unfortunately, these deterministic atmospheric dispersion models (ADMs) do not adequately address uncertainty due to inaccurate model inputs or assumptions, and they do not quantify the uncertainties of their model predictions for pollutant concentrations.

Our proposed autoregressive point source process (ARPS) can improve models of stochastic phenomena across spatial domains because it takes advantage of auxiliary information provided by point sources. The result is more simplified, interpretable, parametric, yet realistic, nonstationary modeling of error processes.

Also in our work, deterministic ADMs, with their many advantages that originate from subject-matter expertise, form the basis of our approach for capturing uncertainties not captured by the deterministic ADM.

Our approach, the Error-Component-Adjustments for ADMs (ECA-ADMs), models concentrations using both a deterministic component, which is based on a deterministic ADM, and a random component that conforms to some of the same assumptions of the deterministic ADM, such as effect of wind direction on movement and dispersion of the pollution plume.

In fact, we allow several sub-components of the random component so that each captures a particular feature. For example, the selected model for Kincaid field

(12)

시킬 수 있다는 장점이 있습니다.

둘째 연구는 결정적 대기확산 모형 자체만으로 얻을 수 없는 모형의 결과값에 대한 불확실 성(Uncertainty)을 얻을 수 있는 새로운 모형을 제시하는 데 있습니다. ‘오차조정 대기확산 모 형(Error-Component-Adjustments for ADM)’이라고 불리는 새로운 접근방식의 모형은 결정적 대기확산 모형을 바탕으로, 바람의 방향과 이동 그리고 대기 오염체(Pollution Plume)의 퍼짐과 같이 결정적 대기확산 모형에 대한 가정들을 만족하는 임의모형(Random Component)을 추가 한 모형입니다. 또한, 이 임의모형은 자료의 특성에 따라 여러 가지 부분 구성 요소로 이루어질 수 있다는 장점이 있습니다.

이 연구들은 통계학 분야와 환경모델링 분야에 걸쳐 아주 중요한 역할을 할 수 있으며, 특히 점 오염원 모델링은 도시계획 연구자에게 아주 유용한 모델링이 될 수 있습니다. 이 모형을 통 해 확정적 모형에서 밝혀진 것보다 더 정확하게 점 오염원에서 기인하는 대기오염 변동패턴을 확인할 수 있으며, 확정적 모형결과가 포함하고 있는 편의를 밝혀낼 수 있습니다. 확정적 모형 에 포함된 편의는 점 오염원과 관측지점의 거리, 기상 조건 등에 따라 달라지므로, 모형이 내포 하고 있는 불확실성을 모형화하기 이전에 이러한 편의들을 먼저 조정하였습니다.

결과적으로, 앞서 제시한 오차조정 대기확산 모형에서 얻어진 예측값들은 결정적 대기확산 모형에서 얻어진 예측값보다 훨씬 예측력이 뛰어남과 동시에, 결정적 모형에서 얻을 수 없는 예측값에 대한 불확실성까지도 없앨 수 있다는 장점이 있습니다. 또한 실제 자료분석을 통하여 오차수정 대기확산 모형에서 얻은 예측값의 불확실성이 감소함을 보여주었습니다.

허: 마지막 질문은 교수님의 향후 연구에 관한 질문입니다. 교수님의 교통(교통모델링)과 환 경분야(점 오염원 모델링) 그리고, 교통과 환경분야에 통계학을 어떻게 결합하여 연구를 하실 지에 대한 의견을 말씀해 주십시오.

▶▶휴즈올리버: 저는 현재 점 오염원의 영향을 예측할 수 있도록 공간에서 관측되는 오염물질 에 대한 모델링에 관해 연구하고 있습니다. 단지 공간영역에서도 여러 가지 흥미 있는 연구가 진행되고 있지만, 현재 저의 연구방향은 공간과 시간을 동시에 고려한 모형(Space-Time Model)을 만들어 내는 데 있습니다.

그와 더불어, 베이지안(Bayesian) 기법을 이용한 동적 선형 모델링(Dynamic Linear Model) 을 통하여 하나의 점 오염원이 아니라, 여러 개의 점 오염원이 있을 때 오염원들의 영향을 동시에 예측할 수 있는 모형을 연구하고 있습니다. 이 연구를 통하여 대기오염 정도의 공간적, 시간적 추 세를(대기 오염 정도가 어느 시간대에 어떤 방향으로 어떻게 변하는지를 예측) 예측할 수 있으 며, 점 오염원으로부터 발생된 대기오염의 진행 패턴을 알 수 있다는 장점을 가지고 있습니다.

(13)

experiments contains several random sub-components where each captures spatial patterns along an arc at fixed distance from the source, for several distances. In this manner, we can exploit many features of point sources that were previously ignored.

There are many significant contributions of this project to statistics and environmental modeling, and these contributions indicate how our point source models can be useful to urban planners.

We were able to identify variability patterns that are attributable to the point source beyond those patterns uncovered by the deterministic model. We were even able to identify systematic biases contained in the deterministic ADM output. The amount of bias depends on distance of site from source and atmospheric conditions, and we adjusted for these biases before modeling uncertainties. Predictions from our ECA-ADMs were meaningful and, more importantly, prediction uncertainties were obtained to reveal additional insights not available from a deterministic model.

For the Kincaid field experiments, we identified clear patterns of increased prediction uncertainty near the source, along the centerline, and even far from the centerline but along an arc at a fixed distance from the source. These patterns offer improvements beyond the commonly quoted ‘prediction uncertainties are 2-5 times the predicted value’

rule.

Heo: The final question is for your future research. What are your future research plans

about transportation modeling and point source modeling and how to combine statistics to transportation and environmental areas?

▶▶ Hughes-Oliver: I am currently working to include point source impact while

modeling spatially-observed pollutant concentrations. While the spatial-only domain offers many interesting research questions, incorporating a temporal component to study the space-time domain is our eventual goal. Additionally, I am moving towards modeling the simultaneous impact of several, not a single, point source. Towards this end, I am moving in the direction of using dynamic linear models fit under the Bayesian paradigm.

This will provide estimates (along with appropriate measures of uncertainty) of temporal and spatial trends in pollutant concentrations. It will also provide information on transport patterns from point sources.

(14)

교통분야에서 저는 교통량의 수정과 검증을 위하여 교통량 모델링을 통한 실시간 시스템 구 축을 노스캐롤라이나 교통국과 같이 연구할 계획입니다.

교통모델링과 환경분야와의 결합은 자동차로부터 배출되는 배기가스 등을 이동 오염원으로 간주하여, 자동차로부터 발생된 배기가스로부터의 오염 정도를 예측할 수 있는 환경모델링을 구축할 수 있으며, 자동차로부터 발생된 배기가스가 얼마나 대기오염에 영향을 많이 끼치며, 더 나아가 자동차 배기가스가 건강에 미치는 영향을 연구할 수 있습니다.

Hughes-Oliver 교수의 최근 주요 저서 및 논문

Hughes-Oliver, J. M and Heo, T.Y., 2005, A Spatial Editing and Validation Process for Short Count Traffic Data. US Department of Transportation (USDOT) Technical Report and to be submitted to Transportation Research Record.

Heo, T.Y. and Hughes-Oliver, J. M., 2005, Statistical Adjustments to Air Dispersion Models for Determining the Effect of a Point Source. To be submitted to Journal of Agricultural, Biological, and Environmental Statistics.

Remlinger, K.S., Hughes-Oliver, J.M., Young, S.S., and Lam, R., 2005, Statistical Design of Pools Using Optimal Coverage and Minimal Collision. Technometrics, in press.

Hughes-Oliver, J.M. Pooling experiments for blood screening and drug discovery, 2005, Accepted. To appear in Screening, edited by Dean, A.M. and Lewis, S.M. and published by Springer-Verlag New York, Inc.

Hughes-Oliver, J.M., Heo, T.Y., and Ghosh, S.K., 2004, An Autoregressive Point Source Model for Nonstationarity in a Spatial Process. Invited to revise for Communications in Statistics-Theory and Methods.

Yi, B., Hughes-Oliver, J. M., Zhu, L., and Young, S. S.,2002, A Factorial Design to Optimize Cell-Based Drug Discovery Analysis. Journal of Chemical Information and Computer Sciences, 42, 1221-1229.

Hughes-Oliver, J. M., 2002, Standard error. In Encyclopedia of Environmetrics, volume 4, edited by A. H. El-Shaarawi and W.

W. Piegorsch, Wiley.

Zhu, L., Hughes-Oliver, J. M., and Young, S. S., 2001, Statistical decoding of potent pools based on chemical structure.

Biometrics, 57 (3), 922-930.

Hughes-Oliver, J. M. and Rosenberger, W. F., 2000, Efficient estimation of the prevalence of multiple rare traits. Biometrika, 87 (2), 315-327.

Boos, D. D. and Hughes-Oliver, J. M., 2000, How large does n have to be for Z and t intervals? The American Statistician, 54 (2), 121-128.

(15)

For transportation, I plan to continue working with the NCDOT as they implement our models in real-time processing for editing and validating traffic counts.

One obvious intersection between transportation modeling and environmental science is to recognize that automobiles are mobile sources of pollution that should be modeled with respect to their impact on ambient pollutant concentrations.

참조

관련 문서

Generally urban freeway is the principal arterial corridor that is intended to provide for high levels of safety and efficiency in the movement of

It is viewed that among the policy tools as to the environmental problems, the most efficient method in controling environmental pollution indirectly on

- "This work was supported by the Korea Foundation for the Advancement of Science and Creativity(KOFAC) grant funded by

fundamental change driven by consolidation, technological development, price volatility, environmental imperatives, and new market fundamentals. A number of

The purpose of this study is to develop and apply a program that can develop and expand SW-based AI education by proving the effectiveness of

That is, the aim of this research is to investigate the military strategy in North Korea on Jeong Eun Kim era from Military Science point of view by analyzing the change

[표 12] The true model is inverse-gaussian, out-of-control ARL1 and sd for the weighted modeling method and the random data driven

Data standards and metadata in spatial database systems. 5.1 Issues with implementing standards and metadata in