• 검색 결과가 없습니다.

IEG 환경지질연구정보센터

N/A
N/A
Protected

Academic year: 2021

Share "IEG 환경지질연구정보센터"

Copied!
13
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

다중 선형 회귀를 이용한 PNU/CME CGCM의 동아시아 여름철 강수예측 보정 연구

황윤정*·안중배

부산대학교 대기과학과, 609-735 부산광역시 금정구 장전동 산 30

A Correction of East Asian Summer Precipitation Simulated by PNU/CME CGCM Using Multiple Linear Regression

Yoon-Jeong Hwang* and Joong-Bae Ahn

Department of Atmosphere Science, Pusan National University, Busan 609-735, Korea

Abstract: Because precipitation is influenced by various atmospheric variables, it is highly nonlinear. Although precipitation predicted by a dynamic model can be corrected by using a nonlinear Artificial Neural Network, this approach has limits such as choices of the initial weight, local minima and the number of neurons, etc. In the present paper, we correct simulated precipitation by using a multiple linear regression (MLR) method, which is simple and widely used. First of all, Ensemble hindcast is conducted by the PNU/CME Coupled General Circulation Model (CGCM) (Park and Ahn, 2004) for the period from April to August in 1979-2005. MLR is applied to precipitation simulated by PNU/CME CGCM for the months of June (lead 2), July (lead 3), August (lead 4) and seasonal mean JJA (from June to August) of the Northeast Asian region including the Korean Peninsula (110o-145oE, 25-55oN). We build the MLR model using a linear relationship between observed precipitation and the hindcasted results from the PNU/CME CGCM. The predictor variables selected from CGCM are precipitation, 500 hPa vertical velocity, 200 hPa divergence, surface air temperature and others. After performing a leave-one- out cross validation, the results are compared with the PNU/CME CGCM’s. The results including Heidke skill scores demonstrate that the MLR corrected results have better forecasts than the direct CGCM result for rainfall.

Keywords: Multiple Linear Regression (MLR), Model Output Statistics (MOS), Precipitation over East Asia, Coupled General Circulation Model

요 약: 강수는 다양한 대기 변수들의 영향으로 나타나기 때문에 비선형성이 매우 강하다. 따라서 역학 모형을 통해 예 측된 강수의 보정은 비선형 모형인 인공 신경망 등을 통해 가능할 것이지만, 인공 신경망의 경우 초기 가중치 선택, 지 역 최소화 문제, 뉴런의 수 결정 등의 문제로 인한 한계가 있다. 그러므로 본 연구에서는 가장 보편적으로 사용되는 다 중 선형 회귀 모형을 이용하여 CGCM에 의해 모사된 강수를 보정하였으며, 예측성을 살펴보았다. 이를 위하여 우선 PNU/CME 접합 대순환 모형(Coupled General Circulation model, CGCM)(박혜선과 안중배, 2004)을 이용하여 1979년 부터 2005년까지 매해 4월부터 8월까지 5개월간 앙상블 적분을 하였다. 적분 결과 중 한반도를 포함한 동북아시아 지 역(110oE-145oE, 25oN-55oN)의 여름철인 6월(리드 2) , 7월(리드 3), 8월(리드 4) 및 여름철 평균인 JJA(from June to August) 기간의 PNU/CME CGCM에 의해 모사된 강수를 보정하기 위해 다중 선형 회귀(Multiple Linear Regression, MLR)를 이용하였다. PNU/CME 접합 대순환 모형의 결과 중 강수, 500 hPa 연직 속도, 200 hPa 발산장, 지상 기온 등 의 예측 인자와 관측 강수와의 선형적인 관계를 이용하여 MLR 모형을 구축하였다. 그리고 교차 검증(cross- validation) 을 수행하여 PNU/CME 접합 대순환 모형의 결과와 교차 검증 결과를 비교하였다. 상관계수, 적중률 (hit rate), 오보율 (false alarm rate) 그리고 Heidke 기술 점수(Heidke skill score) 등을 살펴본 바, 보정하지 않은 모형의 결과에 비해 MLR 모형을 이용하여 보정한 결과의 강수에 대한 예측성이 뛰어난 것을 알 수 있었다.

주요어: 다중선형회귀, 통계적 후처리 과정, 동아시아 지역 강수, 접합 대순환 모형

(해 설)

*Corresponding author: [email protected] Tel: 82-51-514-1932

Fax: 82-51-515-1689

(2)

다중 선형 회귀를 이용한 PNU/CME CGCM의 동아시아 여름철 강수예측 보정 연구

215

서 론

장기 예보는 예보대상기간 11일 이상의 기상이나 기후 변화를 예보하는 것으로 초기치 문제, 모델의 불완전성 등으로 인해 단기 예보에 비해 적중률은 떨어지지만, 최근 전지구적으로 폭설, 폭염, 가뭄, 홍 수, 한파 등의 이상 기후 및 기상 이변 등이 속출함 에 따라 그 중요성은 점점 커지고 있다.

장기 예보를 위한 객관적인 방법은 통계 모델을 이용하는 방법과 역학 모델을 이용하는 것으로 나눌 수 있다. Blanford(1884)를 시작으로 이후 많은 통계 모형이 개발되어 사용되어 오고 있다. 그러나 통계 모델을 이용하는 방법은 변수간의 물리적 해석이 어 려우며, 비선형적인 특성을 반영하지 못하기 때문에, 물리적 법칙을 바탕으로 한 역학 모델을 이용하는 것이 바람직하다. 특히 수주 이상의 예측에 있어서는 열적 관성이 큰 해양뿐만 아니라 해빙, 지면의 영향 까지도 고려한 대기-해양 접합 대순환 모델이 긴 시 간 규모를 다루는 장기 예측을 위한 궁극적인 수단 이 될 수밖에 없다(안중배 외, 1997). 접합 대순환 모 형 (Coupled General Circulation Model, CGCM)을 이용한 연구를 살펴보면, 박혜선과 안중배(2004)는 대기-해양-해빙 접합 모형을 개발하고 이를 이용하여 엘니뇨-남방진동(El Niño and Southern Oscillation, ENSO)을 예측한 바 있다. 또한 국외에서는 Geert et al.(2005)은 European Center for Medium-Range Weather Forecasts(ECMWF) CGCM인 System-2(S2) 를 이용하여 계절 예측성을 살펴본 바 있다. 그러나 접합 대순환 모델을 이용한 예측이건 대기 역학 모 형을 이용한 예측이건 강수 예측의 경우는 다른 기 상 변수의 예측에 비해 더욱 어렵다. 이는 강수를 결 정하는 역학적, 물리적 과정들이 완벽하지 못하기 때 문이다(IPCC, 2001).

일반적으로 예측성을 향상시키기 위하여 통계적인 후처리 기법인 MOS(Model Output Statistics, MOS) (Wilks, 1995) 방법이 이용되고 있다. MOS는 관측과 모델 사이의 통계적인 관계를 찾은 후 이를 적용하 여 예측하는 것이다. MOS 기법에는 SVD(Singular Value Decomposition, Bretherton et al., 1992), PCA (Principle Component Analysis, Lorenz, 1956), CCA (Canonical Correlation Analysis, Barnett and Preisendorfer 1987; Barnett and Ropelewski, 1992), MLR(Multiple Linear Regression, Drapper and

Smith, 1981) 등의 선형적인 방법뿐만 아니라 비선형 적인 방법인 ANN(Artificial Neural Network, Deer and Sultz, 1994; Tangang et al., 1997; 황윤정과 안 중배, 2005)도 있다. 차유미와 안중배(2005)는 전구- 지역모형으로부터 생산된 7월 순별 예측 인자들을 MLR과 ANN에 적용하여 남한의 여름철 강수를 보 정하고 각 기법의 성능을 비교하여 MLR에 비해 ANN에 의한 MOS를 수행하는 경우 예측 능력을 향 상시킬 수 있음을 보인 바 있다. 그러나 차유미와 안 중배(2005)가 지적했듯이 실제 자연계의 현상들은 매 우 복잡한 요소들의 상호작용의 결과이므로 비선형적 인 방법인 ANN이 적합할 것이지만, 다양한 함수의 선택과 옵션에 따라 지역 최소값, 초기 가중치 선택, 과대적합의 가능성 등의 문제로 인한 어려움이 있다.

박수희 외(2005)는 ANN 모델을 이용하여 멀티모델 앙상블 기법(NME)를 개발하고 겨울철 강수 예측성 을 살펴보았다. 그 결과 전구 강수 예측에는 상당한 향상이 있었지만 동아시아 지역에는 ANN을 이용한 NME 기법의 효과가 적었다고 하였다. 손건태 외 (2005)는 로지스틱 회귀모형과 신경망 모형을 이용하 여 호남 지역의 집중 호우를 예측한 결과 모형의 훈 련결과에 있어서는 신경망 모형이 우수하였으나, 검 증결과에 있어서는 로지스틱 회귀 모형의 결과가 우 수하여, 종합적으로 호남 지역 집중 호우에 대해 로 지스틱 회귀 모형의 적용을 제안하였다. 따라서 본 연구에서는 가장 간단하고 널리 사용되는 선형적인 방법을 이용하고자 한다. Massie and Rose(1997)는 Nashville지역의 관측 최대 기온과 Eta 모형과 Nested Grid Model (NGM)을 통해 예측된 층후 사이의 관 계에 선형 회귀 방정식을 적용하여 일 최대 기온을 예측하고자 하였다. 그 결과 Eta 모형에 MOS를 적 용한 결과가 더 우수함을 보였다. Sokol and Rezacova (2000)는 German Numerical Weather Prediction (NWP) Model의 결과에 몇 가지 MOS 기법을 적용 하여 12시간 누적강수량의 예측성을 개선하고자 하였 다. 사용된 MOS 기법은 예측 변수 선택에 따른 4가 지 MLR 방법, 예측 변수의 분포와 함수에 따른 3가 지 Generalized Linear model(GLM) 그리고 Successive Learning Technique(SLT)이다. 이들 MOS 결과와 NWP 모델 결과를 비교하여 통계적 후처리 과정을 거친 결과들이 더 우수함을 보여주었다. Landman and Goddard(2002)은 ECHAM3.6 GCM(General Circulation Model)의 DJF(December-January-February)의 강수

(3)

결과에 CCA를 적용하여 MOS를 수행한 후 남부 아 프리카 지역의 겨울철 강수량을 예측한 바 있다. 또 한 Lin et al.(2005)은 2개 GCM의 겨울철 500 hPa 지위고도와 관측의 지위고도에 SVD를 적용하여 leading SVD 패턴을 구하였다. 그 중 3개의 주요 성분 을 이용하여 MLR을 적용하여 Pacific/North American (PNA) 그리고 North Atlantic Oscillation(NAO)의 예 측성을 본래의 GCM 결과와 비교하여 SVD와 MLR 을 적용하여 MOS를 수행한 결과의 예측성이 뛰어남 을 보였다.

본 연구에서는 CME/PNU 접합 대순환 모형으로부 터 생산되는 예측 인자들을 이용하여 MOS 기법 중 가장 널리 사용되는 MLR 방법을 적용하여 한반도를 중심으로 한 동북아시아 지역(110oE-145oE, 25oN-55

oN)의 6월, 7월, 8월, JJA동안의 강수량을 보정하고, 예측성 향상 정도를 살펴보았다.

모형의 개요 및 검증 방법

PNU/CME 접합 대순환 모형

본 연구에서 사용한 PNU/CME 접합 대순환 모형은 대기 대순환 모형인 NCAR/CCM3(National Center for Atmospheric Research/Community Model)와 해양 대순환 모형인 GFDL(Geophysical Fluid Dynamics Laboratory)에서 개발한 MOM3(Modular Ocean Model)에 기반을 두고 있으며, 해빙 모형은 열역학 부분은 Semtner(1976)의 3층 열역학 해빙 모형, 역학 과 수송 부분은 LANL(Los Alamos National Laboratory)의 EVP(Elastic-Viscous-Plastic) 역학 해빙 모형에 기반을 두고 있다. PNU/CME 접합 대순환 모형에 대한 설명은 박혜선과 안중배(2004)에 자세하 게 소개되었다.

다중 선형 회귀 모형

강수는 다양한 대기 변수들의 영향으로 나타나기 때문에 단지 하나의 독립 변수(예측 변수)와 종속 변 수(예보 변수)만으로 이루어진 단순 회귀 모형으로는 예측하기 힘들다. 따라서 본 연구에서는 한 개의 종 속 변수와 여러 개의 독립 변수로 이루어진 다중 선 형 회귀 모형을 이용하였다. 예측 인자로는 PNU/

CME CGCM의 결과 중 강수, 지상기온, 500 hPa 연 직 속도, 850 hPa 지위고도 그리고 200 hPa 동서, 남 북성분 바람장으로부터 계산된 200 hPa 발산장을 사

전 선택하였다. Fig. 1은 동북아시아 지역의 Global Precipitation Climatology Project(GPCP) 관측 강수와 PNU/CME CGCM의 결과들과의 원격 상관(one-point correlation)을 통해 구해진 각 격자점에 대해 계산된 최대 상관 계수 분포이다. 왼쪽으로부터 강수, 지상 기온, 200 hPa 발산장, 500 hPa 연직속도 그리고 850 hPa 지위 고도이다. 그림에서 보면 알 수 있듯이 850 hPa 지위 고도의 경우는 각 격자점의 최대 상관 계수 값이 다른 변수들에 비해 낮다. 따라서 850 hPa 지위고도를 제외한 나머지 4개의 변수를 예측변수로 선정하였다. Fig. 1에서 살펴본 바와 같이 예측변수 로 상관이 높은 변수 및 격자점을 선택해 줌에 따라 보다 정확한 MLR 모형식을 구할 수 있다. 또한 선 택된 4개의 예측변수들의 조합을 이용하여 여러 개 의 MLR 모형식을 구한 뒤 관측과의 상관이 가장 높 은 모형을 최적 모형으로 선택하였다. 선택된 예측 변수를 사용하여 만든 MLR 모형식은 다음과 같다.

(1) 여기서 xk는 k번째 예측 변수이고, 은 예보 변수 이다.

교차 검증

본 연구에서 사용한 자료의 기간이 학습 자료와 검증 자료로 나누는 방법으로는 검증하기에는 충분하 지 못하므로 Fig. 2에서와 같이 전체 표본 중 1개만 을 제외한 N-1개로 모형 구축 후 나머지 1개 표본으 로 검증하는 방법으로 이와 같은 과정을 N회 반복하 는 방법으로 MLR 모형식을 검증하였다.

실험 방법

본 연구에서 우선 접합 실험에 앞서 기후 표류 현 상을 줄이기 위하여 각 성분 모형을 장기간 스핀업 (spin-up) 하였다. 먼저 대기 대순환 성분 모형의 경 우 관측된 모든 해의 월 평균 해수면 온도를 하부 경계조건으로 두고, 1979년부터 2004년까지 26년에 대해 3월 1일 00시의 관측 자료를 초기조건으로 AGCM(Atmospheric General Circulation Model) 각각 한 달씩 적분하였다. 이로부터 생산되는 지면 자료를 처방하여 다시 3월 31일 00시의 관측 자료를 초기조건으로 각각 하루 동안 적분하여 4월 1일에 적분이 시작되는 접합실험을 위한 초기자료를 생산하

yˆ b= 0+b1x1+b2x2+… b+ kxk+ε

(4)

다중 선형 회귀를 이용한 PNU/CME CGCM의 동아시아 여름철 강수예측 보정 연구

217

였다. 해양 성분 모형의 장기 스핀업 실험에서는 1979년부터 1997년까지의 19년 동안 평균된 관측 월 평균 해면온도를 하부 경계조건으로 AGCM을 19년 간 먼저 적분하였으며, 이로부터 생산되는 대기 모델 최하층에서의 기온, 바람, 비습, 강수, 그리고 지표에 서의 하향 단파 및 장파 복사에너지 등의 대기 상태 변수를 19년간 월 평균하여 OGCM(Ocean General

Circulation Model)을 적분하기 위한 경계 자료를 생 산하였다. 이 때 AGCM의 초기 조건은 임의의 해의 1월 1일 00시 상태로 주었다. 그 후 AGCM으로부터 생산된 대기 경계조건을 사용하여 OGCM을 100년간 적분하였다. 이 때 OGCM의 초기 조건으로는 Levitus (1982)의 1월 평균 해수면온도와 염분도를 사용하였 다. OGCM의 재현실험에서는 초기조건으로 이미 준 Fig. 1. Maps of maximum one-point correlation between the observed and simulated (a) precipitation, (b) temperature, (c) 200 hPa divergence, (d) 500 hPa vertical velocity and (e) 850 hPa geopotential height.

(5)

평형 상태에 도달한 OGCM 장기적분의 최종상태를 사용하였고, 1979년부터 2005년까지의 NCEP/NCAR (National Centers for Environmetal Prediction/

National Center for Atmospheric Research) 재분석 자료를 경계조건으로 OGCM을 27년간 적분하였다.

이렇게 생산된 OGCM은 AGCM과 마찬가지로

CGCM의 초기 조건이 된다. 본 연구에서 CGCM의 hindcast 실험은 4월 1일, 3일, 5일, 7일, 9일에 출발 하여 5개월간 앙상블 적분하였으며, 이러한 적분을 1979년~2005년에 대해 27년간 시행하였다. 그 중에 서 리드(Lead)가 2-4인 6월, 7월 그리고 8월의 CGCM 앙상블 결과 중 강수, 지상 기온, 200 hPa 발

Fig. 3. Maps of correlation between the observed and simulated precipitation by PNU/CME CGCM for (a) June, (b) July, (c) August and (d) JJA.

Fig. 2. Leave-one out cross-validation method. The shaded blocks are test data.

(6)

다중 선형 회귀를 이용한 PNU/CME CGCM의 동아시아 여름철 강수예측 보정 연구

219

Fig. 4. Maps of correlation between the observed precipitation and MLR training for (a) JUN, (b) JUL, (c) AUG and (d) JJA.

MLR results are based on training.

Fig. 5. Maps of correlation between the observed precipitation and cross- validated MLR results for (a) JUN, (b) JUL, (c) AUG and (d) JJA.

(7)

산장. 500 hPa 연직속도, 850hPa 지위고도 중에서 선 택된 변수를 예측 인자로 하여 여름철 강수량을 예 측하기 위해 MLR을 이용한 MOS를 수행하였다.

결과 분석

Fig. 3은 1979년부터 2005년까지 6월, 7월, 8월 그 리고 JJA 동안의 한반도 중심의 동북아시아 지역 (110oE-145oE, 25oN-55oN)의 MLR 모형을 이용하기

전의 PNU/CME CGCM이 생산한 강수와 관측 강수, 즉 NCEP/NCAR 재분석 자료와의 상관관계 분포 그 림이다. 그림의 음영이 짙을수록 상관관계가 높음을 나타낸다. 6월의 경우 일본 및 북서 태평양에서 약함 음의 상관관계가 나타나고, 또한 내륙으로는 둥베이 지방에서 음의 상관관계를 보인다. 그 외 지역은 약 한 양의 상관관계를 나타낸다. 7월은 한반도 ,홋카이 도 및 북서태평양에서 약한 음의 상관관계가 나타나 고 있다. 8월은 화중지방에서 약한 음의 상관을 보이 Fig. 6. Standard deviation of observed precipitation for (a) JUN, (b) JUL, (c) AUG and (d) JJA) and uncorrected precipitation for (e) JUN, (f) JUL, (g) AUG and (h) JJA.

(8)

다중 선형 회귀를 이용한 PNU/CME CGCM의 동아시아 여름철 강수예측 보정 연구

221

고 나머지 지역은 양의 상관관계를 보이고 있다. 여 름철 전체를 살펴본 JJA의 경우, 일본을 포함한 북서 태평양, 한반도 중부, 내몽고, 화중 지방에서 약한 음 의 상관을 나타내고 있다. 이상과 같이 PNU/CME CGCM의 여름철 강수의 상관관계를 살펴본 바, 음의 상관 계수가 나타나는 지역이 존재함으로써 예측성이 낮은 것을 알 수 있다. 따라서 통계적인 보정을 통해 예측성을 향상시킬 필요가 있을 것으로 사료되었다.

이에 본 연구에서는 MLR을 이용하여 PNU/CME CGCM의 결과를 보정하고자 시도하였다.

Fig. 4는 MLR을 이용하여 교차 검증(cross- validation) 하기 전에 학습(training)을 수행하여 얻은 강수와 관측 강수와의 상관 계수 분포를 나타낸 것 이다. 그림에서 보듯이 Fig. 3의 보정하지 않은 결과 와 비교할 때, MLR을 적용하여 보정한 결과 상관 계수의 분포들이 매우 큰 값으로 유의하며 보정 효 과가 뛰어남을 알 수 있다.

다음으로는 Fig. 4의 학습 결과를 바탕으로 교차 검증을 수행하여 실제 보정 기법을 이용한 예측가능 성을 검증하고자 하였다. Fig. 5는 MLR을 적용하여 검증한 결과로 앞서 설명한 교차 검증을 수행한 결 과이다. 6월, 7월, 8월 및 JJA기간을 함께 살펴보면, Fig. 3의 보정하지 않은 결과에 비해 상관 계수 값이 큰 것을 알 수 있다. 즉 MLR을 적용한 결과 보정이 됨으로써 예측성이 향상되었다.

Fig. 6은 그림 위로부터 관측 강수, PNU/CME CGCM 강수, MLR을 이용한 교차 검증한 강수의 표 준 편차 분포 그림으로 왼쪽으로부터 6월, 7월, 8월 그리고 JJA를 나타낸다. 표준 편차는 변수의 경년 변 동성을 나타낸다. 그림에서 보듯이 관측의 표준편차 는 위도 40oN 이하인 한반도, 화북 및 화중 지방, 일 본 및 북태평양에서 2 이상의 높은 값을 나타내고, 고위도 대륙에서는 낮은 값을 가진다. 이와 달리 PNU/CME CGCM의 경우에는 관측과 유사하게 해양 에서는 높은 변동성을 나타내고, 대륙에서는 해양에 비해 낮은 변동성을 보이고 있다. MLR을 적용한 결 과도 마찬가지로 해양에서 표준편차의 값이 크고, 대 륙에서는 상대적으로 낮은 값을 나타내고 있다. 즉 PNU/CME CGCM의 보정하지 않은 결과와 MLR을 이용하여 보정한 결과 모두 경년변동성을 모사하는데 있어서는 관측과 유사하게 모사하고 있음을 알 수 있다.

다음은 6월, 7월, 8월 그리고 JJA 기간 동안의 강 수에 대하여 적중률(Hit rate), 오보율(False alarm rate) 및 Heidke 기술 점수(Heidke skill score)를 구 하여 각 모델의 예측능력을 평가하고자 하였다. 장기 예측에서는 정확한 아노말리(anomaly)의 예측보다는 평년에 비해 높은지, 평년과 비슷한지, 평년보다 낮 은지에 더 관심이 있다. 따라서 본 연구에서는 기상 청 현업에서 사용하는 3분위 예보기준에 따라 강수 Fig. 6. Continued. Standard deviation of MLR cross-validated precipitation for (i) JUN, (j) JUL, (k) AUG and (l) JJA.

(9)

가 평년에 비해 70% 이하일 때는 below normal, 70~120%일 때는 normal, 120% 이상일 때는 above normal 로 정의하였다. Fig. 7은 PNU/CME CGCM 의 보정하지 않은 결과의 적중률과 MLR을 적용한 결과의 적중률을 나타낸 것이다. 적중률은 관측에서 발생한 횟수와 모델이 예측한 횟수의 비로 정의됨으 로 큰 값일수록 예측 능력이 우수하다고 할 수 있다.

먼저 보정하지 않은 결과의 경우 6월에는 한반도 북 부, 둥베이 지방 그리고 동해 및 일본 북부에서 큰

값을 나타내어 예측성이 높고, 그 외 지역은 대체로 낮은 예측성을 나타내고 있으며, 7월에는 한반도에서 낮은 예측성을 나타내고, 이를 제외한 대부분의 지역 에서는 예측성이 높다. 8월은 고위도의 적중률 값이 커서 예측성이 좋은 것으로 보이며, 이외 지역은 비 슷한 예측성들을 가지고 있다. 여름철 전체를 살펴본 JJA의 경우 월별의 적중률보다는 상당히 좋은 예측 성을 보이고 있다. 둥베이 지방은 0.7 이상의 값으로 매우 예측성이 높고, 또한 화북 지방 및 북서 태평양 Fig. 7. Hit rate of uncorrected precipitation for (a) JUN, (b) JUL, (c) AUG and (d) JJA , and MLR cross-validated precipita- tion for (e) JUN, (f) JUL, (g) AUG and (h) JJA.

(10)

다중 선형 회귀를 이용한 PNU/CME CGCM의 동아시아 여름철 강수예측 보정 연구

223

에서도 0.6 이상의 값을 나타내어 예측성이 높다. 다 음으로 MLR을 적용하여 보정한 결과(아래)를 보면, 6월, 7월, 8월 그리고 JJA 기간에 한반도 및 동북아 시아 대부분의 지역에서 보정하지 않은 결과(위)보다 높은 적중률 값을 나타내어 더 정확한 예측을 하고 있음을 알 수 있다.

Fig. 8은 PNU/CME CGCM의 오보율과 MLR을 이용한 교차 검증 결과의 오보율이다. 오보율은 관측 에서 발생하지 않은 횟수와 모형에서 예측한 횟수의

비로 정의되며, 값이 작을수록 모형의 예측 능력이 우수하다고 할 수 있다. PNU/CME CGCM의 결과를 먼저 살펴보면 6월에는 한반도 북부에서 둥베이 지 역을 거쳐 일본에서 대체로 큰 지수 값을 가지고, 또 한 동중국해에서 큰 오보율 값이 나타나므로 이 지 역들의 예측성이 낮음을 알 수 있다. 7월에는 한반도 에서 값이 크게 나타나고 다른 지역은 대체로 낮은 지수 값을 나타낸다. 8월에는 서해와 화북지방에서 큰 지수 값이 나타나 예측성이 낮다. 또한 전체적으 Fig. 8. False alarm rate of uncorrected precipitation for (a) JUN, (b) JUL, (c) AUG and (d) JJA and MLR cross-validated pre- cipitation for (e) JUN, (f) JUL, (g) AUG and (h) JJA.

(11)

로 여름철 JJA를 살펴볼 때, 한반도, 동해, 서해 및 동중국해에서 큰 오보율 값을 나타내어 예측성이 낮 은데, 특히 한반도는 대륙의 경계에 있기 때문에 기 후 예측이 매우 어려운 지역에 속하는 것으로 알려 져 있다. 아래 패널은 MLR 모형의 결과로 6월, 7월, 8월의 경우 0.3 이하의 값으로 대부분의 지역에서 값 이 낮아 예측성이 향상된 것을 알 수 있다. 특히 여 름철 JJA의 경우에는 오보율 값이 0.2 이하의 값으 로 보정하지 않은 결과에 비해 예측성이 상당히 높

아진 것을 확인할 수 있다.

Fig. 9는 Heidke 기술 점수 값을 나타낸 것으로 1 에 가까울수록 예측성이 우수하다고 할 수 있다 (Heidke, 1926). 그림에서 보는 바와 같이 보정하지 않은 모형 결과에서는 6월의 경우, 북서 태평양에서 음의 지수 값이 나타나 예측성이 낮고 동해 및 둥베 이 지역을 포함한 그 외 지역은 양의 값이 나타난다.

7월에는 한반도, 북서 태평양 그리고 중국 내륙 몇몇 지역에서 음의 값이 나타나고 있으며, 둥베이 지방 Fig. 9. Heidke skill score of uncorrected precipitation for (a) JUN, (b) JUL, (c) AUG and (d) JJA and MLR cross-validated results for (e) JUN, (f) JUL, (g) AUG and (h) JJA.

(12)

다중 선형 회귀를 이용한 PNU/CME CGCM의 동아시아 여름철 강수예측 보정 연구

225

등에서 양의 값을 가진다. 8월에는 한반도 , 일본 및 근처 해양에서 낮은 예측성을 보이고 나머지 지역은 Heidke 기술 점수 값이 양으로 어느 정도 예측성이 있는 것으로 나타난다. 또한 전체적으로 JJA 기간에 대해서는 한반도, 남해, 동해, 서해에서 음의 값이 나 타나 다른 지역에 비해 예측성이 낮고, 그 외 지역은 대체로 양의 값을 가진다. 아래 패널의 보정한 MLR 결과를 살펴보면, 6월, 7월, 8월 그리고 JJA 기간의 결과에서 모두 양의 지수 값을 나타내어 예측성이 향상된 것을 알 수 있다. 특히 JJA의 결과를 살펴보 면, 0.5 이상의 값이 나타나는 지역이 많은 것으로 보아 MLR을 통해 보정이 이루어졌음을 알 수 있다.

Fig. 10은 1979년부터 2005년까지의 여름철 6월, 7 월, 8월 그리고 JJA 기간에 대한 한반도 지역(126oE

~129.5oE, 33.5oN~42oN)의 강수 아노말리 결과의 시 계열을 나타낸다. 보정하지 않은 모형의 결과의 관측 시계열과의 상관계수 값을 살펴보면, 그림의 순서대 로 (a)-0.19, (b)-0.46, (c)0.01 그리고 (d) 0.05의 값을 가진다. 즉 보정하지 않은 모형의 결과는 예측성이 낮은 것으로 나타나고 있다. 반면 보정한 결과는 (e) 0.51, (f) 0.47, (g) 0.66, 그리고 (h) 0.54로 95% 신뢰 수준에서 유의한 값인 0.37보다 모두 큰 값으로 예측 성이 매우 높아졌다. 즉 MLR을 통해 적절히 보정이 이루어진 것으로 사료된다.

요약 및 결론

본 연구에서는 PNU/CME 접합 대순환 모형을 이 용하여 1979년부터 2005년까지 매해 4월 1일, 3일, 5일, 7일, 9일 00시에 적분을 시작하여 4월부터 8월 까지 5개월간 앙상블 적분을 하였다. 적분 결과 중 한반도를 포함한 동북아시아 지역(110oE-145oE, 25oN-55oN)의 여름철인 6월, 7월, 8월 및 JJA 기간의 강수에 MLR을 적용하여 접합 모형에 나타나는 기후 표류 등의 계통적 오차를 최소화하고 예측 결과의 향상 여부를 살펴보고자 하였다.

먼저 Fig. 2에서 선택된 모형의 결과인 강수, 500 hPa 연직 속도, 200 hPa 발산장, 지상 기온의 예측 변 수를 MLR의 설명 변수로 하여 관측 강수와의 선형적 인 관계를 이용하여 MLR 모형을 구축하였다. 그리고 Fig. 3과 같은 방법으로 교차 검증을 수행하여 PNU/

CME 접합 대순환 모형의 결과와 교차 검증 결과를 비교하였다. NCEP/NCAR 재분석 자료와의 상관관계 분석 결과는 PNU/CME 접합 대순환 모형의 6월, 7월, 8월 그리고 JJA의 경우 음의 상관 계수 값이 많이 나 타나 예측성이 낮다. 그러나 MLR을 이용하여 교차 검증한 결과, 대부분의 지역에서 양의 상관 계수 값을 나타내어 예측성이 향상되었다. 또한 예측 성능을 알 아보기 위하여 기상청 현업에서 사용하는 3분위 예보 Fig. 10. Time series of precipitation for (a) JUN, (b) JUL, (c) AUG and (d) JJA.

(13)

에 따라 적중률, 오보율 그리고 Heidke 기술 점수 등 을 살펴보았다. 이 경우 보정하지 않은 CGCM의 결과 에 비해 MLR을 이용하여 보정한 결과의 강수 예측성 이 뛰어난 것을 알 수 있었다.

이상의 분석들을 통해 살펴본 바에 따르면, PNU/

CME CGCM의 강수에 나타나는 계통 오차는 MLR 을 통해 보정이 가능하였으며, 예측성이 향상되었다.

사 사

이 논문은 부산대학교 자유 과제 학술연구비(2년) 에 의해서 연구되었음.

참고문헌

박수희, 강성대, 권원태, 2005, 비선형 멀티모델 앙상블 기 법을에 의한 북반구 겨울철 강수량 예측. 한국기상학회 지, 41(6), 1015-1028.

박혜선, 안중배, 2004, 대기-해양-해빙 접합 모형 개발과 이를 이용한 ENSO 예측 실험(1). 한국기상학회지, 40(2), 135-146.

손건태, 이정형, 이순환, 류천수, 2005, 호남지역 집중호우 예측 을 위한 통계 모형 개발. 한국 기상학회지, 41(6), 897-907.

안중배, 박혜선, 이효신, 이우성, 김정우, 1997, 대기 및 해 양 대순환 모형에 나타난 기후 표류에 관한 연구. 한국 기상학회지, 33(3), 509-520.

차유미, 안중배, 2005, 역학적으로 규모축소된 남한의 여름 철 강수에 대한 인공신경망 보정 능력 평가. 한국기상 학회지, 41(6), 1125-1135.

황윤정, 안중배, 2005, 기후 표류된 CME/PNU CGCM 겨 울철 기온의 인공신경망 보정 연구. 한국기상학회지, 41(6), 1067-1076.

Barnett, T.P. and Preisendorfer, R., 1987, Origins and levels if monthly and seasonal forecast skill for United States sur- face air temperature determined by canonical correlation analysis. Monthly Weather Review, 115 (9), 1825-1850.

Barnston, A.G. and Ropelewski, C.F., 1992, Prediction of ENSO episodes using canonical correlation analysis.

Journal of Climate, 5 (11), 1316-1345.

Blandford, H.F., 1884, On the connection of the Himalaya snowfall with dry winds and seasons of drought in India. Proceedings of the Royal Society, 37 (1), 3-22.

Bretherton, C.S., Smith, C., and Wallace, J.M., 1992, An intercomparison of methods for finding coupled pat- terns in climate data. Journal of Climate, 5 (6), 541-560.

Derr, V.B. and Slutz, R.J., 1994, Prediction of El Niño events in the Pacific by means of neural network. Arti-

ficial Intelligence Applications, 8 (2), 51-63.

Drapper, N.R. and Smith, H., 1981, Applied regression analysis. (2nd ed.). Wiley, New York, USA, 736 p.

Oldenborgh, G.J., Balmaseda, M.A., Ferranti, L., Stockdale, T.N., and Anderson, D.L.T., 2005, Evaluation of atmo- spheric fields from the ECMWF seasonal forecasts over a 15-Year period. Journal of Climate, 18 (6), 3250-3269.

Heidke, P., 1926, Berechnung des erfolges und der gute der windstarkvorhersagen im sturmwarnungsdienst.

Geografiska Annaler, 8, 301-349.

IPCC, 2001, Climate Change 2001: The Scientific Basis.

In Houghton, J.T, Ding, Y., Griggs, D.J., Noguer, M., Linden, P.J., Dai, X., Maskell, K., and Johnson, C.A.

(eds.), Cambridge University Press, Cambridge, UK and New York, NY, USA, 892 p.

Landman, W.A. and Lisa Goddard., 2001, Statistical recalibra- tion of GCM forecasts over southern Africa using model output statistics. Journal of Climate, 15 (9), 2038-2055.

Levitus, S., 1982, Climatological Atlas of the world ocean.

Technical Report, NOAA Professional Paper 13. US Government Office, Washington, DC, USA, 173 p.

Lin, H., Derome, J., and Brunet, G., 2005, Correction of GCM seasonal forecasts using the leading forced SVD patterns (solicited), European Geosciences Union, General Assembly.

Lorenz, E.N., 1956, Empirical orthogonal functions and statistical weather prediction. Massachusetts Institute of Technology, Department of Meteorology, Scientific Report No.1., 49 p.

Massie, D.R. and Rose, M.A., 1997, Predicting daily maximum temperatures using linear regression and Eta geopotential thickness forecasts. Weather and Forecasting, 12 (4), 799-807.

Semtner, A.J., Jr., 1976, A model for the thermodynamic growth of sea ice in numerical investigations of cli- mate. Journal of Physical Oceanography, 6 (3), 379-389.

Sokol, Z. and Rezácová D., 2000, Improvement of local categorical precipitation forecasts from an NWP model by various statistical postprocessing methods. Studia Geophysica et Geodaetica, 44 (1), 38-56.

Tangang, F.T., Hsieh, W.W., and Tang, B., 1997, Forecasting the equatorial Pacific sea surface temperatures by neural network models. Climate Dynamics, 13 (2), 135-147.

Walker, G.T., 1924, Correlation in seasonal variations of weather. IX: A further study of world weather (World Weather II). Memoirs of the Indian Meteorological Department, 24 (9), 275-332.

Wilks, D.S., 1995, Statistical methods in the atmosphere science. Academic Press, San Diego, USA, 467 p.

Landman, W.A. and Goddard, L., 2002, Statistical recalibra- tion of GCM forecasts over Southern Africa using model output statistics. Journal of Climate, 15 (15), 2038-2055.

2006년 12월 18일 접수 2007년 1월 12일 수정원고 접수 2007년 3월 26일 채택

수치

Fig. 2. Leave-one out cross-validation method. The shaded blocks are test data.
Fig. 4. Maps of correlation between the observed precipitation and MLR training for (a) JUN, (b) JUL, (c) AUG and (d) JJA.

참조

관련 문서

Characteristics of water quality at East China Sea in southwestern sea of Jeju Island in summer..

The eruption of East Asian financial crisis in 1997 has aroused heated debate on the re-evaluation of past economic achievements of East Asian countries

Second, as a result of implementing multiple regression analysis to discover how learning orientation(moderating variable) among small business employees influence

269~290; Zhangfeng, “Rethinking the Tribute System: Broadening the Conceptual Horizon of Historical East Asian Politics.” Chinese Journal of International

"The Principle of Separating Economics from Politics, and Prospects for Improvement in North-South Relations." East Asian Review.. The Korean Journal

Dong Won Lee, Young Dug Bae, Suk Kwon Kim, Hee Yun Shin, Bong Guen Hong, Hyun Kyu Jung, Yang Il Jung, Jeong Yong Park, Byung Kwon Choi, and Yong Hwan Jeong(KAERI). P07B04

Min Seok Ko, Bo An Lee, Sung Yong Lee, Yeong Jun Jang, Yoon Jeong Hong, and Sin Kim(JNU) TR-PIV Performance Test for a Flow Field Measurement in a Single Rod Test Section Ju

As a result of multiple regression analysis, the statistically associated factors with burnout were social support, GDS, marital state, self­rated health