• 검색 결과가 없습니다.

제9장 시계열분석

N/A
N/A
Protected

Academic year: 2021

Share "제9장 시계열분석"

Copied!
32
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

1. 계량경제의 분류 2. 시계열 자료

3. 예측시스템

4. 확률과정의 종류

5. 안정성 및 Wold Decomposition 6. 자기상관함수 및 편자기상관함수 7. 교차상관계수 및 시차상관계수 8. AR(p) 모형

9. MA(q) 모형

10. ARMA(p,q) 모형

(2)

구분 회귀분석 시계열분석 패널분석

방정식 단일방정식 연립방정식 일변량

(univariate)

다변량

(multivariate) 회귀분석 시계열분석

데이터 횡단면/시계열 횡단면/시계열 시계열 시계열 pool/패널 pool/패널

모형

①단순모형 - ④AR(p)

⑤MA(q)

⑥ARMA(p,q)

⑦ARIMA(p,q)

⑧VAR(p) /VECM ⑨패널모형 ⑩패널VAR(p) / 패널 VECM

②다중모형 ③연립방정식모형

정태/동태모형 정태/

동태모형 동태모형 동태모형 정태/

동태모형 동태모형

추정방법 LS(OLS, WLS, ILS), ML E

LS(OLS, 2SLS, 3SL S)

OLS, NLS, ML

E OLS OLS, LSDV, DI

D OLS, GMM

software Excel, Stata, R

1.계량경제의 분류

(3)

- 시계열 자료 = 체계적 성분+불규칙성분 = 추세성분(𝑻𝒕)+순환성분(𝑪𝒕)+계절성분(𝑺𝒕 )+불규칙성분(𝑰𝒕 ) - 𝑿𝒕 = 𝑻𝒕 + 𝑪𝒕 + 𝑺𝒕 + 𝑰𝒕

- 𝑿𝒕 = 𝑻𝒕 ⅹ 𝑪𝒕 ⅹ 𝑺𝒕 ⅹ 𝑰𝒕

∙ 추세성분 : 관측값이 지속적으로 증가 하거나 감소하는 추세를 갖는 경우의 변동

∙ 순환성분 : 주기적인 변화를 가지나 변화가 계절에 의한 것이 아니고, 주기가 긴 경우의 변동

∙ 계절성분 : 계절의 변화에 따른 주기적인 변동

∙ 불규칙성분 : 시간에 다른 규칙적인 움직임과는 무관하게 랜덤 원인에 의한 변동

2.시계열 자료

(4)
(5)

- 예측시스템은 모형수립단계(model building stage) 및 예측단계(forecasting stage)로 구성됨 - 모형수립단계는 모형적합의 3단계와 동일

∙ 1단계 : 모형의 식별(model identification)

∙ 2단계 : 모형의 추정(model estimation)

∙ 3단계 : 모형의 진단(model diagnostic checking)

3.예측시스템

- 예측단계는 모형수립단계를 거쳐 최종적으로 선택된 모형을 이용하여 예측을 한 후,

새로운 자료가 관측될 때마다 이를 예측 값과 비교, 예측시스템 자체의 변화 여부를 통해 안정성을 조사하고 새로운 관측 값과 이전에 구한 예측 값을 이용하여 미래의 예측 값을 갱신

(6)

- 미래 예측치의 정확도에 대한 사전평가가 불가능하므로 추정된 예측모형을 이용하여 실험적 예측치 도출 - 사용할 수 있는 관측치 중 마지막 일부를 제외하고 모형 추정, 즉, 실제값을 알 수 있는 기간에 대한 사후 예

측치(Ex post Forecast) 도출

- 실제값과 예측치 비교하여 적합성 기준으로 최적 모형 선택

- 최적 모형을 이용하여 사전 예측치(Ex ante Forecast) 도출 → 이후 시간이 경과한 후 실제값과 비교

→ 예측 모형에 대한 재평가 → 필요한 경우 새로운 예측 모형 선택

(7)

- 예측시 발생하는 예측오차는 예측방법의 신뢰성을 평가하는 기준으로 활용

①평균오차(ME: Mean of Errors) : 실제값과 예측값의 차이의 합을 예측기간 수로 나눔 ME = 𝒕=𝟏𝒌 𝜺𝒕

𝒌 = 𝒕=𝟏𝒌 (𝒀𝒕𝒀𝒕)

𝒌

②평균절대오차(MAE: Mean of Absolute Errors) : 실제값과 예측값의 절대값 차이의 함을 예측기간 수로 나눔 MAE = 𝒕=𝟏𝒌 |𝜺𝒕|

𝒌 = 𝒕=𝟏𝒌 |𝒀𝒕𝒀𝒕|

𝒌

③평균절대값퍼센트오차(MAPE: Mean of Absolute Percentage Errors) : 실제값에 대한 MAE 비율

MAPE = 𝒕=𝟏

𝒌 | 𝒀𝒕− 𝒀𝒕|

𝒀𝒕 ∗𝟏𝟎𝟎 𝒌

④평균자승오차(MSE: Mean of Squared Errors) : 실제값과 예측값의 차이의 제곱을 합하여 예측기간으로 나눔 MSE = 𝒕=𝟏𝒌 𝜺𝒕𝟐

𝒌

⑤평균자승오차제곱근(RMSE: Root Mean of Squared Errors) : MSE의 제곱근 RMSE = 𝑴𝑺𝑬 = 𝒕=𝟏𝒌𝒌 𝜺𝒕𝟐

(8)

(1) 확률과정

- T개의 관측치(시계열자료) 𝒚𝟏, 𝒚𝟐, …, 𝒚𝑻는 확률변수 𝒀𝟏, 𝒀𝟐, …, 𝒀𝑻의 실현된 값이며,

확률변수 𝒀𝟏, 𝒀𝟐, …, 𝒀𝑻는 무한계열의 일부분으로 볼 수 있는데 이 무한한 계열을 확률과정이라고 함

(2) 확률과정의 종류

① 백색잡음과정(white noise process)

- 𝒆𝟏, 𝒆𝟐, …,𝒆𝑻 가 있을 경우 다음이 성립하는 확률과정

4.확률과정의 종류

(9)

② 임의보행과정(random walk process)

- 절편이 없는 임의보행과정 : 𝒚𝒕 = 𝒚𝒕−𝟏+ 𝒆𝒕 , 𝒆𝒕~𝑾𝑵 𝑵(𝟎, 𝟏)

- 절편이 있는 임의보행과정∶ 𝒚𝒕 = 𝟎. 𝟐 + 𝒚𝒕−𝟏+ 𝒆𝒕 , 𝒚𝟎 = 𝟎, 𝒆𝒕~𝑾𝑵 𝑵(𝟎, 𝟏)

(10)

③ 자기회귀과정(AutoRegressive process)

(11)

④ 이동평균과정(Moving Average process)

(12)

⑤ 자기회귀이동평균과정(ARMA process)

⑥ 자기회귀적분이동평균과정(ARIMA process)

(13)

(1) 안정성

- 다음의 3조건을 만족하는 확률과정, 𝒚𝒕 를 안정적 시계열(covariance-stationary)이라 함

∙ 시계열의 평균이 일정 즉,

∙ 시계열의 분산이 일정 즉,

∙ 시계열의 공분산이 일정 즉,

- 시계열의 평균이 일정하지 않을 경우를 homogeneous non-stationarity라 하며, 이러한 경우는 원계열을 차분(differencing)을 해주면 안정시계열이 됨

∙ 차분=1:원계열의 수준이 시간에 따라 다를 경우/차분=2 : 원계열의 수준과 기울기가 시간에 따라 다를 경우 – 시계열의 분산이 일정하지 않을 경우를 non-stationary variance라 하며, 이러한 경우 원계열에 자연대수

(natural logarithm)를 취하면 됨

– 일반적으로 성장률의 개념으로 생각하는 시계열(예 : GDP, Money, Price)은 자연대수를 취하는데 이러한 시계열은 자연대수를 취한 후 차분여부를 결정해야 함

5.안정성 및 Wold Decomposition

(14)
(15)

(2) Wold Decomposition

- 모든 안정적인 확률과정은 다음과 같이 확정적 요소(deterministic component)와 확률적 요소(stochastic component)의 합으로 나타낼 수 있음

𝒀𝒕 = 𝝁 + 𝒆𝒕 + 𝚿𝟏 𝒆𝒕−𝟏+ 𝚿𝟐𝒆𝒕−𝟐+ ⋯ 단, 𝒆𝒕 ~i.i.d(0,𝝈𝟐) -- --- (평균) (현재 및 과거의 충격)

- 현재의 𝒀𝒕는 평균(𝝁)과 현재 및 과거의 충격(shock)으로 나타낼 수 있는데 이를 Wold Representation이라 고 함

- 충격의 백색잡음과정의 가정 외에 V𝒂𝒓(𝒀𝒕) = 𝝈𝟐 + 𝝍𝟏𝟐 𝝈𝟐 + ⋯ = 𝝈𝟐 𝒊=𝟎 𝚿𝒊𝟐 < ∞ (finite variance)를

(16)

- 안정적인 확률과정 𝒚𝒕의 평균, 분산, 자기공분산, 자기상관, 편자기상관은 다음과 같이 추정

∙ 표본평균 :

∙ 표본분산 :

∙ 표본자기공분산 :

∙ 표본자기상관함수 :

∙ 표본편자기상관함수 :

3.자기상관함수 및 편자기상관함수

(17)

- 교차 및 시차상관계수는 t기의 특정(기준)변수 x의 값(𝒙𝒕)과 t+k기에 관찰된 y값(𝒚𝒕+𝒌) 간의 상관관계의 정도 를 나타냄

- k=0인 경우 즉, 𝜸𝟎인 경우를 교차상관계수(cross correlation coefficient)라고 하고, k≠0인 경우 를 시차상관계수(leads and lags correlation라고도 함

- 교차상관계수 해석

∙ 𝜸𝟎> 0 : 두 변수들이 서로 같은 방향으로 변화(pro-cyclical:경기순응)

∙ 𝜸𝟎< 0 : 두 변수들이 서로 반대 방향으로 변화(counter-cyclical:경기역행)

∙ 𝜸𝟎 = 0 : 두 변수들이 서로 경기중립적 - 시차상관계수 해석

∙ 𝜸𝒌의 값이 최대가 되는 시차 k가 양(+)이면 해당변수 𝒚𝒕는 𝒙𝒕의 후행지표

∙ 𝜸𝒌의 값이 최대가 되는 시차 k가 음(-)이면 해당변수 𝒚𝒕는 𝒙𝒕의 선행지표

∙ 𝜸𝒌의 값이 최대가 되는 시차 k가 0이면 해당변수 𝒚𝒕는 𝒙𝒕와 동행지표

∙ 만약에 k=2에서 𝜸𝒌의 값이 최대이면, (y가 GDP 뒤따라 변하는 후행지표)

∙ 만약에 k=-2에서 𝜸𝒌의 값이 최대이면, (y가 GDP보다 먼저 변하는 선행지표)

연도 2001 . . 2010

GDP(𝒙𝒕) 𝒙𝟏 . . 𝒙𝟏𝟎 해당변수(𝒚𝒕) 𝒙𝟏 . . 𝒙𝟏𝟎

7.교차상관계수 및 시차상관계수

(18)

(실증분석 예 : 우리나라 경기변동의 실증분석)

- 표준편차 : 변동성(volatility)측정

- 상대적 표준편차 : GDP에 대한 상대적 변동성 측정

- 자기상관계수(autocorrelation) : 경기변동의 지속성 측정

- 교차상관계수(cross correlation): GDP와의 동행성(comovement) 측정

∙ 경기순응적(pro-cyclical) / 경기중립적(a-cyclical) / 경기역행적(counter-cyclical) - 시차상관계수(leads and lags correlation):GDP에 대한 선행성 측정

∙ 경기선행적(leading) / 경기동행적(coincident) / 경기후행적(lagging)

(19)

(1) 모형

AR(1) 𝒚𝒕 = ∅𝟏𝒚𝒕−𝟏+ 𝒆𝒕 , 𝒆𝒕~𝒊𝒊𝒅𝑵(𝟎, 𝝈𝒆𝟐)

AR(p) 𝒚𝒕 = 𝝁 + ∅𝟏𝒚𝒕−𝟏+ ∅𝟐𝒚𝒕−𝟐+ ⋯ + ∅𝒑𝒚𝒕−𝒑 + 𝒆𝒕 , 𝒆𝒕~𝒊𝒊𝒅𝑵(𝟎, 𝝈𝒆𝟐)

(2) AR(1)

① ACF

- 반복적인 대입을 통해 𝒚𝒕를 교란항의 함수로만 표현해 보면(𝒚𝟎 = 𝟎)

8.AR(p) 모형

(20)

- 𝒚𝒕의 평균, 분산 및 공분산을 구해 보면 다음과 같음

(21)

- 따라서 다음과 같이 𝝆𝟎, 𝝆𝟏,…,𝝆𝒌를 구할 수 있음

- 이를 그래프로 나타낸 것을 상관도(correlogram)라 하며 이를 이용하여 시계열의 안정성여부를 판단할 수 있음

- 시계열이 안정적이면(∅→0), ACF는 급격하게 0을 향해 감소하고 시계열이 불안정적이면(∅→1), ACF는 0을 향해 천천히 감소함

(22)

- k 이외의 모든 시차를 갖는 관측치(𝒚𝒕−𝟏, 𝒚𝒕−𝟐,…,𝒚𝒕−𝒌+𝟏)의 영향력을 배제한 가운데 특정의 두 관측치, 𝒚𝒕 및 𝒚𝒕−𝒌가 얼마나 관련이 있는 지 나타내는 척도로 회귀계수가 편자기상관함수가 됨

- 즉,

- 시차 k의 편자기상관계수는 다음 식에서 k번째 회귀계수 ∅𝒌𝒌를 의미함

② PACF

(23)

③ 식별

- ACF가 점진적으로 감소하면 불안정시계열이므 로 원계열을 차분하여 안정시계열로 만들어 줌

- ACF가 0을 향해 감소하고 PACF는 1-2개 정도 만 통계적으로 유의하면 AR모형

(24)
(25)

④ 추정

- 일반적으로 AR 모형은 최소자승법으로 추정하고 MA 모형은 비선형최소자승법으로 추정 - 두 모형 모두 최우법으로 추정하기도 함

(26)

⑤ 모형의 검토

- 잔차분석 : 모형설정이 제대로 되었으면 잔차항은 백색잡음확률과정을 따를 것임

(27)

(1) 모형

MA(1) 𝒚𝒕 = 𝒆𝒕-𝜽𝒆𝒕−𝟏 , 𝒆𝒕~𝒊𝒊𝒅𝑵(𝟎, 𝝈𝒆𝟐)

MA(q) 𝒚𝒕 = 𝒆𝒕-𝜽𝟏𝒆𝒕−𝟏-𝜽𝟐𝒆𝒕−𝟐-…-𝜽𝒒𝒆𝒕−𝒒 , 𝒆𝒕~𝒊𝒊𝒅𝑵(𝟎, 𝝈𝒆𝟐)

(2) MA(1)

① ACF

- 𝒚𝒕의 평균, 분산, 공분산 및 ACF를 구해 보면 다음과 같음

9.MA(q) 모형

(28)

② 식별

- PACF는 0을 향해 감소하고 ACF는 1 - 2개 정도만 통계적으로 유의하면 MA모형

(29)
(30)

③ 추정

④ 모형의 검토

- 잔차분석 : 모형설정이 제대로 되었으면 잔차항은 백색잡음확률과정을 따를 것임

(31)

(1) 모형

ARMA(1,1) 𝒚𝒕 = 𝝁 + 𝝓 𝒚𝒕−𝟏 + 𝒆𝒕-𝜽𝒆𝒕−𝟏 , 𝒆𝒕~𝒊𝒊𝒅𝑵(𝟎, 𝝈𝒆𝟐)

ARMA(p,q) 𝒚𝒕 = 𝝁 + 𝝓𝟏 𝒚𝒕−𝟏+ 𝝓𝟐𝒚𝒕−𝟐 + ⋯ + 𝝓𝒑𝒚𝒕−𝒑 + 𝒆𝒕-𝜽𝟏𝒆𝒕−𝟏-𝜽𝟐𝒆𝒕−𝟐-…-𝜽𝒒𝒆𝒕−𝒒 , 𝒆𝒕~𝒊𝒊𝒅𝑵(𝟎, 𝝈𝒆𝟐)

(2) ARMA(1,1)

① 식별

- ACF는 시차 q(=1)까지는 0과 현저히 다르고, 그 이후는 AR(p)처럼 점차적으로 소멸함

- PACF는 시차 p(=1까지는 0과 현저히 다르고, 그 이후는 MA(q)처럼 점차적으로 소멸함

10.ARMA(p,q) 모형

(32)

확률과정 acf pacf

AR 점차적으로 0으로 수렴함 (tail off)

시차 p까지만 0과 현저히 다르고 이후 0으로 갑자기 이동 (즉, 마지막 스파이크의 시차길이는 AR의 차수와 동일) (cuts off after lag p)

MA

시차 q까지만 0과 현저히 다르고 이후 0으로 갑자기 이동 (즉, 마지막 스파이크의 시차길이는 MA의 차수와 동일) (cuts off after lag q)

점차적으로 0으로 수렴함 (tail off)

ARMA 시차 q까지는 0과 현저히 다르고,

그 이후는 AR(p)처럼 점차적으로 소멸함

시차 p까지는 0과 현저히 다르고,

그 이후는 MA(q)처럼 점차적으로 소멸함 white

noise 모든 시차에 대해 0 모든 시차에 대해 0

주요확률과정의 acf와 pacf (요약)

참조

관련 문서

• 기존 battery는 대용량, 장주기 에너지 저장에 한계가 있으며 기술 대안들은 여전히 경 제성에 문제가 있음.. • Isotope energy storage, 용윰염전지

환경기술 적용 방법에 따른 이산화 탄소 감소량 예측...

그러나 국가적 차원의 평생학습 관련 정책을 수립하고 추진하기 위해서 는 평생학습의 현황에 대한 정확한 진단과 그것을 토대로 한 미래의 예측 이 전제되어야만

수치모델에서 인천공항 안개 예측 시 나타난 습도와 바람의 공통적인 수치적 특 징은 상대습도는 9 8%로 과대모의 경향을 보였고,풍속은 2∼3kt 로 과소모의 경향

장치의 운전에 앞서 장치에 부착된 각각의 계측기의 값과 통신으로 송신된 계측값의 오차 여부를 확인하기 위하여 표준 계측 장비에 의하여 오차를

• 즉 , 기술적 분석기법은 환율의 수요와 공급에 영향을 미 치는 외부요인보다는 이들 외부요인들의 영향으로 나타 난 환율의 행태 자체를 분석함으로써 미래환율을 예측하

백수오의 약효성분으로 Polyoxypregnane glycoside가 존재하며, 당도 다른 강심 배당체에 들 어 있는 Cymarosere가 존재하기 때문에 강심배당체로서의

 authors와 books를 authors의 surname 값과 books의 name 값이 같은 자료를 한 행으로 하여 합친다... 사용예를