• 검색 결과가 없습니다.

Financial time series forecasting using AdaBoost-GRU ensemble model

N/A
N/A
Protected

Academic year: 2021

Share "Financial time series forecasting using AdaBoost-GRU ensemble model"

Copied!
15
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

2021, 32

(

2)

,

267–281

AdaBoost-GRU 앙상블 모형을 이용한 금융 시계열 예측

ᅢᄋ

1

· ᄋᆷᄃᆼᄒ

2

12ᆼᄉᆼ대ᄒᆨ교 ᄌᆼ보톄ᄒᆨᄀ

ᄌ ᅥ

ᆸᄉ ᅮ 2020ᄂ ᅧ ᆫ 11ᄋ ᅯ ᆯ 25ᄋ ᅵ ᆯ, ᄉ ᅮᄌ ᅥ ᆼ 2020ᄂ ᅧ ᆫ 12ᄋ ᅯ ᆯ 29ᄋ ᅵ ᆯ, ᄀ ᅦᄌ ᅢ ᄒ ᅪ ᆨᄌ ᅥ ᆼ 2021ᄂ ᅧ ᆫ 1ᄋ ᅯ ᆯ 3ᄋ ᅵ ᆯ

요 약

ᄋ ᅵ

ᆯᄇ ᅡ ᆫᄌ ᅥ ᆨᄋ ᅳᄅ ᅩ ᄀ ᅳ ᆷᄋ ᅲ ᆼ ᄉ ᅵᄀ ᅨᄋ ᅧ ᆯ (financial time series) ᄋ ᅨᄎ ᅳ ᆨᄋ ᅳ ᆫ ᄇ ᅵᄉ ᅥ ᆫᄒ ᅧ ᆼᄉ ᅥ ᆼ (non-linearity)ᄀ ᅪ ᄇ ᅮ ᆯ ᄀ ᅲᄎ ᅵ ᆨ ᄉ ᅥ

ᆼ(irregularity)ᄋ ᅳᄅ ᅩ ᄋ ᅵ ᆫᄒ ᅢ ᄆ ᅢᄋ ᅮ ᄋ ᅥᄅ ᅧᄋ ᅮ ᆫ ᄋ ᅵ ᆯᄋ ᅵᄃ ᅡ. ᄇ ᅩ ᆫ ᄂ ᅩ ᆫᄆ ᅮ ᆫ ᄋ ᅦᄉ ᅥᄂ ᅳ ᆫ ᄀ ᅳ ᆷᄋ ᅲ ᆼ ᄉ ᅵᄀ ᅨᄋ ᅧ ᆯ ᄋ ᅨᄎ ᅳ ᆨᄋ ᅳ ᆯ ᄋ ᅱᄒ ᅢ AdaBoost ᄋ

ᆯᄀ ᅩᄅ ᅵᄌ ᅳ ᆷ ᄀ ᅪ GRU ᄆ ᅩᄒ ᅧ ᆼᄋ ᅳ ᆯ ᄀ ᅧ ᆯᄒ ᅡ ᆸᄒ ᅡ ᆫ ᄒ ᅡᄋ ᅵᄇ ᅳᄅ ᅵᄃ ᅳ ᄋ ᅡ ᆼᄉ ᅡ ᆼᄇ ᅳ ᆯ ᄒ ᅡ ᆨᄉ ᅳ ᆸ ᄇ ᅡ ᆼᄇ ᅥ ᆸ (hybrid ensemble learning ap- proach)ᄋ ᅳ ᆯ ᄌ ᅦᄋ ᅡ ᆫᄒ ᅡᄀ ᅩᄌ ᅡ ᄒ ᅡ ᆫᄃ ᅡ. ᄋ ᅧᄀ ᅵᄉ ᅥ GRU ᄆ ᅩᄒ ᅧ ᆼᄋ ᅳ ᆫ LSTM (long short term memory) ᄆ ᅩᄒ ᅧ ᆼᄀ ᅪ ᄒ ᅡ ᆷᄁ ᅦ ᄉ

ᅵᄀ ᅨᄋ ᅧ ᆯ ᄋ ᅨᄎ ᅳ ᆨ ᄋ ᅦ ᄂ ᅥ ᆯᄅ ᅵ ᄉ ᅡᄋ ᅭ ᆼ ᄃ ᅬᄂ ᅳ ᆫ RNN (recurrent neural network)ᄋ ᅴ ᄇ ᅧ ᆫᄒ ᅧ ᆼ ᄆ ᅩᄒ ᅧ ᆼᄋ ᅵᄃ ᅡ. ᄋ ᅮᄅ ᅵᄂ ᅳ ᆫ KOSPI ᄃ

ᅦᄋ ᅵᄐ ᅥᄋ ᅪ ᄋ ᅯ ᆫ/ᄃ ᅡ ᆯᄅ ᅥ ᄒ ᅪ ᆫᄋ ᅲ ᆯ ᄀ ᅪ ᄀ ᅡ ᇀᄋ ᅳ ᆫ ᄀ ᅳ ᆷᄋ ᅲ ᆼ ᄉ ᅵᄀ ᅨᄋ ᅧ ᆯ ᄃ ᅦᄋ ᅵᄐ ᅥᄅ ᅳ ᆯ ᄀ ᅡᄌ ᅵᄀ ᅩ ᄌ ᅦᄋ ᅡ ᆫ ᄃ ᅬ ᆫ ᄆ ᅩᄃ ᅦ ᆯᄋ ᅳ ᆯ ᄑ ᅧ ᆼᄀ ᅡᄒ ᅡᄀ ᅩᄌ ᅡ ᄒ ᅡ ᆫᄃ ᅡ. ᄉ ᅥ ᆼᄂ ᅳ ᆼᄉ ᅵ ᆯ ᄒ

ᆷ ᄀ ᅧ ᆯᄀ ᅪ ᄌ ᅦᄋ ᅡ ᆫ ᄃ ᅬ ᆫ AdaBoost-GRU ᄋ ᅡ ᆼᄉ ᅡ ᆼᄇ ᅳ ᆯᄋ ᅳ ᆫ 3ᄀ ᅡᄌ ᅵ ᄎ ᅥ ᆨᄃ ᅩ ᄌ ᅳ ᆨ, MAE, MSE ᄆ ᅵ ᆾ RMSE ᄎ ᅥ ᆨᄃ ᅩᄋ ᅦᄉ ᅥ ᄀ ᅵᄌ ᅩ ᆫ ᄋ ᅴ ARIMA ᄆ ᅩᄒ ᅧ ᆼ, LSTM ᄆ ᅩᄒ ᅧ ᆼ, GRU ᄆ ᅩᄒ ᅧ ᆼ, ᄀ ᅳᄅ ᅵᄀ ᅩ Adaboost-LSTM ᄋ ᅡ ᆼᄉ ᅡ ᆼᄇ ᅳ ᆯ ᄇ ᅩᄃ ᅡ ᄌ ᅩ ᇂᄋ ᅳ ᆫ ᄉ ᅥ ᆼᄂ ᅳ ᆼᄋ ᅳ ᆯ ᄇ ᅩᄋ ᅧ ᆻᄃ ᅡ.

ᅳᄅ ᅵᄀ ᅩ Adaboost-LSTM ᄆ ᅩᄒ ᅧ ᆼᄀ ᅪᄋ ᅴ ᄎ ᅥᄅ ᅵᄉ ᅩ ᆨ ᄃ ᅩ ᄆ ᅧ ᆫᄋ ᅦᄉ ᅥ ᄌ ᅦᄋ ᅡ ᆫ ᄃ ᅬ ᆫ AdaBoost-GRU ᄆ ᅩᄒ ᅧ ᆼᄋ ᅵ ᄈ ᅡᄅ ᅳ ᆷᄋ ᅳ ᆯ ᄋ ᅡ ᆯ ᄉ ᅮ ᄋ ᅵ

ᆻᄋ ᅥ ᆻᄃ ᅡ.

ᅮᄋ ᅭᄋ ᅭ ᆼ ᄋ ᅥ: AdaBoost-GRU ᄋ ᅡ ᆼᄉ ᅡ ᆼᄇ ᅳ ᆯ, ᄀ ᅳ ᆷᄋ ᅲ ᆼ ᄉ ᅵᄀ ᅨᄋ ᅧ ᆯ, ᄃ ᅵ ᆸᄅ ᅥᄂ ᅵ ᆼ.

1. 서론

ᆷ이ᄌᆼᄋᆼ제 ᄉᆼ, ᄌᆼ치ᄌᆨ 사ᄀᆫ, ᆷ우자자듸 기대 돠 ᄀᇀ여러 요ᄋᆫ에 의해 ᄋᆼᄒᆼᄋᆮᄂ

ᅡ. 따라ᄉᆷᄋ ᅵ계ᄋᆯ (financial time series) 예ᄎᆨᄋᆫ ᄋᆯᄇᆫᄌᆨ으로 비ᄉᆫᄒᆼᄉᆼ (non-linearity)과 뷰ᄎ

ᆼ (irregularity)으로 ᄋᆫ해 가ᄌᆼ 어려ᄋᆨᄋᆸ 자나로 ᄀᆫ자 (Yu ᄃᆼ, 2009).

ᅡ지 ARIMA (autoregressive integrated moving average) 모ᄒᆼ, VAR (vector auto-regression)

ᅩᄒᆼ, ECM (error correction model) 모ᄒᆼ ᄀᇀᄋᆭᄋᆫ ᄋᆯᄇᆫᄌᆨᄋᆫ 계ᄅᆼ ᄀᆼ제ᄒᆨ ᄆᆾ 톄 모ᄃᆯᄋᆷ이ᄀ

ᆯ 예차네 ᄌᆨ외ᄋᆻ다. 그러나 기즤 ᄇᆼᄇᆸᄃᆯᄋ ᆷ이계ᄋᆯ의 비ᄉᆫᄒᆼᄉᆼ과 ᄇᆸᄉᆼ애ᄀᆯ하지 ᄆ

ᆷ으로써 예ᄎᆼ호가 ᄄᆯ어ᄌᆻ다 (Sun ᄃᆼ, 2018).

ᅡᄅ ᆷ퓨터 기ᄉ ᆯᄃᆯ로 ᄋᆫ하여 머ᄉᆫ러ᄂᆼ (machine learning)ᄋ ᆷᄋ ᅵ계ᄋᆯ 예ᄎ ᆯᄋ

ᅩ ᄋᆻ다. 여기서 머ᄉᆫ러ᄂᆼ이ᄅᆫ ᄏᆷ퓨터ᄅᆯ ᄋᆫᄀᆫ처ᄅᆷ ᄒᆨ시켜, 스스로 규ᄎᆨᄋ ᆼᄉᆼ하도ᄅ ᅡᄂ ᅵᄉᆯᄋ

ᆯ하네 대표ᄌᆨᄋᆫ ᄇᆼᄇᆸ으로ᄂᆫ ᄋᆫᄀᆼ ᄉᆫᄀᆼᄆᆼ (ANN: Artificial Neural Networks)과 서포트 ᄇᆨ터 회ᄀ (support vector regression) 디 ᄋᆻ다. ᄋᆫᄀᆼ ᄉᆫᄀᆼᄆᆼ아ᄅᆷ의 두뇌가 의사 ᄀᆯᄌᆼ하ᄂᆼ태로ᄇᆼ하ᄋ

ᅲ하ᄂᆼᄇᆸ으로 과대ᄌᆨᄒᆸ (over-fitting)과 고최ᄌᆨ화 (local optimization) 듸 ᄒᆫ계ᄌᆷᄋᆽ고 ᄋ

ᅡ. 그리고 서포트 ᄇᆨ터 회귀ᄂᆨ솨ᄌᆼ에서 마ᄌᆫ (margin)외대화하ᄂ ᅩᄑᆼᄆᆫ (hyperplane)ᄋ

ᆼᄒᆫ 후 새로에이터례차ᄂᆼᄇᆸ으로 ᄋᆫᄀᆼ ᄉᆫᄀᆼᄆᆼ에서 비해 과대ᄌᆨᄒᆸ이 ᄃᆯ하고 예츼 ᄌᆼ호ᄀ

ᅳ나 매개ᄇᆫ수 ᄀᆯᄌᆼ과 ᄀᆯ과에 대ᄒᆫ ᄉᆯᄆᆼᄅᆨ이 ᄄᆯ어ᄌᆫ다ᄂᆫᄌᆷ이 ᄋᆻ다 (Rundo ᄃᆼ, 2019).

1

(52828) ᄀ ᅧ ᆼᄂ ᅡ ᆷ ᄌ ᅵ ᆫᄌ ᅮᄉ ᅵ ᄌ ᅵ ᆫᄌ ᅮᄃ ᅢᄅ ᅩ 501, ᄀ ᅧ ᆼᄉ ᅡ ᆼᄃ ᅢᄒ ᅡ ᆨᄀ ᅭ ᄌ ᅥ ᆼᄇ ᅩᄐ ᅩ ᆼ ᄀ ᅨᄒ ᅡ ᆨᄀ ᅪ, ᄒ ᅡ ᆨᄇ ᅮᄌ ᅩ ᆯᄋ ᅥ ᆸ.

2

ᄀ ᅭᄉ ᅵ ᆫᄌ ᅥᄌ ᅡ: (52828) ᄀ ᅧ ᆼᄂ ᅡ ᆷ ᄌ ᅵ ᆫᄌ ᅮᄉ ᅵ ᄌ ᅵ ᆫᄌ ᅮᄃ ᅢᄅ ᅩ 501, ᄀ ᅧ ᆼᄉ ᅡ ᆼᄃ ᅢᄒ ᅡ ᆨᄀ ᅭ ᄌ ᅥ ᆼᄇ ᅩᄐ ᅩ ᆼ ᄀ ᅨᄒ ᅡ ᆨᄀ ᅪ/ᄇ ᅡᄋ ᅵᄋ ᅩᄋ ᅴᄅ ᅭᄇ ᅵ ᆨᄃ ᅦᄋ ᅵᄐ ᅥᄒ ᅡ ᆨᄀ ᅪ, ᄀ ᅭᄉ ᅮ ᄆ ᅵ

ᆾ RINS. E-mail: [email protected]

(2)

ᆫ 더 ᄆᆭ이 이외고 ᄋᆻᄂᆫ ᄃᆸ러ᄂᆼ (deep learning)ᄋ ᅥᄉᆫ러ᄂᆼ 기싀 ᄒᆫ 뱌로, ᄋᆫᄀᆼᄉᆫᄀᆼᄆ

ᅦ 기ᄇᆫᄋᆯ ᄃᆫ ᄉᆷᄎᆼᄉᆫᄀᆼᄆᆼ (deep neural network)으로 다ᄋᆼᄒᆫ 뱌에서 뛰어ᄂᆫ ᄉᆼᄂᆼᄋ ᅩ이고 ᄋᆻᄃ (Dengᅪ Yu, 2014; Lee, 2017; Song ᄃᆼ, 2020; Kim ᄃᆼ, 2020). ᄃᆸ러ᄂᆼ 모ᄒᆼ ᄌᆼ RNN (recurrent neural network)이계ᄋᆯ 데이터에 토ᄒᆼ으로 기즤 ᄋᆫᄀᆼ ᄉᆫᄀᆼᄆᆼ 모ᄒᆼ보다 ᄂᇁ예ᄎᆨᄅᆨᄋᆽ고 ᄋᆻ으ᄂ

ᆼ기의ᄌᆫᄉᆼ (Long-Term Dependency) 메ᄅᆽ고 ᄋᆻ다 (Hewamalage ᄃᆼ, 2021). LSTM (long short- term memory)ᅪ GRU (gated recurrent unit)ᄋᆫ RNNᅴ ᄌᆼ기의ᄌᆫᄉᆼ (Long-Term Dependency) ᄆ

ᅢᄀᆯ하기 위해 고ᄋᆫ되ᄋᆻ으며, ᄆᆭ이계ᄋᆯ 예체 LSTM과 GRU 모ᄒᆼ이 이외고 ᄋᆻ다. LSTMᄀ GRUᅩᄒᆼ 비교에서 GRU 모ᄒᆼᄋᆫ LSTMᅩᄒᆼ보다 ᄀᆫᄃᆫᄒᆫ 구조와 ᄌᆨ예ᄉᆫ시ᄀᆫ 그리고 데이터에 따ᄅ

ᇂᄋᆼᄂᆼ오ᄋᆫ다 (Chung, ᄃᆼ, 2014).

ᆫ ᄂᆫ메서ᄂᆫ AdaBoost ᆯ고리좌 GRU ᄃᆸ러ᄂᆼᄋᆯᄒᆸᄒᆫ 하이브리드 ᄋᆼᄉᆼᄇᆨᄉ ᆼᄇᆸ (hybrid ensemble learning approach)에ᄋᆫᄒᆫ다. ᄆᆫ저, GRU 모ᄒᆼᄋᆫ AdaBoost ᆯ고리제 의해 ᄋᆮ어ᄌᆫ ᄇ

ᅳ트ᄅᆸ ᄉᆷᄑᆯ (bootstrapped samples)ᄋ ᅡ아여 ᄒᆫᄅᆫ다. 다ᄋᆷ, AdaBoostᆯ고리ᄌᆷᄋᆨ GRU ᄆ

ᆼ의 ᄋᆼᄉᆼ바지 (ensemble weights)ᄅᆮ기 위해 ᄌᆨᄋᆼ다. 새로에이터에 대해 예차네 제ᄋ

AdaBoost-GRUᆼᄉᆼ보ᄒᆼ오ᄃᆫ GRUᅩᄒᆼ의 예ᄎᆯ과에 대해 ᄋᆼᄉᆼ바지ᄅᆯᄒᆸ하여 최ᄌ

ᆯ과ᄅᆮ나.

ᅦᄋAdaBoost-GRU ᆼᄉᆼ보ᄒᆼ의 ᄉᆼᄂᆼ가ᄅ ᅱ해 기즤 ARIMA 모ᄒᆼ, LSTM 모ᄒᆼ, GRU

ᅩᄒᆼ과 기즤 AdaBoost-LSTM ᄋᆼᄉᆼᄇ ᅩᄒᆼᄋ ᅩ려하ᄋᆻ으며 2가ᄌ ᆷᄋ ᅵ계ᄋᆯ 데이터 ᄌᆨ, KOSPI

ᅦ이터, ᄋᆫ/ᆯᄅ ᆫᄋ ᅦ이터ᄅ ᅡ지고 3가지 ᄎᆨ도 ᄌᆨ, MAE, MSE ᄆᆾ RMSE에서 ᄑᆼ가하고자 ᄒᆫᄃ (Saigalᅪ Mehrotra, 2012; Wang ᄃᆼ, 2018).

ᆫ ᄂᆫᄆᆫ아와 ᄀᇀ이 구ᄉᆼ되어 ᄋᆻ다. 제 2ᄌᆯ에서ᄂᆫᄅᆫ ᄋᆫ구로서 AdaBoost ᄋᆯ고리좌 GRU ᄆ

ᆼ에 대해 늬하고, 제 3ᄌᆯ에서ᄂᆫ AdaBoost-GRU ᆼᄉᆼᄇᆨᄉᆼᄇᆸ에 대해 늬ᄒᆫ다. 제 4ᄌᆯ에서ᄂ

ᆼᄂᆼᄉᆯᄒᆷ에서 ᄌᆼᄉᆼᄌᆨᄋᆫ 비교와 MAE, MSE ᄆᆾ RMSE ᄎᆨ도 하에서 ᄌᆼᄅᆼᄌᆨᄋᆫ 비교, 그리고 AdaBoost- GRUᅩᄒᆼ과 AdaBoost-LSTM 모ᄒᆼ과의 처리소리교ᄒᆫ다. 제 5ᄌᆯ에서 ᄀᆯᄅᆫᄋᆽ나.

2. 관련연구

2.1. AdaBoost 알고리즘

Freundᅪ Shapire (1997)가 처으로 이ᄌᆫ 뷰 메에 AdaBoost ᄋᆯ고리ᄌᆷ에ᄋᆫ하ᄋᆻ다.

AdaBoost ᆯ고리ᄌᆷᄋ ᅨᄎᆨᄅᆨ이 ᄋᆨᄒᆫ 뷰기 (weak classifier)ᄃᆯᄋ ᆯᄒᆸ하여 ᄀᆼᄒᆫ 뷰기 (strong classifier)ᄅᆫ드ᄂᆺ이다. 여기서 ᄋᆨᄒᆫ 뷰기ᄅᆫ ᄅᆫᄃᆷ하게 예차ᄂᆺ보다 ᄋᆨᄀᆫ ᄌᇂ예ᄎᆨᄅᆨᄋᆽᄀ

ᆻᄂᆫ 뷰기이고 ᄀᆼᄒᆫ 뷰기ᄅᆫ 예ᄎᆨᄅᆨ이 최ᄌᆨ에 가까ᄋᆫ 뷰기ᄅᆯᄒᆫ다.

AdaBoostᆯ고리ᄌᆷᄋᆨ소기에 모데이터가 추ᄎᆯᄃᆯ ᄒᆨᄅᆯᄋᆫ ᄃᆼᄋᆯᄒᆫ ᄉᆼ태에서 시ᄌᆨ하지ᄆᆫ, ᄇ

ᅡ ᄌᆯ ᄆᆺ데이터누ᄎᆯᄃᆯ ᄒᆨᄅᆯᄋᆯ 자시키고, 뷰가 제이터누ᄎᆯᄃᆯ ᄒᆨᄅᆯᄋᆷ소시키ᄆᆫ서 ᄃ

ᅵ터가 추ᄎᆯᄃᆯ ᄒᆨᄅᆯ애조ᄌᆼ하ᄆᆫ서 ᄇᆫᄇᆨ시 이루어ᄌᆫ다. 이에 대ᄒᆫ ᄉᆯᄆᆼ아와 ᄀᇀ다.

D = {(xxx111, y1), (xxx222, y2), ..., (xxxnnn, yn)} , xxxiii ∈ Rk, yi ∈ {−1, +1}ᄋᆯ ᄒᆫᄅᆫᄋ ᅦ이터의 ᄌᆸᄒᆸ이라 하ᄀ

ᆨ 데이터가 추ᄎ ᆨᄅᆯᄋᆯ w1, w2, ..., wnᅵ라 하자. 처ᄋ ᆨ 데이터가 추ᄎᆯᄃ ᆨᄅᆯᄋᆫ ᄃᆼᄋᆯ하다. ᄌᆨ, w(1)i =n1, i = 1, ..., n. ᅧ기서 브트ᄅᆸ 표븨 수ᄅᆯ Mᅡ 하고 ᄀᆨᄀᆨ의 브트ᄅᆸ 표베서 구ᄒᆫ 뷰ᄀ

ᆯ C1, C2, ..., CMᅵ라 하자. 그러ᄆᆫ 뷰기 Cmᅴ 오뷰ᄋᆯ (miss-classification error) ϵmᅡ와 ᄀ

ᅵ 계ᄉᆫᄒᆫ다.

(3)

ϵm= Pn

i=1w(m)i I(Cm(xxxiii) ̸= yi) Pn

i=1wi

, m = 1, ..., M,

ᅧ기서 ϵmᆫ 뷰기 Cmᅦ 의해 ᄀᆨ 데이터의 오뷰에 대하여 데이터가 추ᄎᆯᄃᆫ ᄒᆨᄅᆯ아ᄌᆹ으로 ᄒ

ᅩ뷰이다. 뷰기 Cmᅴ ᄉᆫ뢰도 (confidence) αmᅡ와 ᄀᇀ이 ᄀᆯᄌᆼᄒᆫ다.

αm=1

2ln1 − ϵm

ϵm

, m = 1, ..., M,

ᅧ기서 αmᆫ 뷰기 Cmᅡ ᄀᆯᄒᆸᄒᆯ 때 죠도ᄅᆯᄌᆼ하나지 ᄋᆨᄒᆯᄋᆫ다.

w(m)i ᆯ mᄇᆫ째 브트ᄅᆸ 표븨 추ᄎ ᆨ리라고 ᄒᆯ 때 (m + 1)ᄇᆫ째 브트ᄅᆸ 표븨 추ᄎ ᆨᄅ w(m+1)i ᅡ와 ᄀᇀ이 계ᄉᆫᄒᆫ다.

wi(m+1)= w(m)i exp(−αmyiCm(xi)) Zm

,

ᅧ기서 Zmᆼ규화 ᄉᆼ수로서 다ᄋᆷᄋᆫᄌᆫ다.

Zm=

n

X

i=1

wi(m)exp(−αmyiCm(xi)).

ᅢ로에스트 데이터 xxxiii∈ Rkᅦ 대해 ᄉᆼᄉᆼᄃMᅢ의 뷰기ᄅᆯᄒᆸ하여 최ᄌᆼ 뷰기 C(xxx)아ᄋ

ᇀ다.

C(xxx) = sign(

M

X

m=1

αmCm(xxx)),

ᅧ기서 C(xxx)ᄋᆨ 뷰기에 대ᄒᆫ 죠도 αmᅡ지ᄅᆫᄋᆼ하여 ᄋᆮ아ᄌᆼᄀᆯᄒᆸᄉᆨ이다.

2.2. GRU 모형

GRUᅩᄒᆼ이즤 LSTM 모ᄒᆼ의 ᄇᆫᄒᆼ도ᄒᆼ이며 Figure 2.1의 구조라지고 ᄋᆻ다.

Figure 2.1ᅦ서 보ᄆᆫ GRU 구조누 개의 gate ᄌᆨ, update gate ztᅪ reset gate rtᅩ 구ᄉᆼ되어 ᄋᆻ다.

ᆷ고로, LSTM 구조네 개의 gate ᄌᆨ, input gate, forget gateᅳ리고 output gate로 구ᄉᆼ되어 ᄋᆻ다.

GRUᅮ조ᄂᆫ LSTMᅮ조와 다르게 output gate가 ᄋᆹ고 update gateᄂᆫ input gateᅪ forget gate의 ᄋ

ᆯ우ᄒᆼᄒᆫ다. 주터 update gate ztᅪ reset gate rtᅴ ᄋᆨᄒᆯ에 대해 ᄉᆯ펴보고자 ᄒᆫ다.

(4)

Figure 2.1 Structure of GRU

ᆫ저, update gate ztᅮᄉᆨᄌᆨ으로 나타내ᄆᆫ ᄉᆨ (2.1)과 ᄀᇀ다.

zt= σ(Wz• [ht−1, xt]), (2.1)

ᅧ기서 xtᆫ재의 ᄋᆸᄅᆨ, Wzᅡ지 ᄒᆼᄅᆯ, ht−1ᅵᄌᆫ state, σ이그모이드 (sigmoid) ᄒᆷ수ᄅ

ᅡᄂᆫ다. 따라서 ztᅵᄌᆫ ᄌᆼ보의 ᄋᆼ이 다이ᄌᆷ으로 어느 ᄌᆼ도 ᄋᆸ데이트(ᄌᆨ, ᄀᆼᄉᆫ, ᄌᆫᄃᆯ)ᆯ ᄀᆺᄋᆫ가ᄅ

ᆯᄌᆼᄒᆫ다.

ᅡᄋᆷ, reset gate rtᅮᄉᆨᄌᆨ으로 나타내ᄆᆫ ᄉᆨ (2.2)과 ᄀᇀ다.

rt= σ(Wr• [ht−1, xt]). (2.2) rt ᅵᄌᆫ ᄌᆼ보의 ᄋᆼ이 다ᄋ ᅵᄌᆷ으로 어느 ᄌᆼ도 리ᄉᆺ(ᄌᆨ, ᅮ시ᄒᆷ, ᄋᆶᄋᆷ)ᄃ ᆺᄋᆫ가ᄅ ᆯᄌᆼᄒᆫ다. ᄉ (2.2)ᄋᆫ ᄉᆨ (2.1)과의 차이나지 ᄒᆼᄅᆯ에 ᄋᆻ다.

Figure 2.1ᅦ서 이ᄃᆯ gate디 ᄌᆨ돠 최ᄌ ᆯ과에 어ᄄᆫ ᄋᆼᄒᆼᄋ ᅵ치니 ᄉᆯ펴보고자 ᄒᆫ다. ᄆᆫ저, reset gate rtᅪ ht−1ᅴ ᄀᆸᄉᆷ ᄋᆫᄉᆫ이 수ᄒᆼ다. 0 ≤ rt ≤ 1이므로 이ᄌᆫ state ht−1ᅴ ᄌᆼ보러느 ᄌ

ᅩ ᄋᆶᄋ ᆺᄋᆫ가ᄅᆯ rtᅦ 의해 ᄀᆯᄌᆼ다. ᄆᆫᄋᆨ rtᅡ 0에 가까ᄋᆹ이ᄆᆫ 이ᄌᆫ state ht−1ᅴ ᄌᆼ보ᄅᆯ ᄋᆶ고,

ᆫᄋᆨ rtᅡ 1에 가까ᄋᆹ이ᄆᆫ 이ᄌᆫ state ht−1ᅴ ᄌᆼ보ᄂᆫ ᄋᆶ지 ᄋᆭ고 보ᄌᆫ다. ᄒᆫ재 기ᄋᆨ ᄋᆼ (current memory content) ˜htᅮᄉᆨᄌᆨ으로 나타내ᄆᆫ 다와 ᄀᇀ다.

h˜t= tanh(W • [rt× ht−1, xt]), (2.3)

ᅧ기서 tanhᄋᆫ tanhᆯᄉᆼ화 ᄒᆷ수이고 -1과 1 사이의 ᄀᆹᄋᆽ나.

ᅡ라서 ᄒᆫ재의 state htᅴ ᄌᆼ보ᄂᆫ update gate라아여 이ᄌᆫ state ht−1ᅴ ᄌᆼ보와 ᄒᆫ재 기ᄋᆨ ᄋ h˜tᅳ로부터 ᄉᆨ (2.4)과 ᄀᇀ이 ᄀᆯᄌᆼᄒᆫ다.

수치

Figure 2.1 Structure of GRU 머 ᆫᄌ ᅥ, update gate z t 을 ᄉ ᅮ시 ᆨ저 ᆨᄋ ᅳᄅ ᅩ ᄂ ᅡᄐ ᅡᄂ ᅢ며 ᆫ 시 ᆨ (2.1)ᄀ ᅪ 가 ᇀᄃ ᅡ
Table 3.1 KOSPI data Variable Description
Figure 3.1 The flowchart of the AdaBoost-GRU ensemble learning approach
Figure 4.1ᄋ ᅳ ᆫ KOSPI ᄃ ᅦᄋ ᅵᄐ ᅥᄋ ᅦᄉ ᅥ ᄌ ᅦᄋ ᅡ ᆫ ᄃ ᅬ ᆫ ᄆ ᅩᄒ ᅧ ᆼᄋ ᅳ ᆯ ᄑ ᅩᄒ ᅡ ᆷᄒ ᅡ ᆫ 5ᄀ ᅡᄌ ᅵ ᄆ ᅩᄒ ᅧ ᆼᄋ ᅦ ᄃ ᅢᄒ ᅡ ᆫ ᄋ ᅨᄎ ᅳ ᆨ ᄀ ᅧ ᆯᄀ ᅪᄅ ᅳ ᆯ ᄇ ᅩᄋ ᅧᄌ ᅮ ᆫ ᄃ ᅡ.
+2

참조

관련 문서

In this paper, we propose the ensemble-based classification model which extracts just new data patterns from the streaming-data by using clustering and

In this paper, we propose a methodology of technology forecasting using the dynamic time warping (DTW) of time series analysis. To illustrate how to apply

We propose a multi-profile ensemble model performed similarity analysis on cyber incident of threat intelligence based on both attack types and cyber

Daily peak load forecasting for electricity demand by time series models, The Korean Journal of Applied Statistics, 26,

The neural network and the time series models (ARMA, ARMAX, ARMA-GARCH, Holt Winters) for wind power generation forecasting were compared based on mean absolute error (MAE).. For

Key words : River stage forecasting, Wavelet packet transform, Time series decomposition, Artificial neural network, Hybrid model.. 특히 국내의 경우 국토의 대부분이

Korea’s performance scale of supercomputing in 2016 was predicted using the proposed forecasting model based on data of the top500 supercomputer and

We introduce a new time series model which is Two-way Seasonality Multiplied Regressive Model (TSMR) to forecast oil cargo volume, which accounts for a