우리나라 단기 가스 소비량 예측에 있어서 Grey Neural Network 활용 가능성 분석
박성준1)· 김진수2)*
An Application of Grey Neural Network for Forecasting Short-term Natural Gas Consumption of Korea
Sungjun Park and Jinsoo Kim
*
(Received 5 October 2015; Final version Received 25 February 2016; Accepted 25 February 2016)
Abstract : Due to recent shale gas boom and recession, natural gas prices are placed at low level. It is thus necessary to establishing new strategy for stable natural gas demand and supply considering changes in energy markets, geopolitical situation, and actions for a climate change. In the light of this, a more accurate forecasting of natural gas consumption is important. Therefore, we setup a Grey Neural Network (GNN) model to forecast Korean natural gas consumption. For empirical analysis, gas consumption data from January 1997 to June 2014 was gathered and a root mean squared error of artificial neural network (ANN), Grey model (GM), hybrid GM-ANN, and GNN models were compared. As a result, the GNN model showed the best forecasting power.
Key words : Forecasting, Gas consumption, Grey neural network, Korea
요 약 : 최근 셰일가스 개발로 인하여 천연가스 공급이 증가한 반면 수요는 침체되어 가격이 많이 하락한 상황이다. 따라서 에너지 시장 변화와 지정학적 영향, 기후변화 대비 전략을 고려하여 보다 안정적으로 가스 수급 전략을 재편할 필요가 있으며, 이를 위하여 보다 정확한 가스 소비량 예측이 중요하다. 이에 본 연구에서는 한국의 단기 가스 소비량 예측을 위하여 Grey 신경망(GNN)을 구성하였다. 1997년 1월~2014년 6월의 월별 가스 소비량 자료로 실증 분석을 수행하였으며, 인공신경망, Grey 모형, GNN, hybrid GM-ANN의 평균제곱근오 차를 비교하였다. 분석 결과 가스 소비량 예측 시 GNN의 설명력이 가장 높은 것으로 나타났다.
주요어 : 예측, 가스 소비, Grey 신경망, 한국
1) 한양대학교 자원환경공학과
*Corresponding Author( 김진수) E-mail; [email protected]
Address; Department of Natural Resources and Environmental Engineering, Hanyang University, Seoul, Korea
서 론
그 동안 여러 연구에서 가스 소비량을 예측하기 위해 다 양한 모형을 적용시켜왔다(Zhang et al., 1998). 그 중에서 인공신경망(Artificial Neural Network, ANN) 모형은 예측 대상에 따라 유연하게 적용이 가능하며 특히 단기 예측에 이점을 가지고 있다(Dahai et al., 2008). 반면 Grey 모형 (Grey Model, GM) 은 원자료가 불완전하거나 불안정하더 라도 좋은 예측 결과를 보이며 중・장기 예측에 이점을 가진 다(Brown et al, 1994). 이에 Dahai 등(2008)은 예측력 향상
을 위해 ANN 모형과 GM을 결합한 Grey 신경망(Grey Neural Network, GNN) 모형을 제시하고 있으며, 분석 결과 ANN, GM 보다 GNN 모형이 동력 부하 예측에서 우수함을 보여 주고 있다. 하지만 GNN 모형은 전력 부하(power load) 예 측에 적용된 사례를 제외하고는 국내・외에서 그 적용 사례 를 찾아보기 어려우며, 이에 본 연구에서 한국의 가스 소비 량 예측에 그 활용 가능성을 살펴보고자 한다.
세계적으로 셰일가스를 비롯한 비전통자원의 등장으로
총 가스매장량이 증가하여 공급은 늘어난 반면 수요가 정
체됨에 따라 원유와 천연가스의 가격은 하락세가 계속되고
있다. 게다가 각 국가의 셰일가스에 대한 관심이 가스 수출
입에도 영향을 미쳐 에너지 시장을 변화시키고 있다(BP,
2015). 미국의 경우 셰일가스와 오일셰일 개발로 인해 작년
원유 및 천연가스 매장량이 소폭 증가하였다. 지속적으로
증가하고 있는 미국의 셰일가스 생산량은 국제 유가와 세
연구논문
계 에너지 시장에 큰 영향을 끼치고 있다(BP, 2015).
경기 침체로 인한 세계적인 수요 정체에도 불구하고 전 세계 1차 에너지 소비는 2035년에 2013년 대비 37%(연평 균 1.4%)가 증가할 것이라 예측하고 있으며, 천연가스 수 요는 아시아 지역, 특히 중국의 성장으로 인해 2035년 까지 연평균 1.9%가 상승하고, 화석연료 중 가장 빠르게 증가할 것으로 전망하고 있다(EIA, 2014). 최근 중국은 에너지 수 요 증가와 환경오염 문제를 해결하기 위해 셰일가스 생산 량을 2020년 까지 연간 13 billion cubic meters(bcm)에서 30 bcm 으로 증가시킬 계획이며, 높은 가스 소비량 때문에 중국은 세계 2번째 셰일가스 생산국임에도 불구하고, 가스 를 수입하고 있는 실정이다(BP, 2015).
BP(2015) 에 따르면 2000년 이후 아시아・태평양 지역의 가스 수요가 증가함에 따라 지역 간 교역이 증가하여, 2020 년대 초 아・태 지역이 유럽을 제치고 가장 큰 가스 수입지 역이 될 것이라 전망하고 있다. 최근 세계 에너지 시장의 약 세에도 불구하고 아시아, 특히 중국과 인도의 경제 성장으 로 세계 에너지 수요는 향후 20년 간 지속적으로 증가할 예 정이다(BP, 2015). 이러한 세계 시장의 변화는 국내에 직・
간접적인 영향을 줄 것으로 보인다(Lee et al., 2013; Shin, 2013; Shin et al., 2013).
한국의 경우, 대부분의 천연가스를 수입하고 있으며 장 기 계약 상태에 놓여 있기 때문에 공급량이 크게 변화하지 않을 것이다. 그에 비해 한국의 천연가스 소비량은 2012년 에 2000년 대비 263%가 증가한 49,955 백만m
3에 이르렀 다(IEA, 2013). 천연가스는 발전과 도시 가스 네트워크(지 역난방, 상업 및 산업 소비)에 사용되고 있으며, 특히, 발전 에 소비되는 가스량이 지난 10년간 크게 증가하였다. 정부 의 장기 에너지 계획에 따른 한국의 총 가스 소비량은 2027 년까지 연평균 약 3.6% 증가할 전망이다(EIA, 2014; Yoon, 2013).
이처럼 전 세계적인 수요 정체에도 불구하고 동북아의 천연가스 수요, 특히 액화천연가스 수요는 견고할 것으로 전망되고 있다. 천연가스 소비 증가에 따라 한국은 에너지 시장 변화와 지정학적 영향을 고려하여 가스 수급 안정성 을 제고할 필요가 있으며, 가스 소비량 예측을 통한 도입계 획의 최적화가 중요해 질 것이라 판단된다. 이에 본 연구는 GNN 모형을 사용하여 한국의 가스 소비량을 예측해보고 자 한다. 이미 많은 연구에서 ANN과 GM을 사용하여 가스 소비량을 예측하고 있다. 회귀 분석 같은 전통적인 확률 모 형의 경우, 자료가 완전하지 않거나 불확실하면 좋은 결과를 예측하기 어려우며, 결과가 정확하다고 할 수 없다(Brown et al., 1994). 반면, ANN은 비모수적(non-parametric) 방법론 이기 때문에 자료의 가정이 요구되지 않는다는 장점을 가 진다.
그 동안 ANN을 사용하여 가스 소비량을 예측하고 기존 계량 모형과 비교한 연구가 다양하게 논의되어 왔다. Brown 등(1994)은 위스콘신 주의 밀워키를 대상으로 ANN을 이 용한 가스 소비량 예측을 시행하였다. 일별 자료를 사용하 였으며, 가스 소비량과 날씨(난방도일, 바람)를 입력자료 로 이용하였다. 결론적으로 전방향 ANN을 사용하였을 때 회 귀 분석에 비해 거의 절반의 값을 가지는 RMSE(root mean square error) 가 산출됨을 보였다. Brown과 Matin(1995)은 위스콘신 가스 회사에서 공급받고 있는 밀워키 2개 지역을 대상으로 가스 소비량을 예측하고 있다. 위 Brown 등(1994) 과 마찬가지로 전방향 ANN을 사용하였고 같은 입력자료 로 분석하였다. 마찬가지로 본 연구에서도 ANN 결과가 회 귀분석에 비해 절반가량 낮은 RMSE가 산출되었으며 두 지역에 대한 위스콘신 가스 회사의 예측 결과보다 오차가 17.8%, 31.3% 가량 감소하였다. Suykens 등(1996)은 벨기 에의 가스 소비량을 월별 기온, 일기 예보와 실제 기온간의 차이, 유가, 지역 난방 수, 산업 소비량을 입력자료로 사용 하여 예측하였으며 ARMA 모형과 비교 분석하였다. 이 논 문은 가스 소비량 예측 시, 가스 소비량 자료를 정규화 시켜 입력 노드(node)로 사용하는 것이 더 좋은 결과를 보인다고 결론짓고 있다. 이상의 연구에서 볼 수 있듯이 ANN 방법론 은 가스 소비량 예측 시 전통적인 확률 모형보다 높은 예측 정확도를 가지고 있음을 시사하고 있다.
또한 다양한 알고리즘을 사용한 ANN 방법론이나 다른 방법론과 결합한 ANN 모형으로 가스 소비량을 예측하고 그 활용 가능성을 제시하는 연구도 진행되어 왔다. Khotanzad 과 Elragal(1999)은 3가지 다른 ANN 모형으로 가스 소비 량 예측을 시행하였다. 이 논문은 가스 소비량, 일 평균 기 온, 일 평균 풍속을 ANN의 입력 자료로 사용하였고 3가지 다른 방법, 즉, 역전파 알고리즘을 사용한 전방향 ANN 모 형, Levenberg Marquardt 알고리즘을 사용한 전방향 ANN 모형 그리고 단층 ANN 모형을 사용하여 분석을 시행하였 다. 결론적으로 단층 모형에 비해 다층 ANN 모형이 예측 정확도가 더 높은 것을 보이고 있다. Gorucu(2004)는 앙카 라의 천연 가스 소비량을 예측하였으며, 4개의 변수(기온, 소비자 수, 판매 가격, 환율)를 입력 변수로 사용하였다.
Viet 과 Mandziuk(2005)는 폴란드 두 지역의 가스 소비량
을 ANN과 퍼지 ANN을 사용하여 분석하였다. 분석 결과,
가스 소비량 만을 학습에 사용한 ANN 모형과 퍼지 ANN 모
형이 가장 낮은 RMSE 값을 가지는 것을 보였다. Tonković
등(2009)은 크로아티아의 오시예크(Osijek) 지역 가스 소
비량을 예측하였다. 시간 별 소비량, 기온, 풍속을 다층 퍼
셉트론(perceptron) ANN 모형의 입력 자료로 활용하였으
며, 3가지 다른 방사 기준 함수(지수 활성 함수, Thnh 활성
함수, 가우시안 활성 함수)를 적용하였다. Dombaycı(2010)
Table 1. The variables used in the previous studies Gas
consumption Temperature Wind speed
Date type
Heating degree days
Number of customers etc.
Brown et al., (1994) √ √ √ √ √
Brown and Matin (1995) √ √ √ √ √
Suykens et al., (1996) √ √ √ Oil prices
Khotanzad and Elragal (1999) √ √ √
Gorucu (2004) √ √ √
Gas prices, exchange
rate
Viet and Mandziuk (2005) √ √
Tonković et al., (2009) √ √ √ √
Dombaycı (2010) √ √
Yu and Xu (2014) √ √ √ Weather
conditions
Jin and Kim (2015) √
는 터키 데니즐리(Denizli)의 열 에너지 소비량을 예측하였 으며, Yu과 Xu(2014)는 유전 알고리즘을 적용한 ANN으 로 단기 가스 소비량 예측을 수행하였다. 이에 이 논문은 Levenberg Marquardt 알고리즘을 사용한 다층 역전파 ANN 모형을 사용하였으며, 입력 자료인 가스 소비량 자료 의 계절 효과를 제거하여 주었다. Jin과 Kim(2015)은 웨이 블렛(wavelet) 분해 방법과 ANN을 결합하여 1997년부터 2014 년 까지 henry hub 가격 예측을 시행하였다. ANN과 웨이블렛-ARIMA 모형을 비교 분석하였고, 웨이블렛 -ANN 모형이 예측 정확도가 가장 높게 산출되었다. 위 연 구들에서 볼 수 있듯이 ANN을 사용한 가스 소비량 예측에 있어서 각기 다른 입력 자료를 사용하고 있으며 다양한 알 고리즘을 적용시키고 있다. Table 1은 선행연구에서 쓰인 ANN 입력 변수들을 보여주고 있다.
많은 연구에서 ANN이 전통적인 확률 모형에 비해 우수 하다는 것을 입증하고, 다양한 ANN 방법론을 소개하고 있 지만, 간단하게 자료를 전처리 해줌으로써 예측 정확도를 향상시킬 수 있는 GNN 방법론에 대한 국내 연구는 선례를 찾아 볼 수 없다. 따라서 본 논문은 AGO(Accumulated Generating Operation) 와 ANN을 결합한 GNN 모형을 사 용하여 한국의 가스 소비량을 예측하였다. AGO는 GM을 구성하는 Accumulated Generating Operation으로서 시계열 자료를 디노이즈(denoise) 하는 역할을 한다(Deng, 1989).
GNN 은 전통적인 GM의 단점, 즉 몇몇 가정 및 단순화로 인 한 오류를 해결 가능하며, ANN의 예측 정확도를 쉽게 향상 시켜준다(Dahai et al., 2008). 따라서 먼저, 시계열 자료를 AGO 로 변환 시킨 후, 역전파 ANN 모형을 적용시켜 예측
을 시행하여 다른 모형과 비교하였고, 그 결과 GNN은 간단 하지만 가장 정확한 예측 결과를 보였다.
분석 방법론
인공신경망
ANN 은 비선형 방법론으로서 복잡하고 다양한 자료를 쉽게 처리 가능하며, 예측력 또한 우수하다(Kim, 2005). 게 다가 변수 사이의 상관관계가 없더라도 입력층, 출력층 간 의 관계를 산출할 수 있다는 장점을 가지고 있다(Karimi and Dastranj, 2014). Cooper(1999) 는 역전파 ANN 알고리 즘과 다층 퍼셉트론의 기본 이론을 설명하고 있으며, ANN 이 전통적인 다변수 통계 기법에 비해 예측력이 우수하다 는 것을 보이고 있다. 식 (1)~(6)은 기본적인 다층 퍼셉트 론 ANN 모형의 구조를 설명하고 있다(Cooper, 1999).
은닉층
의 입력값은 식 (1)과 같다.
(1)
는 I 번째 입력층의 입력 변수이고,
는 I 번째 입력층 과 j 번째 은닉층 사이의 연결 가중치이다. 은닉층
의 산 출값은 식 (2)와 같다.
exp
(2)
Fig. 1. ANN learning process for gas consumption forecasting.
이 은닉층
에서 산출된 값이 가중치
를 통해 출력 층에 입력되며 다음과 같은 식 (3)을 가진다.
(3)
이 연결 가중치
와
는 학습과정에서 최급하강법 (gradient descent method) 에 의해 계속 변화하며, 최종적 으로 목표값과의 오차가 최소가 되도록 조정된다. 최종적 으로 k번째 출력층
에서 결과값이 산출되며 식 (4)와 같 이 구성된다.
exp
(4)
여기서, ⋅가 로지스틱 함수(logistic function)라고 할 때
⋅
(5)
식 (5)가 성립되며, 산출된 출력값
와 실제값
의 차 이를 통해 오차를 산출하게 된다. 입력층의 각 요소 마다 입
력 자료가 삽입되고, 가중치가 적용되어 변환된 신호는 은 닉요소에 전달되며, 마지막으로 출력층에서 출력값을 산 출하게 된다. ANN은 이 출력된 값과 기대값의 오차를 비교 하여 그 차이를 줄여나가는 방향으로 연결 가중치를 조절 하여 모형을 구성한다. ANN에서 일반적으로 사용되는 로 지스틱 함수는 계단함수(hard limiter), 임계논리함수 (threshold logic), 시그모이드 함수(sigmoid function) 등이 있으며, 가장 많이 사용되는 함수는 시그모이드 함수이다 (Kim, 2005). 또한 시그모이드 함수는 0~1 사이의 값을 가 지며 다음의 식 (6)과 같이 표현된다.
exp
(6)
역전파 알고리즘은 다층 퍼셉트론 ANN에서 가장 일반
적으로 쓰이고 있는 알고리즘으로 1개 이상의 은닉층을 가
진 다층 퍼셉트론 ANN에서 오차가 출력 노드로부터 내부
노드로 역전파하여 연결 가중치를 조절하는 방법이다. 이
역전파 알고리즘은 학습과정이 수렴하기 까지 많은 학습데
이터가 필요 하고 이미 학습된 모형을 수정하거나 추가적
으로 학습시킬 수 없지만 분석 및 구현이 쉽고 빠른 학습이
가능하기 때문에 가장 일반적으로 사용되고 있다(Kim,
2005). 반면 ANN은 자료처리 과정이 블랙박스 같은 기능
Fig. 2. Hybrid GM-ANN process for gas consumption forecasting.
을 가지고 있기 때문에 결과 해석에 한계점을 가지고 있다 (Park and Kim, 2014). 본 논문은 시그모이드 함수를 적용 한 다층 퍼셉트론 인공신경망을 역전파 학습 알고리즘으로 학습시켰다. Fig. 1은 ANN을 사용한 단기 가스 소비량 예 측의 대략적인 구조를 보여준다.
Grey 모형
GM 은 자료를 AGO로 전처리 해줌으로써, 시계열 자료 의 음수 요소를 제거하고 평활화 및 연속 함수로 전환시켜 주어 간단하게 디노이징이 가능한 방법이다(Hongwei and Yonghe, 2009). 원자료를 AGO로 바꾸어 준 후, 예측된 결 과값을 IAGO(Inverse Accumulated Generating Operation) 를 통해 다시 변환시켜준다. 본 연구는 GM 중 가장 많이 쓰이 는 GM(1,1)을 사용하였으며, 구조는 식 (7)~(15)와 같다 (Hongwei and Yonghe, 2009).
변수 에 대해 개의 시계열 자료를 다음과 같이 가정 한다.
⋯
(7)
은 변수의 개수고,
의 AGO인
는 식 (8)과 (9)의 과정을 거쳐 생성된다.
⋯ (8)
⋯
(9)
GM(1,1) 은 식 (10), (11)과 같이
의 1차 미분 방정식 으로 정의될 수 있다.
(10)
(11)
여기서 a와 b는 모형 매개변수로 식 (12)와 같이 정의되며, B 와
은 각각 식 (13), (14)와 같다.
(12)
⋮
⋮ (13)
⋯
(14)
식 (11)로
를 얻을 수 있으며, 식 (15)와 같은 IAGO과 정을 거쳐 예측 값,
를 산출한다.
(15)
Hybrid Grey–ANN
Hybrid GM-ANN 모형은 Park과 Kim(2015)이 처음으
로 시도한 모형으로 GM으로 예측한 결과의 잔차를 ANN
으로 보정시켜주는 모형이다. GM(1,1)으로 산출된 경향선
(fitted sequence) 의 잔차를 ANN으로 학습하여 GM 예측
값과 잔차 예측값을 더하여 주는 모형으로 구조는 Fig. 2와
같다.
Fig. 4. Gas consumption data.
Fig. 5. Gas consumption after removing the seasonal effect.
Fig. 3. GNN learning process for gas consumption forecasting.
Grey 신경망
GNN 모형은 원자료를 AGO로 전환시키고 ANN으로 학 습시켜 예측치를 산출해 내는 방법으로 간단하게 GM의 단 점을 극복하고 예측 정확도를 높일 수 있다. 이를 위해 원자 료를 위 식 (7)~(9)를 통해 AGO로 변환시킨다. 시계열 자 료를 누적시켜 계속적으로 증가하게 되는 AGO는 자료의 무작위성(randomness)을 감소시키고 규칙성 있는 자료로 변환시켜 준다(Yidan, 1992). 이렇게 변환된 AGO 자료를 기반으로 ANN을 학습시켜 모형을 구축한 뒤, 예측 자료를 산출해 낸다. 산출된 예측값은 AGO로 구성되어 있으므로 이를 다시 IAGO 과정을 통해 변환시킨다. Fig. 3은 GNN을 사용한 단기 가스 소비량 예측의 대략적인 구조를 보여준다.
본 논문은 시계열 분석 시 대표적으로 사용되는 지표인 RMSE 를 사용하여 입력 노드와 은닉 노드의 개수를 결정 하고 4개 모형의 정확도를 비교하였으며 Matlab 프로그램 을 이용하여 모형을 구현하였다.
분석 결과
분석 자료 및 개요
실증분석을 위하여 1997년 1월부터 2014년 6월까지 통
계청의 한국 가스 소비량 자료를 사용하였다. 통계청 가스
소비량 자료가 1997년 이후로 제공되고 있기 때문에 기간
은 1997년 이후로 한정하였다. 또한 ANN과 GNN, GM 비
교를 위해 단변수 모형으로 가정하였다. GM의 경우, 일반
적으로 모형 비교를 위해 적용시킬 때 GM(1,1)을 사용하
며, 같은 입력 자료를 사용해야 하는 만큼 ANN과 GNN 모
Fig. 6. The forecasting result of ANN
Fig. 7. The forecasting result of GM.
형에도 단변수 모형을 적용하였다(Hongwei and Yonghe, 2009). 가스 소비량 자료의 계절 효과를 제거해 주기 위해 X-12 ARIMA 를 사용하여 전처리를 수행하였다. Fig. 4와 Fig. 5 는 계절 효과 제거 전・후의 가스 소비량을 보여준다.
ANN 모형의 경우 기존 여러 연구에서 계절 효과를 제거해 주지 않고 있으며 모형 구조 상 계절 효과를 제거하지 않더라 도 학습과정에서 계절 효과까지 학습이 가능하다(Khotanzad et al., 2000). 하지만 본 연구에서는 순수한 GM과의 비교 를 위해서 계절 효과를 제거해 주었다.
10 개월 단기 예측을 시행하였으며 월별 자료로 분석을 시행하였다. 학습(training) 자료는 1997년 1월부터 2013 년 8월까지로 설정하여 ANN을 학습시켰고, 2013년 9월부 터 2014년 6월까지 ANN 예측치를 산출하여 표본 외 예측 (out-of-sample forecasting) 을 시행하였다. 은닉층은 1개 로 설정하고, 입력 노드 개수와 은닉층 노드 개수를 각각 변 화시켜 최적의 예측 모형을 산출하였다. Dutta과 Shashi (1988) 와 Salchenberger 등(1992)에 따르면, 은닉층을 2개 이상으로 증가시켜도 1개인 경우와 비교했을 때, 예측률이 크게 향상되지 않기 때문에 본 연구에서도 1개의 은닉층으 로 고정하고 학습을 진행하였다.
본 연구는 4개 모형, 즉 ANN, GM, hybrid GM-ANN 그 리고 GNN 모형의 RMSE를 비교하여 최적 모형을 찾고자 하였다. GNN 모형의 활용 가능성을 살펴보기 위해 GNN 모형의 기반이 되는 ANN모형과 GM, 그리고 hybrid GM-ANN 의 예측력과 비교해보았다. 물론 다른 모형보다 예측 정확도가 높다고 해서 가장 좋은 모형이라고 단정지 을 수는 없지만, 본 논문의 목적은 GNN 모형이 가스 소비 량 예측에 활용될 수 있는지를 확인하고, 가스 소비량 예측 을 위한 최적의 모형을 제시하는 것이므로 모형의 예측력 비교는 본문의 4개 모형에 한정한다.
분석 결과
Fig. 6 은 ANN의 예측 결과이다. 역전파 알고리즘이 적용 되었으며 연속방식(cascade method)이 사용되었다. 비연 속방식을 사용하게 되면 특정 시점의 예측치(t)가 다음 시 점 예측치(t+1)에 영향을 미치지 않기 때문에, 즉 비연속 방 식이기 때문에 예측값이 선형적으로 증가하게 된다. 반면, 연속방식은 특정 시점의 예측치를 다음 학습 시 포함하여 학습하게 되고, 그 때문에 다음 시점 예측값에 영향을 미치 게 되는 방식으로 더 정확한 모형 구축에 도움이 된다(Park and Kim, 2014). ANN 예측 결과로 RMSE값은 107.287로 산출되었으며, 은닉 노드 개수는 4개, 그리고 입력 노드 개 수는 4개에서 가장 낮은 RMSE값을 보였다. 본 연구에서 예측력을 측정하는 방법으로 RMSE와 MAPE(mean absolute percentage errors) 를 사용하고 있으며 낮은 수치를 가질수
록 예측력, 즉 실제값과 예측값 사이의 오차가 작은 것을 의 미한다. 또한 RMSE와 MAPE는 기존 많은 예측 연구에서 예측 결과를 판단하기 위해 사용되어 왔기 때문에 본 연구 에서도 이를 기준으로 모형들의 예측 정확도를 판별한다 (Kim et al., 2015).
GM 예측 결과는 Fig. 7과 같으며, 다음 10개월 예측 결과 를 보여준다. RMSE는 335.613으로 ANN의 결과보다 높 게 산출되었다. 또한 선형적으로 증가하는 예측 결과가 산 출된 것을 볼 수 있으며 이 것이 GM의 한계점이라 할 수 있다.
Fig. 8 은 GM과 ANN을 결합한 hybrid GM-ANN 모형의
결과이다. Hsu과 Chen(2003)은 GM과 ANN을 결합하여
개선된 GM을 제안하였다. 먼저, 일반적인 GM으로 예측
을 시행한 후 발생하는 잔차를 다시 한번 GM으로 예측하
였다. 여기에서 예측된 잔차를 시계열 예측값에 적용시키
는 단계에서 ANN의 패턴 인식 기법을 사용하고 있다. 하지
만 본 연구에서는 Hsu과 Chen(2003)이 GM으로 예측한 잔
Table 2. The RMSE and MAPE of each model
Models RMSE MAPE
ANN 0107.2870 4.8972
GM 335.6130 15.3024
hybrid Grey –ANN 252.0437 11.1308
GNN 78.1005 3.4556
Fig. 8. The forecasting result of hybrid Grey–ANN.
Fig. 9. The forecasting AGO result of GNN.
Fig. 10. The forecasting result of GNN.
차 자체를 ANN으로 예측하여 GM 시계열 예측값에 적용 시켜 주었다(Park and Kim, 2015). 그 결과는 Fig. 8과 같으 며, RMSE는 252.0437로 일반적인 GM 보다는 낮은 값이 산출 되었으나, 여전히 ANN보다는 높은 RMSE를 가진다.
GNN 예측 결과는 Fig. 10과 같다. 시계열 자료를 AGO 로 변환시킨 다음 연속방식 ANN으로 10개월 예측을 시행 하였다. Fig. 9는 AGO 자체의 예측 자료로써 원자료로 변 환하기 전 예측값을 보여주고 있으며, Fig. 10은 산출된 AGO 자료를 다시 원자료로 변환시켜 주어(IAGO) 실제값 과 비교한 그래프이다.
1)RMSE 는 78.1005로 가장 낮은 값 을 보이고 있으며, 이는 가스 소비량 예측에서만큼은 다른 3 가지 모형보다 예측 정확도가 높다는 것을 보여준다.
ANN 학습 시 은닉 노드 개수는 4개, 입력 노드 개수는 6개 일 때 가장 낮은 RMSE값이 산출 되었다. Table 2는 4개 모 형의 RMSE와 MAPE 값을 보여준다.
결 론
본 연구는 한국 가스 소비량의 단기 예측을 위하여 일반 적인 통계적 방법 대신 GNN을 사용하여 분석하였다.
ANN, GM, hybrid Grey-ANN, GNN 모형을 비교, 분석 하 였으며, 가스 소비량 예측 정확도가 가장 높은 모형을 찾고 자 하였다. 기존의 ANN, GM, GNN 방법론뿐 아니라 hybrid Grey-ANN 모형을 구성하여 예측을 시행하고 각각 의 예측 오차를 산출하였다.
연구 결과, AGO로 자료를 변환 한 뒤, ANN으로 예측한 GNN 모형이 예측 정확도가 가장 높게 산출되었으며, 전통 적인 역전파 ANN 모형보다 더 낮은 RMSE가 산출되었다.
이 결과의 의의는 간단한 자료 변환을 통해 노이즈를 감소 시켜 예측 정확도를 향상시켰다는 것에 있다. 다만 경험적 인 방법에 의해 입력 노드와 은닉 노드의 개수를 설정해 주 어야 하는 ANN의 특성 상, GNN과 ANN, 그리고 hybrid Grey-ANN 의 각 노드 개수가 달라지게 되고 RMSE만으로
1) Fig. 9의 경우 AGO 예측값으로, 실제 예측값 산출을 위해 시간 t 예측값에서 t-1 예측값을 제하여 주어야 하므로(IAGO) 11개 예측이 시행되었다.
정확도를 다루게 되는 한계점을 가진다. 따라서 좀 더 동일 한 조건에서 학습이 이루어질 수 있는 후속 연구가 필요할 것이다.
또한 GM의 경우, 관측치 즉, 모형을 구성 할 때 필요한 자 료의 수가 적을 때 효과적인 방법론이다(Hsu and Chen, 2003). 그렇기 때문에 본 연구에서는 RMSE가 높게 산출되 어 다른 3가지 모형에 비해 정확도가 떨어지는 결과를 보이 고 있다. 반면, ANN은 분석 자료 수가 많을수록 학습 효과 가 증가하고 더 정확한 모형이 구축되게 된다. 또한 GM은 중장기 예측에, ANN모형은 단기예측에 유리한 모형이다.
때문에 GM과 ANN의 직접적인 비교는 어렵다고 판단되 지만, 본 연구의 목적은 GM과 ANN 모형의 비교가 아닌 GNN, Hybrid Grey-ANN 모형과의 비교에 있으므로 GM 과 ANN 모형의 예측력 비교는 제외한다. GNN, Hybrid Grey-ANN 모형은 GM과 ANN 모형을 결합한 방법론이기 때문에 예측 자료 개수와는 상관없이 GM, 혹은 ANN 모형 과 비교 분석하였다.
Hybrid Grey-ANN 모형은 전통적인 ANN모형에 비해 더 높은 RMSE값을 가진다. 앞에서 언급하였듯이, GM과 ANN 의 분석 자료의 개수 문제로 인해 발생한 결과라 할 수 있다. 각기 다른 목적을 가진 방법론이기 때문에, 두 방법론 을 hybrid Grey-ANN 모형의 방식으로 결합하는 것이 무의 미 하며 연구 결과도 ANN 예측 결과보다 더 높은 RMSE가 산출된 것을 볼 수 있다.
2)다만 Hsu과 Chen(2003)와 같이 잔차의 예측값을 원 자료의 예측값에 포함시켜야 하는지에 대한 여부를 ANN 패턴 인식 방법으로 결정 짓는 모형의 경 우는 가스 소비량 예측에 고려해 볼 수 있을 것이다.
결론적으로, 관측치의 개수가 많을 경우 AGO를 사용해 자료변환을 시행한 뒤 ANN으로 예측하는 것이 예측력을 향상시킬 수 있는 방법이라 할 수 있다. 이는 간단한 자료변 환을 통한 GNN 모형이 ANN 모형에 비해 더 정확한 예측 치를 산출 할 수 있다는 것을 보여준다. 앞으로 ANN을 사 용하여 예측 시행 시, 원 자료를 AGO로 변환해주면 보다 예측력을 향상시킬 수 있을 것이다.
사 사
본 연구는 2015년도 산업통상자원부의 재원으로 한국에 너지 기술평가원(KETEP)의 지원을 받아 수행한 연구 과 제 입니다(No. 20152510101880).
2) GM은 완전하지 못한 자료를 사용하여 예측을 수행하기 위한 목적을 가지는 반면, ANN은 관측 자료를 바탕으로 최적의 학 습 모형을 구현해 내는데 그 목적이 있다.
References
BP, 2015, Bp energy outlook 2035, BP p.l.c. 2015, London, United Kingdom.
Brown, R.H. and Matin, I., 1995, “Development of artificial neural network models to predict daily gas consumption,”
Industrial Electronics, Control, and Instrumentation, 1995., Proceedings of the 1995 IEEE IECON 21st International Conference on, 6-10 Nov 1995, pp. 1389-1394.
Brown, R.H., Kharouf, P., Xin, F., Piessens, L.P. and Nestor, D., 1994, “Development of feed-forward network models to predict gas consumption,” Neural Networks, 1994. IEEE World Congress on Computational Intelligence., 1994 IEEE International Conference on, 27 Jun-2 Jul 1994, pp.
802-805.
Cooper, J.C.B., 1999, “Artificial neural networks versus multivariate statistics: An application from economics,”
Journal of Applied Statistics, Vol. 26, No. 8, pp. 909-921.
Dahai, Z., Zhiwu, R., Yanbing, B., Dazhou, Z. and Yanqiu, B., 2008, “Power load forecasting based on grey neural network,” Industrial Electronics, 2008. ISIE 2008. IEEE International Symposium on, June 30 2008-July 2 2008, pp. 1885-1889.
Deng, J.L., 1989, “Introduction to grey system theory,” J.
Grey Syst., Vol. 1, No. 1, pp. 1-24.
Dombaycı, Ö.A., 2010, “The prediction of heating energy consumption in a model house by using artificial neural networks in denizli –turkey,” Advances in Engineering Software, Vol. 41, No. 2, pp. 141-147.
Dutta, S. and Shashi, S., 1988, “Bond rating: A nonconservative application of neural networks,” Neural Networks, 1988., IEEE International Conference on, 24-27 July 1988, pp.
443-450.
EIA, 2014, Korea, south, international energy data and analysis, The U.S. Energy Information Administration, Washington, DC.
Gorucu, F.B., 2004, “Artificial neural network modeling for forecasting gas consumption,” Energy Sources, Vol. 26, No. 3, pp. 299-307.
Hongwei, M. and Yonghe, W., 2009, “Grey predictive on natural gas consumption and production in china,” Web Mining and Web-based Application, 2009. WMWA '09.
Second Pacific-Asia Conference on, 6-7 June 2009, pp.
91-94.
Hsu, C.-C. and Chen, C.-Y., 2003, “Applications of improved grey prediction model for power demand forecasting,”
Energy Conversion and Management, Vol. 44, No. 14, pp. 2241-2249.
IEA, 2013, Natural gas information 2013, International
김 진 수
2003년 서울대학교 지구환경시스템공학부 2005년 서울대학교 지구환경시스템공학부 공학사 2010년 서울대학교 에너지시스템공학부 공학석사
공학박사 현재 한양대학교 자원환경공학과 조교수 (E-mail; [email protected])
박 성 준
현재 한양대학교 자원환경공학과 석․박사통합과정 (本 學會誌 第51券 第6号 參照)