2021, 32
(3)
,569–584
전력 수요량에 대한 다변량 시계열 군집분석
†
기
ᆷ인희
1
· 김재희2
1덕성여자대학교 수학 및 통계학과 ·2덕성여자대학교 정보통계학과
ᄌ ᅥ
ᆸᄉ ᅮ 2021ᄂ ᅧ ᆫ 2ᄋ ᅯ ᆯ 17ᄋ ᅵ ᆯ, ᄉ ᅮᄌ ᅥ ᆼ 2021ᄂ ᅧ ᆫ 3ᄋ ᅯ ᆯ 16ᄋ ᅵ ᆯ, ᄀ ᅦᄌ ᅢ ᄒ ᅪ ᆨᄌ ᅥ ᆼ 2021ᄂ ᅧ ᆫ 3ᄋ ᅯ ᆯ 16ᄋ ᅵ ᆯ
요 약
ᄉ
ᅳᄆ ᅡᄐ ᅳ ᄀ ᅳᄅ ᅵᄃ ᅳᄋ ᅴ ᄇ ᅡ ᆯᄌ ᅥ ᆫᄋ ᅳᄅ ᅩ ᄋ ᅵ ᆫᄒ ᅢ ᄌ ᅥ ᆫᄅ ᅧ ᆨ ᄃ ᅦᄋ ᅵᄐ ᅥᄋ ᅦ ᄌ ᅥ ᆸᄀ ᅳ ᆫ ᄋ ᅵ ᄉ ᅱᄋ ᅮᄆ ᅧ, ᄆ ᅡ ᆭᄋ ᅳ ᆫ ᄋ ᅣ ᆼᄋ ᅴ ᄌ ᅥ ᆫᄅ ᅧ ᆨ ᄃ ᅦᄋ ᅵᄐ ᅥᄅ ᅳ ᆯ ᄋ ᅥ ᆮᄋ ᅳ ᆯ ᄉ ᅮ ᄋ ᅵ
ᆻᄃ ᅡ. ᄌ ᅥ ᆫᄅ ᅧ ᆨ ᄉ ᅮᄋ ᅭᄂ ᅳ ᆫ ᄋ ᅵ ᆯᄇ ᅡ ᆫᄌ ᅥ ᆨᄋ ᅳᄅ ᅩ ᄑ ᅢᄐ ᅥ ᆫᄋ ᅵ ᄌ ᅩ ᆫ ᄌ ᅢᄒ ᅡᄀ ᅵ ᄄ ᅢᄆ ᅮ ᆫ ᄋ ᅦ ᄉ ᅮᄋ ᅭ ᄑ ᅢᄐ ᅥ ᆫᄇ ᅧ ᆯᄅ ᅩ ᄀ ᅮ ᆫᄌ ᅵ ᆸᄒ ᅪᄒ ᅡᄋ ᅧ ᄋ ᅨᄎ ᅳ ᆨ ᄒ ᅡᄂ ᅳ ᆫ ᄀ ᅥ ᆺᄋ ᅵ ᄒ ᅭ ᄀ
ᅪᄌ ᅥ ᆨᄋ ᅵᄃ ᅡ. ᄄ ᅡᄅ ᅡᄉ ᅥ ᄇ ᅩ ᆫ ᄋ ᅧ ᆫᄀ ᅮᄋ ᅦᄉ ᅥᄂ ᅳ ᆫ ᄌ ᅥ ᆫᄅ ᅧ ᆨ ᄉ ᅮᄋ ᅭᄅ ᅣ ᆼᄋ ᅦ ᄃ ᅢᄒ ᅡ ᆫ ᄉ ᅵᄀ ᅨᄋ ᅧ ᆯ ᄀ ᅮ ᆫᄌ ᅵ ᆸᄇ ᅮ ᆫᄉ ᅥ ᆨᄋ ᅳ ᆯ ᄉ ᅮᄒ ᅢ ᆼᄒ ᅡᄀ ᅩᄌ ᅡ ᄒ ᅡ ᆫᄃ ᅡ. ᄌ ᅥ ᆫᄅ ᅧ ᆨ ᄉ ᅮ ᄋ
ᅭᄅ ᅣ ᆼ ᄃ ᅦᄋ ᅵᄐ ᅥᄅ ᅳ ᆯ ᄀ ᅮ ᆫᄌ ᅵ ᆸᄒ ᅪᄒ ᅡᄀ ᅵ ᄋ ᅱᄒ ᅢ 5ᄀ ᅡᄌ ᅵᄋ ᅴ ᄀ ᅥᄅ ᅵᄎ ᅳ ᆨ ᄃ ᅩᄋ ᅪ 3ᄀ ᅡᄌ ᅵᄋ ᅴ ᄀ ᅮ ᆫᄌ ᅵ ᆸᄒ ᅪ ᄇ ᅡ ᆼᄇ ᅥ ᆸᄋ ᅳ ᆯ ᄋ ᅵᄋ ᅭ ᆼ ᄒ ᅡᄋ ᅧ ᆻᄀ ᅩ ᄀ ᅮ ᆫᄌ ᅵ ᆸᄇ ᅮ ᆫᄉ ᅥ ᆨ ᄒ ᅮ 4ᄀ ᅢ ᄀ ᅮ ᆫᄌ ᅵ ᆸ ᄋ ᅲᄒ ᅭᄉ ᅥ ᆼ ᄑ ᅧ ᆼᄀ ᅡ ᄌ ᅵᄑ ᅭᄅ ᅳ ᆯ ᄀ ᅨᄉ ᅡ ᆫᄒ ᅡᄋ ᅧ ᆻᄃ ᅡ. ᄋ ᅧᄅ ᅥ ᄑ ᅢᄐ ᅥ ᆫᄋ ᅴ ᄉ ᅵᄀ ᅨᄋ ᅧ ᆯ ᄃ ᅦᄋ ᅵᄐ ᅥᄅ ᅳ ᆯ ᄉ ᅢ ᆼᄉ ᅥ ᆼᄒ ᅡᄋ ᅧ ᄆ ᅩᄋ ᅴᄉ ᅵ ᆯᄒ ᅥ ᆷᄋ ᅳᄅ ᅩ ᄀ ᅮ ᆫᄌ ᅵ ᆸ ᄇ
ᅮ ᆫᄉ ᅥ ᆨᄋ ᅳ ᆯ ᄉ ᅮᄒ ᅢ ᆼᄒ ᅡᄀ ᅩ ᄉ ᅵ ᆯᄌ ᅦ ᄌ ᅥ ᆫᄅ ᅧ ᆨ ᄉ ᅮᄋ ᅭᄅ ᅣ ᆼ ᄃ ᅦᄋ ᅵᄐ ᅥᄋ ᅦ ᄃ ᅢᄒ ᅡ ᆫ ᄀ ᅮ ᆫᄌ ᅵ ᆸᄇ ᅮ ᆫᄉ ᅥ ᆨᄋ ᅳ ᆯ ᄉ ᅮᄒ ᅢ ᆼᄒ ᅡᄋ ᅧ ᆻᄃ ᅡ.
ᄌ
ᅮᄋ ᅭᄋ ᅭ ᆼ ᄋ ᅥ: ᄀ ᅮ ᆫᄌ ᅵ ᆸᄇ ᅮ ᆫᄉ ᅥ ᆨ, ᄀ ᅮ ᆫᄌ ᅵ ᆸ ᄋ ᅲᄒ ᅭᄉ ᅥ ᆼ, ᄃ ᅡᄇ ᅧ ᆫᄅ ᅣ ᆼ ᄉ ᅵᄀ ᅨᄋ ᅧ ᆯ, ᄌ ᅥ ᆫᄅ ᅧ ᆨ ᄉ ᅮᄋ ᅭᄅ ᅣ ᆼ.
1. 서론 겨
ᆼ제의 성장으로 인해 전력사용량이 증가하고 있으며, 전기 자동차 또는 IoT (사물 인터넷)의 발전으 ᄅ
ᅩ 인해 전력의 수요가 더욱 증가할 것으로 예상된다. 특히 스마트 그리드 (smart grid)는에너지 감소 르
ᆯ 통한 비용절감으로 이익이 발생하기 때문에 전력난의 해결방안으로 주목받고 있으며, 스마트 그리드 ᄀ
ᅵ술의 발전으로 인해 전력 수요 데이터는 실시간으로 빅데이터로 수집된다.
ᄀ ᅮ
ᆨ내의 전력 생산 방식은최대 수요량을기반으로 15%의 예비 전력을두는방식으로 생산되고 있으 ᄆ
ᅧ, 2014년도 ‘제 2차 에너지 기본계획 정책 이후 전력관리는전력의 공급에서 전력의 수요관리 중심 ᄋ
ᅳ로 전환되고 있다 (Sohn 등, 2016). 따라서 예비 전력의 낭비를막기 위해 전력 수요의 패턴을파악하 느
ᆫ것이 중요하다 (Shin 등 2016). 전력 수요의 패턴은계절, 주중 및 주말, 건물의 종류, 전력장치의 종 ᄅ
ᅲ 등에 따라 다른형태를띠며, 본연구에서는전력 장치들에 대한 시계열 데이터를기반으로 군집분석 으
ᆯ수행하고자 한다.
ᄀ ᅮ
ᆨ내외에서 전력 데이터를이용한 시계열 데이터의 군집분석 연구가활발히 진행되고 있다. Park 등 (2009)는시계열 분석을적용한 패턴 인식을이용하여 전력 수요 예측을수행하였으며, SOM 알고리즘 ᄀ
ᅪ k-평균방법으로 군집화하였다. Song 등 (2013)은주중,주말, 특수일, 기타의 4개 그룹으로 나누어 ᄌ
ᅥᆫ력 수요를예측하였고, Lim (2014)은 k-평균 군집분석을이용하여 특수일 최대 전력 수요 예측을 9개 구
ᆫ집으로 나누어 분석을수행하였다. Hwang 등 (2015)은계층적 군집 분석 방법을사용하여 건물의 월 벼
ᆯ 전력 수요를 예측하였다. Park과 Yoon (2017)은 k-평균, 가우시안 혼합 모형, 함수적 모형을사용
†
ᄇ ᅩ ᆫ ᄋ ᅧ ᆫᄀ ᅮᄂ ᅳ ᆫ ᄒ ᅡ ᆫᄀ ᅮ ᆨᄌ ᅥ ᆫᄅ ᅧ ᆨ ᄌ ᅥ ᆫᄅ ᅧ ᆨᄋ ᅧ ᆫᄀ ᅮᄋ ᅯ ᆫ ᄌ ᅵᄋ ᅯ ᆫ (Grant number: R18XA01)ᄀ ᅪ ᄒ ᅡ ᆫᄀ ᅮ ᆨᄋ ᅧ ᆫᄀ ᅮᄌ ᅢᄃ ᅡ ᆫ ᄌ ᅮ ᆼᄀ ᅧ ᆫᄋ ᅧ ᆫᄀ ᅮ ᄌ ᅵᄋ ᅯ ᆫ (No.
2018R1A2B26001664)ᄋ ᅳ ᆯ ᄇ ᅡ ᆮᄋ ᅡ ᆻᄉ ᅳ ᆸ ᄂ ᅵᄃ ᅡ.
1
(01369) ᄉ ᅥᄋ ᅮ ᆯᄐ ᅳ ᆨᄇ ᅧ ᆯᄉ ᅵ ᄃ ᅩᄇ ᅩ ᆼ ᄀ ᅮ ᄉ ᅡ ᆷᄋ ᅣ ᆼᄅ ᅩ 144ᄀ ᅵ ᆯ 33, ᄃ ᅥ ᆨᄉ ᅥ ᆼᄋ ᅧᄌ ᅡᄃ ᅢᄒ ᅡ ᆨᄀ ᅭ ᄋ ᅵ ᆯᄇ ᅡ ᆫᄃ ᅢᄒ ᅡ ᆨᄋ ᅯ ᆫ ᄉ ᅮᄒ ᅡ ᆨ ᄆ ᅵ ᆾ ᄐ ᅩ ᆼ ᄀ ᅨᄒ ᅡ ᆨᄀ ᅪ, ᄉ ᅥ ᆨᄉ ᅡ.
2
ᄀ ᅭᄉ ᅵ ᆫᄌ ᅥᄌ ᅡ: (01369) ᄉ ᅥᄋ ᅮ ᆯᄐ ᅳ ᆨᄇ ᅧ ᆯᄉ ᅵ ᄃ ᅩᄇ ᅩ ᆼ ᄀ ᅮ ᄉ ᅡ ᆷᄋ ᅣ ᆼᄅ ᅩ 144ᄀ ᅵ ᆯ 33, ᄃ ᅥ ᆨᄉ ᅥ ᆼᄋ ᅧᄌ ᅡᄃ ᅢᄒ ᅡ ᆨᄀ ᅭ ᄌ ᅥ ᆼᄇ ᅩᄐ ᅩ ᆼ ᄀ ᅨᄒ ᅡ ᆨᄀ ᅪ, ᄀ ᅭᄉ ᅮ.
E-mail: [email protected]
ᄒ
ᅡ여 전력 수요 패턴에 대한 군집 및 분류 분석을수행하였다. Liao (2005)는시계열 군집화를연구한 노
ᆫ문을광범위하게 조사하여, 시계열 간 유사도를계산할 수 있는거리 측도, 군집 분석 방법, 군집화 결 ᄀ
ᅪ 평가 방법 등을설명하였다. Brock 등 (2008)은 9가지의 군집분석 방법과 군집화 결과의 유효성 평 ᄀ
ᅡ 방법을제시하였다. Montero와 Vilar (2014)는여러 가지 거리 측도를이용하여 군집분석을수행 후 구
ᆫ집 유사도를계산하였고, Haben 등 (2016)은스마트 미터 데이터를활용하여 유한 혼합 모형을기반 ᄋ
ᅳ로 주거용건물의 전력 수요를 군집 분석하였다.
보
ᆫ 논문의 구성은다음과 같다. 2절에서 시계열 사이의 거리 측도를 살펴본다. 3절에서는 군집화 방 버
ᆸ들에 대해 살펴본다. 4절은 군집화 후 군집의 유효성을 평가하는방법을설명한다. 5절은모의실험 ᄃ
ᅦ이터를이용하여 군집분석을수행하고, 6절에서는 실제 전력 수요 데이터를활용하여 분석을수행한 ᄃ
ᅡ. 마지막으로 7절에서는연구 결과에 대한 요약과 함께 결론을맺는다.
2. 거리 측도 과
ᆫ측된두 시계열 데이터 XXXT = (X1, . . . , XT)′와 YYYT = (Y1, . . . , YT)′ 사이의 거리를 측정하는몇 가 ᄌ
ᅵ 방법을소개하고자 한다.
2.1. 상관관계 기반 거리 ᄉ
ᅡᆼ관관계 기반 거리 (correlation based distance)는 Golay 등 (2005)이 제안하였으며, 시계열 XXXT와 Y
YYT 사이의 피어슨상관관계를고려한다. 상관계수는 식 (2.1)과 같이 표현된다.
COR(XXXT, YYYT) = PT
t=1(Xt− XT)(Yt− YT) q
PT
t=1(Xt− XT)2(Yt− YT)2
, (2.1)
ᄋ
ᅧ기서 XT= T1 PT
t=1Xt, YT =T1 PT
t=1Yt이며, 상관관계 기반 거리는 식 (2.2)와 같이 정의된다.
dCOR.1(XXXT, YYYT) =p
2(1 − COR(XXXT, YYYT)). (2.2)
2.2. 자기상관관계 기반 거리 ᄌ
ᅡ기상관관계 기반 거리 (autocorrelation-based distance)는두 시계열 사이의 유사도를 측정하는방 버
ᆸ이다. Galeano와 Pena (2000), Caiado 등 (2006), D’Urso와 Maharaj (2009)는 추정된자기상관 (autocorrelation)함수를이용하여 자기상관관계 기반 거리 측정 방법을고려하였다.
Galeano와 Pena (2000)는 XXXT와 YYYT 사이의 거리를 식 (2.3)과 같이 정의한다.
dACF(XXXT, YYYT) = q
( ˆρXXXT − ˆρYYYT)′ΩΩΩ( ˆρXXXT − ˆρYYYT), (2.3) ᄋ
ᅧ기서 ˆρXXXT = ( ˆρ1,XT, · · · , ˆρL,XT)′, ˆρYYYT = ( ˆρ1,YT, · · · , ˆρL,YT)′는각각 XXXT와 YYYT의 추정된자기상관 베
ᆨ터이며, ΩΩΩ는가중치 행렬이다.
2.3. 주기도 기반 거리 ᄌ
ᅮ기도 기반 거리 (periodogram-based distance)는 Caiado 등 (2006)에 의해 제안되었으며, 여기서 ᄌ
ᅮ기도 (periodogram)는시계열 자료에 기초한 자료를각 주파수로 분해한 것을의미한다. 주기도 기반 ᄀ
ᅥ리는 식 (2.4)와 같이 표현된다.
dP(XXXT, YYYT) = 1 n
v u u t
n
X
k=1
(IXXXT(λk) − IYYYT(λk))2. (2.4)
IXXXt(λk), IYYYt(λk)는각각 XXXT와 YYYT의 주기도를나타내며 식 (2.5)와 같이 쓸수 있다.
IXXXT(λk) = T−1
T
X
t=1
Xte−iλkt
2
, IYYYT(λk) = T−1
T
X
t=1
Yte−iλkt
2
, (2.5)
ᄋ
ᅧ기서 λk= 2πk/T , k = 1, · · · , n이고 n = [(T − 1)/2]이다.
2.4. 피콜로 거리
Piccolo (1990)는가역성 ARMA 과정에 대한 비유사성 측도를정의했으며, 초기값을제외한 자기회 ᄀ
ᅱ의확장이확률적 구조에 대한 유용한 정보를전달한다고 설명하였다.
π(B)XXXt = at,여기서 at는 Gaussian process. π(B) = 1 −P∞
j=1πjBj 그리고 또한 P∞ j=1|πj| <
∞를만족하는 πi를 구한다. 마찬가지로 YYYT 에 대해서도 구한다. 그러므로 XXXT와 YYYT의 생성과정을 ᄀ
ᅳᆫ사적으로 나타내는 k1과 k2를정한다. ˆΠΠΠXT = (ˆπ1,XT, · · · , ˆπk1,XT)′와 ˆΠΠΠYT = (ˆπ1,YT, · · · , ˆπk2,YT)′에 ᄃ
ᅢ해 피콜로 거리 (Piccolo distance)는 식 (2.6)과 같다.
dP IC(XXXT, YYYT) = v u u t
k
X
j=1
(ˆπj,XT − ˆπj,YT)2, (2.6)
ᄋ
ᅧ기서 k = min(k1, k2)이다.
2.5. 동적 시간 워핑 거리 ᄃ
ᅩᆼ적 시간 워핑 (Dynamic Time Warping; DTW) 알고리즘은모형에 제약 없이 접근하는대표적 방 버
ᆸ으로, Berndt와 Clifford (1994)에 의해 제안되었다. 음성인식, 온라인 필기체의 문자 인식 등에서 널 ᄅ
ᅵ 사용되는알고리즘으로 패턴 인식에 이용되기도 한다.
ᄃ
ᅮ 시계열 간의 거리를최소화하는방향으로 움직이면서 매칭시키며, 누적 거리를계산하여 최소가 되 느
ᆫ 집단을 군집화한다. 시계열 XXXT와 YYYT 간의근접 정도를 측정하는방법으로 그 값의근접도에 기반 ᄒ
ᅡ여 사용하며, DTW 거리는 식 (2.7)과 같이 정의된다.
dDT W(XXXT, YYYT) = min
r∈M T
X
i=1,2,··· ,m
|Xai− Ybi|
!
, (2.7)