2021, 32
(5)
,943–952
이산 웨이블릿 변환을 이용한 시계열 분류
이
ᆷ세은
1
·나종화2
1NH농협금융 ·2충북대학교 정보통계학과
ᄌ ᅥ
ᆸᄉ ᅮ 2021ᄂ ᅧ ᆫ 7ᄋ ᅯ ᆯ 22ᄋ ᅵ ᆯ, ᄉ ᅮᄌ ᅥ ᆼ 2021ᄂ ᅧ ᆫ 8ᄋ ᅯ ᆯ 23ᄋ ᅵ ᆯ, ᄀ ᅦᄌ ᅢ ᄒ ᅪ ᆨᄌ ᅥ ᆼ 2021ᄂ ᅧ ᆫ 8ᄋ ᅯ ᆯ 27ᄋ ᅵ ᆯ
요 약
ᄎ
ᅬ ᄀ ᅳ ᆫ ᄀ ᅡ ᆨᄌ ᅩ ᆼ ᄃ ᅵᄌ ᅵᄐ ᅥ ᆯ ᄀ ᅵᄀ ᅵᄅ ᅩᄇ ᅮᄐ ᅥ ᄑ ᅩ ᆨ ᄇ ᅡ ᆯᄌ ᅥ ᆨᄋ ᅳᄅ ᅩ ᄉ ᅢ ᆼᄉ ᅡ ᆫᄃ ᅬᄀ ᅩ ᄋ ᅵ ᆻᄂ ᅳ ᆫ ᄉ ᅵᄀ ᅨᄋ ᅧ ᆯ ᄌ ᅡᄅ ᅭᄋ ᅦ ᄃ ᅢᄒ ᅡ ᆫ ᄃ ᅦᄋ ᅵᄐ ᅥᄆ ᅡᄋ ᅵᄂ ᅵ ᆼ ᄀ ᅵᄇ ᅥ ᆸᄋ ᅴ ᄌ
ᅥ
ᆨᄋ ᅭ ᆼ ᄋ ᅵ ᄌ ᅮᄋ ᅭ ᄀ ᅪ ᆫ ᄉ ᅵ ᆷᄉ ᅡᄋ ᅵᄃ ᅡ. ᄋ ᅧᄀ ᅵᄋ ᅦᄂ ᅳ ᆫ ᄉ ᅵᄀ ᅨᄋ ᅧ ᆯ ᄌ ᅡᄅ ᅭᄋ ᅦ ᄃ ᅢᄒ ᅡ ᆫ ᄇ ᅮ ᆫ ᄅ ᅲᄋ ᅴ ᄆ ᅮ ᆫ ᄌ ᅦᄀ ᅡ ᄑ ᅩᄒ ᅡ ᆷᄃ ᅬ ᆫ ᄃ ᅡ. ᄇ ᅩ ᆫ ᄋ ᅧ ᆫᄀ ᅮᄋ ᅦᄉ ᅥᄂ ᅳ ᆫ ᄉ ᅵᄀ ᅨ ᄋ ᅧ
ᆯ ᄌ ᅡᄅ ᅭᄋ ᅴ ᄇ ᅮ ᆫ ᄅ ᅲ ᄆ ᅮ ᆫ ᄌ ᅦᄋ ᅦ ᄋ ᅵᄉ ᅡ ᆫ ᄋ ᅰᄋ ᅵᄇ ᅳ ᆯᄅ ᅵ ᆺ ᄇ ᅧ ᆫᄒ ᅪ ᆫᄋ ᅳ ᆯ ᄋ ᅵᄋ ᅭ ᆼ ᄒ ᅡᄂ ᅳ ᆫ ᄇ ᅡ ᆼᄇ ᅥ ᆸᄋ ᅳ ᆯ ᄉ ᅩᄀ ᅢᄒ ᅡᄀ ᅩ, ᄉ ᅵ ᆯᄌ ᅦᄋ ᅴ ᄌ ᅡᄅ ᅭ ᄇ ᅮ ᆫᄉ ᅥ ᆨᄋ ᅦ ᄌ ᅥ ᆨᄋ ᅭ ᆼ ᄒ ᅡ ᆫ ᄃ
ᅡ. ᄋ ᅵᄉ ᅡ ᆫ ᄋ ᅰᄋ ᅵᄇ ᅳ ᆯᄅ ᅵ ᆺ ᄇ ᅧ ᆫᄒ ᅪ ᆫᄋ ᅳ ᆫ ᄉ ᅵᄀ ᅡ ᆫᄋ ᅴ ᄌ ᅥ ᆼᄇ ᅩᄅ ᅳ ᆯ ᄃ ᅡ ᆷᄌ ᅵ ᄆ ᅩ ᆺ ᄒ ᅡᄂ ᅳ ᆫ ᄑ ᅮᄅ ᅵᄋ ᅦ ᄇ ᅮ ᆫᄉ ᅥ ᆨᄋ ᅴ ᄇ ᅡ ᆯᄌ ᅥ ᆫᄃ ᅬ ᆫ ᄒ ᅧ ᆼᄐ ᅢᄅ ᅩ ᄉ ᅵᄀ ᅡ ᆫ ᄒ ᅢᄉ ᅡ ᆼᄃ ᅩᄋ ᅪ ᄌ ᅮ ᄑ
ᅡᄉ ᅮ ᄒ ᅢᄉ ᅡ ᆼᄃ ᅩᄅ ᅳ ᆯ ᄃ ᅩ ᆼ ᄉ ᅵᄋ ᅦ ᄂ ᅩ ᇁᄋ ᅵ ᆯ ᄉ ᅮ ᄋ ᅵ ᆻᄂ ᅳ ᆫ ᄌ ᅡ ᆼᄌ ᅥ ᆷᄋ ᅵ ᄋ ᅵ ᆻᄋ ᅥ ᄇ ᅵᄌ ᅥ ᆼᄉ ᅡ ᆼᄌ ᅥ ᆨ ᄉ ᅵᄀ ᅨᄋ ᅧ ᆯ ᄌ ᅡᄅ ᅭᄋ ᅦ ᄃ ᅢᄒ ᅡ ᆫ ᄇ ᅮ ᆫ ᄅ ᅲ ᄆ ᅮ ᆫ ᄌ ᅦᄋ ᅦ ᄒ ᅭᄀ ᅪᄌ ᅥ ᆨᄋ ᅵ ᄃ
ᅡ. ᄇ ᅮ ᆫ ᄅ ᅲ ᄆ ᅩᄒ ᅧ ᆼᄋ ᅳᄅ ᅩᄂ ᅳ ᆫ ᄋ ᅴᄉ ᅡᄀ ᅧ ᆯᄌ ᅥ ᆼᄂ ᅡᄆ ᅮ, ᄃ ᅡ ᆫᄉ ᅮ ᆫ ᄇ ᅦᄋ ᅵᄌ ᅳ, k-ᄋ ᅵ ᆫᄌ ᅥ ᆸᄋ ᅵᄋ ᅮ ᆺ, SVM, ᄅ ᅢ ᆫᄃ ᅥ ᆷ ᄑ ᅩᄅ ᅦᄉ ᅳᄐ ᅳ ᄇ ᅡ ᆼᄇ ᅥ ᆸᄋ ᅵ ᄉ ᅡᄋ ᅭ ᆼ ᄃ ᅬᄋ ᅥ ᆻ ᄋ
ᅳᄆ ᅧ, ᄉ ᅥ ᆼᄂ ᅳ ᆼ ᄇ ᅵᄀ ᅭᄅ ᅳ ᆯ ᄋ ᅱᄒ ᅢ ᄌ ᅥ ᆼᄒ ᅪ ᆨ ᄃ ᅩ, ᄏ ᅡᄑ ᅡᄀ ᅨᄉ ᅮ, F1-ᄌ ᅥ ᆷᄉ ᅮ, ARI ᄃ ᅳ ᆼ ᄋ ᅴ ᄃ ᅡᄋ ᅣ ᆼᄒ ᅡ ᆫ ᄎ ᅳ ᆨ ᄃ ᅩᄀ ᅡ ᄉ ᅡᄋ ᅭ ᆼ ᄃ ᅬᄋ ᅥ ᆻᄃ ᅡ. ᄋ ᅧ ᆷᄉ ᅡ ᆫᄋ ᅴ ᄂ ᅩ ᆼ ᄃ
ᅩᄅ ᅳ ᆯ ᄎ ᅳ ᆨᄌ ᅥ ᆼᄒ ᅡ ᆫ ᄉ ᅵᄀ ᅨᄋ ᅧ ᆯ ᄌ ᅡᄅ ᅭᄋ ᅦ ᄌ ᅥ ᆨᄋ ᅭ ᆼ ᄒ ᅡ ᆫ ᄀ ᅧ ᆯᄀ ᅪ, ᄋ ᅵᄉ ᅡ ᆫ ᄋ ᅰᄋ ᅵᄇ ᅳ ᆯᄅ ᅵ ᆺᄋ ᅳ ᆯ ᄋ ᅵᄋ ᅭ ᆼ ᄒ ᅡ ᆫ ᄇ ᅡ ᆼᄇ ᅥ ᆸᄋ ᅵ ᄋ ᅯ ᆫ ᄉ ᅵ ᄉ ᅵᄀ ᅨᄋ ᅧ ᆯ ᄌ ᅡᄅ ᅭᄋ ᅦ ᄌ ᅵ ᆨᄌ ᅥ ᆸ ᄇ ᅮ ᆫ ᄅ
ᅲ ᄆ ᅩᄒ ᅧ ᆼᄋ ᅳ ᆯ ᄌ ᅥ ᆨᄋ ᅭ ᆼ ᄒ ᅡ ᆫ ᄀ ᅧ ᆯᄀ ᅪᄂ ᅡ ᄀ ᅩᄉ ᅩ ᆨ ᄑ ᅮᄅ ᅵᄋ ᅦ ᄇ ᅧ ᆫᄒ ᅪ ᆫ (ᄄ ᅩᄂ ᅳ ᆫ ᄃ ᅡ ᆫᄉ ᅵᄀ ᅡ ᆫ ᄑ ᅮᄅ ᅵᄋ ᅦ ᄇ ᅧ ᆫᄒ ᅪ ᆫ)ᄋ ᅳ ᆯ ᄋ ᅵᄋ ᅭ ᆼ ᄒ ᅡ ᆫ ᄀ ᅧ ᆯᄀ ᅪᄇ ᅩᄃ ᅡ ᄉ ᅥ ᆼᄂ ᅳ ᆼ ᄋ ᅵ ᄋ ᅮ ᄉ
ᅮᄒ ᅡ ᆷᄋ ᅳ ᆯ ᄒ ᅪ ᆨ ᄋ ᅵ ᆫᄒ ᅡᄋ ᅧ ᆻᄃ ᅡ. ᄋ ᅵᄉ ᅡ ᆫ ᄋ ᅰᄋ ᅵᄇ ᅳ ᆯᄅ ᅵ ᆺ ᄇ ᅧ ᆫᄒ ᅪ ᆫ ᄋ ᅴ ᄌ ᅥ ᆨᄋ ᅭ ᆼ ᄀ ᅪᄌ ᅥ ᆼᄋ ᅦᄉ ᅥ ᄌ ᅮᄋ ᅭᄒ ᅡᄀ ᅦ ᄎ ᅱᄀ ᅳ ᆸ ᄃ ᅬᄂ ᅳ ᆫ ᄆ ᅩ ᄋ ᅰᄋ ᅵᄇ ᅳ ᆯᄅ ᅵ ᆺᄋ ᅴ ᄉ ᅥ ᆫᄐ ᅢ ᆨ ᄆ ᅮ ᆫ ᄌ ᅦ ᄃ
ᅩ ᄒ ᅡ ᆷᄁ ᅦ ᄀ ᅩᄅ ᅧᄒ ᅡᄋ ᅧ ᆻᄃ ᅡ.
ᄌ
ᅮᄋ ᅭᄋ ᅭ ᆼ ᄋ ᅥ: ᄀ ᅩᄉ ᅩ ᆨ ᄑ ᅮᄅ ᅵᄋ ᅦ ᄇ ᅧ ᆫᄒ ᅪ ᆫ , ᄃ ᅡ ᆫᄉ ᅵᄀ ᅡ ᆫ ᄑ ᅮᄅ ᅵᄋ ᅦ ᄇ ᅧ ᆫᄒ ᅪ ᆫ , ᄉ ᅵᄀ ᅨᄋ ᅧ ᆯ ᄇ ᅮ ᆫ ᄅ ᅲ, ᄋ ᅵᄉ ᅡ ᆫ ᄋ ᅰᄋ ᅵᄇ ᅳ ᆯᄅ ᅵ ᆺ ᄇ ᅧ ᆫᄒ ᅪ ᆫ .
1. 서론 ᄉ
ᅵ계열 자료는시간의 흐름에 따라관측된자료로 최근다양한 디지털 기기가 개발됨에 따라 온도, 압 ᄅ
ᅧᆨ, 전기 등의 여러 분야에서 폭발적으로 생성되고 있다. 지금까지 많은시계열 분석 방법은미래 예측 ᄋ
ᅦ 초점이 맞추어져 있었으며, ARIMA나 지수평활법 및 최근에는 Prophet 모형 등이 예측모형으로 ᄉ
ᅡ용되고 있다. 하지만 방대한 양의 시계열 자료를다루는데이터마이닝 영역에서 시계열 자료에 대한 부
ᆫ류나 군집관련의 분석 방법들이 연구자나 실무자들 사이에서 큰 관심사가 되고 있다. 시계열 분류 (time series classification)는범주를알고 있는시계열 자료로부터 얻은정보를 바탕으로 범주가 알려 ᄌ
ᅵ지 않은시계열 자료를 분류하는방법이다. 시계열 자료는경향성, 주기성 등비정상적인 특성을포함 ᄒ
ᅡ는 경우가 많다 (Lee 등, 2019). 따라서 시계열 분류 성능을 향상하기 위해 푸리에 분석이나 웨이블 리
ᆺ 분석을 통해 필요한 정보 (계수)를추출하고, 이를이용하여 시계열 자료에 대한 분류를수행하게된 ᄃ
ᅡ. 푸리에 분석은 일반적으로 시계열 자료를시간 영역에서 주파수 영역으로 변형시켜 시계열 자료의 ᄌ
ᅮ기성을파악하는데 사용된다. 그러나 푸리에 분석은 시간 정보를포함하고 있지 않기 때문에 시간에 ᄄ
ᅡ라 변하는비정상 신호의 분석을위해서는이를보완한 단시간 푸리에 분석을사용한다. 그러나 이 분 ᄉ
ᅥ
ᆨ 역시 고정된주파수 범위 밖의 성분에 대해서는해석이 어려운 단점을가진다. 웨이블릿 분석은 단
1
(04517) ᄉ ᅥᄋ ᅮ ᆯᄐ ᅳ ᆨᄇ ᅧ ᆯᄉ ᅵ ᄌ ᅮ ᆼ ᄀ ᅮ ᄐ ᅩ ᆼᄋ ᅵ ᆯᄅ ᅩ 120, NHᄂ ᅩ ᆼᄒ ᅧ ᆸᄀ ᅳ ᆷᄋ ᅲ ᆼ, ᄌ ᅮᄋ ᅵ ᆷ.
2
ᄀ ᅭᄉ ᅵ ᆫᄌ ᅥᄌ ᅡ: (28644) ᄎ ᅮ ᆼᄇ ᅮ ᆨ ᄎ ᅥ ᆼᄌ ᅮᄉ ᅵ ᄉ ᅥᄋ ᅯ ᆫ ᄀ ᅮ ᄎ ᅮ ᆼ ᄃ ᅢᄅ ᅩ 1, ᄎ ᅮ ᆼᄇ ᅮ ᆨ ᄃ ᅢᄒ ᅡ ᆨᄀ ᅭ ᄌ ᅥ ᆼᄇ ᅩᄐ ᅩ ᆼ ᄀ ᅨᄒ ᅡ ᆨᄀ ᅪ, ᄀ ᅭᄉ ᅮ.
E-mail: [email protected]
ᄉ
ᅵ간 푸리에 분석의 단점을보완한 방법으로 시간에 따라 변하는c주기를 가지는 자료의 정보를더 잘 ᄂ
ᅡ타내기 위한 방법으로 제안되었다. 한편 통계적 분류 문제에 푸리에 및 웨이블릿 변환을적용한 논문 ᄋ
ᅳ로 Polat와 Gunes (2007)는뇌파 신호에서 뇌전증 발작을 분류하기 위해 고속 푸리에 변환과 의사 겨
ᆯ정나무를사용하였으며, Elbir 등 (2018)은 음악 장르를 분류하기 위해 STFT와 SVM을사용하였다.
Wu 등 (2000)은시계열 데이터베이스에서 이산 푸리에 변환과 이산 웨이블릿 변환을이용한 시계열 매 ᄎ
ᅵᆼ 성능을 비교하였고, Das 등 (2006)은 고압 전송선 결함 위치 예측과 결함 분류를위해서 이산 푸리 ᄋ
ᅦ 변환과 이산 웨이블릿 변환을이용하고, 두 변환의 성능을비교하였다. 또한 Li 등 (2016)은경험적 ᄋ
ᅧᆫ구로 다양한 시계열 자료에 이산 웨이블릿 변환과 1-NN (1-nearest neighbor)을사용하여 분류 성능 으
ᆯ비교하였고, Gokgoz와 Subasi (2015)는근전도 신호 분류를위해 이산 웨이블릿 변환과 의사결정나 ᄆ
ᅮ, 랜덤 포레스트를사용하였다. Ubeyli (2009)는뇌파 신호 분류를위해 웨이블릿 변환과 신경망 모 ᄃ
ᅦᆯ을사용하였으며, Murugappan (2011)은뇌파 신호로 인간의 감정을 분류하기 위해서 웨이블릿 변환 ᄀ
ᅪ k-인접이웃을사용하였고, Mao와 Aggarwal (2001)은전류 분류를위해 웨이블릿 변환과 신경망 모 ᄃ
ᅦᆯ을사용한 연구를수행한 바 있다. 아울러 대용량 자료와 시계열 자료에 대한 분류 및 군집 분석에 대 ᄒ
ᅡᆫ 국내 연구로는 Bang 등 (2021)과 Kim과 Kim (2021)이 있다. 본 논문에서는이산 웨이블릿 변환을 ᄐ
ᅩ
ᆼ한 시계열 자료의 분류 문제를 다루었다. 분석에는 염산의 농도를 측정한 시계열 자료를사용하였으 ᄆ
ᅧ, 성능비교를위해 두 종류의 푸리에 변환과 원시 시계열 자료를이용한 분류 방법도 함께 다루었다.
ᄇ
ᅩᆫ 논문의 구성은다음과 같다. 2절에서는푸리에 분석과 웨이블릿 분석을소개하고, 3절에서는 분석 자 ᄅ
ᅭ에 대한 소개와 분석 결과를제시하고, 성능평가를위한 비교 분석을수행하였다. 마지막으로 4절에 ᄉ
ᅥ는결론에관해 서술하였다.
2. 푸리에 분석과 웨이블릿 분석 ᄋ
ᅵ번 절에서는먼저 웨이블릿 분석의근간이 되는푸리에 분석을소개한 뒤, 웨이블릿 분석을소개한 ᄃ
ᅡ.
2.1. 푸리에 분석 ᄑ
ᅮ리에 분석 (Fourier analysis)은 복잡한 형태 (주기 또는비주기 함수)의 시간 영역의 신호를사인 ᄒ
ᅡᆷ수의 합으로 분해하고 이로부터 주파수의 기여도를찾아내는방법이다. 푸리에 분석은 신호의 주기성 ᄋ
ᅦ 따라 푸리에 급수와 푸리에 변환으로 나누어진다.
2.1.1. 푸리에 급수 ᄑ
ᅮ리에 급수 (Fourier series)는주기성을 따르는 신호의 주파수를 분석하는방법으로 복잡한 형태의 ᄉ
ᅵᆫ호를삼각함수를이용하여 주파수로 나타낸다. 시간 영역의 함수 f(t)가 주기함수일 때, 푸리에 급수 ᄂ
ᅳᆫ다음의 식과 같이 나타낼 수 있다.
f (t) = a0+
∞
X
n=1
(ancos nwt + bnsin nwt), (2.1) ᄋ
ᅧ기서 w는 주파수를나타낸다. a0는 신호의 중심을의미하며 사인과 코사인 함수가 0을 중심으로 진 ᄃ
ᅩ
ᆼ하는것과 같이 임의의 함수 f(t)가 a0를 중심으로 진동한다는의미이다. an과 bn은주파수 성분들이 어
ᆯ마나 기여하는지를의미한다.