• 검색 결과가 없습니다.

Deep multiple kernel least squares support vector regression machine<sup>†</sup>

N/A
N/A
Protected

Academic year: 2021

Share "Deep multiple kernel least squares support vector regression machine<sup>†</sup>"

Copied!
8
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

2018, 29

(

4)

,

895–902

심층 다중 커널 최소제곱 서포트 벡터 회귀 기계

ᆼᄎᆼᄒ

1

·ᅬᄉᆼᄋ

2

· ᄉᆷ주ᄋ

3

1ᆫᄀᆨ교 ᄋᆼᄋᆼ톄ᄒᆨ과 ·2ᆫ개ᄒᆨ교 ᄋᆼᄋᆼᄏᆷ퓨터ᄀᆨ과 ·3ᆫ제대ᄒᆨ교 톄ᄒᆨᄀ

ᄌ ᅥ

ᆸᄉ ᅮ 2018ᄂ ᅧ ᆫ 6ᄋ ᅯ ᆯ 25ᄋ ᅵ ᆯ, ᄉ ᅮᄌ ᅥ ᆼ 2018ᄂ ᅧ ᆫ 7ᄋ ᅯ ᆯ 12ᄋ ᅵ ᆯ, ᄀ ᅦᄌ ᅢ ᄒ ᅪ ᆨᄌ ᅥ ᆼ 2018ᄂ ᅧ ᆫ 7ᄋ ᅯ ᆯ 17ᄋ ᅵ ᆯ

요 약

ᅩ ᆫ ᄂ ᅩ ᆫᄆ ᅮ ᆫ ᄋ ᅦᄉ ᅥᄂ ᅳ ᆫ ᄒ ᅬᄀ ᅱᄆ ᅩᄒ ᅧ ᆼᄋ ᅳ ᆯ ᄋ ᅱᄒ ᅡ ᆫ ᄉ ᅵ ᆷᄎ ᅳ ᆼ ᄃ ᅡᄌ ᅮ ᆼ ᄏ ᅥᄂ ᅥ ᆯ ᄎ ᅬᄉ ᅩᄌ ᅦᄀ ᅩ ᆸ ᄉ ᅥᄑ ᅩᄐ ᅳ ᄇ ᅦ ᆨᄐ ᅥ ᄒ ᅬᄀ ᅱ ᄀ ᅵᄀ ᅨ (least squares support vector regression machine; LS-SVRM)ᄋ ᅳ ᆯ ᄌ ᅦᄋ ᅡ ᆫᄒ ᅡ ᆫᄃ ᅡ. ᄌ ᅦᄋ ᅡ ᆫ ᄃ ᅬ ᆫ ᄆ ᅩᄒ ᅧ ᆼᄋ ᅳ ᆫ ᄋ ᅵ ᆸᄅ ᅧ ᆨᄎ ᅳ ᆼ, 2ᄀ ᅢᄋ ᅴ ᄋ ᅳ ᆫᄂ ᅵ ᆨ ᄎ

ᅳ ᆼ ᄆ ᅵ ᆾ ᄎ ᅮ ᆯᄅ ᅧ ᆨᄎ ᅳ ᆼ ᄋ ᅳᄅ ᅩ ᄀ ᅮᄉ ᅥ ᆼᄃ ᅬ ᆫ ᄃ ᅡ. ᄀ ᅡ ᆨ ᄋ ᅳ ᆫᄂ ᅵ ᆨᄎ ᅳ ᆼ ᄋ ᅦᄉ ᅥ ᄃ ᅡᄅ ᅳ ᆫ ᄒ ᅧ ᆼᄐ ᅢᄋ ᅴ ᄏ ᅥᄂ ᅥ ᆯᄋ ᅳ ᆯ ᄀ ᅡᄌ ᅵᄂ ᅳ ᆫ LS-SVRMᄋ ᅵ ᄋ ᅵ ᆸᄅ ᅧ ᆨᄀ ᅪ ᄌ ᅩ ᆼᄉ ᅩ ᆨᄇ ᅧ ᆫ ᄉ

ᅮᄅ ᅳ ᆯ ᄋ ᅵᄋ ᅭ ᆼ ᄒ ᅡᄋ ᅧ ᄒ ᅡ ᆨᄉ ᅳ ᆸᄃ ᅬ ᆫ ᄃ ᅡ. ᄎ ᅬᄌ ᅩ ᆼ ᄎ ᅮ ᆯᄅ ᅧ ᆨᄋ ᅳ ᆯ ᄋ ᅱᄒ ᅢ ᄎ ᅮ ᆯᄅ ᅧ ᆨᄎ ᅳ ᆼᄋ ᅳ ᆫ ᄃ ᅮᄇ ᅥ ᆫᄍ ᅢ ᄋ ᅳ ᆫᄂ ᅵ ᆨᄎ ᅳ ᆼ ᄋ ᅴ ᄎ ᅮ ᆯᄅ ᅧ ᆨᄋ ᅳ ᆯ ᄋ ᅵ ᆸᄅ ᅧ ᆨᄋ ᅳᄅ ᅩ ᄉ ᅡᄋ ᅭ ᆼ ᄒ ᅡᄋ ᅧ ᄒ ᅡ ᆨ ᄉ

ᆸᄃ ᅬ ᆫ ᄃ ᅡ. ᄃ ᅡᄎ ᅳ ᆼ ᄉ ᅵ ᆫᄀ ᅧ ᆼᄆ ᅡ ᆼᄀ ᅪ ᄃ ᅡ ᆯᄅ ᅵ ᄉ ᅵ ᆷᄎ ᅳ ᆼ ᄃ ᅡᄌ ᅮ ᆼ ᄏ ᅥᄂ ᅥ ᆯ LS-SVRMᄋ ᅦᄉ ᅥ ᄀ ᅡ ᆨ LS-SVRMᄋ ᅳ ᆫ ᄇ ᅥ ᆯᄎ ᅵ ᆨᄒ ᅪ ᄆ ᅩ ᆨᄌ ᅥ ᆨᄒ ᅡ ᆷᄉ ᅮᄅ ᅳ ᆯ ᄎ ᅬ ᄉ

ᅩᄒ ᅪᄒ ᅡᄃ ᅩᄅ ᅩ ᆨ ᄒ ᅮ ᆫᄅ ᅧ ᆫᄃ ᅬ ᆫ ᄃ ᅡ. ᄄ ᅡᄅ ᅡᄉ ᅥ ᄉ ᅵ ᆷᄎ ᅳ ᆼ ᄃ ᅡᄌ ᅮ ᆼ ᄏ ᅥᄂ ᅥ ᆯ LS-SVRMᄋ ᅴ ᄒ ᅡ ᆨᄉ ᅳ ᆸᄋ ᅳ ᆫ ᄎ ᅬᄌ ᅩ ᆼ ᄇ ᅵᄋ ᅭ ᆼ ᄒ ᅡ ᆷᄉ ᅮᄆ ᅡ ᆫ ᄎ ᅬᄉ ᅩᄒ ᅪᄒ ᅡᄀ ᅵ ᄋ ᅱ ᄒ

ᅢ ᄀ ᅡᄌ ᅮ ᆼ ᄎ ᅵ ᄆ ᅵ ᆾ ᄑ ᅧ ᆫᄋ ᅴᄒ ᅡ ᆼᄋ ᅳ ᆯ ᄒ ᅡ ᆨᄉ ᅳ ᆸ ᄒ ᅡᄂ ᅳ ᆫ ᄃ ᅡᄎ ᅳ ᆼ ᄉ ᅵ ᆫᄀ ᅧ ᆼᄆ ᅡ ᆼᄀ ᅪ ᄋ ᅪ ᆫᄌ ᅥ ᆫᄒ ᅵ ᄃ ᅡᄅ ᅳᄃ ᅡ. ᄉ ᅵ ᆷᄎ ᅳ ᆼ ᄃ ᅡᄌ ᅮ ᆼ ᄏ ᅥᄂ ᅥ ᆯ LS-SVRMᄋ ᅳ ᆫ ᄆ ᅩᄃ ᅳ ᆫ LS-SVRMᄋ ᅳ ᆯ ᄒ ᅮ ᆫᄅ ᅧ ᆫᄒ ᅡᄀ ᅩ ᄌ ᅩᄒ ᅡ ᆸ ᄀ ᅡᄌ ᅮ ᆼ ᄎ ᅵᄋ ᅪ ᄑ ᅧ ᆫᄋ ᅴᄒ ᅡ ᆼᄅ ᅳ ᆯ ᄉ ᅡᄋ ᅭ ᆼ ᄒ ᅡ ᆫᄃ ᅡ. ᄋ ᅵᄄ ᅢ ᄌ ᅩᄒ ᅡ ᆸ ᄀ ᅡᄌ ᅮ ᆼ ᄎ ᅵᄋ ᅪ ᄑ ᅧ ᆫᄋ ᅴᄒ ᅡ ᆼᄋ ᅳ ᆫ ᄋ ᅧ ᆨᄌ ᅥ ᆫᄑ ᅡ ᄋ ᅡ ᆯᄀ ᅩ ᄅ

ᅵᄌ ᅳ ᆷᄅ ᅳ ᆯ ᄋ ᅵᄋ ᅭ ᆼ ᄒ ᅡᄋ ᅧ ᄀ ᅢ ᆼᄉ ᅵ ᆫᄃ ᅬ ᆫ ᄃ ᅡ. ᄉ ᅮᄎ ᅵᄌ ᅥ ᆨ ᄋ ᅧ ᆫᄀ ᅮᄂ ᅳ ᆫ ᄉ ᅵ ᆷᄎ ᅳ ᆼ ᄃ ᅡᄌ ᅮ ᆼ ᄏ ᅥᄂ ᅥ ᆯ LS-SVRMᄋ ᅵ ᄒ ᅬᄀ ᅱ ᄆ ᅮ ᆫ ᄌ ᅦᄋ ᅦ ᄃ ᅢᄒ ᅡ ᆫ ᄎ ᅬᄎ ᅥ ᆷᄃ ᅡ ᆫ ᄀ ᅵ ᄀ

ᅨ ᄒ ᅡ ᆨᄉ ᅳ ᆸ ᄆ ᅩᄒ ᅧ ᆼᄇ ᅩᄃ ᅡ ᄋ ᅮᄋ ᅱᄋ ᅦ ᄋ ᅵ ᆻᄋ ᅳ ᆷᄋ ᅳ ᆯ ᄇ ᅩᄋ ᅧᄌ ᅮ ᆫ ᄃ ᅡ.

ᅮᄋ ᅭᄋ ᅭ ᆼ ᄋ ᅥ: ᄃ ᅡᄎ ᅳ ᆼ ᄉ ᅵ ᆫᄀ ᅧ ᆼᄆ ᅡ ᆼ, ᄇ ᅥ ᆯᄎ ᅵ ᆨᄒ ᅪ ᄆ ᅩ ᆨᄌ ᅥ ᆨᄒ ᅡ ᆷᄉ ᅮ, ᄉ ᅵ ᆷᄎ ᅳ ᆼ ᄉ ᅵ ᆫᄀ ᅧ ᆼᄆ ᅡ ᆼ, ᄋ ᅧ ᆨᄌ ᅥ ᆫᄑ ᅡ ᄋ ᅡ ᆯᄀ ᅩᄅ ᅵᄌ ᅳ ᆷ, ᄎ ᅬᄉ ᅩᄌ ᅦᄀ ᅩ ᆸ ᄉ ᅥᄑ ᅩᄐ ᅳ ᄇ ᅦ ᆨᄐ ᅥ ᄀ ᅵᄀ ᅨ, ᄒ

ᅬᄀ ᅱ.

1. 서론

ᅥ포트 ᄇᆨ터 기계 (support vector machine; SVM)ᄋᆫ 뷰 ᄆᆾ 회귀ᄇᆫᄉᆫᄅᆫ ᄉᆯ제메에서 ᄉᆼᄀᆼᄌᆨᄋ

ᆯ외ᄋᆻ다 (Vapnik, 1995). SVM의 ᄉᆼᄀᆼᄌᆨᄋᆯ에도 부하고 SVM ᄒᆨᄉᆸᄋᆫ 2ᅡ 프로그래ᄆᆼ ᄆ

ᅦᄅ ᅮᄇᆫᄒᆫ다. 티 대ᄋᆼ 자료의 ᄀᆼ우 SVMᄋᆫ 2ᅡ 프로그래ᄆᆼ 메루네 ᄉᆷᄀᆨᄒᆫ 어려이 ᄋ

ᅡ. Suykens와 Vanderwalle (1999)ᄋᆫ SVMᅴ 최소제ᄀ ᅥᄌᆫᄋᆫ LS-SVMᄋ ᅦᄋᆫ하ᄋᆻ다. LS-SVMᄋ

ᅢ우 ᄑᆫ리하고 유ᄋᆫ ᄇᆼᄇᆸ으로 ᄋᆸ죄ᄋᆻ다. SVM과 LS-SVM의 소개 ᄆᆾ 채ᄇᆯ에 대ᄒᆫ ᄉᆯᄆᆼᄋ

ᅢ Suykens ᄃᆼ (2001), Smolaᅪ Sch¨olkopf (2004), Hwang (2015, 2016), Seok (2015), Hwangᅪ Shim (2017)ᄋᆷ고하라.

SVMᅪ LS-SVMᄋ ᆫᄎ ᅮ조 (shallow architecture)ᄅ ᆽᄂ ᅩᄒᆼ이기 때메 ᄇᆸᄒᆫ ᄐᆨᄉᆼᄋ ᅡᄌ

ᅦ이터에 ᄌᆨᄋᆼᄃ ᅢ ᄌᆼᄌ ᅡᄈ ᆯ과ᄅ ᅣ기하ᄂ ᆼᄒᆼ이 ᄋᆻ다 (Bengio와 Le Cun, 2007). ᄉᆷᄎᆼ ᄉ

ᆼᄆᆼ (deep neural network)ᄋ ᆭᄋᆫ ᄉᆯ제메에서 우수ᄒᆫ ᄉᆼᄂᆼᄋ ᅩ여주ᄂᆺ으로 ᄋᆯ려ᄌᆻ다 (Bengio

ᄋ ᅵ ᄂ ᅩ ᆫᄆ ᅮ ᆫᄋ ᅳ ᆫ 2016ᄂ ᅧ ᆫᄃ ᅩ, 2018ᄂ ᅧ ᆫᄃ ᅩ ᄀ ᅭᄋ ᅲ ᆨ ᄇ ᅮᄋ ᅴ ᄌ ᅢᄋ ᅯ ᆫ ᄋ ᅳᄅ ᅩ ᄒ ᅡ ᆫᄀ ᅮ ᆨᄋ ᅧ ᆫᄀ ᅮᄌ ᅢᄃ ᅡ ᆫᄋ ᅴ ᄌ ᅵᄋ ᅯ ᆫᄋ ᅳ ᆯ ᄇ ᅡ ᆮᄋ ᅡ ᄉ ᅮᄒ ᅢ ᆼᄃ ᅬ ᆫ ᄀ ᅵᄎ ᅩᄋ ᅧ ᆫᄀ ᅮᄉ ᅡᄋ ᅥ ᆸᄋ ᅵ ᆷ (NRF-2016R1D1A1B03931617, NRF-2018R1D1A1B07042349). ᄋ ᅵ ᄋ ᅧ ᆫᄀ ᅮᄂ ᅳ ᆫ 2017ᄒ ᅡ ᆨᄂ ᅧ ᆫᄃ ᅩ ᄃ ᅡ ᆫᄀ ᅮ ᆨ ᄃ ᅢᄒ ᅡ ᆨᄀ ᅭ ᄃ

ᅢᄒ ᅡ ᆨᄋ ᅧ ᆫᄀ ᅮᄇ ᅵ ᄌ ᅵᄋ ᅯ ᆫ ᄋ ᅳᄅ ᅩ ᄋ ᅧ ᆫᄀ ᅮᄃ ᅬᄋ ᅥ ᆻᄋ ᅳ ᆷ.

1

(16890) ᄀ ᅧ ᆼᄀ ᅵᄃ ᅩ ᄋ ᅭ ᆼᄋ ᅵ ᆫᄉ ᅵ ᄉ ᅮᄌ ᅵᄀ ᅮ ᄌ ᅮ ᆨᄌ ᅥ ᆫᄅ ᅩ 152, ᄃ ᅡ ᆫᄀ ᅮ ᆨ ᄃ ᅢᄒ ᅡ ᆨᄀ ᅭ ᄋ ᅳ ᆼᄋ ᅭ ᆼᄐ ᅩ ᆼ ᄀ ᅨᄒ ᅡ ᆨᄀ ᅪ, ᄀ ᅭᄉ ᅮ.

2

(16890) ᄀ ᅧ ᆼᄀ ᅵᄃ ᅩ ᄋ ᅭ ᆼᄋ ᅵ ᆫᄉ ᅵ ᄉ ᅮᄌ ᅵᄀ ᅮ ᄌ ᅮ ᆨᄌ ᅥ ᆫᄅ ᅩ 152, ᄃ ᅡ ᆫᄀ ᅮ ᆨ ᄃ ᅢᄒ ᅡ ᆨᄀ ᅭ ᄋ ᅳ ᆼᄋ ᅭ ᆼᄏ ᅥ ᆷᄑ ᅲᄐ ᅥᄀ ᅩ ᆼ ᄒ ᅡ ᆨᄀ ᅪ, ᄇ ᅮᄀ ᅭᄉ ᅮ.

3

ᄀ ᅭᄉ ᅵ ᆫᄌ ᅥᄌ ᅡ: (50834) ᄀ ᅧ ᆼᄂ ᅡ ᆷ ᄀ ᅵ ᆷᄒ ᅢᄉ ᅵ ᄋ ᅵ ᆫᄌ ᅦᄅ ᅩ 197, ᄋ ᅵ ᆫᄌ ᅦᄃ ᅢᄒ ᅡ ᆨᄀ ᅭ ᄐ ᅩ ᆼ ᄀ ᅨᄒ ᅡ ᆨᄀ ᅪ, ᄀ ᅧ ᆷᄋ ᅵ ᆷᄀ ᅭᄉ ᅮ.

E-mail: [email protected]

(2)

ᆼ, 2013). ᅡ수의 ᄋᆫ구자ᄃᆯ어ᄂᆯᄒᆨ시 ᄃᆸ러ᄂᆼ위해 수ᄌᆼ두 ᄋᆻ니ᄅᆫ구하ᄋᆻ다. Cho와 Saul (2009)우ᄒᆫ 크기의 ᄉᆫᄀᆼᄆᆼ의 ᄃᆨ오ᄇᆼ하도ᄅᆯ가크코사ᄋᆫ (arccosine) 커ᄂᆯ아아여 ᄃ

ᅥᄂᆼ위ᄒᆫ 커ᄂᆯ기계레ᄋᆫ하ᄋᆻ다. 그러나 이 ᄇᆼᄇᆸᄋᆼ위 ᄎᆫᄅᆫ대개ᄇᆫ수로ᄌᆼ하ᄂᆺ이 ᄉ

ᅵ ᄋᆭᄋ ᆫᄌᆷᄋ ᅡ지고 ᄋᆻ다. Zhuang ᄃᆼ (2011)ᄋ ᅧ러 개의 커ᄂᆯ의 조ᄒᆸ오려하ᄂᆫ 2ᄎ ᅡᄌ ᅥᄂ

ᆨᄉᆸ에ᄋᆫ하ᄋᆻ지ᄆᆫ 3치ᄉᆼ의 다저ᄂᆯ기계ᄅᆼ하ᄂ ᅦᄂᆫ 메가 ᄋᆻ다. Wiering과 Schomaker (2014)나ᄎᆼ SVM우차고 ᄒᆫᄅᆫ하기 위ᄒᆫ ᄀᆫᄃᆫᄒᆫ ᄇᆼᄇᆸᄋᆫ구하ᄋᆻ다.

SVMᅪ LS-SVM예ᄎᆨᄉᆼ니 모ᄒᆼ에 사ᄋᆼ더ᄂᆯ의 쥬에 ᄋᆼᄒᆼᄋᆭ이 ᄇᆮᄂᆫ ᄐᆨᄉᆼ아지고 ᄋᆻ다.

ᅵ라ᄐᆼ으로 우리녀러 가지 커ᄂᆯ아아고 ᄉᆷᄎᆼ ᄉᆫᄀᆼᄆᆼ과 LS-SVRM의 아이디어ᄅᆯᄒᆸᄒᆫ ᄉᆷᄎ

ᅡ저ᄂᆯ LS-SVRM에ᄋᆫ하고자 ᄒᆫ다. LS-SVRMᄋᆨ ᄋᆫᄂᆨ노드에 ᄌᆨ아여 ᄉᆷᄎᆼ ᄉᆫᄀᆼᄆᆼ의 아이ᄃ

ᅥ라ᄋᆯ 수 ᄋᆻ다. 그러나, ᄉᆷ차저ᄂᆯ LS-SVRM에서 ᄋᆫᄂᆨ츼 ᄀᆨ LS-SVRMᄋᆯᄎᆨ화 ᄆᆨᄌᆨᄒ

ᅮ뢰소화하도ᄅᆨ ᄒᆫᄅᆫ다. ᄂᆫ믜 나머지 부ᄇᆫ아와 ᄀᇀ이 구ᄉᆼ다. 2ᄌᆯ에서 LS-SVRM에 대ᄒ

ᆫᄃᆫ히 ᄉᆯ펴바. 3ᄌᆯ에서ᄂᆫ ᄋᆸᄅᆨᄎᆼ, 2ᅢ의 ᄋᆫᄂᆨᄎᆼ ᄆᆾ ᄎᆯᄅᆨ츠로 구ᄉᆼᄃᆷ차저ᄂᆯ LS-SVRMᄋ

ᅦᄋᆫᄒᆫ다. 4ᄌᆯ에서ᄂ ᅦᄋᆷ차저ᄂᆯ LS-SVRMᄋᆯ ᄉᆯ제자료에 ᄌᆨ아여 기즤 LS-SVRM ᄆ

ᅡᄎᆼ ᄉᆫᄀᆼᄆᆼ과 ᄉᆼᄂᆼ이교ᄒᆫ다. 그리고 5ᄌᆯ에서 ᄀᆯᄅᆫ애ᄅᆫ다.

2. LS-SVRM

ᅮ어ᄌᆫ 자료ᄅ {(xxxi, yi)}ni=1ᅳ로 표기하기로 ᄒᆫ다. 여기서 xxxi ∈ Rdᆫ ᄋᆸᄅᆨᄇᆨ터이고 yi ∈ Rᄂᆫ ᄎᆯᄅ

ᆹ이다. 비ᄉᆫᄒᆼ 회귀모ᄒᆼ위하여 회귀ᄒᆷ수 f(xxx) = www′ϕϕϕ(xxx) + b로려ᄒᆫ다. 여기서 ϕϕϕ : Rd→ Rdf

ᆸᄅᆨᄀᆫᄋᆷ시ᄌᆨ으로 ᄌᆼᄋ ᅥ ᄂᇁᄋ ᅡ의 ᄐᆨᄌᆼᄀᆫ으로 사ᄉᆼ하니ᄉᆫᄒᆼ ᄐᆨᄌᆼ사ᄉᆼᄒᆷ수이다. LS- SVRMᅴ 최ᄌᆨ화 메나와 ᄀᇀ이 ᄌᆼ아.

min1

2www′www +C 2

n

X

i=1

e2i (2.1)

subject to ei= yi− www′ϕϕϕ(xxxi) − b, i = 1, · · · , n,ᅧ기서 C > 0ᄂᆨᄒᆸ도와 www′wwwᅡ이의 ᄀᆫᄒᆼ에어하ᄂ

ᆯᄎᆨᄉᆼ수이다.

ᆨ (2.1)에 대해 라그ᄅᆼ즈 (Lagrange) ᄒᆷ수라와 ᄀᇀ이 ᄆᆫ두 ᄋᆻ다.

L =1

2www′www +C 2

n

X

i=1

e2i

n

X

i=1

αi(ei− yi+ www′ϕϕϕ(xxxi) + b), (2.2)

ᅧ기서 αiᅡ그ᄅᆼ즈 배수 (multiplier)이다. 따라서 최ᄌᆨ화 조ᄀᆫ (optimality condition)아와 ᄀ

ᅵ 구해ᄌᆫ다.

∂L

∂www = 000 → www −

n

X

i=1

αiϕϕϕ(xxxi) = 000,

∂L

∂b = 0 →

n

X

i=1

αi= 0,

∂L

∂ei

= 0 → Cei− αi= 0, i = 1, · · · , n,

∂L

∂αi

= 0 → ei− yi+ www′ϕϕϕ(xxxi) + b = 0, i = 1, · · · , n. (2.3)

(3)

ᆨ (2.3)ᄋ ᆼ리하ᄆᆫ 다의 ᄉᆫᄒᆼᄇᆼᄌᆼᄉᆨ으로 ᄀᆫᄃᆫ하게 표ᄒᆫ다. 따라서 라그ᄅᆼ즈 배수의 최ᄌᆨᄀᆹᄀ

ᆫ의ᄒᆼ의 추ᄌᆼᄀᆹ이 ᄉᆫᄒᆼᄇᆼᄌᆼᄉᆨ으로부터 구해ᄌᆫ다.

K + I/C 111 1 11′ 0

! ααα b

!

= yyy 0

!

, (2.4)

ᅧ기서 ααα = (α1, · · · , αn)′, yyy = (y1, · · · , yn)′, K = {K(xxxi, xxxj)}ni,j=1 = ϕϕϕ(xxxi)′ϕϕϕ(xxxj)ᅵ고, 이ᄀᆺᄋ Mercer (1909)ᅴ 조ᄀᆫᄋᆯ ᄋᆼ아여 구해ᄌᆫ다.

ᅡ라서 ᄋᆷ의의 ᄋᆸᄅᆨᄇᆨ터 xxxt∈ Rdᅦ 대ᄒᆫ 회귀ᄒᆷ수의 추ᄌᆼᄀᆹ아와 ᄀᇀ이 구해ᄌᆫ다.

f (xˆxxt) = KKKtααα + b = HHHtyyy, (2.5)

ᅧ기서 KKKt= (K(xxxt, xxx1), · · · , K(xxxt, xxxn)), ααα = (α1, · · · , αn)′, (KKKt, 1)HHH0ᅵᄀ

H H

H0= (KKK + III/C)−1− (KKK + III/C)−1111(111′(KKK + III/C)−1111)111′(KKK + III/C)−1 (111′(KKK + III/C)−1111)−1111′(KKK + III/C)−1

! .

ᅮ어ᄌᆫ 모ᄒᆼ의 ᄉᆼᄂᆼᄋ ᆯᄎᆨᄉᆼ수와 커ᄂᆯ모수, ᄌ ᅩ모수 (hyperparameter)의 ᄀᆹ에 ᄋᆼᄒᆼᄋ ᆭ이 ᄇᆮᄂ

ᅡ. 모ᄒᆼ에 사외너ᄂᆯ의 ᄒᆼ태가 ᄌᆼ해ᄌᆫ ᄀᆼ우 모ᄒᆼᄉᆫᄐᆨ이ᄅᆫ 초모수의 최ᄌᆨᄀᆹ우하ᄂᆺ이다. LS- SVRMᅦ서 초모수의 최ᄌᆨᄀᆹ우하기 위하여 ᄆᆫ저 다와 ᄀᇀᄋᆫ LOO-ᅭ차타ᄃᆼᄉᆼ (leave one out-cross validation)ᆷ수로려ᄒᆯ 수 ᄋᆻ다.

CV (θθθ) = 1 n

n

X

i=1

(yi− ˆfi(−i)θθ))2, (2.6)

ᅧ기서 θθθᄂᆯᄎᆨᄉᆼ수와 커ᄂᆯ모수로 이루어ᄌᆫ ᄇᆨ터이고, ˆfi(−i)θθ)ᄂᆫ iᄇᆫ째 자료리아지 ᄋᆭ고 구ᄒᆫ ᄒ

ᅱᄒᆷ수 f(xxxi)ᅴ 추ᄌᆼᄀᆹ이다. LOO-교차타ᄃᆼᄉᆼ ᄇᆼᄇᆸ우어ᄌᆫ θθθ에 대하여 n개의 ˆfi(−i)θθ)ᅡ ᄑᆯ요하므ᄅ LOO-ᅭ차타ᄃᆼᄉᆼ ᄒᆷ수리아여 ᄇᆯᄎᆨᄉᆼ수와 커ᄂᆯ모수의 최ᄌᆨᄀᆹ우하ᄂᆺ예ᄉᆫᄎᆨᄆᆫ에서 매우 ᄇ

ᅭᄋᆯᄌᆨ이다. 따라서 LOO-교차타ᄃᆼᄉᆼ ᄒᆷ수래체ᄒᆯ 교차타ᄃᆼᄉᆼ ᄒᆷ수로려해야 ᄒᆫ다.

LOO ᅩ조ᄌᆼ리 (Craven과 Wahba, 1979)와 1차 Taylor ᄌᆫ개리아ᄆᆫ LOO-교차타ᄃᆼᄉᆼ ᄒᆷ수ᄋ

ᅡᄋᆫ ᄉᆼ요차타ᄃᆼᄉᆼ(ordinary cross validation) ᄒᆷ수가 다와 ᄀᇀ이 구해ᄌᆫ다.

OCV (θθθ) = 1 n

n

X

i=1

yi− ˆfiθθ) 1 −∂ ˆ∂yfi

i

2

= 1 n

n

X

i=1

yi− ˆfiθθ) 1 − hiiθθ)

!2

, (2.7)

ᅧ기서 hiiθθ)ᄂᆫ ˆfff = (f (xxx1), · · · , f (xxxn))′ = HHHyyyᄅᆫ자노자ᄒᆼᄅᆯ (hat matrix) HHHᅴ 대ᄀᆨ오이다.

ᆨ (2.7)의 hiiθθ)ᅢᄉᆫ trace(HHH)/n라아ᄆᆫ ᄋᆯᄇᆫ화 교차타ᄃᆼᄉᆼ (generalized cross validation) ᄒᆷᄉ

ᅡ와 ᄀᇀ이 구해ᄌᆫ다.

GCV (θθθ) = nPn

i=1(yi− ˆfiθθ))2

(n − trace(HHH))2 . (2.8)

(4)

3. 심층 다중 커널 LS-SVRM

ᅮ어ᄌᆫ 자료ᄅ{(xxxi, yi)}ni=1ᅳ로 표기하기로 ᄒᆫ다. 여기서 xxxi∈ Rdᆫ ᄋᆸᄅᆨᄇᆨ터이고 yi∈ Rᄂᆫ ᄎᆯᄅᆨᄇ

ᅮ이다. 비ᄉᆫᄒᆼ 회귀모ᄒᆼ위하여 Figure 3.1과 ᄀᇀ이 ᄋᆸᄅᆨᄎᆼ, 2ᅢ의 ᄋᆫᄂᆨᄎᆼ ᄆᆾ ᄎᆯᄅᆨ츠로 구ᄉᆼᄃᆷᄎ

ᅡ저ᄂᆯ LS-SVRMᄋᆼᄀᆨᄒᆫ다.

Figure 3.1 Architecture of a deep multiple kernel LS-SVRM with three LS-SVRMs on the hidden layer

ᆷᄎ ᅡᄌ ᅥᄂᆯ LS-SVRMᄋᆫ 2ᅢ의 ᄋᆫᄂᆨᄎᆼᄋ ᅡ지며, ᄀᆨ ᄋᆫᄂᆨᄎᆼᄋᆫ dLᅢ의 다ᄅ ᆼ태의 커ᄂᆯᄋ

ᅵᄂᆫ LS-SVRMᄋᆨᄋᆫ다. Figure 3.1에서 dL= 3ᅵ고 커ᄂᆯᄋᆫ K1, K2, K3ᅵ다. L(1)l ᅥᄂᆯ Kl

ᅡ아ᄂᆺᄇᆫ째 ᄋᆫᄂᆨ츼 lᄇᆫ째 LS-SVRM아타내고, fl(1)ᆫ L(1)l ᅴ ᄎᆯᄅᆨᄋ ᅡ타ᄂᆫ다. L(1)l ᅡᄅ {(xxxi, yi)}ni=1ᅵ아여 ᄒᆨ쇠며, ᄋᆷ의의 ᄋᆸᄅᆨᄇᆨ터 xxxtᅦ 대해 fl(1)ᅡ와 ᄀᇀ이 표ᄒᆫ다.

fl(1)(xxxt) =

n

X

i=1

Kl(xxxt, xxxi(1)li + b(1)l0 , l = 1, · · · , dL, (3.1)

ᅧ기서 α(1)li ᆫᄅᆫ LS-SVRM의 라그ᄅᆼ즈 배수, b(1)l0 ᆫᄅᆫ LS-SVRM의 ᄑᆫ의ᄒᆼ, 그리고 Klᆫᄅ LS-SVRMᅴ 커ᄂᆯ이다. (α(1)li , b(1)l0 )ᄋᆫ ᄉᆨ (2.4)의 ᄉᆫᄒᆼᄇᆼᄌᆼᄉᆨ아아여 구ᄒᆯ 수 ᄋᆻ다.

L(2)l ᅥᄂᆯ Klᅡ아누ᄇᆫ째 ᄋᆫᄂᆨ츼 lᄇᆫ째 LS-SVRM아타내고, fl(2)ᆫ L(2)l ᅴ ᄎᆯᄅᆨᄋ

ᅡᄂᆫ다. L(2)l {(zl(xxxi), yi)}ni=1ᅵ아여 ᄒᆨ쇠며, 이때 zl(xxxi)나와 ᄀᇀ이 표ᄒᆫ다.

zl(xxxi) =

dL

X

j=1

wzljfj(1)(xxxi) + bzl0, l = 1, · · · , dL, (3.2)

ᅧ기서 wzljᆫ fj(1)ᅪ L(2)l ᅡ이의 가지이고 bzl0ᆫᄅᆫ ᄑᆫ의ᄒᆼ이다. 따라서 ᄋᆷ의의 ᄋᆸᄅᆨᄇᆨ터 xxxtᅦ ᄃ

ᅢ fl(2)ᅡ와 ᄀᇀ이 표ᄒᆫ다.

fl(2)(xxxt) =

n

X

i=1

Kl(zzzl(xxxt), zzzl(xxxi))α(2)li + b(2)l0, l = 1, · · · , dL, (3.3)

수치

Figure 3.1 Architecture of a deep multiple kernel LS-SVRM with three LS-SVRMs on the hidden layer
Table 3.1 Algorithm of deep multiple kernel LS-SVRM
Table 4.1 The averages and standard errors of MSEs by standard LS-SVRM, multilayer neural network and deep multiple kernel LS-SVRM on 6 datasets (standard errors in parenthesis)

참조

관련 문서

In this paper we derive a noble algorithm of semisupervised learning for support vector quantile regression (S2SVQR) based on support vector machine formulation.. In Section 2

In this paper we propose the iteratively reweighted least squares procedure to solve the quadratic programming problem of support vector expectile regression with

Key Words : Sensor fault diagnosis, Support vector machine, Genetic algorithm, Multi-layer support vector machine, Convolution neural network, Ensemble... 정상신호와

Figure 4.2 shows plots of the quantile regression functions estimated by the noncrossing varying coefficient support vector quatile regression (ncVcSVQR), where each quantile

In this paper we propose an iterative reweighted least squares (IRWLS) procedure to solve the quadratic problem of partially linear support vector regression with a modified

Keywords: Censored regression, generalized cross validation function, Kaplan-Meier estimator, kernel function, least squares support vector machine, randomly right cen-

Quadratic Loss Support Vector Interval Regression Machine for Crisp Input-Output Data.. Changha

Kernel machines such as support vector machine(SVM) and kernel ridge regression(KRR) were designed to overcome these problems. Kernel machines are used widely in