• 검색 결과가 없습니다.

A study on principal component analysis using penalty method

N/A
N/A
Protected

Academic year: 2021

Share "A study on principal component analysis using penalty method"

Copied!
11
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

2017, 28

(

4)

,

721–731

페널티 방법을 이용한 주성분분석 연구

ᆨᄎᆯᄋ

1

1ᅨᄆᆼ대ᄒᆨ교 톄ᄒᆨᄌᆫᄀ

ᄌ ᅥ

ᆸᄉ ᅮ 2017ᄂ ᅧ ᆫ 6ᄋ ᅯ ᆯ 5ᄋ ᅵ ᆯ, ᄉ ᅮᄌ ᅥ ᆼ 2017ᄂ ᅧ ᆫ 7ᄋ ᅯ ᆯ 8ᄋ ᅵ ᆯ, ᄀ ᅦᄌ ᅢ ᄒ ᅪ ᆨᄌ ᅥ ᆼ 2017ᄂ ᅧ ᆫ 7ᄋ ᅯ ᆯ 11ᄋ ᅵ ᆯ

요 약

ᅵ ᄋ ᅧ ᆫᄀ ᅮᄋ ᅦᄉ ᅥᄂ ᅳ ᆫ Lasso ᄑ ᅦᄂ ᅥ ᆯᄐ ᅵ ᄇ ᅡ ᆼᄇ ᅥ ᆸᄋ ᅳ ᆯ ᄋ ᅵᄋ ᅭ ᆼ ᄒ ᅡ ᆫ ᄌ ᅮᄉ ᅥ ᆼᄇ ᅮ ᆫᄇ ᅮ ᆫᄉ ᅥ ᆨ ᄇ ᅡ ᆼᄇ ᅥ ᆸᄋ ᅳ ᆯ ᄉ ᅩᄀ ᅢᄒ ᅡ ᆫᄃ ᅡ. ᄌ ᅮᄉ ᅥ ᆼᄇ ᅮ ᆫᄇ ᅮ ᆫᄉ ᅥ ᆨᄋ ᅦ Lasso ᄑ ᅦ ᄂ ᅥ

ᆯᄐ ᅵᄅ ᅳ ᆯ ᄌ ᅥ ᆨᄋ ᅭ ᆼ ᄒ ᅡᄂ ᅳ ᆫ ᄇ ᅡ ᆼᄇ ᅥ ᆸᄋ ᅳᄅ ᅩ ᄒ ᅳ ᆫ ᄒ ᅵ ᄉ ᅡᄋ ᅭ ᆼ ᄃ ᅬᄂ ᅳ ᆫ ᄇ ᅡ ᆼᄇ ᅥ ᆸᄋ ᅳ ᆫ ᄏ ᅳᄀ ᅦ ᄃ ᅮ ᄀ ᅡᄌ ᅵᄀ ᅡ ᄋ ᅵ ᆻᄃ ᅡ. ᄎ ᅥ ᆺ ᄇ ᅥ ᆫᄍ ᅢ ᄇ ᅡ ᆼᄇ ᅥ ᆸᄋ ᅳ ᆫ ᄌ ᅮᄉ ᅥ ᆼᄇ ᅮ ᆫᄋ ᅳ ᆯ ᄇ ᅡ ᆫᄋ ᅳ ᆼ ᄇ

ᅧ ᆫᄉ ᅮᄅ ᅩ ᄂ ᅩ ᇂ ᄀ ᅩ ᄋ ᅯ ᆫ ᄌ ᅡᄅ ᅭᄒ ᅢ ᆼᄅ ᅧ ᆯᄋ ᅳ ᆯ ᄉ ᅥ ᆯᄆ ᅧ ᆼᄇ ᅧ ᆫᄉ ᅮᄅ ᅩ ᄒ ᅡᄂ ᅳ ᆫ ᄒ ᅬᄀ ᅱᄇ ᅮ ᆫᄉ ᅥ ᆨᄋ ᅴ ᄒ ᅬᄀ ᅱᄀ ᅨᄉ ᅮᄅ ᅳ ᆯ ᄋ ᅵᄋ ᅭ ᆼ ᄒ ᅡᄋ ᅧ ᄎ ᅬᄌ ᅥ ᆨᄋ ᅴ ᄉ ᅥ ᆫᄒ ᅧ ᆼᄀ ᅧ ᆯᄒ ᅡ ᆸ ᄇ ᅦ ᆨᄐ ᅥ ᄅ

ᅳ ᆯ ᄀ ᅮᄒ ᅡ ᆯ ᄄ ᅢ Lasso ᄑ ᅦᄂ ᅥ ᆯᄐ ᅵ (ᄋ ᅵ ᆯᄇ ᅡ ᆫᄌ ᅥ ᆨᄋ ᅳᄅ ᅩ elastic net ᄑ ᅦᄂ ᅥ ᆯᄐ ᅵ)ᄅ ᅳ ᆯ ᄇ ᅮᄀ ᅪᄒ ᅡᄂ ᅳ ᆫ ᄇ ᅡ ᆼᄇ ᅥ ᆸᄋ ᅵᄃ ᅡ. ᄃ ᅮ ᄇ ᅥ ᆫᄍ ᅢ ᄇ ᅡ ᆼᄇ ᅥ ᆸᄋ ᅳ ᆫ ᄋ ᅯ ᆫ ᄌ

ᅡᄅ ᅭᄒ ᅢ ᆼᄅ ᅧ ᆯᄋ ᅳ ᆯ ᄇ ᅵᄌ ᅥ ᆼᄎ ᅵ ᆨᄀ ᅡ ᆹ ᄇ ᅮ ᆫ ᄒ ᅢᄅ ᅩ ᄀ ᅳ ᆫ ᄉ ᅡᄒ ᅡᄀ ᅩ ᄂ ᅡ ᆷᄋ ᅳ ᆫ ᄌ ᅡ ᆫᄎ ᅡᄒ ᅢ ᆼᄅ ᅧ ᆯᄋ ᅦ Lasso ᄑ ᅦᄂ ᅥ ᆯᄐ ᅵᄅ ᅳ ᆯ ᄇ ᅮᄀ ᅪᄒ ᅡᄋ ᅧ ᄎ ᅬᄌ ᅥ ᆨᄋ ᅴ ᄉ ᅥ ᆫᄒ ᅧ ᆼᄀ ᅧ ᆯᄒ ᅡ ᆸ ᄇ ᅦ ᆨ ᄐ

ᅥᄅ ᅳ ᆯ ᄀ ᅮᄒ ᅡᄂ ᅳ ᆫ ᄇ ᅡ ᆼᄇ ᅥ ᆸᄋ ᅵᄃ ᅡ. ᄋ ᅵ ᄋ ᅧ ᆫᄀ ᅮᄋ ᅦᄉ ᅥᄂ ᅳ ᆫ ᄌ ᅮᄉ ᅥ ᆼᄇ ᅮ ᆫ ᄇ ᅮ ᆫᄉ ᅥ ᆨᄋ ᅦ Lasso ᄑ ᅦᄂ ᅥ ᆯᄐ ᅵᄅ ᅳ ᆯ ᄇ ᅮᄀ ᅪᄒ ᅡᄂ ᅳ ᆫ ᄋ ᅵ ᄃ ᅮ ᄀ ᅡᄌ ᅵ ᄇ ᅡ ᆼᄇ ᅥ ᆸᄃ ᅳ ᆯᄋ ᅳ ᆯ ᄌ

ᅡᄉ ᅦᄒ ᅡᄀ ᅦ ᄀ ᅢ ᄀ ᅪ ᆫ ᄒ ᅡᄂ ᅳ ᆫ ᄃ ᅦ, ᄋ ᅵ ᄇ ᅡ ᆼᄇ ᅥ ᆸᄃ ᅳ ᆯᄋ ᅳ ᆫ ᄇ ᅧ ᆫᄉ ᅮ ᄉ ᅮ ᆺ ᄌ ᅡᄀ ᅡ ᄑ ᅭᄇ ᅩ ᆫ ᄏ ᅳᄀ ᅵᄇ ᅩᄃ ᅡ ᄏ ᅳ ᆫ ᄀ ᅧ ᆼᄋ ᅮᄋ ᅦᄃ ᅩ ᄌ ᅥ ᆨᄋ ᅭ ᆼ ᄀ ᅡᄂ ᅳ ᆼ ᄒ ᅡ ᆫ ᄌ ᅡ ᆼᄌ ᅥ ᆷᄋ ᅵ ᄋ ᅵ ᆻᄃ ᅡ.

ᅩᄒ ᅡ ᆫ ᄉ ᅵ ᆯᄌ ᅦ ᄌ ᅡᄅ ᅭᄇ ᅮ ᆫᄉ ᅥ ᆨᄋ ᅦᄉ ᅥ R ᄑ ᅳᄅ ᅩᄀ ᅳᄅ ᅢ ᆷᄋ ᅳ ᆯ ᄐ ᅩ ᆼ ᄒ ᅢ ᄃ ᅮ ᄇ ᅡ ᆼᄇ ᅥ ᆸᄋ ᅳ ᆯ ᄌ ᅥ ᆨᄋ ᅭ ᆼ ᄒ ᅡᄀ ᅩ ᄀ ᅳ ᄀ ᅧ ᆯᄀ ᅪᄅ ᅳ ᆯ ᄇ ᅵᄀ ᅭᄒ ᅡ ᆫᄃ ᅡ. ᄀ ᅮᄎ ᅦᄌ ᅥ ᆨᄋ ᅳᄅ ᅩ ᄇ ᅧ ᆫ ᄉ

ᅮ ᄉ ᅮ ᆺ ᄌ ᅡᄀ ᅡ ᄑ ᅭᄇ ᅩ ᆫ ᄏ ᅳᄀ ᅵᄇ ᅩᄃ ᅡ ᄏ ᅳ ᆫ Ahamad (1967)ᄋ ᅴ crime ᄌ ᅡᄅ ᅭᄋ ᅦ ᄌ ᅥ ᆨᄋ ᅭ ᆼ ᄒ ᅡ ᆫᄃ ᅡ.

ᅮᄋ ᅭᄋ ᅭ ᆼ ᄋ ᅥ: ᄅ ᅡᄉ ᅩ, ᄇ ᅵᄌ ᅥ ᆼᄎ ᅵ ᆨᄀ ᅡ ᆹ ᄇ ᅮ ᆫ ᄒ ᅢ, ᄌ ᅮᄉ ᅥ ᆼᄇ ᅮ ᆫᄇ ᅮ ᆫᄉ ᅥ ᆨ, ᄑ ᅦᄂ ᅥ ᆯᄐ ᅵ, elastic net.

1. 머리말

Lasso (least absolute shrinkage and selection operator) ᅵᄇᆸᄋᆫ Tibshirani (1996)ᅦ 의해 회귀ᄆ

ᆼ에서 L1 ᆯᄌᆷ (penalty)우과하여 회귀계수루하ᄂ ᆼᄇᆸ으로 제ᄋᆫ되ᄋᆻ다. Tibshirani (1996)ᄋ

ᅴ하ᄆᆫ Lasso 회귀 (Lasso regression)뇌소제괴귀 (least squares regression)와ᄂᆯ리 회귀계ᄉ

ᅮᄌᆼᄀᆹ이 보다 ᄉᆸ게 0이 되ᄂ ᅴᄇᆨᄉᆼ (sparsity)이 ᄉᆼ기기 때메 ᄇᆫ수ᄉᆫᄐᆨ (variable selection)의 ᄒ

ᅪ가 ᄋᆻ으며, 디에 ᄂᆼᄒᆼ 회귀 (ridge regression)의 ᄌᆼᄌᆷᄋᆫ 예ᄎᆨᄌᆼ호 (prediction accuracy)도 ᄀ

ᅵ하고 ᄋᆻᄂ ᆺ으로 ᄋᆯ려져 ᄋᆻ다. 회귀모ᄒᆼ에 Lasso ᄇᆼᄇᆸ이 소기후 ᄋᆯᄇᆫ화ᄉᆫᄒᆼ모ᄒᆼ (generalized linear model; Friedman ᄃᆼ, 2008; Parkᅪ Kye, 2013)과 ᄉᆫᄒᆼᄑᆫᄇᆯᄇᆫᄉᆨ (linear discriminant analysis;

Wittenᅪ Tibshirani, 2011) 듸 다ᄋᆼᄒᆫ 뱌에 ᄌᆨ외ᄋᆻ다. Lasso ᄇᆼᄇᆸ에 대ᄒᆫ 자세ᄒᆫ ᄀᆫᄋᆫ Kwon

ᆼ (2013)ᄋᆷ조하기 바ᄅᆫ다.

Lasso ᆼᄇᆸ우ᄉᆼᄇᆫᄇᆫᄉᆨ (principal component analysis)에도 ᄌᆨ아나다. 다시 ᄆᆯ해 ᄋᆫ수ᄋ

ᆫᄒᆼᄀᆯᄒᆸ으로 주ᄉᆼᄇᆫ (principal component)ᄋ ᅮᄒᆯ 때, ᄉᆫᄒᆼᄀᆯᄒᆸ 계수에 L1 ᅦᄂᆯ티루과하ᄆᆫ ᄇᆫᄉ

ᆫᄐᆨ의 해ᄉᆨᄅᆨ과 예ᄎᆨᄌᆼ호가 디에 ᄆᆫ죄내로우ᄉᆼᄇᆫ우ᄒᆯ 수 ᄋᆻ다. 이ᄀᆺᄋᆯ ᄌᆨᄌᆸ 구ᄒᆫᄒᆫ ᄋ

ᅩ리지 ScoTLass ᄇᆼᄇᆸ (Jolliffe ᄃᆼ, 2003)ᅵ다 (자세ᄒᆫ ᄀᆺᄋᆫ 2.1ᅦ ᄉᆯᄆᆼ되어 ᄋᆻ다). 이 ScoTLass ᄇ

ᆸᄋᆫ Rᄋ ᅵᄋᆫ 프로그ᄅᆷ이 재하지 ᄋᆭ으며, 또ᄒᆫ 아래에서 ᄉᆯᄆᆼ되누 ᄇᆫ째 ᄇᆼᄇᆸ으로 효ᄋᆯᄌᆨ으ᄅ ScoTLassᆯ고리지 구ᄒᆫ두 ᄋᆻᄂᆺ으로 ᄋᆯ려져 ᄋᆻ어 (Witten ᄃᆼ, 2009)ᅵ ᄋᆫ구에서너 이ᄉᆼ ᄎ

ᅮ하지 ᄋᆭ나.

1

(42601) ᄃ ᅢᄀ ᅮ ᄀ ᅪ ᆼᄋ ᅧ ᆨᄉ ᅵ ᄃ ᅡ ᆯᄉ ᅥᄀ ᅮ ᄃ ᅡ ᆯᄀ ᅮᄇ ᅥ ᆯᄃ ᅢᄅ ᅩ 1095, ᄀ ᅨᄆ ᅧ ᆼᄃ ᅢᄒ ᅡ ᆨᄀ ᅭ ᄐ ᅩ ᆼ ᄀ ᅨᄒ ᅡ ᆨᄌ ᅥ ᆫᄀ ᅩ ᆼ, ᄀ ᅭᄉ ᅮ. E-mail: [email protected]

(2)

ᅮᄉᆼᄇᆫᄇᆫᄉᆨ에서 Lasso 페ᄂᆯ티루과하ᄂᆺ ᄇᆫ째 ᄇᆼᄇᆸ으로 고려되고 ᄋᆻᄂᆺ우ᄉᆼ베 elastic net (Zouᅪ Hastie, 2005) 회귀ᄅᆨ아ᄂ ᆼᄇᆸ이다. ᄉᆯ제로 ᄇᆫᄋᆼᄇᆫ수ᄅ ᅮᄉᆼ브로 하고 ᄉᆯᄆᆼᄇᆫ수ᄅᆯ ᄋ

ᅡ료ᄒᆼᄅᆯ로 지ᄌᆼ하ᄆᆫ 회귀계수 추ᄌᆼᄅᆼ이 바로 해ᄃᆼ 고유ᄇᆨ터 (eigenvector)가 (Park, 2013). 따ᄅ

ᅥ Lasso 회ᄀᆫᄌᆷ에서 보다 0이 ᄆᆭ아지늬ᄇᆨᄉᆼ아ᄌᆫ 고유ᄇᆨ터루ᄒᆯ 수 ᄋᆻ다. 그러나 이 ᄇᆼᄇᆸᄋ

ᆫ수의 수가 개체수보ᄃᆼ우에ᄂᆨ외지 마ᄂᆫᄌᆷ이 ᄋᆻ다. 그ᄅᆫ데 L2 ᅦᄂᆯ티루과ᄒᆫ ᄉᆼ태ᄋ

ᅥ ᄇᆫᄋᆼᄇᆫ수루ᄉᆼ브로 하고 ᄉᆯᄆᆼᄇᆫ수ᄅᆯ 아료ᄒᆼᄅᆯ로 ᄒᆫ 회귀계수루하ᄆᆫ 해ᄃᆼ 고유ᄇᆨ터에 비ᄅ

ᅡ가 (Zou ᄃᆼ, 2006). ᅡ라서 Lasso에 해ᄃᆼ되ᄂᆫ L1 ᅦᄂᆯ티에 ᄂᆼᄒᆼ에 해ᄃᆼ되ᄂᆫ L2 ᅦᄂᆯ티루ᄀ

ᅡᄂᆫ elastic netᄋᆯ 태 ᄇᆫ수의 수가 개체수보ᄃᆼ우에도 ᄌᆨ아ᄂᆫ 희ᄇᆨᄉᆼ아ᄌᆫ 고유ᄇᆨ터ᄅ

ᆯ 수 ᄋᆻ다.

ᅮᄉᆼᄇᆫᄇᆫᄉᆨ에서 Lasso 페ᄂᆯ티루과하누 ᄇᆫ째 ᄇᆼᄇᆸ으로 고려되고 ᄋᆻᄂᆺ이ᄌᆼᄎᆨᄀᆹ 배 (sin- gular value decomposition)ᅦ 의해 아료 ᄒᆼᄅᆯ아시ᄏᆯ 때 Lasso ᄇᆯᄌᆷ우과하네ᄂᆯ티ᄒᆼᄅᆯᄇ

ᅢ (penalized matrix decomposition) ᄇᆼᄇᆸ이다 (Witten ᄃᆼ, 2009). ᅮ체ᄌᆨ으로 차수가 n × pᄋᆫ ᄋ

ᅭ ᄒᆼᄅᆯ X라수가 1ᄋᆫ 비ᄌᆼᄎᆨᄀᆹ 배 (u d vt; u, vᄂᆨᄀᆨ n-ᄇᆨ터, p-ᄇᆨ터이며 dᄂᆫ ᄉᆯ수ᄀᆹ)라ᄉ

ᆯ 때 고유ᄇᆨ터에 해ᄃᆼ되ᄂᆫ vᅦ Lasso 페ᄂᆯ티ᄅ ᅮ과하며, 이 후에니ᄅᇂ게 구ᄒᆫ ᄌᆫ차ᄒᆼᄅᆯ (residual matrix; X −Pk

i=1uidivti) (k = 1, 2, . . . , p − 1)ᅦ 대해 ᄃᆼᄋᆯᄒᆫ ᄇᆼᄉᆨ으로 희ᄇᆨᄉᆼ이 ᄋᆻᄂ ᅩ유ᄇᆨᄐ vkᅮ하ᄂᆼᄇᆸ이다. 이 ᄇᆼᄇᆸ우ᄉᆼᄇᆫᄇᆫᄉᆨ에서 p > nᄋᆫ ᄀᆼ우에도 ᄌᆨ아나며, 또ᄒᆫ ᄌᆼᄌᆫᄇᆫᄉ (canonical correlation analysis)ᅦ도 ᄌᆨ아ᄂᆫ ᄌᆼᄌᆷ이 ᄋᆻ다 (Witten ᄃᆼ, 2009).

ᅵ ᄋᆫ구에서ᄂᇁ에서 ᄀᆫᄅᆨ히 ᄉᆯᄆᆼᄒᆫ 주ᄉᆼᄇᆫᄇᆫᄉᆨ에 L1 ᅦᄂᆯ티루과하누 가지 ᄇᆼᄇᆸ아세히 ᄉ

ᅧ보고, R 프로그ᄅᆷᄋᆯ 태 p > n ᄋᆫ ᄉᆯ제 자료에 ᄌᆨ아녜제로여주고자 ᄒᆫ다. 이뤼해 이 ᄂ

ᆫᄋ ᅡ와 ᄀᇀ이 구ᄉᆼ하고자 ᄒᆫ다. 2ᄌᆯ에서ᄂᆫ저 주ᄉᆼᄇᆫᄇᆫᄉᆨ과 ScoTLass ᄇᆼᄇᆸᄋᆫᄅᆨ히 ᄉᆯᄆᆼ하고, elastic net ᅬ귀와 페ᄂᆯ티ᄒᆼᄅᆯ배에 의해 L1 ᅦᄂᆯ티루과하누ᄉᆼᄇᆫᄇᆫᄉᆨ ᄇᆼᄇᆸ아세히 ᄉᆯᄆᆼᄒᆫ다.

3ᄌᆯ에서ᄂᆫ Rᅳ로그ᄅᆷᄋᆯ 태 이 두 가지 ᄇᆼᄇᆸᄋᆯ p > nᄋᆫ ᄉᆯ제 자료ᄋᆫ crime 자료 (Ahamad, 1967)ᄋ

ᆨ아고 비교ᄒᆫ다. 4ᄌᆯ의 ᄀᆯ레서니 ᄋᆫ구의 ᄀᆯ과ᄃᆯᄋᆼ리ᄒᆫ다.

2. Lasso 페널티에 기반한 주성분분석 방법

2.1. 주성분분석과 ScoTLass 방법

ᆼ기 0ᄋᆫ ᄋᆫᄉᆨᄒ ᆨᄅᆯᄇᆫ수 X1, · · · , Xpᅴ 차ᄋᆫ초 (dimension reduction) ᄇᆼᄇᆸ ᄌ ᆫᄒᆼᄌᆨᄋᆫ ᄇ

ᆸᄋᆫ 주ᄉᆼᄇᆫᄇᆫᄉᆨ (principal component analysis)이 ᄆᆭ이 사외고 ᄋᆻ다. 구체ᄌᆨ으로 주ᄉᆼᄇᆫᄇᆫᄉᆨ ᄇᆼᄇ

ᆫ X = (X1, · · · , Xp)Tᅴ ᄉᆫᄒᆼᄀᆯᄒᆸ lTX (ᆼᄎᆷ자 T ᄂᆫ치)의 ᄇᆫ외대화시키ᄂᆫᄒᆼᄀᆯᄒᆸ ᄇᆨ터ᄅ

ᅮ하여, 이 ᄉᆫᄒᆼᄀᆯᄒᆸ ᄇᆨ터로 계ᄉᆫ되ᄂᆸᄉᆼᄇᆫ수ᄋᆫ 주ᄉᆼᄇᆫ (principal component)이아여 차ᄋᆫᄎ

ᅡᄂᆼᄇᆸ이다. 이 메에 대ᄒᆫ 수ᄒᆨᄌᆨ 해ᄇᆸᄋᆫ X1, · · · , Xpᅴ 표ᄇᆫᄀᆼᄇᆫᄒᆼᄅᆯ S의 고유ᄀᆹ-고유ᄇᆨ터 ᄊ (eigenvalue-eigenvector pairs) (δi, vi), i = 1, . . . , pᅦ 의해 ᄀᆯᄌᆼ다 (여기서 δ1≥ · · · ≥ δpᅩ ᄌᆼᄅᆯᄃ

ᅥ ᄋᆻ다고 가ᄌᆼᄒᆫ다). 구체ᄌᆨᄋᆫ 수ᄒᆨᄌᆨ 해ᄇᆸ아와 ᄀᇀ이 주어ᄌᆫ다 (Johnson과 Wichern, 1992).

max

l̸=0

lTSl

lTl = δ1ᅵ며 argmaxl̸=0

lTS‘l lTl = v1.

v1, . . . , vk(k = 1, . . . , p − 1)ᅦ ᄌᆨ교ᄋᆫ l에 대ᄒ max

l̸=0

lTSl

lTl = δk+1ᅵ며 argmaxl̸=0

lTS‘l

lTl = vk+1.

(3)

ᅳᄅᆫ데 l ̸= 0에 대해 v = l/p

lTl래로ᄋᆫᄒᆼᄀᆯᄒᆸ ᄇᆨ터라고 느ᄆᆫ ᄀᆯ이가 |v|2 pvTv = 1ᅵ ᄃ

ᅵ 때메 ᄉᆫᄒᆼᄀᆯᄒᆸ ᄇᆨ터 lᄋᆯ이가 1이라고 가ᄌᆼ해도 무ᄇᆼ하다. 이ᄅᇂ게 ᄉᆫᄒᆼᄀᆯᄒᆸ ᄇᆨ터루ᄒᆯ 때 L1

ᅦᄂᆯ티루과하게 되ᄆᆫ ScoTLass ᄇᆼᄇᆸ (Jolliffe ᄃᆼ, 2003)ᅡ. 구체ᄌᆨ으로 L1 ᅦᄂᆯ티루과ᄒᆫ ᄌ

ᆼᄇᆫ Xvk (k = 1, . . . , p)ᅴ ᄉᆫᄒᆼᄀᆯᄒᆸ ᄇᆨ터 ˜vkᅡ와 ᄀᇀ이 구ᄒᆯ 수 ᄋᆻ다.

˜

v1= argmax|v|2=1

vTSv + λ1|v|1



. (2.1)

˜

v1, . . . , ˜vk(k = 1, . . . , p − 1)ᅦ ᄌᆨ교ᄋᆫ v에 대ᄒ

˜

vk+1= argmax|v|2=1

vTS‘v + λ1|v|1

 .

ᅧ기서 |v|1=Pp

i=1|vi|ᄂᆫ v = (v1, . . . , vp)Tᅴ L1 ᅩᄅᆷ (norm)ᅵ다.

ScoTLassᆼᄇᆸᄋᆫ R이ᄋᆫ 프로그ᄅᆷ이 재하지 ᄋᆭ으며, 또ᄒᆫ 다ᄋᆯ에서 ᄉᆯᄆᆼ데ᄂᆯ티ᄒᆼᄅᆯᄇ (penalized matrix decomposition) ᆼᄇᆸ에 의ᄒᆫ 주ᄉᆼᄇᆫᄇᆫᄉᆨ이 ScoTLass ᄇᆼᄇᆸ요과ᄌᆨ으로 구ᄒᆫ하ᄂ

ᅡ나의 ᄋᆯ고리ᄌᆷ에가ᄂ ᆺ으로 ᄋᆯ려져 ᄋᆻ어 (Witten ᄃᆼ, 2009)ᅵ ᄋᆫ구에서니 ᄇᆼᄇᆸ어 이ᄉ

ᅡ루지 ᄋᆭ기로 ᄒᆫ다.

2.2. elastic net 회귀를 이용한 주성분분석 방법

elastic net (Zouᅪ Hastie, 2005) 회귀리ᄋᆫ 주ᄉᆼᄇᆫᄇᆫᄉᆨ ᄇᆼᄇᆸ요ᄋᆨ하ᄆᆫ 다와 ᄀᇀ다. ᄆᆫ저 ᄌ

ᆼᄇᆫᄇᆫᄉᆨ에 의해 p개 주ᄉᆼ베 해ᄃᆼ되ᄂᆫ ᄇᆨ터 y1, . . . , y

pᅮᄒᆫ다. 그 다이 주ᄉᆼᄇᆫᄇᆨ터ᄅᆫᄋᆼᄇᆫᄉ

ᅩ 하고 (ᄑᆼ기 0ᄋᆫ) X1, · · · , Xpᆯᄆᆼᄇᆫ수로 하ᄂᆫ elastic netᅬ귀에 의해 회귀계수 추ᄌᆼᄅᆼ우ᄒ

ᅡ. 이 회귀계수 추ᄌᆼᄅᆼᄋᆯ이가 1이 되도ᄅᆫ 후 이ᄀᆺ예수ᄇᆨ터로 이ᄋᆫ 주ᄉᆼᄇᆫ우ᄒᆫ다.

ᆼ기 ᄌᆯ차라ᄋᆯ 수 ᄋᆻᄂᆨᄉᆷᄌᆨ어나와 ᄀᇀ다.

정리 2.1 (Zou ᄃᆼ, 2006) ᅭᄇᆫᄀᆼᄇᆫᄒᆼᄅᆯ S의 고유ᄀᆹ-고유ᄇᆨ터 ᄊᆼᄋᆯ (δi, vi), (i = 1, . . . , p)ᅡ고 하자.

ᅵ 때 S의 계수 (rank)ᄅᆯ r (r ≤ p)ᅵ라 가ᄌᆼ하ᄆᆫ δ1≥ · · · ≥ δr > 0 = δr+1= · · · = δpᅵ라고 두 ᄋ

ᅡ. n × pᄋᆫ ᄑᆼ기 0ᄋᆫ 자료ᄒᆼᄅᆯ X에 대해 yi= Xviᆯ i-ᄇᆫ째 주ᄉᆼᄇᆫ ᄇᆨ터라고 하ᄆᆫ 다이 ᄉᆼᄅᆸᄒᆫ다.

argminβn

|yi− Xβ|22+ λ2|β|22

o

( vi if i ≤ r, 0 otherwise.

명: 이 ᄌᆼ리ᄂᆫ ᄀᆼᄇᆫᄒᆼᄅᆯ S 대ᄉᆫ에 XTXᅦ 대해 (i ≤ rᄋᆫ ᄀᆼ우에 ᄒᆫ해) Zhou ᄃᆼ (2006)ᅦ서 The- orem 1ᅳ로 주어져 ᄋᆻ다. 그러나 이 ᄋᆫ구에서 ᄑᆯ요ᄒᆫ ᄒᆨ서 즤 하나이기 때메 자체ᄌᆨᄋᆫ ᄌᆼᄆᆼᄋ

ᅦ시하도라ᄀᆻ다. 다죄귀모ᄒᆼ (multiple regression model) y

i = Xβ + ϵᅴ 회귀계수 β의 ᄂᆼᄒᆼ ᄎ

ᆼᄅᆼ (ridge estimator)아와 ᄀᇀ다.

β˜

i= (XTX + λ2I)−1XTy

i= (XTX + λ2I)−1XTXvi= (XTX + λ2I)−1δivi.

ᅡ라서 i > r에 대해서ᄂᆫ δi= 0ᅵ기 때메 ˜β

i= 0ᅡ.

i ≤ rᅦ 대해서ᄂ ᅡ와 ᄀᇀ이 ˜β

iᆯ ᄌᆨᄌᆸ 계ᄉᆫᄒᆫ다. S = XTX/(n − 1)ᅵ기 때메 스ᄑᆨ트ᄅᆷᄇ (spectral decomposition)ᅦ 의해 XTX = (n − 1)V ∆VTᅡ. 여기서 ∆ = diag(δ1, . . . , δr)ᅵᄆ V = (v1, . . . , vr)ᅵ다. 따라서 다이 ᄉᆼᄅᆸᄒᆫ다.

(XTX + λ2I)−1=

V ((n − 1)∆ + λ2I)VT−1

= V ((n − 1)∆ + λ2I)−1VT.

수치

Table 3.1 Eigenvectors corresponding to the first three largest eigenvalues
Figure 3.1 CPEV versus sparsity for the first three principal components using elestic net regression
Table 3.2 Coefficients vectors for the new principal components with sparsity 1, 4, 5 using elastic net regression Variable name PC1 PC2 PC3 Homicide 0.0000 -0.3327 0.8367 Woundings 0.2671 0.1056 -0.0276 Homosexual -0.0611 0.5052 0.1063 Heterosexual 0.2414
Table 3.3 Coefficients vectors for the first three principal components with sparsity parameter 3.8, 2.8, 2.0 using penalized matrix decomposition

참조

관련 문서

1 John Owen, Justification by Faith Alone, in The Works of John Owen, ed. John Bolt, trans. Scott Clark, "Do This and Live: Christ's Active Obedience as the

The objective of this research is to propose a method for evaluating service reliability based on service processes using fuzzy failure mode effects analysis (FMEA) and grey

This study reports sensitivity enhancement method of a temperature sensor based on fiber Bragg grating (FBG) in combination with an auxiliary materials with a

 So the rank vector r is an eigenvector of the web matrix M, with the corresponding eigenvalue 1.  Fact: The largest eigenvalue of a column stochastic

In the proposed method, the motion of focused object and the background is identified and then the motion vector information is extracted by using the 9

The resolved-rate control method [9] is based on the manipulator velocity equation kX = kje where kj is the Jacobian matrix, e is the vector of relative joint rates, kX is the

 The simplest method of storing a raster layer in the memory of the computer is using a data structure called an array..  We consider alternative methods for searching through

"A correlation coefficient for modal vector analysis." Proceedings of 1st International Modal Analysis Conference (IMAC),