• 검색 결과가 없습니다.

ADMM algorithms in statistics and machine learning

N/A
N/A
Protected

Academic year: 2021

Share "ADMM algorithms in statistics and machine learning"

Copied!
16
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

2017, 28

(

6)

,

1229–1244

통계적 기계학습에서의 ADMM 알고리즘의 활용

ᅬ호ᄉ

1

·ᅬᄒᆫᄌ

2

·ᆨᄉᆼᄋ

3

12ᆼ기대ᄒᆨ교 ᄋᆼᄋᆼ톄ᄒᆨ과 ·3ᆼ기대ᄒᆨ교 ᄀᆼᄋᆼᄌᆼ보ᄒᆨᄀ

ᄌ ᅥ

ᆸᄉ ᅮ 2017ᄂ ᅧ ᆫ 10ᄋ ᅯ ᆯ 31ᄋ ᅵ ᆯ, ᄉ ᅮᄌ ᅥ ᆼ 2017ᄂ ᅧ ᆫ 11ᄋ ᅯ ᆯ 14ᄋ ᅵ ᆯ, ᄀ ᅦᄌ ᅢ ᄒ ᅪ ᆨᄌ ᅥ ᆼ 2017ᄂ ᅧ ᆫ 11ᄋ ᅯ ᆯ 21ᄋ ᅵ ᆯ

요 약

ᅬ ᄀ ᅳ ᆫ ᄋ ᅧᄅ ᅥ ᄇ ᅮ ᆫ ᄋ ᅣᄋ ᅦᄉ ᅥ ᄃ ᅦᄋ ᅵᄐ ᅥᄋ ᅦ ᄀ ᅳ ᆫ ᄀ ᅥᄒ ᅡ ᆫ ᄇ ᅮ ᆫᄉ ᅥ ᆨᄇ ᅡ ᆼᄇ ᅥ ᆸᄅ ᅩ ᆫ ᄋ ᅦ ᄃ ᅢᄒ ᅡ ᆫ ᄉ ᅮᄋ ᅭᄀ ᅡ ᄌ ᅳ ᆼ ᄃ ᅢ ᄃ ᅬ ᆷ ᄋ ᅦ ᄄ ᅡᄅ ᅡ ᄋ ᅵᄅ ᅳ ᆯ ᄎ ᅥᄅ ᅵᄒ ᅡ ᆯ ᄉ ᅮ ᄋ ᅵ ᆻ ᄂ

ᅳ ᆫ ᄎ ᅬᄌ ᅥ ᆨᄒ ᅪ ᄇ ᅡ ᆼᄇ ᅥ ᆸᄋ ᅵ ᄇ ᅡ ᆯᄌ ᅥ ᆫᄃ ᅬᄀ ᅩ ᄋ ᅵ ᆻᄃ ᅡ. ᄐ ᅳ ᆨ ᄒ ᅵ ᄐ ᅩ ᆼ ᄀ ᅨᄒ ᅡ ᆨᄀ ᅪ ᄀ ᅵᄀ ᅨᄒ ᅡ ᆨᄉ ᅳ ᆸ ᄇ ᅮ ᆫ ᄋ ᅣᄋ ᅴ ᄆ ᅮ ᆫ ᄌ ᅦᄃ ᅳ ᆯ ᄋ ᅦᄉ ᅥ ᄋ ᅭᄀ ᅮᄃ ᅬᄂ ᅳ ᆫ ᄃ ᅡᄋ ᅣ ᆼᄒ ᅡ ᆫ ᄌ ᅦᄋ ᅣ ᆨ ᄌ

ᅩᄀ ᅥ ᆫᄋ ᅳ ᆫ ᄇ ᅩ ᆯᄅ ᅩ ᆨ ᄎ ᅬᄌ ᅥ ᆨᄒ ᅪ (convex optimization) ᄇ ᅡ ᆼᄇ ᅥ ᆸᄋ ᅳᄅ ᅩ ᄒ ᅢᄀ ᅧ ᆯᄒ ᅡ ᆯ ᄉ ᅮ ᄋ ᅵ ᆻᄃ ᅡ. ᄇ ᅩ ᆫ ᄂ ᅩ ᆫᄆ ᅮ ᆫ ᄋ ᅦᄉ ᅥ ᄅ ᅵᄇ ᅲᄒ ᅡᄂ ᅳ ᆫ alter- nating direction method of multipliers (ADMM) ᄋ ᅡ ᆯᄀ ᅩᄅ ᅵᄌ ᅳ ᆷᄋ ᅳ ᆫ ᄉ ᅥ ᆫᄒ ᅧ ᆼ ᄌ ᅦᄋ ᅣ ᆨ ᄌ ᅩᄀ ᅥ ᆫᄋ ᅳ ᆯ ᄒ ᅭᄀ ᅪᄌ ᅥ ᆨᄋ ᅳᄅ ᅩ ᄎ ᅥᄅ ᅵ ᄒ ᅡ

ᆯ ᄉ ᅮ ᄋ ᅵ ᆻᄋ ᅳᄆ ᅧ, ᄒ ᅡ ᆸᄋ ᅴ ᄇ ᅡ ᆼᄉ ᅵ ᆨᄋ ᅳ ᆯ ᄐ ᅩ ᆼ ᄒ ᅢ ᄇ ᅧ ᆼᄅ ᅧ ᆯᄋ ᅧ ᆫᄉ ᅡ ᆫᄋ ᅳ ᆯ ᄉ ᅮᄒ ᅢ ᆼᄒ ᅡ ᆯ ᄉ ᅮ ᄋ ᅵ ᆻᄋ ᅥᄉ ᅥ ᄇ ᅥ ᆷᄋ ᅭ ᆼᄌ ᅥ ᆨᄋ ᅵ ᆫ ᄑ ᅭᄌ ᅮ ᆫ ᄎ ᅬᄌ ᅥ ᆨᄒ ᅪ ᄐ ᅮ ᆯ ᄅ ᅩ ᄌ ᅡᄅ ᅵᄆ ᅢᄀ ᅵ ᆷ ᄃ

ᅬᄀ ᅩ ᄋ ᅵ ᆻᄃ ᅡ. ADMMᄋ ᅳ ᆫ ᄋ ᅯ ᆫ ᄅ ᅢᄋ ᅴ ᄆ ᅮ ᆫ ᄌ ᅦᄇ ᅩᄃ ᅡ ᄎ ᅬᄌ ᅥ ᆨᄒ ᅪᄀ ᅡ ᄉ ᅱᄋ ᅮ ᆫ ᄇ ᅮᄇ ᅮ ᆫᄆ ᅮ ᆫ ᄌ ᅦᄅ ᅩ ᄇ ᅮ ᆫ ᄒ ᅡ ᆯᄒ ᅡᄀ ᅩ ᄋ ᅵᄅ ᅳ ᆯ ᄎ ᅱᄒ ᅡ ᆸᄒ ᅡ ᆷᄋ ᅳᄅ ᅩᄊ ᅥ ᄇ ᅩ ᆨ ᄌ ᅡ ᆸ ᄒ ᅡ

ᆫ ᄋ ᅯ ᆫ ᄆ ᅮ ᆫ ᄌ ᅦᄅ ᅳ ᆯ ᄒ ᅢᄀ ᅧ ᆯᄒ ᅡᄂ ᅳ ᆫ ᄇ ᅡ ᆼᄉ ᅵ ᆨᄋ ᅴ ᄀ ᅳ ᆫ ᄉ ᅡᄋ ᅡ ᆯᄀ ᅩᄅ ᅵᄌ ᅳ ᆷ ᄋ ᅵᄃ ᅡ. ᄇ ᅮᄃ ᅳᄅ ᅥ ᆸᄌ ᅵ ᄋ ᅡ ᆭᄀ ᅥᄂ ᅡ ᄇ ᅩ ᆨ ᄒ ᅡ ᆸᄌ ᅥ ᆨᄋ ᅵ ᆫ (composite) ᄆ ᅩ ᆨᄌ ᅥ ᆨ ᄒ ᅡ ᆷᄉ ᅮ ᄅ

ᅳ ᆯ ᄎ ᅬᄌ ᅥ ᆨᄒ ᅪᄒ ᅡ ᆯ ᄄ ᅢ ᄋ ᅲᄋ ᅭ ᆼ ᄒ ᅡᄆ ᅧ, ᄊ ᅡ ᆼᄃ ᅢᄋ ᅵᄅ ᅩ ᆫ ᄀ ᅪ proximal ᄌ ᅡ ᆨᄋ ᅭ ᆼ ᄉ ᅩ ᄋ ᅵᄅ ᅩ ᆫᄋ ᅳ ᆯ ᄐ ᅩᄃ ᅢᄅ ᅩ ᄎ ᅦᄀ ᅨᄌ ᅥ ᆨᄋ ᅳᄅ ᅩ ᄋ ᅡ ᆯᄀ ᅩᄅ ᅵᄌ ᅳ ᆷᄋ ᅳ ᆯ ᄀ ᅮᄉ ᅥ ᆼᄒ ᅡ ᆯ ᄉ

ᅮ ᄋ ᅵ ᆻᄀ ᅵ ᄄ ᅢᄆ ᅮ ᆫ ᄋ ᅦ ᄐ ᅩ ᆼ ᄀ ᅨ ᄆ ᅵ ᆾ ᄀ ᅵᄀ ᅨᄒ ᅡ ᆨᄉ ᅳ ᆸ ᄇ ᅮ ᆫ ᄋ ᅣᄋ ᅦᄉ ᅥ ᄑ ᅩ ᆨ ᄂ ᅥ ᆲᄀ ᅦ ᄒ ᅪ ᆯᄋ ᅭ ᆼ ᄃ ᅬᄀ ᅩ ᄋ ᅵ ᆻᄃ ᅡ. ᄇ ᅩ ᆫ ᄂ ᅩ ᆫᄆ ᅮ ᆫ ᄋ ᅦᄉ ᅥᄂ ᅳ ᆫ ᄎ ᅬ ᄀ ᅳ ᆫ ᄐ ᅩ ᆼ ᄀ ᅨᄋ ᅪ ᄀ ᅪ ᆫᄅ ᅧ ᆫ ᄃ ᅬ

ᆫ ᄋ ᅧᄅ ᅥ ᄇ ᅮ ᆫ ᄋ ᅣᄋ ᅦᄉ ᅥ ADMMᄋ ᅡ ᆯᄀ ᅩᄅ ᅵᄌ ᅳ ᆷ ᄋ ᅴ ᄒ ᅪ ᆯᄋ ᅭ ᆼ ᄃ ᅩᄅ ᅳ ᆯ ᄉ ᅡ ᆯᄑ ᅧᄇ ᅩᄀ ᅩᄌ ᅡ ᄒ ᅡᄆ ᅧ ᄌ ᅮᄋ ᅭᄒ ᅡ ᆫ ᄃ ᅮ ᄀ ᅡᄌ ᅵ ᄌ ᅮᄌ ᅦᄋ ᅦ ᄌ ᅮ ᆼᄌ ᅥ ᆷᄋ ᅳ ᆯ ᄃ ᅮᄀ ᅩ ᄌ

ᅡ ᄒ ᅡ ᆫᄃ ᅡ. (1) ᄆ ᅩ ᆨᄌ ᅥ ᆨᄉ ᅵ ᆨᄋ ᅴ ᄇ ᅮ ᆫ ᄒ ᅡ ᆯ ᄌ ᅥ ᆫᄅ ᅣ ᆨᄀ ᅪ ᄌ ᅳ ᆼ ᄀ ᅡ ᆼ ᄅ ᅡᄀ ᅳᄅ ᅡ ᆼᄌ ᅵᄋ ᅡ ᆫ ᄇ ᅡ ᆼᄇ ᅥ ᆸ ᄆ ᅵ ᆾ ᄊ ᅡ ᆼᄃ ᅢᄆ ᅮ ᆫ ᄌ ᅦᄋ ᅴ ᄉ ᅥ ᆯᄆ ᅧ ᆼᄀ ᅪ (2) proximal ᄌ ᅡ ᆨᄋ ᅭ ᆼ ᄉ

ᅩᄋ ᅴ ᄋ ᅧ ᆨᄒ ᅡ ᆯᄋ ᅵᄃ ᅡ. ᄋ ᅡ ᆯᄀ ᅩᄅ ᅵᄌ ᅳ ᆷ ᄋ ᅵ ᄌ ᅥ ᆨᄋ ᅭ ᆼᄃ ᅬ ᆫ ᄉ ᅡᄅ ᅨᄅ ᅩ, ᄇ ᅥ ᆯᄌ ᅥ ᆷᄒ ᅪ ᄒ ᅡ ᆷᄉ ᅮ ᄎ ᅮᄌ ᅥ ᆼ ᄃ ᅳ ᆼ ᄋ ᅴ ᄌ ᅩᄌ ᅥ ᆼᄒ ᅪ (regularization)ᄅ ᅳ ᆯ ᄒ ᅪ ᆯᄋ ᅭ ᆼ ᄒ ᅡ ᆫ ᄇ

ᅡ ᆼᄇ ᅥ ᆸᄅ ᅩ ᆫᄃ ᅳ ᆯᄋ ᅳ ᆯ ᄉ ᅩᄀ ᅢᄒ ᅡ ᆫᄃ ᅡ. ᄆ ᅩᄋ ᅴ ᄌ ᅡᄅ ᅭᄅ ᅳ ᆯ ᄒ ᅪ ᆯᄋ ᅭ ᆼ ᄒ ᅡᄋ ᅧ lasso ᄆ ᅮ ᆫ ᄌ ᅦᄋ ᅴ ᄎ ᅬᄌ ᅥ ᆨᄒ ᅪᄋ ᅦ ᄃ ᅢᄒ ᅡ ᆫ ᄉ ᅵ ᆯᄌ ᅳ ᆼᄀ ᅧ ᆯᄀ ᅪᄅ ᅳ ᆯ ᄌ ᅦᄉ ᅵᄒ ᅡ ᆫᄃ ᅡ.

ᅮ요어: ᄇᆯᄌᆷᄒᆷ수, ᄇᆼᄅᆯᄏᆷ퓨ᄐᆼ, 제ᄋᆨ조ᄀᆫ, 조ᄌᆼ화, 최ᄌᆨ화.

1. 서론

ᅧ러 뱌에서 데이터ᄋ ᅥᄒᆫ ᄇᆫᄉᆨᄇᆼᄇᆸ레 대ᄒᆫ 수요가 제 따라 이ᄅ ᅥ리ᄒᆯ 수 ᄋ

ᅬᄌᆨ화 ᄇᆼᄇᆸ이 ᄇᆯᄌᆫ되고 ᄋᆻ다. 티 톄ᄒᆨ과 기계ᄒᆨᄉᆸ 뱌의 메데서 요구되ᄂ ᅡᄋᆼᄒᆫ 제ᄋᆨᄌ

ᆫᄋᆫ ᄇᆯᄅ ᅬᄌᆨ화 (convex optimization) ᄇᆼᄇᆸ으로 해ᄀᆯᄒᆯ 수 ᄋᆻ다. 지ᄂᆫ 10ᄂᆫᄀᆫ ᄇᆯᄅ ᅬᄌᆨ화 (con- vex optimization) 뱌에서 ᄀᆮ고 ᄋᆻᄂᆫ ADMM (alternating direction method of multipliers;

Boyd ᄃᆼ, 2010)ᆯ고리ᄌᆷ에ᄋᆨ조ᄀᆫ이교ᄌᆨ ᄉᆸ게 처리ᄒᆯ 수 ᄋᆻ다. ADMMᄇᆼᄇᆸ이뷰ᄒᆫ Boyd ᄃ (2010) ᄂᆫᄆᆫᄋᆫ 2017ᄂᆫ 10ᄋᆯᄆᆯ ᄒᆫ재 ᄋᆨ 6000여ᄀᆫ의 피ᄋᆫ외수 (Google scholar ᄀᆷᄉᆨ기ᄌᆫ)ᄅ ᅩ이ᄀ

ᆻ다. ADMMᄇᆼᄇᆸᄋ ᅩᄅᆫ 기ᄀᆫ 다ᄋᆼ하게 ᄇᆯᄌᆫ되어ᄋ ᅵᄉᆫ 아이디어듸 ᄋᆸ어하며, 크게 ᄋ

ᅵ (primal) 메와 ᄊᆼ대 (dual) 메라 비우ᄂ ᅮ ᄃᆫ계의 교차 최ᄌᆨ화와 그에 따ᄅ ᅢ의 ᄋᆸ데이ᄐ

ᅪᄌᆼ으로 구ᄉᆼ다. 교차 ᄀᆼᄉᆫ과ᄌᆼ의 계ᄉᆫᄇᆸ도 (computational complexity)가 ᄌᆨᄋ ᅢ, 에 ᄃ

ᅵ 효ᄋᆯᄉᆼ이 크다고 ᄋᆯ려져 ᄋᆻ다. ᄆᆭᄋ ᆼ우 ADMM 내부의 부ᄇᆫ메 (sub-problem)에 대ᄒᆫ 최ᄌᆨᄒ

ᆫ proximalᆯ고리ᄌᆷ (Parikh and Boyd, 2013)ᅦ 의해 수ᄒᆼ다. Proximal ᄋᆯ고리ᄌᆷ외ᄌᆨ화ᄒᆯ ᄒ

1

ᄀ ᅭᄉ ᅵ ᆫᄌ ᅥᄌ ᅡ: (16938) ᄀ ᅧ ᆼᄀ ᅵᄃ ᅩ ᄉ ᅮᄋ ᅯ ᆫ ᄉ ᅵ ᄋ ᅧ ᆼᄐ ᅩ ᆼ ᄀ ᅮ ᄀ ᅪ ᆼ ᄀ ᅭᄉ ᅡ ᆫᄅ ᅩ ᄀ ᅧ ᆼᄀ ᅵᄃ ᅢᄒ ᅡ ᆨᄀ ᅭ ᄋ ᅳ ᆼᄋ ᅭ ᆼᄐ ᅩ ᆼ ᄀ ᅨᄒ ᅡ ᆨᄀ ᅪ, ᄌ ᅩᄀ ᅭᄉ ᅮ.

E-mail: [email protected]

2

(16938) ᄀ ᅧ ᆼᄀ ᅵᄃ ᅩ ᄉ ᅮᄋ ᅯ ᆫ ᄉ ᅵ ᄋ ᅧ ᆼᄐ ᅩ ᆼ ᄀ ᅮ ᄀ ᅪ ᆼ ᄀ ᅭᄉ ᅡ ᆫᄅ ᅩ ᄀ ᅧ ᆼᄀ ᅵᄃ ᅢᄒ ᅡ ᆨᄀ ᅭ ᄋ ᅳ ᆼᄋ ᅭ ᆼᄐ ᅩ ᆼ ᄀ ᅨᄒ ᅡ ᆨᄀ ᅪ, ᄀ ᅭᄉ ᅮ.

3

(16938) ᄀ ᅧ ᆼᄀ ᅵᄃ ᅩ ᄉ ᅮᄋ ᅯ ᆫ ᄉ ᅵ ᄋ ᅧ ᆼᄐ ᅩ ᆼ ᄀ ᅮ ᄀ ᅪ ᆼ ᄀ ᅭᄉ ᅡ ᆫᄅ ᅩ ᄀ ᅧ ᆼᄀ ᅵᄃ ᅢᄒ ᅡ ᆨᄀ ᅭ ᄀ ᅧ ᆼᄋ ᅧ ᆼᄌ ᅥ ᆼᄇ ᅩᄒ ᅡ ᆨᄀ ᅪ, ᄇ ᅮᄀ ᅭᄉ ᅮ.

(2)

ᅮ로다 부드러ᄋᆷ수로 ᄆᆫ더 즈로써 가해ᄅᆽ아자. 이 ᄋᆯ고리ᄌᆷᄋᆫ proximalᆨᄋ (operator)ᅪ 해의 ᄇᆼᄒᆼ이나 ᄀᆼᄉᆫ소레어하ᄂᆫ gradientᆨ오로 구ᄉᆼ다.

ADMM ᆯ고리ᄌᆷᄋ ᆯ펴보기로 ᄒᆫ다. p차의 모수ᄇᆨ터 x ∈ Rpᅡ 나. 톄ᄒᆨ에서ᄂ ᅩ수 (pa- rameter)ᅡ 부르나, 보에서ᄂᆷ고ᄆᆫᄒᆫ데서 사외ᄂᆫ 어ᄃᆯᄋᆷᄋᆫ하여 ᄇᆫ수 (variable)로 ᄒᆫᄋ

ᅧ 쓰기로 ᄒᆫ다. 두 개의 ᄒᆷ수 f(x)와 g(x)로 구ᄉᆼᄃᆫ ᄆᆨᄌᆨᄒᆷ수에 대ᄒᆫ 다의 최ᄌᆨ화 메로려해ᄇ

ᅡ.

min

x f (x) + g(x). (1.1)

ᅵ 메와 ᄃᆼᄋᆯᄒᆫ 메나래와 ᄀᇀ이 구ᄉᆼᄒᆯ 수 ᄋᆻ다.

minx,z f (x) + g(z) subject to x = z. (1.2)

ᅦ (1.1)과 ᄃᆯ리 메 (1.2)에서ᄂ ᅢ로ᄋ ᅩ수ᄇᆨ터 z가 추가ᄌᆨ으로 도ᄋᆸ되ᄋᆻ다. 여기서, z ∈ Rpᅩ조ᄇᆫ수 (auxiliary variable)로 부르고, ᄋᆫ ᄇᆫ수 x의 베ᄇᆫ수로 ᄋᆫ ᄆᆨᄌᆨᄉᆨ의 최ᄌᆨ화 메ᄅᆯ ᄇ

ᆯ하게 하ᄂᆨᄒᆯ우ᄒᆼᄒᆫ다. 가ᄌᆼ ᄃᆫᄉᆫ ᄒᆼ태의 ᄇᆯᄋᆫ ᄋᆫᄇᆫ수와 보조ᄇᆫ수와예ᄉᆨ이 ᄒᆼᄃᆼ계ᄋ x = zᅵ다. 가ᄌᆼ ᄂᆯ리 ᄋᆯ려ᄌᆫ lasso 예제ᄅᆯ ᄐᆫ하여보자.

예제 1.1 [lasso 메] ᄉᆯᄆᆼᄇᆫ수와 ᄌᆼᄉᆨᄇᆫ수로 구ᄉᆼ다료ᄊᆼ {(xi, yi)}ni=1ᅦ 대해 다의 lasso ᄆᆨᄌᆨᄉ

ᅩ려하자.

β∈Rminp 1 2

n

X

i=1

(yi− xTiβ)2+ λ

p

X

j=1

j|. (1.3)

ᅬ귀계수 β ∈ Rpᅦ 대해 보조ᄇᆫ수 γ ∈ Rpᅩᄋᆸ하여 β = γ예ᄉᆨ으로 ᄉᆯᄌᆼ하ᄆᆫ 위와 ᄃᆼᄋᆯᄒᆫ ᄆ

ᅦᄂ

β∈Rminp,γ∈Rp

1 2

n

X

i=1

(yi− xTiβ)2+ λ

p

X

j=1

j| (1.4)

ᅡ. ᄋ ᆨᄌᆨᄉᆨ이 β-최ᄌᆨ화 부ᄇᆫ (Pn

i=1(yi− xTiβ)2)ᅪ γ-최ᄌᆨ화 부ᄇᆫ (Pp

j=1j|)으로 ᄇᆯᄃᆷᄋ

ᆯ 수 ᄋᆻ다. ᄇᆫᄆᆫ, 최ᄌᆨ화ᄒᆯ 모수의 수ᄂᆫ βᅪ γ로 2배로 자ᄒᆫ다. ᄉᆨ (1.3)ᄋᆫ βᅦ 대ᄒᆫ 이차ᄀᆨᄇ (quadratic program) 메이다. ᄇᆫᄆᆫ ᄉᆨ (1.4)ᄂᆫ β = γᅴ 제ᄋᆨᄉᆨ에외하ᄆᆫ β와 γ의 최ᄌᆨ화내ᄇ

ᅩ 이루어ᄌᆯ 수 ᄋᆻ다. 그러므로 ᄉᆫᄒᆼ제ᄋᆨᄉᆨ β − γ = 0ᄋᆫ자게 하ᄆᆫ서 교차로 β와 γ뢰ᄌᆨ화하ᄂ

ᅡ이디어ᄅᆼᄀᆨᄒᆯ 수 ᄋᆻᄀᆻ다. 사ᄉᆯ 이러ᄒᆫ ᄇᆯ ᄇᆼᄇᆸᄋᆫ 1950ᄂᆫ대의 Douglas-Rachford splitting으ᄅ

ᆫ미ᄇᆼᄌᆼᄉᆨ의 수치해루하기 위ᄒᆫ ᄇᆼᄋᆫ으로 개ᄇᆯ되ᄋᆻ다. Bregmann iteration 드로도 비네,

ᅵᄉᆫ 유ᄒᆼ으로 톄ᄒᆨ ᄆᆾ 기계ᄒᆨᄉᆸ뱌 ᄈᆫ 아니라 이미지 프로세ᄉᆼ, compressive sensing, matrix completion,ᆷᄋᆼ 듸 뱌에서 ᄇᆯᄌᆫ되아.

ADMMᅴ ᄐᆨᄌᆼᄋᆫᄅᆨ히 ᄌᆼ리하ᄆᆫ 다와 ᄀᇀ다. ᄎᆺ째, ᄇᆯ두 ᄋᆻᄂᆫᄒᆼ 제ᄋᆨ조ᄀᆫ아ᄌᆫ ᄇᆯᄅᆨ ᄆ

ᅦ노조ᄇᆫ수로ᄋᆸ하여 모수의 비ᄒᆷ으로써 ᄉᆸ게 처루 ᄋᆻ다. 대, ADMMᄋᆯ ᄐᆫ 메ᄅ

ᆨᄋᆫ 메로 ᄇᆯ시ᄏᆯ 수 ᄋᆻ다. ᆫ치가 ᄆᆭ에이터의 ᄀᆼ우 데이터ᄅᆯ ᄇᆯᄃᆫ ᄇᆯ르로 배하고 ᄀᆨ ᄇ

ᅦ 대해 최ᄌᆨ화루ᄒᆼᄒᆯ 수 ᄋᆻ다. 이 ᄀᆼ우 ᄀᆨ 데이터 ᄇᆯ레 대ᄒᆫ 최ᄌᆨ화ᄅᆯ ᄐᆫ 해가 ᄌᆫ체 자료에 ᄃ

ᆫ 해로 수ᄅᆷᄒᆯ 수 ᄋᆻ도ᄅᆨ,ᅥ로 ᄋᆯ치하게 하네ᄋᆨ 조ᄀᆫ이 포ᄒᆷ되어야 ᄒᆫ다. ᄃᆼᄋᆯᄒᆫ ᄇᆼᄇᆸ으로 ᄀᆨ ᄇᆫᄉ

ᅧ러 ᄇᆯ르로 ᄇᆯᄒᆯ 수 ᄋᆻ고, 부ᄇᆫ메뤼ᄒᆸ하여 ᄌᆫ체 메에 대ᄒᆫ 최ᄌᆨ해ᄅᆫ차ᄂᆼᄇᆸ이ᄅ

ᆯ 수 ᄋᆻ다 (Hastie ᄃᆼ, 2016).

(3)

ᆫᄑᆫ 가ᄌᆼ ᄋᆯᄇᆫᄌᆨᄋᆫ ᄒᆼ태의 도 ᄉᆫᄒᆼ 제ᄋᆨᄉᆨᄋᆫ Ax+Bz = cᅵ다. 여기서 A와 Bᄂᆨᄌᆯᄒᆫ ᄒᆼᄅᆯ이ᄀ cᄂᆼ수ᄇᆨ터이다. 예ᄅᆯ 더, 모수디 나무 (tree) ᄒᆼ태의 위계ᄌᆨ으로 구조헤ᄋᆨ이 되어 ᄋᆻ다하ᄃ

ᅡ도 ADMM ᄋᆯ고리ᄌᆷᄋ ᆨᄋᆯ 수 ᄋᆻ다 (Yan과 Bien, 2015). 체ᄂᆫ ᄃᆸ러ᄂᆼ (deep learning) ᄇ

ᅣ에 이르기까ᄌ ᆼᄇᆷ위하ᄀ ᆯ외고 ᄋᆻ다. Wen ᄃᆼ (2016)ᄋᆫ CNN (convolutional neural network)

ᆼᄇᆸ에 대해 구조ᄌᆨ ᄉᆼᄀᆫ 조ᄌᆼᄒᆨᄉᆸᄇᆸ (structured sparsity learning)ᄋᆯ아여 ᄑᆯ터, 채ᄂᆯ, 레이어ᄋ

ᆼ 두조ᄅ ᅩᄌᆼ (regularize)하기 위ᄒᆫ 최ᄌᆨ화 ᄇᆼᄇᆸ으로 ADMMᄋᆯ아ᄋᆻ다. 이 외에도 Yang ᄃ (2017)ᅪ Taylor ᄃᆼ (2016) ᄃᆼᄋ ᆷᄋᆼᄌᆨᄋᆫ ᄃᆸ러ᄂᆼ ᄇᆼᄇᆸ의 ᄇᆫ처리뤼해 ADMMᄋᆯ아ᄋᆻ다. ᄌ

ᆨᄉᆨ의 구체ᄌᆨ ᄌᆨ아례누ᄉᆯ 2.5ᄌᆯ의 fused lasso리ᄅᆫ 여러 예제데서 구체ᄌᆨ으로 다루기ᄅ

ᆫ다.

ADMMᅴ ᄎᆷ고ᄆᆫᄒᆫ으로ᄂᆫ Boyd ᄃᆼ (2010), proximalᆯ고리즤 리뷰ᄂᆫ Parikhᅪ Boyd (2013)ᄅ

ᆷ고하기 바ᄅᆫ다. ᄇᆫ ᄂᆫᄆᆫ우로 Boyd ᄃᆼ (2010)ᅪ Polson ᄃᆼ (2015)ᅴ 리뷰리초로 ᄒᆷ이리 ᄇᆰᄒ

ᅧ 구ᄉᆼ아와 ᄀᇀ다. 2ᄌᆯ에서ᄂᆫ ADMM ᆯ고리좌 이에 ᄑᆯ요ᄒᆫ 기ᄇᆫᄌᆨ 내ᄋᆼ ᄃᆼ이ᄉᆫ다. 3ᄌᆯᄋ

ᅥᄂᆫ ADMMᅴ ᄋᆼ아례ᄋᆯ펴보고, ᄀᆫᄃᆫᄒᆫ 모의 자료ᄅᆯ아여 lasso 메의 최ᄌᆨ화에 대ᄒᆫ ᄉᆯᄌᆼᄀ

ᅪ레시ᄒᆫ다. 끄로 4ᄌᆯ에서ᄂᆯᄅᆫ ᄆᆾ GPU ᄇᆼᄅᆯ 처리뤼ᄒᆫ ᄒᆼ후 ᄀᆨ이ᄉᆫ다.

2. ADMM 방법론

ᅵ ᄌᆯ에서ᄂ ᅦᄋᆨ조ᄀᆫᄋ ᅡᄌᆫ 최ᄌᆨ화 메ᄅ ᅵ제ᄋᆨ (unconstrained) ᄒᆼᄉᆨ의 ᄇᆯᄌᆷ화 (penaliza- tion)ᄃ ᅦ로 ᄌᆫ하여 이해하고, 이ᄋ ᆫᄅᆫᄃᆼ대메 (dual problem)ᄅ ᅬᄌᆨ화하기 위ᄒᆫ ᄇᆼᄇᆸᄋ

ᆯᄆᆼᄒᆫ다.

2.1. 쌍대문제와 증강 라그랑지안 방법

ᅦ (1.2)에 대ᄒᆫ 라그ᄅᆼ지ᄋᆫ ᄒᆷ수 (Lagrangian function)ᄅᆼᄀᆨ해 보자.

L(x, z, α) = f (x) + g(z) + αT(x − z),

ᅧ기서 αᄂ ᅡ그ᄅᆼ지ᄋᆫ 수 (Lagrangian multipliers)이다. ᄆᆫ저 메 (1.2)ᄅᆯ 이 (primal) 메ᄅ

ᅡ고, 모수 x, zᄅᆯ 이모수 (primal parameter)라 ᄒᆫ다. α가 주어ᄌᆻᄋ ᅢ, x, z에 대ᄒᆫ 최소ᄀᆹ아ᄌ

ᆷ수ᄅᆼ대ᄒᆷ수 (dual function)라 부르고, 다으로 ᄌᆼ의ᄒᆫ다.

d(α) = inf

x,zL(x, z, α).

ᅦᄋᆨ조ᄀᆫ x − z = 0하에서 이메에서의 최ᄌᆨᄀᆹᄋᆯ p = infx,z{f (x) + g(z)}으로 느ᄆᆫ d(α)ᄋ pᅪ예나와 ᄀᇀᄋᆷᄋᆯ ᄌᆼᄆᆼᄒᆯ 수 ᄋᆻ다 (Boyd와 Vandenberghe, 2004).

d(α) = inf

x,zL(x, z, α) ≤ p= inf

x,z{f (x) + g(z)}.

ᅳ러므로 d(α)ᄂᆫ pᅦ 대ᄒᆫ 하ᄒᆫ (lower bound)아. 따라서 이 하ᄒᆫ의 최대ᄀᆹ우하ᄆᆫ pᅪ ᄎ

ᅢᄒᆫᄌᆸ하ᄀᆯ ᄀᆺ이라 예ᄉᆼᄒᆯ 수 ᄋᆻ다. 이ᄉᆼ의 ᄉᆯᄆᆼ아의 메로 ᄌᆼᄉᆨ화ᄒᆯ 수 ᄋᆻ가.

maxα d(α).

ᅵᄅᆯ 이메에 대ᄒᆫ ᄊᆼ대메라 부라. ᄊᆼ대메의 최ᄌᆨᄀᆹᄋᆯ d= supαd(α)ᅡ 두ᄆᆫ 예ᄉᆨᄋ

ᅴ해 ᄋᆨᄊᆼ대ᄉᆼ (weak duality)

d≤ p

수치

Table 3.1 Result of elasped time (in second) p n 5000 10000 15000 20000 1500 10.2196 18.6746 29.2402 41.6025 3000 24.2095 38.1463 79.9708 102.7723 4500 46.6089 62.7049 141.4850 184.3950 ᄉ ᅮ저 ᆼ ᄏ ᅩᄃ ᅳᄋ ᅦᄉ ᅥ ᄉ ᅡ용 하 ᆫ ᄏ ᅩᄃ ᅳ느 ᆫ CPU 여 ᆫ사 ᆫᄀ ᅪ 벼 ᆼ려 ᆯ여
Figure 4.1 Process for GPU computation using theano

참조

관련 문서

Department of Anatomy, Ajou University School of Medicine, 164 World Cup-ro, Yeongtong-gu, Suwon 16499, Republic of Korea..

Department of Anatomy, Ajou University School of Medicine, 164 World Cup-ro, Yeongtong-gu, Suwon 16499, Republic of Korea..

Department of Anatomy, Ajou University School of Medicine, 164 World Cup-ro, Yeongtong-gu, Suwon 16499, Republic of Korea.

7 Corresponding author: Professor, Department of Information Statistics, Chungbuk National Univer- sity, 1 ChungDae-ro, Seowon-gu,

Department of Anatomy, Ajou University School of Medicine, 164 World Cup-ro, Yeongtong-gu, Suwon 16499, Republic of Korea.

Department of Anatomy, Ajou University School of Medicine, 164 World Cup-ro, Yeongtong-gu, Suwon 16499, Republic of Korea.

Department of Anatomy, Ajou University School of Medicine, 164 World Cup-ro, Yeongtong-gu, Suwon 16499, Republic of Korea.

Correspondence to Sung Ran Cho, M.D., Ph.D., Department of Laboratory Medicine, Ajou University School of Medicine, 164, World cup-ro, Yeongtong-gu, Suwon 16499, Korea,