• 검색 결과가 없습니다.

A study on complexity of deep learning model

N/A
N/A
Protected

Academic year: 2021

Share "A study on complexity of deep learning model"

Copied!
11
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

2017, 28

(

6)

,

1217–1227

딥러닝 모형의 복잡도에 관한 연구

ᆷᄃ

1

· ᄇᆨ규ᄉ

2

· ᄀᆷᄋ

3

123ᅥ애ᄒᆨ교 톄ᄒᆨᄀ

ᄌ ᅥ

ᆸᄉ ᅮ 2017ᄂ ᅧ ᆫ 10ᄋ ᅯ ᆯ 31ᄋ ᅵ ᆯ, ᄉ ᅮᄌ ᅥ ᆼ 2017ᄂ ᅧ ᆫ 11ᄋ ᅯ ᆯ 22ᄋ ᅵ ᆯ, ᄀ ᅦᄌ ᅢ ᄒ ᅪ ᆨᄌ ᅥ ᆼ 2017ᄂ ᅧ ᆫ 11ᄋ ᅯ ᆯ 23ᄋ ᅵ ᆯ

요 약

ᄃ ᅵ

ᆸᄅ ᅥᄂ ᅵ ᆼᄋ ᅳ ᆫ ᄋ ᅧ ᆼᄉ ᅡ ᆼ ᄋ ᅵ ᆫᄉ ᅵ ᆨ, ᄋ ᅳ ᆷᄉ ᅥ ᆼ ᄋ ᅵ ᆫᄉ ᅵ ᆨ ᄃ ᅳ ᆼ ᄀ ᅵᄌ ᅩ ᆫ ᄋ ᅴ ᄆ ᅥᄉ ᅵ ᆫ ᄅ ᅥᄂ ᅵ ᆼ ᄀ ᅵᄇ ᅥ ᆸᄃ ᅳ ᆯ ᄅ ᅩ ᄒ ᅢᄀ ᅧ ᆯᄋ ᅵ ᄋ ᅥᄅ ᅧᄋ ᅯ ᆻᄃ ᅥ ᆫ ᄇ ᅮ ᆫ ᄋ ᅣᄋ ᅦᄉ ᅥ ᄆ ᅢᄋ ᅮ ᄋ ᅮ ᄉ

ᅮᄒ ᅡ ᆫ ᄉ ᅥ ᆼᄂ ᅳ ᆼᄋ ᅳ ᆯ ᄇ ᅩᄋ ᅧ ᆻᄀ ᅩ, ᄀ ᅳᄅ ᅩ ᄋ ᅵ ᆫᄒ ᅢ ᄃ ᅵ ᆸᄅ ᅥᄂ ᅵ ᆼᄋ ᅴ ᄑ ᅩ ᆨ ᄇ ᅡ ᆯᄌ ᅥ ᆨᄋ ᅵ ᆫ ᄋ ᅧ ᆫᄀ ᅮᄋ ᅴ ᄌ ᅳ ᆼ ᄀ ᅡᄀ ᅡ ᄋ ᅵ ᆻᄋ ᅥ ᆻᄃ ᅡ. ᄌ ᅩ ᇂᄋ ᅳ ᆫ ᄉ ᅥ ᆼᄂ ᅳ ᆼᄋ ᅳ ᆯ ᄇ ᅩᄋ ᅵᄂ ᅳ ᆫ ᄆ ᅩᄒ ᅧ ᆼ ᄆ ᅵ

ᆾ ᄆ ᅩᄉ ᅮ ᄎ ᅮᄌ ᅥ ᆼ ᄇ ᅡ ᆼᄇ ᅥ ᆸᄋ ᅦ ᄃ ᅢᄒ ᅡ ᆫ ᄋ ᅧ ᆫᄀ ᅮᄃ ᅳ ᆯ ᄋ ᅵ ᄌ ᅮᄅ ᅳ ᆯ ᄋ ᅵᄅ ᅮᄀ ᅩ ᄋ ᅵ ᆻᄂ ᅳ ᆫ ᄒ ᅧ ᆫ ᄒ ᅳᄅ ᅳ ᆷ ᄉ ᅩ ᆨ ᄋ ᅦᄉ ᅥ ᄃ ᅵ ᆸᄅ ᅥᄂ ᅵ ᆼᄋ ᅴ ᄋ ᅵᄅ ᅩ ᆫᄌ ᅥ ᆨᄋ ᅵ ᆫ ᄋ ᅧ ᆫᄀ ᅮ ᄄ ᅩᄒ ᅡ ᆫ ᄌ

ᅩᄉ ᅵ ᆷᄉ ᅳᄅ ᅥ ᆸᄀ ᅦ ᄌ ᅵ ᆫᄒ ᅢ ᆼᄃ ᅬᄀ ᅩ ᄋ ᅵ ᆻᄃ ᅡ. ᄇ ᅩ ᆫ ᄂ ᅩ ᆫᄆ ᅮ ᆫ ᄋ ᅦᄉ ᅥᄂ ᅳ ᆫ ᄃ ᅵ ᆸᄅ ᅥᄂ ᅵ ᆼᄋ ᅴ ᄉ ᅥ ᆼᄀ ᅩ ᆼᄋ ᅳ ᆯ ᄃ ᅵ ᆸᄅ ᅥᄂ ᅵ ᆼ ᄒ ᅡ ᆷᄉ ᅮᄀ ᅡ ᄇ ᅩ ᆨ ᄌ ᅡ ᆸᄒ ᅡ ᆫ ᄒ ᅡ ᆷᄉ ᅮᄅ ᅳ ᆯ ᄒ ᅭᄋ ᅲ ᆯᄌ ᅥ ᆨᄋ ᅳᄅ ᅩ ᄌ

ᆯ ᄑ ᅭᄒ ᅧ ᆫᄒ ᅡ ᆯ ᄉ ᅮ ᄋ ᅵ ᆻᄋ ᅳ ᆷ ᄋ ᅦᄉ ᅥ ᄒ ᅢᄃ ᅡ ᆸᄋ ᅳ ᆯ ᄎ ᅡ ᆽᄀ ᅩ, ᄋ ᅵᄋ ᅦ ᄀ ᅪ ᆫᄅ ᅧ ᆫᄃ ᅬ ᆫ ᄋ ᅵᄅ ᅩ ᆫᄌ ᅥ ᆨᄋ ᅵ ᆫ ᄋ ᅧ ᆫᄀ ᅮᄃ ᅳ ᆯᄋ ᅳ ᆯ ᄌ ᅩᄉ ᅡᄒ ᅡᄋ ᅧ ᄇ ᅮ ᆫᄉ ᅥ ᆨᄒ ᅡᄀ ᅩᄌ ᅡ ᄒ ᅡ ᆫᄃ ᅡ.

ᅮᄋ ᅭᄋ ᅭ ᆼ ᄋ ᅥ: ᄃ ᅵ ᆸᄅ ᅥᄂ ᅵ ᆼ, ᄇ ᅩ ᆨ ᄌ ᅡ ᆸᄃ ᅩ, ᄉ ᅥ ᆫᄒ ᅧ ᆼ ᄋ ᅧ ᆼᄋ ᅧ ᆨ, ᄉ ᅵ ᆷᄎ ᅳ ᆼ ᄉ ᅵ ᆫᄀ ᅧ ᆼᄆ ᅡ ᆼ ᄒ ᅡ ᆷᄉ ᅮ, ᄒ ᅡ ᆷᄉ ᅮ ᄀ ᅰᄌ ᅥ ᆨ, ᄒ ᅡ ᆷᄉ ᅮ ᄌ ᅥ ᆫᄋ ᅵ.

1. 서론

ᆸ러ᄂᆼᄋᆫ ᄃᆼ뫄 ᄋᆫᄀᆫ의 뉴ᄅᆫ 구조ᄅ ᅩ사ᄒᆫ ᄉᆷᄎᆼ ᄋᆫᄀᆼ ᄉᆫᄀᆼᄆᆼ 모ᄒᆼ (deep neural network model;

Larochelle ᄃᆼ, 2007)ᄋᆯ ᄋᆼ아여 ᄆᆫ도ᄒᆼ ᄆᆾ 이ᄅᆨ사기 위ᄒᆫ ᄋᆯ고리ᄌᆷᄋᆯ ᄎᆼᄎᆼᄒᆫ다. ᄃᆸ러ᄂᆼᄋᆫ ᄐ

ᅵ 예ᄌᆫ까지 ᄌᇂᄋ ᆼᄂᆼᄋ ᅢ지 ᄆᆺᄒᆻᄃᆫ 뱌ᄃᆯ (ᅡᄌᆫ ᄋᆫᄉᆨ, ᄋᆷᄉᆼ ᄋᆫᄉᆨ, 비디오 ᄋᆫᄉᆨ ᄆᆾ 자ᄋᆫ어 처리)ᄋ

ᅥ ᄋᆸ도ᄌᆨᄋᆫ ᄉᆼᄂᆼ오이고 ᄋᆻ다 (Hochreiter와 Schmidhuber, 1997; Krizhevsky ᄃᆼ, 2012; Sutskever

ᆼ, 2014; Chung ᄃᆼ, 2008; Ioffeᅪ Szegedy, 2015; He ᄃᆼ, 2016). ᅡᄋᆼ하고 ᄇᆸᄒᆫ 모ᄒᆼᄃᆯ(Krizhevsky

ᆼ, 2012)ᅪ 다ᄋᆼᄒᆫ ᄒᆨᄉ ᆯ고리즤 개ᄇᆯ (Kingma와 Ba, 2014), 데이터 규모의 자, 그리고 다ᄌ GPU (graphics processing units)ᅴ 사ᄋᆼ (Krizhevsky ᄃᆼ, 2012) 드로 ᄋᆫ해 ᄃᆸ러ᄂᆼᄋᆫ ᄀᆸᄀᆨᄒᆫ ᄉᆼᄌ

ᅵ루게 되ᄋᆻ고, 그 ᄀᆯ과 ᄃᆸ러ᄂᆼ이ᄋᆫ ᄋᆫ기느로그ᄅᆷᄋᆫ AlphaGo (Silver ᄃᆼ, 2016; Silver ᄃᆼ, 2017)나지 ᄋᆫ기네ᄀᆫ의 구ᄋᆨ이라 여겨지ᄃᆫ 바데서 ᄋᆫᄀᆫ 프로기사ᄅᆸ도ᄌᆨ으로 이ᄀ

ᆼ에 오게 되ᄋᆻ다. 또ᄒᆫ 의료 보ᄀᆫ 서비스,ᆷ이ᄌᆼ 다회 ᄌᆫᄇᆫᄌᆨᄋᆫ 뱌에 ᄃᆸ러ᄂᆼ 모ᄒᆼᄋᆨᄋ

ᅡ여 ᄌᇂᄋᆼ과러두고 ᄋᆻ다 (Lee ᄃᆼ, 2015; Leeᅪ Chun, 2016; Lee, 2017; Miotto ᄃᆼ, 2017).

ᅢ부븨 ᄃᆸ러ᄂᆼᄋᆫ ᄋᆫ구ᄃᆯ위어ᄂᆫ ᄉᆼᄂᆼ오이도라노ᄒᆼ 또니ᄇᆸ, 그리고 ᄌᇂ우ᄌᆼᄅ

ᅦ개주ᄂ ᆨᄉ ᆼᄇᆸ데 대ᄒᆫ 제ᄋᆫ이 주리루고 ᄋᆻ다. ᄃᆸ러ᄂᆼ ᄋᆫ구의 시ᄇᆯᄌᆷᄋᆫ 2006ᄂᆫ G. E.

Hintonᅵ 제ᄒᆫᄃᆫ 브ᄆᆫ 기계 (restricted Boltzmann machine; Smolensky, 1986)리아여 ᄉᆷᄎᆼ ᄉ

ᆼᄆᆼ 모수의 초기ᄀᆹᄋᆯᄌᆼ해주ᄂᆫ pre-trainingᆼᄇᆸ이며, 이ᄅᆯ 태 과거에 비해 ᄌᇂ우ᄌᆼᄅᆼᄋᆮᄋ

ᆻ게 되ᄋᆻ다 (Hinton ᄃᆼ, 2006; Hintonᅪ Salakhutdinov, 2006). ᄃᆸ러ᄂᆼ의 ᄒᆫ 요소ᄋᆯᄉᆼ ᄒᆷ수에 ᄃ

ᆫ ᄋᆫ구ᄃᆯ히 ᄌᆫᄒᆼ되ᄋᆻ네 2010ᄂᆫ에 제ᄋReLU (rectified linear unit; Nairᅪ Hinton, 2010)ᄀ

ᄋ ᅵ ᄂ ᅩ ᆫᄆ ᅮ ᆫᄋ ᅳ ᆫ ᄉ ᅡ ᆷᄉ ᅥ ᆼᄆ ᅵᄅ ᅢᄀ ᅵᄉ ᅮ ᆯᄋ ᅲ ᆨᄉ ᅥ ᆼᄌ ᅢᄃ ᅡ ᆫᄋ ᅴ ᄌ ᅵᄋ ᅯ ᆫᄋ ᅳ ᆯ ᄇ ᅡ ᆮᄋ ᅡ ᄉ ᅮᄒ ᅢ ᆼᄃ ᅬ ᆫ ᄋ ᅧ ᆫᄀ ᅮᄋ ᅵ ᆷ. (ᄀ ᅪᄌ ᅦᄇ ᅥ ᆫᄒ ᅩ SSTF-BA1601-02).

1

(08826) ᄉ ᅥᄋ ᅮ ᆯ ᄉ ᅵ ᄀ ᅪ ᆫ ᄋ ᅡ ᆨᄀ ᅮ ᄀ ᅪ ᆫ ᄋ ᅡ ᆨᄅ ᅩ 1, ᄉ ᅥᄋ ᅮ ᆯ ᄃ ᅢᄒ ᅡ ᆨᄀ ᅭ ᄐ ᅩ ᆼ ᄀ ᅨᄒ ᅡ ᆨᄀ ᅪ, ᄇ ᅡ ᆨᄉ ᅡᄀ ᅪᄌ ᅥ ᆼ.

2

(08826) ᄉ ᅥᄋ ᅮ ᆯ ᄉ ᅵ ᄀ ᅪ ᆫ ᄋ ᅡ ᆨᄀ ᅮ ᄀ ᅪ ᆫ ᄋ ᅡ ᆨᄅ ᅩ 1, ᄉ ᅥᄋ ᅮ ᆯ ᄃ ᅢᄒ ᅡ ᆨᄀ ᅭ ᄐ ᅩ ᆼ ᄀ ᅨᄒ ᅡ ᆨᄀ ᅪ, ᄇ ᅡ ᆨᄉ ᅡᄀ ᅪᄌ ᅥ ᆼ.

3

ᄀ ᅭᄉ ᅵ ᆫᄌ ᅥᄌ ᅡ: (08826) ᄉ ᅥᄋ ᅮ ᆯ ᄉ ᅵ ᄀ ᅪ ᆫ ᄋ ᅡ ᆨᄀ ᅮ ᄀ ᅪ ᆫ ᄋ ᅡ ᆨᄅ ᅩ 1, ᄉ ᅥᄋ ᅮ ᆯ ᄃ ᅢᄒ ᅡ ᆨᄀ ᅭ ᄐ ᅩ ᆼ ᄀ ᅨᄒ ᅡ ᆨᄀ ᅪ, ᄀ ᅭᄉ ᅮ.

E-mail: [email protected]

(2)

ᅢ표ᄌᆨ이다. 이후에ᄂᆫ ReLUᄅᆯ ᄋᆼ아여 LeakyReLU (Maas ᄃᆼ, 2013), PReLU (He ᄃᆼ, 2015), ELU (Clevert ᄃᆼ, 2015) ᄃᆭᄋᆯᄉᆼ ᄒᆷ수가 제ᄋᆫ되ᄋᆻ다.

ᆸ러ᄂᆼᄋ ᆭ오수라아기 때메 과ᄌᆨᄒᆸ다ᄂᆼᄉᆼ이 나. 따라서 과ᄌᆨᄒᆸᄋᆼ지하기 위ᄒᆫ ᄃ

ᆼᄒᆫ ᄌᆼ규화 (regularization) ᄇᆼᄇᆸ 또ᄒᆫ ᄋᆫ구되ᄋᆻ네 2012ᄂᆫ에 ᄇᆯᄑᆫ ᄋᆫᄂᆨ 노드듸 ᄉᆫ계ᄅᆯ ᄌ

ᅮᄂᆫ drop-out (Hinton ᄃᆼ, 2012)ᅪ ᄀᆨ ᄋᆫᄂᆨ 노드듸 보ᄅᆯ ᄋᆯᄀᆫᄉᆼᄋᆻ게 바꾸어 ᄌᇂ우ᄌᆼᄀᆹᄋ ᆮᄋ

ᅮ ᄋᆻ도래주ᄂᆫ batch-normalization algorithm (Ioffeᅪ Szegedy, 2015)이 대표ᄌᆨ이다. 또ᄒᆫ 모수ᄅ

ᅭᄋᆯᄌᆨ으로 빠르게 추ᄌᆼ하느래디ᄋᆫ트 기ᄇᆫ의 ᄋᆯ고리조ᄒᆫ 다ᄋᆼ하게 개ᄇᆯ되ᄋᆻ네, 대표ᄌᆨᄋᆫ ᄋᆯᄀ

ᅵ즈로ᄂᆫ RMSProp (Tielemanᅪ Hinton, 2012), Adadelta (Zeiler, 2012), Adam (Kingma와 Ba, 2014) 디 ᄋᆻ다. 위에서 ᄋᆫᄀᆫ 여러 ᄋᆫ구ᄃᆯ이아여 GoogLeNet (Szegedy ᄃᆼ, 2015), ResNet (He

ᆼ, 2016), WaveNet (Oord ᄃᆼ, 2016) 다ᄋᆼᄒᆫ 모ᄒᆼ디 개ᄇᆯ되ᄋᆻ고, 사ᄌᆫ ᄋᆫᄉᆨ, ᄋᆷᄉᆼ ᄋᆫᄉᆨ ᄃᆼ ᄋᆫᄀ

ᆼ 뱌에서 ᄋᆯᄃᆫ ᄉᆼᄂᆼ오이고 ᄋᆻ다.

ᅵ러ᄒᆫ ᄃᆸ러ᄂᆼ 모ᄒᆼ의 ᄉᆼ과 더버 ᄃᆸ러ᄂᆼ 모ᄒᆼ이 어ᄄᇂ게 ᄌᆯ ᄌᆨ다니, 다ᄅᆼᄇᆸᄅᆫ데 비해 ᄋ

ᅱ어ᄂᆫ ᄉᆼᄂᆼ아지니에 대ᄒᆫ 이ᄅᆫᄌᆨ ᄋᆫ구 또ᄒᆫ 조ᄉᆷ스ᄅᆸ게 ᄌᆫᄒᆼ되고 ᄋᆻ다. 최초로 ᄋᆫᄀᆼ ᄉᆫᄀᆼᄆᆼ 모ᄒ

ᅴ 이ᄅᆫᄌᆨᄋᆫ ᄐᆨᄉᆼᄋᆰᄒᆫ ᄂᆫᄆᆫᄋᆫ Hornik ᄃᆼ (1989)ᅪ Cybenko (1989)의 ᄋᆫ구로, ᄃᆫᄎᆼ ᄋᆫᄀᆼ ᄉᆫᄀᆼᄆᆼ ᄆ

ᆼ이 ᄋᆷ의의 ᄋᆫᄉᆷ수ᄅᆯ 아ᄂᆼᄆᆯ도라ᄒᆯ 수 ᄋᆻᄋᆷ우ᄒᆨᄌᆨ으로 ᄌᆼᄆᆼ하ᄋᆻ다. 체 ᄇᆯᄑ

ᅮ븨 ᄋᆫ구ᄃᆯᄋᆫ 개의 ᄋᆫᄂᆨᄎᆼᄋᆽᄂᆫᄎᆼ ᄋᆫᄀᆼ ᄉᆫᄀᆼᄆᆼ 모ᄒᆼ (shallow neural network)과 여러개ᄋ

ᆫᄂᆨᄎᆼᄋᆽᄂᆫ ᄉᆷᄎᆼ ᄋᆫᄀᆼ ᄉᆫᄀᆼᄆᆼ 모ᄒᆼ (deep neural network)리교하ᄂᆺᄋᆯ 묘로 하ᄋᆻ다. ᄒᆫ 예ᄅ Eldanᅪ Shamir (2016)ᄂᆫᄎᆼ ᄋᆫᄀᆼ ᄉᆫᄀᆼᄆᆼ으로 ᄉᆷᄎᆼ ᄋᆫᄀᆼ ᄉᆫᄀᆼᄆᆼᄋ ᅡ하기 어ᄅᆸ다ᄂ ᆺ예제ᄅ

ᅢ 보ᄋᆻ다.

ᅩᄒᆫ, 다ᄋᆼᄒᆫ 초ᄅ ᅵ아여 ᄉᆷᄎᆼ ᄋᆫᄀᆼ ᄉᆫᄀᆼᄆᆼ 모ᄒᆼ이 ᄃᆫᄎᆼ ᄋᆫᄀᆼ ᄉᆫᄀᆼᄆᆼ 모ᄒᆼ에 비해 ᄂᇁᄋᆫ ᄇ

ᅩ (complexity)ᄅ ᆽ나ᄂ ᅡᄉᆯᄋ ᅵᄅᆫᄌᆨ으로 ᄇᆰ히기도 하ᄋᆻ네 Pascanu ᄃᆼ (2013)ᅪ Montufar (2014)노ᄒᆼ의 ᄇᆸ도라타내ᄂᆫ 초로써 ᄒᆷ수가 가지ᄂᆫᄒᆼ ᄋᆼᄋᆨ의 수리아ᄋᆻ다. 이 ᄇᆸᄃ

ᅵ아여 ᄀᇀ애수의 노드ᄅᆽ고 ᄋᆻ더라도 ᄋᆫᄂᆨ츼 개수가 커ᄌᆯ수ᄅᆷ수의 ᄇᆸ도가 자ᄒᆫ다ᄂ

ᅡᄉᆯ우ᄒᆨᄌᆨ으로 ᄌᆼᄆᆼ하ᄋᆻ다. 또ᄒᆫ Raghu ᄃᆼ (2016)ᄋᆫᄒᆼ ᄋᆼᄋᆨ의 수 ᄈᆫ 아니라 더 나아가서 ᄋ

ᆨ ᄇᆫ수가 ᄋᆷᄌᆨ이ᄆᆫ서 ᄆᆫ더내ᄂᆷ수의 궤ᄌᆨ의 ᄀᆯ이ᄅᆯ ᄇᆸ도의 초로 제ᄋᆫ하ᄋᆻ다. 이 ᄇᆸ도ᄅ

ᅢ서 다ᄋᆼᄒᆫ 모수에서 ᄒᆷ수의 ᄇᆸ도가 ᄋᆫᄂᆨ츼 개수에 따라 지수ᄌᆨ으로 자ᄒᆫ다나ᄉᆯ오ᄋᆻ다.

ᆫ ᄂᆫ메서ᄂᆫᄒᆼ ᄋᆼᄋᆨ의 수와 ᄒᆷ수 궤ᄌᆨ의 ᄀᆯ이리아여 ᄃᆫᄎᆼ ᄋᆫᄀᆼ ᄉᆫᄀᆼᄆᆼ 모ᄒᆼ과 ᄉᆷᄎᆼ ᄋᆫᄀᆼ ᄉᆫᄀ

ᆼ 모ᄒᆼ의 ᄇᆸ도리교하니ᄅᆫ구데 대해 자세히 ᄉᆯ펴보고자 ᄒᆫ다.

ᆫ ᄂᆫ믜 구ᄉᆼ아와 ᄀᇀ다. 2ᄌᆼ에서ᄂᆫ ᄋᆫᄀᆼ ᄉᆫᄀᆼᄆᆼ 모ᄒᆼ에 대해 ᄀᆫᄃᆫᄒᆫ ᄋᆫᄀᆸᄋ ᆫ다. 3ᄌᆼ에서ᄂ

ᆫᄀᆼ ᄉᆫᄀᆼᄆᆼ 모ᄒᆼ의 ᄇᆸ도ᄅ ᅡ타내누가지의 초에 대해 ᄉᆯᄆᆼ하고, 이 초ᄅ ᅡᄋᆼᄒᆻᄋ ᅢ ᄋᆯ ᄉ

ᆻᄂ ᅵᄅᆫᄌᆨᄋᆫ ᄀᆯ과에 대해 ᄉᆯᄆᆼᄒᆫ다. 4ᄌᆼ에서ᄂᆫ 3ᆼ에서 소개ᄒᆫ 다ᄋᆼᄒᆫ ᄇᆸ도ᄅᆯ ᄉᆯ제로 ᄎᆨᄌᆼ하여 ᄋ

ᆫᄌᆨᄋᆫ ᄀᆯ과와 비교해보고, 마지ᄆᆨ으로 5ᄌᆼ에서 ᄀᆯᄅᆫᄋᆽ나.

2. 신경망 모형

ᆫᄀᆼ ᄉᆫᄀᆼᄆᆼ 모ᄒᆼ (artificial neural network)ᄋ ᅵ계 ᄒᆨ세서 ᄋᆫ구하ᄂᆫ 뱌 자나로, ᄃᆼ믜 ᄂ

ᅮ조로ᄇᆼ하여 ᄆᆫ두ᄒᆨᄌᆨ 모ᄒᆼ이다. 사아고자 하ᄂᆫ ᄆᆨᄌᆨ에 따라 ᄏᆫ부ᄉᆫ ᄉᆫᄀᆼᄆᆼ 모ᄒᆼ (convolu- tional neural network; LeCun ᄃᆼ, 1998), ᄉᆫᄒᆫᄀᆼᄆᆼ 모ᄒᆼ (recurrent neural network; Mikolov ᄃᆼ, 2010) 디 ᄋᆻ지ᄆᆫ ᄇᆫ ᄂᆫ메서ᄂ ᅡᄌᆼ ᄀᆫᄃᆫᄒᆫ ᄒᆼ태ᄋᆫᄌᆫ ᄋᆫᄀᆯᄃᆫᄀᆼ ᄉᆫᄀᆼᄆᆼ 모ᄒᆼ (fully connected neural network; Larochelle ᄃᆼ, 2007)ᆫ오려하도ᄅᆫ다.

mᅡ의 ᄇᆨ터 xᄅᆯ ᄋᆸᄅᆨ ᄇᆫ수로 하ᄂᆫ ᄋᆷ의의 ᄋᆫᄀᆼ ᄉᆫᄀᆼᄆᆼ 모ᄒᆼᄋᆯ Aᅡ 하고, A 모ᄒᆼ의 구조ᄅ ᆽᄂ

ᆫᄀᆼ ᄉᆫᄀᆼᄆᆼ 예ᄎ ᆷ수ᄅᆯ FA(x; W, b)ᅡ 하자. 이 때 (W, b)ᄂ ᆷ수에 ᄑᆯ요ᄒᆫ 모수ᄅ ᅴ미ᄒᆫ다. ᄋᆫᄀ

수치

Figure 3.1 Example of an artificial neural network prediction function 정리 3.1 (Proposition 1 of Pascanu 드 ᆼ (2013)) n × k ᄀ ᅢᄋ ᅴ ᄂ ᅩᄃ ᅳ를 가 ᆽ는 다 ᆫ츠 ᆼ 이 ᆫ고 ᆼ 시 ᆫ겨 ᆼ마 ᆼ ᄆ ᅩ혀 ᆼ A 1,nk 를 ᄉ ᅢ ᆼ가 ᆨᄒ ᅡᄌ ᅡ
Figure 4.1 Two graphs of deep neural network
Figure 4.2 Complexity measures of deep neural networks

참조

관련 문서

Motivation – Learning noisy labeled data with deep neural network.

Key Words : Convergence, Convergence, Power Demand Forecasting, Electric Peak Load Prediction, Deep Neural Network, Deep

Keywords: Deep Learning, Convolutional Neural Network, Hyperparameter, Activation Function,

Thus, we develop convolutional neural network (CNN), long short term memory (LSTM), and multi-layer neural network models, as deep neural networks models, for detecting emotion in

Key words: Convolutional neural network, Deep Learning, Multi-dimensional image, Water-environment 주제어: 합성곱 신경망, 딥러닝, 다차원 이미지, 수환경...

▸Keyword: Passive infrared, movement direction detection, deep learning, machine learning, convolutional neural network.. 특히 오래전 제안되어 널리 활용되었던 인공

▸Keyword: Data Structuring, Deep neural network, Information of Rail services, Social network service,

The detection is based on the deep neural net- works, specifically the Faster R-CNN (faster regions with CNN) model based on CNN (convolutional neural network), with the yellow