• 검색 결과가 없습니다.

Deformable convolutional networks based Mask R-CNN <sup>†</sup>

N/A
N/A
Protected

Academic year: 2021

Share "Deformable convolutional networks based Mask R-CNN <sup>†</sup>"

Copied!
16
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

요 약

ᄀ ᅢ

ᆨᄎ ᅦ ᄐ ᅡ ᆷᄉ ᅢ ᆨᄋ ᅳ ᆫ ᄌ ᅡᄋ ᅲ ᆯ ᄌ ᅮᄒ ᅢ ᆼ, ᄉ ᅵ ᆯᄉ ᅵᄀ ᅡ ᆫ ᄇ ᅩᄋ ᅡ ᆫ, ᄀ ᅥ ᆫᄉ ᅥ ᆯ ᄌ ᅡᄃ ᅩ ᆼ ᄒ ᅪᄋ ᅦᄉ ᅥ ᄒ ᅪ ᆯᄋ ᅭ ᆼᄃ ᅬ ᆯ ᄉ ᅮ ᄋ ᅵ ᆻᄂ ᅳ ᆫ ᄀ ᅵᄉ ᅮ ᆯ ᄅ ᅩᄉ ᅥ ᄀ ᅡ ᆨ ᄀ ᅪ ᆼ ᄇ ᅡ ᆮᄀ ᅩ ᄋ ᅵ ᆻᄂ ᅳ ᆫ ᄏ ᅥ

ᆷᄑ ᅲᄐ ᅥ ᄇ ᅵᄌ ᅥ ᆫ ᄋ ᅳ ᆼᄋ ᅭ ᆼ ᄀ ᅵᄉ ᅮ ᆯ ᄋ ᅵᄃ ᅡ. ᄎ ᅬ ᄀ ᅳ ᆫ ᄃ ᅵ ᆸᄅ ᅥᄂ ᅵ ᆼᄋ ᅳ ᆯ ᄀ ᅵᄇ ᅡ ᆫᄋ ᅳᄅ ᅩ ᄒ ᅡ ᆫ ᄀ ᅢ ᆨᄎ ᅦ ᄐ ᅡ ᆷᄉ ᅢ ᆨ ᄆ ᅩᄃ ᅦ ᆯᄋ ᅵ ᄃ ᅳ ᆼ ᄌ ᅡ ᆼᄒ ᅡᄋ ᅧ ᆻᄀ ᅩ ᄃ ᅵ ᆸᄅ ᅥᄂ ᅵ ᆼ ᄀ ᅵᄉ ᅮ ᆯ ᄋ ᅴ ᄇ

ᅡ ᆯᄌ ᅥ ᆫᄀ ᅪ ᄒ ᅡ ᆷᄁ ᅦ ᄈ ᅡᄅ ᅳ ᆫ ᄉ ᅩ ᆨ ᄃ ᅩᄅ ᅩ ᄀ ᅢ ᆨᄎ ᅦ ᄐ ᅡ ᆷᄉ ᅢ ᆨ ᄆ ᅩᄃ ᅦ ᆯᄃ ᅳ ᆯ ᄃ ᅩ ᄇ ᅡ ᆯᄌ ᅥ ᆫᄒ ᅡᄀ ᅩ ᄋ ᅵ ᆻᄃ ᅡ. ᄀ ᅢ ᆨᄎ ᅦ ᄐ ᅡ ᆷᄉ ᅢ ᆨ ᄆ ᅩᄃ ᅦ ᆯᄃ ᅳ ᆯᄋ ᅳ ᆫ ᄃ ᅢᄋ ᅭ ᆼ ᄅ ᅣ ᆼ ᄏ ᅳᄀ ᅵᄋ ᅴ ᄋ ᅵ ᆸ ᄅ

ᅧ ᆨᄀ ᅡ ᆹᄋ ᅵ ᆫ ᄋ ᅵᄆ ᅵᄌ ᅵᄅ ᅳ ᆯ ᄎ ᅥᄅ ᅵᄒ ᅡᄀ ᅵ ᄋ ᅱᄒ ᅢ ᄀ ᅩ ᆼᄐ ᅩ ᆼᄌ ᅥ ᆨᄋ ᅳᄅ ᅩ CNN (convolutional neural network)ᄅ ᅳ ᆯ ᄉ ᅡᄋ ᅭ ᆼ ᄒ ᅡ ᆫᄃ ᅡ. ᄒ ᅡ ᄌ

ᅵᄆ ᅡ ᆫ CNNᄋ ᅳ ᆫ ᄀ ᅢ ᆨᄎ ᅦᄋ ᅴ ᄏ ᅳᄀ ᅵᄋ ᅦ ᄉ ᅡ ᆼ ᄀ ᅪ ᆫᄋ ᅥ ᆹᄋ ᅵ ᄀ ᅩ ᆼᄐ ᅩ ᆼᄃ ᅬ ᆫ ᄑ ᅵ ᆯᄐ ᅥᄅ ᅳ ᆯ ᄉ ᅡᄋ ᅭ ᆼ ᄒ ᅡᄂ ᅳ ᆫ ᄆ ᅮ ᆫ ᄌ ᅦᄌ ᅥ ᆷᄋ ᅵ ᄋ ᅵ ᆻᄃ ᅡ. ᄇ ᅩ ᆫ ᄋ ᅧ ᆫᄀ ᅮᄋ ᅦᄉ ᅥᄂ ᅳ ᆫ ᄋ ᅩᄑ ᅳ ᄉ

ᅦ ᆺ (offset)ᄋ ᅳ ᆯ ᄋ ᅵᄋ ᅭ ᆼ ᄒ ᅢ ᄀ ᅢ ᆨᄎ ᅦᄋ ᅦ ᄃ ᅢᄋ ᅳ ᆼ ᄒ ᅡᄂ ᅳ ᆫ ᄑ ᅵ ᆯᄐ ᅥᄅ ᅳ ᆯ ᄆ ᅡ ᆫᄃ ᅳᄂ ᅳ ᆫ Deformable convolutional networkᄅ ᅳ ᆯ Mask R-CNN ᄋ ᅦ ᄌ ᅥ ᆨᄋ ᅭ ᆼ ᄒ ᅢ ᄒ ᅡ ᆸᄉ ᅥ ᆼᄀ ᅩ ᆸ ᄂ ᅦᄐ ᅳᄋ ᅯᄏ ᅳᄋ ᅴ ᄆ ᅮ ᆫ ᄌ ᅦᄌ ᅥ ᆷᄋ ᅳ ᆯ ᄒ ᅢᄀ ᅧ ᆯᄒ ᅡᄀ ᅩ ᄀ ᅢ ᆨᄎ ᅦ ᄐ ᅡ ᆷᄉ ᅢ ᆨ ᄋ ᅡ ᆯᄀ ᅩᄅ ᅵᄌ ᅳ ᆷ ᄋ ᅴ ᄌ ᅥ ᆼᄒ ᅪ ᆨ ᄃ ᅩᄅ ᅳ ᆯ ᄂ ᅩ ᇁ ᄋ ᅵᄂ ᅳ ᆫ ᄇ ᅡ ᆼᄇ ᅥ ᆸ ᄋ

ᅳ ᆯ ᄌ ᅦᄋ ᅡ ᆫᄒ ᅡᄀ ᅩᄌ ᅡ ᄒ ᅡ ᆫᄃ ᅡ. ᄌ ᅦᄋ ᅡ ᆫ ᄃ ᅬ ᆫ ᄇ ᅡ ᆼᄇ ᅥ ᆸᄋ ᅳ ᆫ Pascal VOC ᄋ ᅪ COCO ᄃ ᅦᄋ ᅵᄐ ᅥᄅ ᅳ ᆯ ᄋ ᅵᄋ ᅭ ᆼ ᄒ ᅢ ᄉ ᅥ ᆼᄂ ᅳ ᆼᄉ ᅵ ᆯᄒ ᅥ ᆷᄋ ᅳ ᆯ ᄉ ᅮᄒ ᅢ ᆼᄒ ᅡᄋ ᅧ ᆻ ᄀ

ᅩ, ᄀ ᅵᄌ ᅩ ᆫ ᄋ ᅴ Mask R-CNN ᄇ ᅡ ᆼᄇ ᅥ ᆸᄇ ᅩᄃ ᅡ ᄉ ᅥ ᆼᄂ ᅳ ᆼ ᄋ ᅵ ᄀ ᅢᄉ ᅥ ᆫᄃ ᅬᄂ ᅳ ᆫ ᄀ ᅧ ᆯᄀ ᅪᄅ ᅳ ᆯ ᄇ ᅩᄋ ᅧ ᆻᄃ ᅡ.

ᅮᄋ ᅭᄋ ᅭ ᆼ ᄋ ᅥ: ᄃ ᅵ ᆸᄅ ᅥᄂ ᅵ ᆼ, deformable convolutional networks, mask R-CNN, ᄀ ᅢ ᆨᄎ ᅦᄐ ᅡ ᆷᄉ ᅢ ᆨ.

1. 서론

ᆷ퓨터 비ᄌᆫ이ᄀᆨᄌᆨ 세계ᄅ ᅢᄉᆨ하고 이해하도ᄅᆷ퓨터ᄅᆨ시키ᄂᆫ ᄋᆫ기ᄂᆼ 뱌로서 ᄏᆷ퓨ᄐ

ᅵᄌᆫ 모ᄃᆯ이 카메라와 ᄃᆼᄋᆼᄉᆼ에서 ᄋᆮᄋ ᅵ지ᄐᆯ 이미지ᄅᆯ ᄃᆸ러ᄂᆼ 모ᄃᆯ아아여 ᄀᆨ체ᄅᆯ ᄉᆨᄇᆯ하고 ᄇ

ᅲᄒᆫ다. ᄏᆷ퓨터 비ᄌᆫ의 ᄋᆼ이ᄉᆯ ᄌ ᅡ나ᄋᆫ ᄀᆨ체 ᄐᆷᄉᆨ에픠 ᄀᆯᄒᆷ 여부ᄅᆯ ᄉᆯ시ᄀᆫ으로 ᄉᆨᄇᆯ하ᄂ

ᅩᄋᆸ (He ᄃᆼ, 2019), MRI, CAT ᅳᄏᆫ, X 레이의 이미지ᄅ ᆷ사하여 이ᄉᆼ ᄌᆼ후ᄅ ᆷ지하늬료ᄇ (Franzel ᄃᆼ, 2012), ᅡᄅᆼ의 파ᄉᆼ태ᄅᆯ ᄋᆯᄀᆫᄌᆨ이고 ᄌᆼ하게 ᄎᆨᄌᆼ하노ᄒᆷ회사 (Ali와 Alwan, 2017),

ᅢᄎᆼᄋᆷᄉᆨ하ᄂᆫ ᄂᆼᄋᆸ 뱌 (Lee와 Seok, 2018), 고ᄀᆨ의 ᄉᆫᄋᆫᄋᆼ히 ᄉᆨᄇᆯ하ᄂᆫ ᄋᆫᄒᆼ이나 카지노 ᄀᇀᄋ

ᅩᄋᆫ이 지되ᄂᆫ 뱌 (Szczodrak와 Czyzewski, 2017)에ᄉᆯᄋᆼ두 ᄋᆻ니소서 ᄀᆮ고 ᄋᆻ다.

ᆫ 더 ᄃᆸ러ᄂᆼ 기싀 ᄇᆯᄃᆯ로 ᄀᆨ체 ᄐᆷᄉᆨ ᄇᆼᄇᆸᄅᆫᄃᆯ아르게 ᄇᆯᄌᆫ하고 ᄋᆻ다. Girshick ᄃᆼ (2015)ᄋ

ᅦ가 재ᄒᆯ ᄋᆼᄋᆨ에ᄋᆫ해주ᄂᆼᄋᆨ 제ᄋᆫ (region proposal) ᄋᆯ고리ᄌᆷᄋᆫᄀᆯ하여 ᄀᆨ체 ᄐᆷᄉᆨ우ᄒ

ᅡᄂᆫ R-CNNᆼᄇᆸ에ᄋᆫ하ᄋᆻ다. Girshick (2015)ᄋᆫ R-CNNᅴ ᄇᆸᄒᆫ ᄒᆨᄉᆫ계 대ᄉᆫ, ᄒᆫ ᄇᆫ의 ᄒᆨᄉᆸᄋ

ᅱᄒᆫ CNN (convolutional neural network)우차고 ᄀᆨ체 ᄐᆷᄉᆨ우ᄒᆼ하ᄂᆫ Fast R-CNN에ᄋᆫᄒ

ᆻ다. Ren ᄃᆼ (2015)ᄋᆫ Fast R-CNNᅦ ᄋᆼᄋᆨ 제ᄋᆫ 네트워크 (region proposal network, RPN)루가ᄒ

ᄋ ᅵ ᄂ ᅩ ᆫᄆ ᅮ ᆫᄋ ᅳ ᆫ 2017ᄂ ᅧ ᆫᄃ ᅩ ᄌ ᅥ ᆼᄇ ᅮ (ᄀ ᅪᄒ ᅡ ᆨᄀ ᅵᄉ ᅮ ᆯᄌ ᅥ ᆼᄇ ᅩᄐ ᅩ ᆼᄉ ᅵ ᆫᄇ ᅮ)ᄋ ᅴ ᄌ ᅢᄋ ᅯ ᆫ ᄋ ᅳᄅ ᅩ ᄒ ᅡ ᆫᄀ ᅮ ᆨᄋ ᅧ ᆫᄀ ᅮᄌ ᅢᄃ ᅡ ᆫ - ᄎ ᅡᄉ ᅦᄃ ᅢᄌ ᅥ ᆼᄇ ᅩ · ᄏ ᅥ ᆷᄑ ᅲᄐ ᅵ ᆼᄀ ᅵᄉ ᅮ ᆯ ᄀ ᅢᄇ ᅡ ᆯ ᄉ

ᅡᄋ ᅥ ᆸᄋ ᅴ ᄌ ᅵᄋ ᅯ ᆫᄋ ᅳ ᆯ ᄇ ᅡ ᆮᄋ ᅡ ᄉ ᅮᄒ ᅢ ᆼᄃ ᅬ ᆫ ᄋ ᅧ ᆫᄀ ᅮᄋ ᅵ ᆷ (NRF-2017M3C4A7083281).

1

(06974) ᄉ ᅥᄋ ᅮ ᆯᄐ ᅳ ᆨᄇ ᅧ ᆯᄉ ᅵ ᄃ ᅩ ᆼ ᄌ ᅡ ᆨᄀ ᅮ ᄒ ᅳ ᆨᄉ ᅥ ᆨᄅ ᅩ 84, ᄌ ᅮ ᆼ ᄋ ᅡ ᆼᄃ ᅢᄒ ᅡ ᆨᄀ ᅭ ᄋ ᅳ ᆼᄋ ᅭ ᆼᄐ ᅩ ᆼ ᄀ ᅨᄒ ᅡ ᆨᄀ ᅪ, ᄉ ᅥ ᆨᄉ ᅡᄌ ᅩ ᆯᄋ ᅥ ᆸ.

2

(04620) ᄉ ᅥᄋ ᅮ ᆯᄐ ᅳ ᆨᄇ ᅧ ᆯᄉ ᅵ ᄌ ᅮ ᆼ ᄀ ᅮ ᄑ ᅵ ᆯᄃ ᅩ ᆼ ᄅ ᅩ 1ᄀ ᅵ ᆯ 30, ᄃ ᅩ ᆼᄀ ᅮ ᆨ ᄃ ᅢᄒ ᅡ ᆨᄀ ᅭ ᄐ ᅩ ᆼ ᄀ ᅨᄒ ᅡ ᆨᄀ ᅪ, ᄀ ᅭᄉ ᅮ.

3

ᄀ ᅭᄉ ᅵ ᆫᄌ ᅥᄌ ᅡ: (06974) ᄉ ᅥᄋ ᅮ ᆯᄐ ᅳ ᆨᄇ ᅧ ᆯᄉ ᅵ ᄃ ᅩ ᆼ ᄌ ᅡ ᆨᄀ ᅮ ᄒ ᅳ ᆨᄉ ᅥ ᆨᄅ ᅩ 84, ᄌ ᅮ ᆼ ᄋ ᅡ ᆼᄃ ᅢᄒ ᅡ ᆨᄀ ᅭ ᄋ ᅳ ᆼᄋ ᅭ ᆼᄐ ᅩ ᆼ ᄀ ᅨᄒ ᅡ ᆨᄀ ᅪ, ᄀ ᅭᄉ ᅮ.

E-mail: [email protected]

(2)

ᅧ CPU 대ᄉᆫ GPU에서 계ᄉᆫ우ᄒᆼ하ᄆᆫ서 ᄀᆨ체 ᄐᆷᄉᆨ 소ᄅᆼᄉᆼ시ᄏᆫ Faster R-CNN에ᄋᆫ하ᄋᆻ다.

Redmon ᄃᆼ (2016)이미지 내의 ᄀᆼ계ᄇᆨ스 (bounding box)와 캐ᄉᆨᄅᆯ (class probability)ᄋᆫᄋ

ᅬ귀 메 (single regression problem)로 ᄀᆫ주하여 소ᄅᆼᄉᆼ시ᄏᆫ You Only Look Once (YOLO)ᄅ

ᅦᄋᆫ하ᄋᆻ다. He ᄃᆼ (2017)ᄋᆫ Faster R-CNNᅦ서 이ᄌᆫ 마스크 (binary mask)ᄋᆷᄋᆼᄋᆨ ᄌᆼᄅᆯ (Region of interest align, ROI align)아아여 ᄉᆼᄂᆼ애ᄉᆫᄒᆫ Mask R-CNN ᄇᆼᄇᆸ에ᄋᆫ하ᄋᆻ다.

ᅵ러ᄒᆫ 기즤 ᄀᆨ체 ᄐᆷᄉᆨᄇᆼᄇᆸᄃᆯᄋ ᅡ이즈의 이미지 데이터ᄅ ᅥ리하기 위해 ᄀᆼᄐᆼᄌᆨ으로 CNNᄋ

ᅡ아고 ᄋᆻ다. CNNᄋᆫ ᄋᆫᄀᆫ의 시ᄉᆫᄀᆼ 구조로ᄇᆼᄒᆫ 기소 ᄋᆫᄀᆼᄉᆫᄀᆼᄆᆼ 기ᄇᆸ에 ᄑᆯ터ᄅᆼ 기ᄇᆸᄋᆨᄋ

ᅳ로써 ᄋᆸᄅᆨ ᄀᆹ으로 더오니미지러요과ᄌᆨ으로 처리하니ᄇᆸ이다. CNNᄋᆫ ᄒᆼᄅᆯ로 표ᄒᆫᄃ

ᅥ의 ᄀᆨ 요소가 데이터 처리에 ᄌᆨᄒᆸ하도르스로 ᄒᆨ사게 ᄒᆫ다. 이ᄅᆫ CNN의 ᄐᆨᄌᆼ 때메 이미지 ᄇ

ᅲ ᄋᆯ고리제 CNNᄅᆨ아게 되ᄆᆫ 뷰 ᄌᆼ호가 ᄒᆼ사. ᄎᆫ CNNᄋᆯᄌᆫ시ᄏᆫ 새로ᄋᆼᄇᆸᄃ

ᅵ 꾸지 ᄋᆫ구되고 ᄋᆻ다. Dai ᄃᆼ (2017)ᄋᆨ체에 ᄆᆽᄂᆫ ᄑᆯ터ᄅᆨ시키ᄂᆫ Deformable convolutional network레ᄋᆫ하ᄋᆻ다. Wang ᄃᆼ (2019)ᄋᆫ CNNᅴ ᄌᆼᄇᆨᄉᆼ 메ᄅᆯ ᄌᆨ교ᄉᆼ ᄌᆼ규화ᄅᆯ 태 해ᄀᆯ하고 ᄉ

ᆼ애ᄉᆫ시ᄏᆫ Orthogonal CNN레ᄋᆫ하ᄋᆻ다. Shulman (2019)니ᄀᆫᄌᆨ 서라루ᄂᆼ우 ᄃᆼᄋᆯᄒ

ᅲ의 ᄇᆫᄒᆼ이 ᄇᆯᄉᆼᄒᆯ 수 ᄋᆻ다고 가ᄌᆼ하고 Dynamic time warping과 유사ᄒᆫ ᄋᆯ고리ᄌᆷ아아여 ᄀ

ᆨ으로 이ᄐᆯ ᄉᆼ태ᄋᆫ 게서 ᄑᆯ터와 ᄋᆸᄅᆨ ᄀᆹᄋᆼᄅᆯ하ᄂᆫ Dynamic time warp convolutional networkᄅ

ᅦᄋᆫ하ᄋᆻ다. Song ᄃᆼ (2020)ᄋ ᆼᄉᆼ ᄌᆸᄋ ᅦ거ᄅ ᅱ해 CNN과 디노이ᄌᆼ 오토ᄋᆫ코더 (denoising au- toencoder)ᄅᆯᄒᆸ시ᄏᆫ Convolutional denoising autoencoder레ᄋᆫ하ᄋᆻ다.

ᅡᄅᆷᄋᆫ ᄐᆨᄌᆼ ᄀᆫ에서 메ᄃᆯᄋᆯ 배 메마다 ᄄᇀ이야ᄅᆯ 태 ᄑᆫᄃᆫ하지 ᄋᆭ나. ᄌᆨ의자ᄅᆯ ᄇ

ᅢᄂ ᅴ자의 크기에 ᄆᆽ게 시야ᄅ ᆽ추고, 커다ᄅᆫ ᄐᆨ자ᄅᆯ ᄇ ᅢᄂ ᆨ자의 크기에 ᄆᆽ춰 시야ᄅ ᆼᄉᆼᄒᆫ다.

ᆫᄋᆨ ᄌᆨ의자ᄅᆯ 배의 시야리ᄋᆨ자ᄅᆯ 바ᄆᆨ자레대로 ᄋᆫᄉᆨ하지 ᄆᆯ ᄀᆺ이다. ᄀ

ᅦ ᄐᆷᄉᆨ에 사외니미지ᄂᆫ Figure 1.1ᅥᄅᆷ 서로 다르기의 ᄀᆨ체라지고 ᄋᆻ다. ᄀᆨ체ᄅᆷᄉᆨᄒᆯ ᄄ

ᆯᄇᆫᄌᆨᄋᆫ CNNᄋᆫ ᄀᆼᄐᆼᄃ ᆯ터ᄅ ᅡ아기 때메 크기가 서로 다ᄅ ᆨ체듸 ᄐᆨᄌᆼᄌᆨᄋᆫ ᄌᆼ보ᄅᆼᄒ

ᅦ 추차기 ᄒᆷ다. Dai ᄃᆼ (2017)아ᄅᆷ이 ᄀᆨ체의 크기에 ᄆᆽ춰 시야ᄅᆼᄉᆼ하ᄂᆺ처ᄅᆷ ᄀᆨ체의 크ᄀ

ᅦ ᄆᆽᄂᆫ ᄑᆯ터ᄅᆨ시키ᄂᆫ Deformable convolutional networkᄅᆯ Faster R-CNNᆼᄇᆸ에 ᄌᆨ애 ᄉᆼᄂ

ᆼᄉᆼ시ᄏᆻ다.

Figure 1.1 Image consisting of objects with different sizes (Everingham et al., 2015)

ᆫ ᄂᆫ메서ᄂ ᆨ체 ᄐᆷᄉᆨ의 Mask R-CNN 모ᄒᆼ에 Deformable convolutional networkᄅ ᆨ이ᄏ

(3)

2. 객체 탐색 기존 연구

2.1. 개념 및 용어 설명

ᆨ체 ᄐᆷᄉᆨ이미지 내에서 어ᄄᆫ 메ᄋᆫ지 뷰하ᄂᆫ 뷰 (classification) 메와 그 메가 어디 ᄋᆻᄂ

ᅵ ᄀᆼ계ᄇᆨ스ᄅᆯ 태 위치 ᄌᆼ보라타내ᄂᆫ 고화 (localization) 메래ᄀᆯ하ᄂ ᆺ의미ᄒᆫ다. Fig- ure 2.1처ᄅᆷ ᄀᆨ체 ᄐᆷᄉᆨ이미지에 재하노ᄃᆨ체ᄅᆷᄉᆨ하기 때메 ᄋᆯᄇᆫᄌᆨᄋᆫ 이미지 뷰보다 ᄃ

ᅥᄅᆸ고 ᄇᆸ하다. ᄀᆨ체 ᄐᆷᄉᆨᄋᆫ ᄋᆯᄇᆫᄌᆨ으로 3ᄃᆫ계에 ᄀᆯ쳐 ᄌᆨᄋᆸ우ᄒᆼᄒᆫ다: (1) 이미지나 ᄋᆼᄉᆼ으로부ᄐ

ᆨ체 후보 ᄋᆼᄋᆨᄃᆯᄋᆫᄐᆨ, (2) ᄀᆨ 후보듸 ᄋᆼᄋᆨ으로부터 ᄐᆨᄌᆼ우ᄎᆯ, (3)ᅮᄎᆫ ᄐᆨᄌᆼᄃᆯᄋᆯ 뷰기ᄅ

ᅡ여 ᄀᆨ체 후보 ᄋᆼᄋᆨ의 캐스ᄅᆯ 뷰하고 ᄀᆼ계ᄇᆨ스 회귀ᄇᆫᄉᆨ과 ᄀᇀ우처리ᄅᆯ 태 고화 ᄉᆼᄂᆼᄋᆯ ᄂ

ᅵ놔ᄌᆼ어ᄎᆫ다. ᄀᆨ체 ᄐᆷᄉᆨ ᄇᆼᄇᆸ우보 ᄋᆼᄋᆨ의 ᄐᆨᄌᆼ 추ᄎᆯ 때 이미지 데이터ᄅᆯ ᄇᆫᄉᆨ하ᄂᆫ CNNᄋ

ᅡᄋᆫ다.

Figure 2.1 Example of object detection (Everingham et al., 2015)

ᆼᄋᆨ 제ᄋᆫ ᄇᆼᄇᆸᄋᆫ ᄋᆸᄅᆨ ᄀᆹ에서 ‘ᄀᆨ체가 ᄋᆻᄋ ᆸᄒᆫ’ ᄋᆼᄋᆨᄋ ᅡᄅᆫ 소로 ᄎᆽ아내ᄂ ᆯ고리ᄌᆷ의미ᄒ

(4)

ᅡ. Harzallah ᄃᆼ (2009)ᄋᆫᄌᆫ ᄐᆷᄉᆨ (exhaustive search) ᄇᆼᄇᆸ으로 Figure 2.2처ᄅᆷ 후보고ᄃ

ᆨᄋᇀᄉᇀ이 조사하ᄂᆼᄇᆸ아아ᄋᆻ다. 하지ᄆᆫ 이 ᄇᆼᄇᆸᄋᆫ ᄋᆷ의의 모ᄃᆼᄋᆨ오사하기 때메 시ᄀ

ᅵ 오래 ᄀᆯᄅᆫ다ᄂᆫᄌᆷ이 ᄋᆻᄋᆻ다.

Figure 2.2 Example of applying the exhaustive search method. The image is originally from Uijlings et al.

(2013)

Alexe ᄃᆼ (2012)ᄋᆫᄌᆫ ᄐᆷᄉᆨ ᄇᆼᄇᆸ의 ᄃᆫᄌᆷᄋᆫ, 데이터의 ᄐᆨᄉᆼ에 기ᄇᆫ하여 후보ᄀᆯ ᄋᆼᄋᆨᄋ

ᆫᄃᆼ ᄇᆨ스로 ᄎᆽᄂᆼᄇᆸᄋᆫ ᄇᆯ (segmentaion) ᄇᆼᄇᆸ에ᄋᆫᄒᆻ다. Figure 2.3처ᄅᆷ 고ᄋᆼ이의 패ᄐᆫ이 비ᄉ

ᆫ ᄀᆼ우ᄂᆨᄁᆯ에 기ᄇᆫ하여 후보 ᄋᆼᄋᆨᄋᆽ고 Figure 2.4처ᄅᆷ 퐈 ᄃᆼ믜 ᄉᆨᄁᆯ이 비ᄉᆫ ᄀᆼ우내ᄐᆫᄋ

ᅩ 후보ᄋᆼᄋᆨᄋᆽ나.

Figure 2.3 The candidate areas can be distinguished by color. The original image is from Uijlings et al. (2013)

Uijlings ᄃᆼ (2013)ᄋᆫᄌᆫ ᄐᆷᄉᆨ과 ᄇᆯ ᄇᆼᄇᆸ의 ᄌᆼᄌᆷᄋᆸᄎᆫ ᄉᆫᄐᆨᄌᆨ ᄐᆷᄉᆨ (selective search)에ᄋᆫᄒ

(5)

Figure 2.4 The candidate areas can be distinguished by pattern. The original image is from Uijlings et al.

(2013)

ᅡ. 이 ᄇᆼᄇᆸᄋᆫ ᄇᆯ에 ᄃᆼ아ᄂᆫ 모ᄃᆼᄇᆸᄋᆯ아여 seedᄅᆯᄌᆼ하고, 그 seed에 대하ᄋᆫᄌᆫ ᄐᆷᄉ

ᆼᄉᆨ으로 ᄎᆽᄂᆺᄋᆯ 묘로 하ᄂᆼᄇᆸ으로 ᄎᆨ체 ᄐᆷᄉᆨ에서 자주 사외니ᄇᆸ이다.

2.2. R-CNN

Girshick ᄃᆼ (2015)ᄋᆼᄋᆨ 제ᄋᆫ과 CNNᄋᆯᄒᆸᄒᆫ ᄀᆨ체 ᄐᆷᄉᆨ ᄇᆼᄇᆸ으로 기즤 ᄇᆼᄇᆸ에 비해 ᄉᆼᄂᆼᄉ

ᅩ여ᄌᆫ R-CNNᅵᄇᆸ에ᄋᆫ하ᄋᆻ다. ᄎᆨ체 ᄐᆷᄉᆨ 기ᄇᆸᄃᆯᄋᆫ R-CNNᆼᄇᆸ이ᄇᆫ으로 소와 ᄌᆼᄒ

ᅩᄅᆼᄉᆼ시키ᄂᆼᄒᆼ으로 ᄋᆫ구가 ᄌᆫᄒᆼ되고 ᄋᆻ고 빠ᄅᆫ 소로 기ᄇᆸ디 ᄇᆯᄌᆫ하고 ᄋᆻ다.

R-CNN ᅵᄇᆸᄋᆫ Figure 2.5ᅪ ᄀᇀ이 ᄋᆸᄅᆨ 이미지로부터 ᄉᆫᄐᆨᄌᆨ ᄐᆷᄉᆨᄋ ᅵ아여 ᄀᆨ체 후보 ᄋᆼᄋᆨ ᄋ 2000ᅢ ᄌᆼ도의 ᄋᆼᄋᆨ 제ᄋᆫ우ᄎᆫ다. ᄀᆨᄀᆨ의 제ᄋᆫᄃᆯᄋᆫ CNNᅴ ᄋᆸᄅᆨᄀᆹ으로 더가기 위해 ᄀᆫᄋᆯᄒᆫ ᄏ

ᅵ로 ᄆᆽ추고 이때 아ᄑᆫ 워ᄑᆼ (affine warping)ᄋ ᅮᄒᆼ하ᄀ ᅡ. 추ᄎᆯᄃ ᆨᄌᆼᄋ ᆫᄒᆼ SVM (support vector machine)이아여 최ᄌᆼᄌᆨ으로 ᄀᆨ체의 쥬ᄅᆯ ᄋᆫᄉᆨᄒᆫ다. R-CNNᄋᆼᄋᆨ 제ᄋᆫ 추ᄎᆯᄋᆯ 태 ᄀ

ᅦ의 고화루ᄒᆼ하고, 추ᄎᆯᄃᆫ ᄐᆨᄌᆼ의 ᄉᆫᄒᆼ SVMᄋᆯ 태 ᄀᆨ체의 캐스ᄅᆯ ᄋᆫᄉᆨ하고 ᄀᆨ체 ᄀᆷᄎᆯ우ᄒ

ᅡ가. ᄀᆨ체 ᄀᆷᄎᆯ우ᄒᆼᄒᆫ 후 ᄀᆼ계ᄇᆨ스 회귀ᄇᆫᄉᆨ우ᄒᆼ하ᄆᆫ서 고화 에러ᄅᆯ 지놔ᄌᆼ우ᄒ

ᅡ가 (Girshick ᄃᆼ, 2015).

Figure 2.5 Object detection system overview of R-CNN (Girshick et al., 2015)

수치

Figure 1.1 Image consisting of objects with different sizes (Everingham et al., 2015)
Figure 2.1 Example of object detection (Everingham et al., 2015)
Figure 2.2 Example of applying the exhaustive search method. The image is originally from Uijlings et al.
Figure 2.5 Object detection system overview of R-CNN (Girshick et al., 2015)
+7

참조

관련 문서