Deep Learning Based Object Recognition in Spherical Panoramic Image

(1)

VR/AR

Received: Sep. 11. 2018 Revised: Oct. 16. 2018 Accepted: Oct. 19. 2018

Corresponding Author: Jong-Seung Park (Incheon National University)

ISSN: 1598-4540 / eISSN: 2287-8211

Ⓒ The Korea Game Society. All rights reserved. This is an open-access article distributed under the terms of the Creative Commons Attribution Non-Commercial License (http://creativecommons.otg/licenses/by-nc/3.0), which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.

구면 파노라마 영상에서의 딥러닝 기반 객체 인식

정민석, 박종승 인천대학교 컴퓨터공학부 [email protected], [email protected]

Deep Learning Based Object Recognition in Spherical Panoramic Image

Minsuk Jung, Jong-Seung Park

Dept. of Computer Science & Engineering, Incheon National University

요 약

영상 인식 기술은 평면 영상에 대해서 많이 연구되고 그 성능 또한 발전하고 있다. 그러나 평면 영상이 아닌 구면 파노라마 영상과 다양한 환경에서 주어지는 특수한 형태의 영상에 대한 인식은 평면과 다르게 기하학적인 왜곡으로 인해서 많은 어려움이 따른다. 본 논문에서는 평면 영상의 인식 기술에서 최근 각광받는 훈련을 통한 신경망 인식 기법이 구면 파노라마 영상의 인식에서도 쓰일 수 있음을 보인다. 또한 구면 영상에 대한 기존 신경망 모델의 인식률을 높이 기 위해서 큐브맵 변환을 활용하는 방법을 제시한다.

ABSTRACT

A lot of research has been done on image recognition technique for planar images and the performance has also been improved. However, it is difficult to recognize objects in spherical panoramic images or images in special form which are given in various environments because of the spherical distortion given in different form from the planar case. In this paper, we show that the neural network recognition approach can be used for object recognition in spherical image and suggest a method of using cubemap transform in order to increase recognition accuracy in spherical image.

Keywords : Spherical Panoramic Image(구면 영상), Deep Learning(딥러닝), Object Recognition(객체 인식), Cubemap(큐브맵)

(2)

1. 서 론

객체 인식을 위한 딥러닝 기법들은 대부분 평면 영상을 대상으로 동작한다. 평면 영상이 아닌 구면 파노라마 영상의 경우 객체 인식을 위하 딥러닝을 바로 적용하는 것에 어려움이 있다. 기존의 평면 영상용으로 개발된 딥러닝 처리법은 구면 영상과 같이 왜곡이 있는 경우 인식률이 크게 떨어진다.

구면 파노라마 영상에서의 물체 인식을 위해서 는 반드시 영상의 구면 왜곡을 보정할 필요가 있 다. 첫 번째 방법으로 구면 파노라마에 사영된 평 면 영상의 왜곡을 탐색에 감안하는 방법이 있다[1].

두 번째 방법으로는 기존의 특징점 검출 알고리즘 을 구면상에서 작동하도록 개조하는 방법이 있다.

구면 영상에서 SIFT 알고리즘 등을 사용하기 위 해서 구면 특징점을 추출하는 방법이 그것이다[2].

다른 방식으로는 영상의 큐브맵 변환결과를 평면용 알고리즘에 활용하는 방법도 있다[3].

본 논문에서는 구면 파노라마 영상에서의 객체 인식률을 높이기 위해서 분류 학습과 큐브맵 변환 을 활용하는 방법을 제안한다. 제안 방법은 기존의 평면 영상용으로 훈련되어서 우수한 성능을 보여주 는 딥러닝 모델을 구면 파노라마 영상에 적용할 수 있도록 한다.

2. 딥러닝에 기반한 영상 인식

영상인식을 위해서 개발된 다양한 기술들은 크 게 히스토그램, 특징점, 기계학습 기반으로 분류할 수 있다. 히스토그램 기반은 영상의 색분포를 영상 인식의 근거로 삼는다. 특징점 기반 영상인식은 수 학적으로 계산한 특징점을 감지한다. 각 방식마다 회전이나 다양한 왜곡에 대해 인식 특성이 달라진 다. 기계학습에 기반한 영상인식은 다른 방식에 비 해서 우수한 인식률을 보여주고 있다. 최근 개발되 는 기법들은 처리속도도 대단히 빠른 모습을 보여 주어 주목받고 있다.

2.1 영상 인식을 위한 딥러닝 모델

영상을 인식하기 위해서 연구되는 방법 중 신경 망에 기반을 둔 방식이 최근 널리 연구되고 있다.

특히 다양한 신경망 구조 중 입력값으로 사용되는 영상의 각 화소로부터 추출하는 위치 정보가 신경 망 계층에서 내부적으로 유지되는 합성곱 신경망 (convolution neural network; CNN)모델이 주목 받고 있다. 이 신경망은 그 특성상 내부에서 특징 점들의 상대적인 위치를 조합해서 영상에 찾고자 하는 객체가 있는지를 검색하게 되어 인식률이 대 단히 높다. 이것은 CNN 모델이 찾고자 하는 목표 객체의 이동 불변성(translation invariance)을 검 출하기에 가능하다. 기존의 고전적 머신러닝과 딥 러닝 모델은 이동 불변성이 있는 특징을 검출하기 위해서 과도하게 많은 학습량과 지나치게 깊고 큰 신경망이 필요했으나, CNN은 신경망 내부의 고유 한 구조를 활용해서 그런 단점을 해소한다.

CNN은 내부적으로 몇 종류의 레이어로 구성된 다. CNN의 최상단은 원시 영상 입력 레이어이다.

이 레이어에서 원시 영상은 중첩 타일화(수 픽셀에 서 수십 픽셀 규모의 윈도우 영역)가 이루어진다.

중첩 타일은 특징점 연산을 수행하는 후속 레이어 로 이어진다. 후속 연산의 종류로는 각 타일에 대 한 단순 신경망 연산을 통해 상대적으로 작아진 중간 결과를 만들어내는 합성곱(convolution) 레이 어, 해당 레이어의 결과를 최대값 연산으로 압축해 서 보다 작은 레이어로 만드는 풀링(pooling) 레이 어, 그리고 그런 레이어와 몇몇 단순 연산 레이어 들의 조합으로 만들어진 레이어들의 결과를 모두 합쳐서 최종적으로 연산 결과를 출력해내는 완전 연결(fully connected) 레이어 등이 있다. 이런 내 부 계층은 네트워크의 설계에 따라서 얼마든지 여 러 층이 존재할 수 있다. 신경망은 이런 망의 연산 결과로써 물체의 특징을 찾아낸다.

신경망 인식 방식이 가지는 중요한 특징은 신경 망의 내부 가중치가 훈련을 통해서 자동적으로 결 정된다는 것이다. 신경망이 내부적으로 어떤 특징 을 어떤 방식으로 추출해서 사용하는가에 대해서는

(3)

대략적인 분석이 가능할 뿐, 기존의 특징점 검출과 같이 그 작동법을 수동으로 지정하는 것이 아니다.

2.2 구면 파노라마 영상과 딥러닝

구면 파노라마 영상에서의 패턴 탐색과 인식은 구면 파노라마 특유의 왜곡으로 인해서 어려워진 다. 구면 파노라마 영상의 위도와 경도의 변화에 따라서 직사각형 모양으로 저장된 원시 영상은 상 단과 하단의 왜곡이 특히 크다. 이런 왜곡은 기존 의 강인한 특징점 검출 알고리즘도 작동하지 못하 게 한다. [Fig. 1]은 구면 영상의 예를 보여준다.

[Fig. 1] Example of spherical image

한편, 구면 파노라마 영상의 상하단부에 존재하 는 심한 왜곡에도 불구하고, 기존의 신경망은 여전 히 영상의 인식 처리를 위해서 사용될 수 있다. 그 러나 평면 영상을 위해서 설계된 신경망은 올바른 처리를 위해서 모든 왜곡 형태를 학습할 필요가 있다. 이것은 CNN이 가지는 상대적으로 적은 학 습량으로 추출하는 이동 불변성이라는 장점을 발휘 하지 못하게 한다.

학습량을 과도하게 늘리지 않고 왜곡을 처리하 는 방법으로써 큐브맵 변환을 사용할 경우 하나의 구면 영상으로부터 여섯 개의 정사각형 영상을 얻 어낼 수 있다. 각각의 정사각형 영상에서는 왜곡이 사라지게 되고 이들은 평면 영상용으로 설계된 신 경망의 훈련에 적합한 입력으로 사용된다.

3. 큐브맵을 사용한 딥러닝 인식률 향상

본 논문에서는 구면 영상의 분류와 객체 식별을 위해서 실내 구면 영상의 대략적인 천정의 위치를 파악한 후 영상을 올바른 방향으로 회전시킨 후 물체 인식을 하는 방식을 제안한다. 이 과정에서 큐브맵 변환은 분류와 물체 인식 과정에서 왜곡을 없애기 위해서 사용된다. 또한 영상의 천정면을 검 출하기 위해서 딥러닝 기법을 사용한다.

3.1 구면 영상의 천정 위치 탐색

구면 영상을 큐브맵으로 변환하면 평면 영상을 얻게 되고, 이것은 평면 영상용으로 훈련된 신경망 이 처리하기에 적합하다. 영상의 물체를 인식하기 위해서 사용하는 신경망은 물체의 회전에 관계없이 올바르게 인식할 수 있도록 설계되어 있다. 그러나 실제로 사용하는 훈련 자료와 신경망 성능의 제약 등으로 인해 카메라가 뒤집혀서 촬영한 영상의 경 우 물체 인식이 제대로 되지 않는 문제가 생긴다.

그러므로 물체 식별을 위한 신경망에 큐브맵을 제 공하기 위한 전처리 과정에서 구면 영상의 천정을 탐지해서 천정이 영상의 위쪽을 향하는 큐브맵을 만드는 처리 과정이 필요하다. 천정이라 함은 건물 의 천정과 실외 환경의 하늘 등을 포괄적으로 지 칭한다. 영상의 천정 위치를 탐색하기 위해서 분류 신경망을 훈련해서 천정의 검출에 사용할 수 있다.

본 논문의 분류기는 몇몇 실내와 실외 환경의 선별한 훈련 샘플로 구면 영상의 큐브맵에서 천정 을 검출한다. 테스트 영상은 분류 실험에 사용될 원시 구면 파노라마 영상이다. 분류기의 훈련을 위 해서 촬영 과정에서 천정과 측면, 바닥면의 구도가 일정하도록 사무실과 실외 환경, 주차장 등을 배경 으로 직접 촬영한 잘 구성된 학습 세트를 사용한 다. 훈련 세트에 사용된 원본 구면 파노라마 영상 은 동일한 좌표계 변환 규칙으로 변환했을 때 큐 브맵의 상단 패치에 천정의 영상이, 측면 패치 4개 에 측면 영상이, 하단 패치에 바닥의 영상이 있도 록 구성되어 있다. 이 영상들을 통해서 분류기는 사진의 구도를 학습하고, 천정과 측면, 바닥면에 대한 분류가 가능해진다. 분류기를 훈련시키고 시

(4)

험용 영상에서 천정을 찾아내는 과정을 나타낸 슈 도코드는 [Fig. 2]와 같다. 입력의 training_set은 원시 구면 파노라마 영상으로 주어지는 훈련 세트 이며, ConvertTrainingSet 함수는 훈련 세트를 부 위별로 분류하는 과정으로 슈도코드는 [Fig. 3]과 같다.

Algorithm DetectCeilingFromSphericalImage

Input : training_set, test_image OutPut : category_text[]

Begin

cubemap_set ← ConvertTrainingSet(training_set) cubemap_image ← ConvertToCubeMap(test_image) rate_list ← Create an empty array

trainedCNN ← TrainCNN(cubemap_set) foreach image in cubemap_image

result ← CubeMapClassification(trainedCNN, image) rate_list.add(result.GetCategoryRate(“TOP”)) return IndexOfMaxValue(rate_list)

End

[Fig. 2] Ceil detection algorithm

Algorithm ConvertTrainingSet

Input : training_set, OutPut : cubemap_set Begin

cubemap_set ← Create an empty associate map foreach image in training_set

cubemap = ConvertToCubeMap(image) cubemap_set[sides] += cubemap.sides cubemap_set[top] += cubemap.top cubemap_set[bottom] += cubemap.bottom return cubemap_set

End

[Fig. 3] Training set conversion algorithm

훈련한 신경망에 큐브맵을 입력받아서 분류하는 함수인 CubeMapClassification 함수는 앞서 훈련 한 분류용 신경망을 사용하며, 그 결과는 Softmax 함수로 처리된 일치율 목록이다. 각각의 신경망이 돌려주는 일치율의 총 합은 1이며 천정, 측면, 바 닥면 3종의 분류에 대한 일치율을 돌려준다. 이 경

우 큐브맵의 패치 6개에 대해서 일치율을 돌려주 지만 분류의 목적이 천정면을 찾아내는 것이므로, 6개의 영상 중 천정에 대한 일치율이 가장 높은 부분을 돌려준다.

3.2 천정 탐지를 통한 회전 큐브맵 생성

앞서 구면 파노라마를 통해 생성한 6개의 큐브 맵 중 어떤 면이 천정면인지 찾아냈다. 실제 사진 에서의 천정면은 큐브맵 중 하나 이상에 포함될 수 있으나, 가장 일치율이 높은 것을 회전 기준으 로 삼음으로써 최대한 천정면이 위쪽에 오도록 만 든다.

[Fig. 4] Exploded view of a cubemap (up) and corresponding spherical panorama (down)

영상의 픽셀에 대해서 계산하는 회전은 촬영에 사용한 카메라가 반대 방향으로 회전한 것과 같은 결과를 보여주게 된다. 큐브맵에 있는 모든 픽셀들 은 회전하여 큐브맵 내부의 다른 픽셀의 좌표에 위치하게 된다. 큐브맵의 각 패치의 방향관계를 나 타낸 전개도와 원본 구면 파노라마 영상의 예시는 [Fig. 4]에 있다.

(5)

큐브맵 전개도는 각 큐브맵 패치 간의 상대적인 방향 관계를 제시해준다. 또한 위의 영상은 큐브맵 이 실제로 파노라마 영상에 어떻게 사영될지를 보 여준다. 구면 영상의 각 패치에 대해서 영상 인식 을 수행한 후 얻어내는 각 객체의 위치 정보를 구 면 영상의 좌표로 다시 변환할 때 위에서 제시한 각 면 사이의 위치 관계를 고려하여 변환 수식을 사용해야 한다.

본 논문에서 사용된 큐브맵은 각 정사각면의 너 비가 2로 정규화되어 있고 좌표축에 정렬된 상태 를 가정한다. 큐브맵의 중심은 좌표계 원점인 (0, 0, 0)이고 큐브맵의 윗면은 +z, 앞면은 +x, 오른면 은 +y 좌표값이 1인 평면에 위치한다. 각 큐브맵 패치의 텍스처 공간 좌표는 우상단을 원점으로 삼 으며 가로축이 x, 세로축이 y로 정의된다. 큐브맵 의 각 면이 천정면으로 감지되었을 때 큐브맵에 적용할 회전 각도는 [Table 1]과 같이 주어진다.

회전 변환을 적용한 후의 큐브맵 영상은 인공지능 이 물체를 식별하기에 보다 적합한 형태이다.

position of ceiling axis and angle

top N/A

left X, π / 2

front Y, π / 2

right X, -π / 2

back Y, -π / 2

down X, π

[Table 1] Rotation angle for transformation of cubemap

3.3 큐브맵에서의 물체 인식

생성한 큐브맵의 각 패치에 대해서 물체를 인식 한 후 그 위치를 회전변환을 고려하여 다시 원본 구면 파노라마의 영상으로 바꾼다. 큐브맵 패치 내 부의 텍스쳐 좌표로 주어지는 인식 좌표를 큐브맵 좌표로 변환한 후, 앞선 단계에서 적용한 회전에 대한 역회전 변환을 적용하여 원본 구면 파노라마 내부의 좌표로 변환해준다. 역회전 변환은 [Table 1]에서 제시한 회전을 축은 그대로 유지하고 회전

각만 반대로 하는 과정이다. 그 과정을 나타낸 슈 도코드는 [Fig. 5]와 같다. 입력에 사용된 object는 큐브맵 패치 내부 좌표와 물체의 종류, 확신도 정 보를 가지고 있다. ceiling_info는 회전변환 전에 감지한 상단의 위치를 가지고 있다.

Algorithm ConvertObjectCoordinate

Input : object, ceiling_info OutPut : converted_object Begin

converted_object.detectinfo = object.detectinfo cubepos = ConvertToCubeCoord(object.pos) cubepos.InversRotation(ceiling_info)

r = sqrt(cubepos.x^2 + cubepos.y^2 + cubepos.z^2) converted_object.theta = arccos(cubepos.z / r) converted_object.phi=arctan2(cubepos.y, cubepos.x) + PI return converted_object

End

[Fig. 5] Spherical coordinate conversion algorithm

4. 실험 결과

실험은 분류기의 정확성 실험, 회전 변환의 유효 성 확인 실험, 회전 변환과 큐브맵 변환절차를 사 용한 인식과 구면 파노라마 영상을 직접 사용한 인식의 결과 비교로 진행되었다. 모든 이미지는 사 무실, 실외, 주차장 등의 환경에서 직접 촬영했으 며, 촬영에는 Ricoh Theta 카메라가 사용되었다.

4.1 천정면 탐지를 위한 분류기 학습

천정면 탐지를 위한 분류기의 학습을 위해서 본 논문에서는 InceptionV3를 사용했다[4,7]. 이것은 구글이 개발한 TensorFlow에서 작동하는 CNN 학습모델이다[5]. 이 모델의 최초 버전은 ILSVRC14에서 우수한 성적을 기록했다[6]. 이 모 델은 기존의 평면 영상에 대해서 우수한 결과를 보여주고 있으며, 사용법이 간단하고 훈련에 소요 되는 시간도 짧다.

(6)

(a)

(b)

(c)

[Fig. 6] Training set: (a) top patches, (b) side patches, (c) bottom patches

[Fig. 7] Part of test set for ceiling detection

분류기의 학습을 위해서 다양한 실외/실내 구면 파노라마 영상을 사용했다. 영상은 상부, 중부, 하 부를 수작업으로 분류했고 탐지를 원하는 천정은 상부로 분류하여 훈련시켰다. 훈련에 사용된 각 클 래스의 학습 영상은 [Fig. 6]에 있다. 분류 실험에 쓰인 신경망 입력인 큐브맵 패치는 [Fig. 7]에 있 다. 일부 이미지가 뒤집어진 것을 볼 수 있다.

[Fig. 8] Test sets for experiments

[Fig. 9] Test result of rotation

총 24장의 실험 영상 중 분류 결과 인식에 성공

(7)

한 영상은 24장, 실패 영상 0장, 성공한 영상의 평 균 확신도는 0.966이었다. 실험 결과 충분한 정확 도로 천정면을 검출해 낼 수 있음을 확인했다.

4.2 천정 탐지를 통한 큐브맵 회전 실험

앞서 수행한 큐브맵 천정 인식을 통해서 올바른 방향으로 회전한 큐브맵을 얻어내는 실험을 진행했 다. 실험에 사용한 원본 구면 파노라마 영상과 회 전 변환 실험 결과는 [Fig. 8]과 [Fig. 9]에 있다.

[Fig. 9]은 변환이 이루어지기 전의 원시 구면 영상을 보여주고 있으며, 각각의 테스트셋의 큐브 맵 변환 결과와 그 올바른 회전 큐브맵은 [Fig. 9]

에 제시되어 있으며 그 구성은 다음과 같다. 각 테 스트셋은 총 12장의 그림으로 이루어져 있으며 구 분선으로 나뉘어져 있다. 왼쪽 여섯 장이 원본, 오 른쪽 여섯 장이 회전된 큐브맵이며 각 여섯 장의 윗줄 3장이 Front, Right, Back, 아랫줄 3장이 Left, Bottom, Top면의 순서로 제시되어 있다. 회 전 후의 Top 면에 천정으로 보이는 이미지가 위치 한 것을 통해서 각 큐브맵이 모든 실험셋에서 올 바른 방향으로 회전된 것을 알 수 있다.

4.3 회전한 큐브맵의 인식 비교 실험

앞서 올바른 방향으로 정렬시킨 큐브맵 영상을 영상 인식용 신경망에게 제공해 그 결과를 비교한 다. 결과는 큐브맵 변환 전의 원본 영상과 회전 처 리가 없는 큐브맵, 회전 처리한 큐브맵이 올바르게 인식한 객체의 개수와 잘못 인식한 영상의 개수를 비교하는 방식으로 성능을 측정한다. 하나의 이어 진 물체가 여러 번 인식된 경우 한 번 인식된 것 으로 측정했다. 결과표의 비율은 전체 인식 대비 올바른 인식의 비율이다. 인식에는 RCNN네트워크 모델이 사용되었다. RCNN 신경망이 개발된 후 보 다 빠르게 실행되는 RCNN 신경망의 연구가 지속 적으로 이루어지고 있으며[8,9], 이 모델은 속도가 느린 편이지만 정확도가 높기에 기존의 구면 영상 에 사용해도 다른 모델에 비해 결과를 보여주었기

에 실험에 사용했다.

[Fig. 10]~[Fig. 13]은 위에서부터 아래로 각각의 실험 영상과 그 큐브맵 영상, 그리고 올바르게 회 전한 큐브맵 변환 영상을 보여주고 있다. 모든 영 상에 대해서 미리 사물 검출을 위해서 훈련된 RCNN신경망이 검출해낸 물체 영역이 상자로 표 시되어 있다. 큐브맵의 제시 순서는 [Fig. 9]와 동 일하다. 실험 결과 원본 영상에 대해서 회전 처리 를 한 상태에서의 큐브맵 영상은 가장 우수한 결 과를 보여주고 있음을 알 수 있다. 또한, 각 실험 결과 분석을 [Table 2]~[Table 5]에 요약하였다.

각 표는 올바른 인식과 실패한 인식의 개수를 분 석한 결과를 표시한다.

5. 결 론

본 논문에서는 평면 영상용으로 훈련된 영상 인 식 신경망을 구면 영상에 활용할 때 인식률을 올 리는 방안으로써 구면 파노라마 영상의 큐브맵 변 환 기법과 신경망 분류 학습을 활용하는 절차을 제시하고 제시한 절차의 각 단계가 실제 인식률 증가에 기여함을 보였다. 실험 결과, 구면 영상을 직접 인식할 때 매우 적은 개수의 물체를 인식하 지만 그마저도 오류가 많고, 천정 영역을 탐지해서 회전한 큐브맵 영상을 사용할 경우 인식 개수와 인식의 오류 비율이 큰 폭으로 줄어든 것을 확인 할 수 있었다. 본 연구를 통해 기존의 우수한 평면 영상용 신경망을 보다 효율적으로 구면 영상에 활 용할 수 있을 것이다.

(8)

[Fig. 10] Recognition result for test set #1

[Table 2] Accuracy of test set #1 type #correct #wrong ratio

spherical panorama 2 1 0.666

cubemap 10 6 0.625

rotated cubemap 27 4 0.870

cubemap 9 5 0.642

(9)

cubemap 11 11 0.5

cubemap 8 10 0.444

(10)

ACKNOWLEDGMENTS

This research was supported by Basic Science Research Program through the National Research Foundation of Korea(NRF) funded by the Ministry of Education(No.

NRF-2015R1D1A1A01058809).

REFERENCES

[1] Bo-sung Kim, Jong-Seung Park, "Matching between spherical panorama and planar image", Journal of the Korean Institute of Information Scientists and Engineers, Vol. 42, No.10, pp. 1322-1324, 2014.

[2] Javier Cruz-Mota, et al., "Scale invariant feature transform on the sphere: theory and applications", International Journal of Computer Vision, Vol. 98, No. 2, pp. 217-241, 2012.

[3] Jeong-Hyeon Park, Jong-Seung Park, "Planar texture replacement in spherical images using cubemap", Journal of Korea Game Society, Vol. 17, No. 6, pp. 153-164, 2017.

[4] Christian Szegedy, et al., "Rethinking the inception architecture for computer vision", Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, pp.

2818-2826, 2016.

[5] Martin Abadi, et al., "TensorFlow: a system for large-scale machine learning", 12th USENIX Symposium on Operating Systems Design and Implementation, Vol. 16, pp.

265-283, 2016.

[6] Christian, Szegedy, et al. "Going deeper with convolutions", Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, pp.

1-9, 2015.

[7] Christian Szegedy, et al., "Inception-v4, Inception-ResNet and the impact of residual connections on learning", AAAI, Vol. 4, pp.

4278-4284, 2017.

[8] Ross Girshick, et al., "Region-based convolutional networks for accurate object detection and segmentation", IEEE transactions on pattern

analysis and machine intelligence, Vol. 38, No. 1, pp. 142-158, 2016.

[9] Ross Girshick, "Fast R-CNN", Proceedings of the IEEE International Conference on Computer Vision, pp. 1440-1448, 2015.

정 민 석 (Jung, Minsuk)

약 력 : 2015년～현재 인천대학교 컴퓨터공학부 학사과정 관심분야 : 컴퓨터게임, 게임엔진, 영상분석, 인공지능

박 종 승 (Park, Jong-Seung)

약 력 : 1992년 경북대학교 전자계산학과(이학사) 1994년 POSTECH 컴퓨터공학과(공학석사) 1999년 POSTECH 컴퓨터공학과(공학박사) 2004년~현재 인천대학교 컴퓨터공학부 교수 관심분야 : 게임제작, 게임프로그래밍, 증강현실