大 韓 土 木 學 會 論 文 集 第26卷 第3D 號·2006年 5月 pp. 519~525
測量 및 地形空間情報工學
컬러영상의 경계정보와 색상정보를 활용한 동일건물인식
Building Detection Using Edge and Color Information of Color Imagery
박정환*ㆍ손홍규**
Park, Choung Hwan ㆍ Sohn, Hong Gyoo
···
Abstract
The traditional area-based matching or efficient matching methods using epipolar geometry and height restriction of stereo images, which have a confined search space for image matching, have still some disadvantages such as mismatching and time- consuming, especially in the dense metropolitan city that very high and similar buildings exist. To solve these problems, a new image matching method through building recognition has been presented. This paper described building recognition in color stereo images using edge and color information as a elementary study of new matching scheme. We introduce the modified Hausdorff distance for using edge information, and the modified color indexing with 3-D RGB histogram for using color infor- mation. Color information or edge information alone is not enough to find conjugate building pairs. For edge information only, building recognition rate shows 46.5%, for color information only, 7.1%. However, building recognition rate distinctly increase 78.5% when both information are combined.
Keywords : building recognition, hausdorff distance, color indexing, image matching
···
요 지
기존의 영역기반의 영상정합이나 에피폴라 기하 혹은 고도값 제한 등을 통해 정합의 탐색영역을 줄임으로 영상정합의 효 율성을 높이는 방법들은 비슷한 형태의 고층 건물이 밀집되어 있는 대규모 도심지와 같은 경우 오정합의 가능성이 크며 정 합에 소요되는 시간도 여전히 오래 걸리는 단점을 갖고 있다. 이러한 단점을 보완하기 위하여 건물 인식을 통한 영상정합법 에 대하여 연구를 수행하고자 한다. 본 논문에서는 새로운 영상정합기법의 기초연구로서 컬러영상으로부터 경계정보와 색상 정보를 활용하여 동일 건물 인식에 관하여 실험을 수행하였다. 경계정보와 색상정보를 활용하기 위하여 각각 보완된 Hausdorff 거리개념과 보완된 컬러 인덱싱 기법을 적용하였다. 각각의 정보를 단독으로 활용한 경우 동일건물의 인식률이 경 계정보의 경우 46.5%, 색상정보의 경우 7.1%로 매우 낮았으나, 두 가지 정보를 조합하여 인식을 실시한 결과 78.5%로 인 식률이 높아지는 것을 확인할 수 있었다.
핵심용어 : 동일건물인식, Hausdorff 거리, 컬러 인덱싱, 영상정합
···
1. 서 론
최근 컴퓨터의 성능향상과 함께 3 차원 지형정보에 대한 관 심이 높아지고 있으며 이에 따라 위성영상이나 항공사진 , 수 치지도 등을 이용한 3 차원 모델링에 대한 다양한 연구들이
진행되고 있다 . 시각화된 3 차원 영상은 평면적인 2 차원 영상 으로는 해석 및 분석이 불가능했던 지형분석이나 시뮬레이 션 및 경관 분석 등에 활용될 수 있는 장점이 있다 . 특히 ,
도심지역의 건물에 대한 3 차원 모델링은 현재 활발히 연구 가 진행되는 분야로 현재 추진하고 있는 국가지리정보체계 사업에서도 중요한 연구과제로 인식되고 있다 .
일반적인 건물의 3 차원 모델링 방법은 위치결정의 재원으 로 흑백의 단색영상을 사용하며 중복된 두 영상 간의 영상
정합을 수행하는 방법에 기초하고 있다 . 이러한 접근법은 상
관계수법이나 최소제곱법과 같은 영역기준 영상정합이나
LoG 나 Ψ -s 기법을 사용하는 형상기준 영상정합을 사용한다
( 유환희 , 1998). 그러나 이러한 기존의 방법들은 정합에 소요
되는 시간이 많으며 오정합의 가능성이 높고 전체 영상에 대하여 영상정합을 실시하기 때문에 특정 도심지와 같은 국 부적인 3 차원 모델링을 수행하는데 비효율적인 단점이 있 다 . 이러한 비효율적인 면을 보완하기 위하여 에피폴라 기하 나 높이제한에 대한 가정 사항을 활용하여 탐색영역을 최소
화하는 방안에 대한 연구가 수행되어 왔다 (Kim, 2000;
Sohn 등 , 2005). 그러나 에피폴라 기하를 생성하는 위해서는
정확한 센서모델이 제공되어야 하지만 최근 활발히 보급되
는 IKONOS 와 같은 고해상도의 위성영상의 경우 정확한 엄
*연세대학교첨단융합건설연구단연구원
(E-mail : [email protected])
**정회원ㆍ연세대학교사회환경시스템공학부부교수
(E-mail : [email protected])
밀센서모델이 제공되지 않으며 지상기준점을 통하여 제공되 는 센서모델을 재구성해야 하는 번거로움도 존재한다 ( 손홍규
등 , 2001; Sohn 등 , 2004). 또한 아파트 단지와 같이 비슷
한 모양의 건물이 밀집되어 있는 도심지에서는 그 효율성과 정확성이 급격히 감소하는 단점이 존재한다 . 이러한 영상정 합이 갖는 단점들을 보완하기 위하여 중복된 입체영상 상에 서 동일 건물을 인식하여 전체 영상에 대한 영상정합이 아 닌 인식된 건물 상호간의 일대일 영상정합을 수행한다면 오 정합의 확률을 줄이는 동시에 정합점의 위치 정확도를 높일 수 있으며 , 또한 영상정합의 효율성 면에서도 큰 이점을 얻 을 수 있을 것이라 예상된다 . 따라서 본 논문에서는 이러한 새로운 영상정합의 기초 연구로서 중복된 입체영상 상에서 동일건물을 인식하는 방법에 관한 연구를 수행하였다 .
건물의 인식과 관련된 연구는 현재 국내 및 국외의 사진 측량 분야에서 거의 연구가 수행되고 있지 않은 분야 중 하 나로 현재까지의 연구 성과는 대부분 컴퓨터 비전 분야에 집중되어 있는 형편이다 . 경계정보를 활용하는 방법으로
Huttenlocher(1993) 등은 Hausdorff 거리 개념을 이용하여
대상물의 비유사성을 측정하는 방법을 연구를 수행한 바 있 다 . 또한 대상물 정합을 위해 색상 및 경계정보를 함께 활
용하기 위한 연구 (Dubuisson and Jain, 1994; Fuertes 등 ,
2003) 나 영역 분할을 이용한 입체 영상의 정합 (Boufama
and O'Connell, 2002) 에 관한 연구 등이 수행된 바 있다 .
본 논문에서는 동일 건물의 인식을 위하여 성남시 이매동
일대의 IKONOS 입체 컬러영상을 사용하여 실험을 실시하
였다 . 두 장의 영상 내에 존재하는 동일건물을 인식하기 위 한 기본 전제로 건물의 경계정보에 대한 정확한 추출이 필 요하다 . 컬러영상으로부터 건물의 경계를 추출하기 위한 연 구는 본 연구와 함께 동시에 진행되어야 하는 하나의 큰 연 구 분야로서 본 연구에서는 건물의 자동적인 경계추출은 연 구범위로 포함하고 있지 않으며 건물의 경계추출이 이루어진 상태를 기반으로 실험을 수행하였다 . 실험을 위한 구체적인 가정으로는 두 영상 상에서 건물에 대한 색상의 변화는 없다 고 고려하였으며 , 건물의 증축이나 개축과 같은 형태의 변화 역시 없는 상태로 실험의 범위를 제한하였다 . 또한 최종 추
출된 건물경계는 실제의 건물 위에 존재하는 여러 보조물은 고려하지 않고 처리되었다 . 이와 같은 여러 가정에 따라 실 험을 위한 건물 경계가 추출되었으며 , 추출된 경계 내에 존 재하는 색상정보를 활용하기 위해 RGB 3 차원 히스토그램이 제작되었다 . 추출된 경계정보에 대해서는 Hausdorff 거리 개 념을 보완하여 두 경계정보 사이의 비유사성을 측정하였으 며 , 색상정보는 3 차원 히스토그램을 활용한 보완된 컬러 인 덱싱 기법을 적용하여 두 색상정보 사이의 유사성을 측정하 였다 . 최종적으로 건물인식을 위한 지표는 경계정보의 비유 사성과 생삭정보의 유사성 수치를 조합하여 사용하였다 . 2. 동일건물인식을 위한 처리방법
2.1 Hausdorff 거리
경계정보를 활용하여 동일건물을 인식하기 위하여서는 하 나의 경계정보에 관한 집합이 다른 것과 구별되는가에 대한 범위를 정의해주어야 하는 것이 가장 큰 문제 중의 하나이
다 . 상관계수정합 (correlation matching), 템플릿 정합 (templet
matching) 혹은 모형에 기초한 정합 (model-based vision
methods) 등의 형상 인식 처리법들은 모두 서로 다른 모양
들 간의 차이를 규정하는 방법들이다 . Arkin(1991) 등은 컴 퓨터 비전에서 사용되는 이러한 다양한 방법들 간의 차이점 과 유용성에 대하여 언급하였으며 , 위에 기술한 방법들에 비
해 Hausdorff 거리가 갖는 장점들에 대하여 설명하였다 .
Hausdorff 거리가 갖는 장점은 크게 두 가지로 하나는 영상
의 작은 왜곡에 덜 민감하다는 것이고 다른 하나는 계산이
단순하며 계산양이 많지 않다는 것이다 . 따라서 Hausdorff
거리가 로봇비전 (robot vision) 분야나 영상처리 (image
processing) 분야에서 보다 효율적으로 사용될 것이라고 예상
하였다 . 또한 대상물의 형상정보를 이용하는 방법으로 최근 사진측량 분야에서 불변모멘트 (invariant moment) 를 사용하 는 방법에 대한 연구가 활발히 진행되고 있으나 본 연구에 서와 같이 단순한 형태의 건물 형상을 활용하는 경우에는 인식의 정확성이 떨어진다고 알려져 있다 .
일반적인 개념에서 거리는 최소함수를 의미한다 . Hausdorff
거리란 이러한 최소함수의 거리개념에 도형의 형태와 관련
된 원리를 적용시킨 개념이다 . Hausdorff 거리는 하나의 점
들의 집합으로부터 각각의 점에 대응되는 다른 점들의 집합 까지의 최대거리를 의미하며 이는 최대함수 개념이라고 할
수 있다 . Hausdorff 거리는 식 (1) 과 같이 정의된다 .
(1)
여기서 h ( A , B ) 와 h ( B , A ) 를 직접거리 (direct Hausdorff distance)
라고 하며 식 (2) 와 (3) 과 같이 계산한다 .
(2) (3)
식 (2) 와 (3) 에서 || · || 연산은 || x || = 로 계산되는 두 벡 터사이의 Euclidean norm 을 의미한다 . h ( A , B ) 는 || · || 연산으 로 도형 B에 존재하는 가까이에 이웃한 a점까지의 거리를 계산한 값이며 , 가까이에 이웃한 점들 중에서 어떤 점 b로 부터 가장 멀리 떨어진 인 점을 찾아내는 것을 의미 한다 . 즉 , h ( A , B ) 는 거리에 기초하여 도형 B로부터 가까이에 이웃한 인 점들의 순위를 매긴 후 가장 순위가 높은 점을 선택하는 개념이라고 할 수 있다 . 그림 1 은 Hausdorff
H A B ( , ) = max ( h A B ( , ) h B A , ( , ) )
h A B ( , ) = max min
a A∈ b B∈a b –
h B A ( , ) = max min
b B∈ a A∈b a –
xtx
a A ∈ a A ∈
그림 1. Hausdorff 거리 개념도
직접거리에 대한 개념을 나타낸 그림이다 .
그림 1 에서 보듯이 a 1 에서 가장 가까이에 있는 점은 b 1 이 며 , a 2 에서 가장 가까이에 있는 점은 b 2 이다 . 이 중에서 더 큰 거리에 있는 것은 || a 1 − b 1 || 이며 , 따라서 h = || a 1 − b 1 || 으 로 계산한다 . 이와 같은 경우 A의 모든 점은 도형 B의 어 떤 점에서든지 최대 h만큼의 거리 내에 존재하게 된다고 말 할 수 있으며 , 이를 통해 두 도형 사이의 유사도를 측정할 수 있다 . 그러나 이러한 거리개념은 컴퓨터 비전 분야에서 사용되는 방법으로 비전분야에서의 사용은 영상과 모형간의 유사성을 찾는 것에 근거하고 있다 . 즉 , 하나의 모형이 입력 되면 대상이 되는 영상 상에서 그 모형과 가장 유사한 것을 찾는 것을 의미한다 . 그러나 본 연구에서는 같이 분할된 다 수 대 다수의 모형 중에 유사성이 높은 쌍을 찾기 위해서는 위와 같은 거리 개념에 대한 보완이 필요하며 , 따라서 직접 거리를 구하는 방법을 다음과 같이 보정하여 실험에 적용하 였다 . 각각 N
A, N
B의 크기를 갖는 두 개의 도형을 생각한
다면 Hausdorff 거리를 통한 유사도는 식 (1) 과 같이
S
d=max( d ( A , B ), d ( B , A )) 로 적용되며 , 이 때 직접거리는 다음 의 식 (4) 와 (5) 와 같이 계산하였다 .
(4) (5)
위의 식으로부터 항상 S
d≥ 0 임을 알 수 있으며 , 만약 S
d=
0 은 두 개의 점들의 집합은 완전히 동일한 경우 , 즉 두 개
의 도형이 완전히 동일한 경우에 계산된다 . Hausdorff 거리
는 d ( A , B ) 와 d ( B , A ) 중의 큰 값을 선택하게 된다 . 이것은 도형 A에 존재하는 점으로부터 동일점으로 생각되는 도형 B 까지의 거리를 측정함으로 , 혹은 그 반대로 두 도형 사이의 비유사도를 측정하는 방법임을 의미한다 .
Hausdorff 거리 S
d는 두 점들 사이의 기하학적인 거리에
기초한 값이기 때문에 두 개의 집합 사이의 상대적인 변위 ,
회전 , 축척에 의해 영향을 받는다 . 사진측량학적인 측면에서 두 장의 스테레오 영상 상에 나타나는 동일한 두 개의 대상 물일지라도 변위나 회전 , 축척 등이 동일하지 않은 것이 일 반적이다 . 따라서 두 장의 스테레오 영상 상에 나타난 대상 물 간의 거리를 구하기 전에 반드시 두 장의 사진을 등록
(registration) 할 필요가 있다 . 두 장의 사진을 등록함에 있어
서 영상 전체에 대한 등록은 불필요하며 모델링을 수행하고 자 하는 대상지역을 선별하여 대상지역 내의 공액점을 찾는 방법을 사용할 수 있고 , 간단한 부등각사상 변환만으로도 충 분한 정확도를 얻을 수 있다 . 그러나 본 연구에서는 두 영
상의 기하적인 특성을 고려해야 하는 불편함을 줄이기 위하 여 두 영상의 등록과정을 생략하였다 . 두 영상의 경계정보가 입력되면 경계검출 기법을 사용하여 각각의 대상물의 경계 를 판단하게 되고 , 이 과정에서 각각의 대상물의 상하좌우의 최대값 및 최소값을 사용하여 대상물의 패치를 형성되도록 하였다 . 대상물의 유사성은 이 패치 내에서의 상대좌표를 이 용하여 계산하는 방식으로 판단하였다 . 이러한 경우 두 영상 간의 축척이나 회전에 대한 고려가 전혀 이루어지지 않게 되지만 본 연구에서의 가정 사항 ( 건물의 형태나 색이 변하지
않는다는 가정 ) 과 Hausdorff 거리가 국부적인 왜곡에 대해
갖는 장점을 고려한다면 처리과정에 있어 오류가 발생할 경 우는 없는 것으로 판단된다 .
2.2 컬러 인덱싱
컬러 인덱싱 (color indexing) 은 Swain 과 Ballad(1991) 에 의해 처음 제안되었으며 , 색상정보에 기초하여 대상물을 식 별하는 방법이다 . 이 방법은 전통적으로 대상물의 기하학적 인 특징에 의존하여 인식을 수행하던 방식과는 매우 다른 방식의 접근법이며 표정각의 변화 , 시점의 이동 , 대상물 주 변 환경의 변화 , 부분적인 폐색 , 대상물의 급격한 변화와 같 은 다양한 조건에서도 적용가능하다고 연구되었다 . 반면 , 이 접근법은 빛과 매우 관련이 있기 때문에 조도에 따라 매우 다른 결과를 나타내기도 했다 . 이에 대한 보완책으로 컬러
컨스턴시 (constancy) 이론과 같은 연구들이 수행되었다 (Funt
등 , 1995; Tsukada and Tajima, 1999). 인간이 빛을 인식
하는 것은 빛이 대상물에 입사되어 대상물로부터 반사된 빛 을 인식하는 일련의 과정으로 설명할 수 있다 . 대상물에 입 사되는 조도가 변할 경우에 대상물로부터 반사되는 빛도 변 하게 되고 결과적으로 대상물의 색상을 다르게 인식할 수 있다 . 따라서 조도의 변화에 따른 영향 없이 대상물의 색상 을 안정적으로 인식할 수 있게 하는 시각적 함수를 컬러 컨 스턴시라고 한다 . 이 이론의 목표는 영상에서 관측되는
RGB 값들로부터 조도의 스펙트럼 분포와 대상물의 표면 반 사를 구해내는 것이다 .
컬러 인덱싱은 대상물의 색상을 비교함으로 대상물을 인식 하는 알고리즘이다 . 이 방법을 적용하기 위해서는 관심의 대
상이 되는 전 영역에 대하여 색상이 포함되어야 하며 , 또한 불필요한 영역의 컬러는 제거되어야 한다 . 대상이 되는 영역 내의 히스토그램이 생성되고 생성된 히스토그램간의 교차실 험을 통하여 대상물을 인식하게 된다 . 따라서 본 연구에서도
Swain 에 의해 제안된 히스토그램 생성법을 기본으로 하여
실험을 수행하였다 . 컬러 히스토그램은 RGB 각각의 밴드별 로 3 차원 벡터형식으로 생성되며 , 이는 영상 내에 특정한
RGB 값을 갖는 영상소의 개수를 의미한다 . 컬러 히스토그램
이 생성되면 식 (6) 과 같이 교차실험을 실시하게 되고 가장 적합한 대상물을 인식하게 된다 .
(6)
이 식에서 I는 기준이 되는 영상 (image) 이고 M은 인식하고
자 하는 모형 (model) 을 의미하며 , j는 각각의 히스토그램의
단계를 나타낸다 . 실제적인 정합값을 계산하기 위하여 위의
식은 식 (7) 과 같이 모형의 히스토그램에 대한 합을 이용하 여 정규화된다 . 정규화된 히스토그램 정합값은 0 에서 1 사이 의 값을 가지며 , 기준이 되는 영상 ( I ) 과 모형 ( M ) 이 완벽하게
분할 (segmentation) 된다면 대상의 주변으로부터의 영향도 받
지 않게 된다 .
(7)
d A B ( , ) 1
N
A--- min
a A
∑
∈ b B∈a b –
=
d B A ( , ) 1
N
B--- min
b B
∑
∈ a A∈b a –
=
j 1=
min
∑
n{ I
j, M
j}
H I M ( , )
j 1=
min
∑
n{ I
j, M
j}
M
jj 1=
∑
n---
=
그림 2. 대상지역의 영상패치
본 연구에서는 식 (7) 에서 나타난 정규화식을 식 (8) 과 같 이 수정하여 실험에 적용하였다 . 기존의 식이 정규화를 하기 위하여 모형식의 히스토그램 개수를 적용시켰던 것과는 달리 본 연구에서 실험하고자 한 두 대상물의 히스토그램 개수를 계산하여 그 중 작은 값을 사용하여 정합값을 계산하였다 .
히스토그램은 위에서 기술한 바와 같이 RGB 의 3 차원 벡터 형태로 계산하였다 . 두 대상물의 RGB 히스토그램 H 1 ( R , G , B )
와 H 2 ( R , G , B ) 에 대하여 색상정보를 활용한 정합식은 식 (8) 과 같이 정의된다 .
(8)
이 식에서 S는 색상정보를 이용하여 두 대상물 사이의 유 사도를 측정한 지표이고 , 과 는 각각 히스토그램 H 1 과 H 2 로부터 계산되는 총 영상소의 개수이다 . S
c는 0 ≤ S
c≤ 1 의 값을 가지게 되며 두 대상물 중 하나의 히스토그램이 다른 하나에 완전히 포함되는 경우 S
c=1 의 값을 갖는다 . 3. 자료처리 및 결과
3.1 실험영상 및 평가방법
본 연구에서 제안된 알고리즘을 구현하기 위하여 Visual
C++ 6.0 을 사용하여 프로그램을 제작하였으며 , 운영체제로
Windows XP 를 사용하였다 . 실험에 사용한 영상은 모두
2001 년 2 월 1 일에 2 분 간격으로 서울 강남과 경기도 성남
및 분당 지역을 촬영한 IKONOS 컬러 입체 영상이다 . 기존
의 IKONOS 컬러 영상은 4m 의 해상도를 갖지만 1m 의 해
상도를 갖는 전정색 영상과의 융합을 통해 1m 의 해상도를 갖도록 개선된 영상을 사용하였다 . 영상으로부터 한 블록 정
도의 크기를 갖도록 각각 그림 2 와 같은 패치를 제작하였으 며 패치로부터 그림 3 과 같은 경계를 추출하였다 . 서론에서 언급한 바와 같이 경계를 추출하는 과정에 대한 연구는 본 연구의 범위가 아니며 , 본 연구에서는 이상적인 경계 추출을 가정하고 실험을 실시하였다 . 본 연구에서는 각각의 영상에
대해 Erdas Imagine 8.7 을 통하여 Prewitt 경계 추출 연산
자를 사용하여 경계를 추출하였고 추출된 경계를 실험에 사 용할 수 있도록 개선하였다 . 패치된 구역 내에서 아파트를 중심으로 각각의 영상으로부터 총 28 개의 대상건물을 선정 하였으며 각각의 대상물의 인식 번호는 그림 3 에 나타나있 다 . 그림 3 에서 보는 바와 같이 아파트가 밀집된 도심지역 에서의 경계정보는 각각의 대상물마다 매우 유사한 형태를 나타내게 된다 . 따라서 단순히 경계정보만을 사용하여 대상 물의 인식 실험을 수행할 경우 그 결과가 정확하게 나타나 지 않을 가능성이 있으며 이에 대한 보완이 필요함을 알 수 있었다 .
실험 결과의 평가는 경계정보 및 색상정보를 활용하여 구 해진 값을 이용하여 실시하였다 . 각각의 실험에 대하여 유 사도가 높은 순서대로 순위를 정하였고 , 동일한 건물 사이
에 나타난 가장 낮은 순위를 R max 로 표현하였다 . 또한 동 일건물간의 인식이 이루어지지 않는 것을 판별할 수 있기 때문에 잘못 인식된 결과를 M
f로 나타내었다 . 한편 , 주어진 대상물에 대한 인식 실험의 결과로부터 주어진 결과를 인식 이 이루어진 것으로 판단할 지에 대한 결정방식이 필요하다
. 본 연구에서는 인식의 결과에 대한 결정방식을 정하기 위 하여 좌측영상의 i번째 건물과 우측영상의 1~28, 28 개의 건물과의 유사도를 { S
i,(1) , ..., S
i,(28) } 로 표현하였고 , 또한
높은 순위의 유사도를 순서대로 로 표현하였다 . 이 때 식
(9) 와 같은 결정방식을 사용하여 올바른 인식 여부를 판단 S
cΣ
RΣ
GΣ
Bmin ( H
1( R G B , , ) H ,
2( R G B , , ) )
min ( N
H1, N
H2)
---
=
NH1 NH2