• 검색 결과가 없습니다.

Development of a Compound Classification Process for Improving the Correctness of Land Information Analysis in Satellite Imagery - Using Principal Component Analysis, Canonical Correlation Classification Algorithm and Multitemporal Imagery -

N/A
N/A
Protected

Academic year: 2021

Share "Development of a Compound Classification Process for Improving the Correctness of Land Information Analysis in Satellite Imagery - Using Principal Component Analysis, Canonical Correlation Classification Algorithm and Multitemporal Imagery -"

Copied!
9
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

大 韓 土 木 學 會 論 文 集 第28卷 第4D 號·2008年 7月 pp. 569~577

測量地形空間情報工學

위성영상의 토지정보 분석정확도 향상을 위한 응용체계의 개발

− 다중시기 영상과 주성분분석 및 정준상관분류 알고리즘을 이용하여 −

Development of a Compound Classification Process for Improving the

Correctness of Land Information Analysis in Satellite Imagery

− Using Principal Component Analysis, Canonical Correlation Classification Algorithm and Multitemporal Imagery −

박민호*

Park, Min-Ho

···

Abstract

The purpose of this study is focused on the development of compound classification process by mixing multitemporal data and annexing a specific image enhancement technique with a specific image classification algorithm, to gain more accurate land information from satellite imagery. That is, this study suggests the classification process using canonical correlation clas- sification technique after principal component analysis for the mixed multitemporal data. The result of this proposed classi- fication process is compared with the canonical correlation classification result of one date images, multitemporal imagery and a mixed image after principal component analysis for one date images. The satellite images which are used are the Landsat 5 TM images acquired on July 26, 1994 and September 1, 1996. Ground truth data for accuracy assessment is obtained from topographic map and aerial photograph, and all of the study area is used for accuracy assessment. The proposed compound classification process showed superior efficiency to appling canonical correlation classification technique for only one date image in classification accuracy by 8.2%. Especially, it was valid in classifying mixed urban area correctly. Conclusively, to improve the classification accuracy when extracting land cover information using Landsat TM image, appling canonical cor- relation classification technique after principal component analysis for multitemporal imagery is very useful.

Keywords :compound classification process, multitemporal imagery, principal component analysis, canonical correlation classification technique, classification accuracy assessment

···

요 지

본 연구의 목적은 위성영상으로부터 보다 정확한 토지정보를 취득하기 위해 다중시기데이터의 혼합과 특정 영상강조기법 및 영상분류알고리즘을 병합하여 적용하는 응용분류체계의 개발이다. 즉, 본 연구에서는 혼합된 다중시기데이터를 주성분분 석한 후 정준상관분류기법을 적용하는 분류과정을 제안한다. 이 분류과정의 결과를 단일영상별 정준상관분류결과, 다중시기 혼합영상의 정준상관분류결과, 시기별 주성분분석 후 정준상관분류결과와 비교한다. 사용된 위성영상은 1994년 7월 26일과 1996년 9월 1일에 취득된 Landsat 5 TM 영상이다. 정확도평가를 위한 지상실제데이터는 지형도 및 항공사진으로부터 취득 되었으며, 연구대상영역 전체가 정확도평가 대상으로 사용되었다. 제안된 응용분류체계는 단일영상만을 사용하여 정준상관분 류를 수행한 경우보다 분류정확도면에서 약 8.2% 상승되는 우수한 효과를 보여주었다. 특히, 복잡한 토지특성이 혼합되어 있는 도시역을 정확히 분류하는데 유효하였다. 결론적으로 Landsat TM 영상을 사용한 토지피복정보 추출시 분류정확도를 높이기 위해서, 다중시기영상을 사전에 주성분분석 후 정준상관분류기법을 적용하면 매우 효과적임을 확인하였다.

핵심용어 : 응용분류체계, 다중시기영상, 주성분분석, 정준상관분류기법, 분류정확도평가

···

1. 서 론

오늘날 원격탐사 기술은 기상 및 환경정보 수집, 국토개발 에 관한 각종 정보의 수집, 각종 주제별 지도(Thematic Map)작성, 도시환경 및 토지이용정보의 추출, 농수산자원 조

사, 지질조사, 군사시설물 및 이동상황 파악 등 광범위한 응 용분야에 적용되고 있다. 일반적으로 원격탐사 데이터는 항 공기의 다중분광스캐너(MSS)나 인공위성의 센서(TM,

ETM+, HRV, HRVIR 등)를 사용하여 디지털 형태로 취득

되며, 인공위성을 이용하는 경우 항공기에 의한 방법에 비해

*정회원·목포대학교지적학과교수 (E-mail : [email protected])

(2)

광범위한 지역을 주기적으로 관측할 수 있으므로 대규모 프 로젝트 수행 시에는 인공위성 원격탐사 데이터를 사용하는 것이 경제적이다. 그러나 인공위성의 고도(Landsat 평균고도 약 705km)가 너무 높기 때문에 해상력의 한계성이라는 결 정적인 단점이 있다. 항공기 탑재용 MSS의 경우 비행고도 와 관측기기에 따라 원하는 해상력을 얻을 수 있으나,

Landsat의 TM은 30m 그리고 SPOT의 HRV는 10m(XS는

20m)로서 센서에 따른 해상력이 이미 정해져 있다. 비록 각 위성보유국들이 보다 우수한 해상력을 가지는 센서의 개발 에 심혈을 기울이고 있으며, 현재 약 0.6m~2.5m 정도의 해 상력을 가지는 데이터까지 민간인들에게 공개되고 있지만, 고고도 위성용 센서가 보다 좋은 공간해상력을 가지기 위해 서는 앞으로도 상당한 기간이 소요될 것으로 예상된다. 이러 한 해상력의 한계는 결국 분석정확도에 영향을 미치며, 특히 우리나라와 같이 토지 이용단위가 작고 여러 가지 피복상태 가 섞여 분포하는 경우, 그 정도는 더욱 심각하다. 그럼에도 불구하고 환경보호에 대한 인식과 국토 및 자원의 효율적인 관리에 대한 필요성이 더욱 요구되고 있으므로, 이에 대한 가장 효율적인 방안으로서의 원격탐사 기술이 보다 고도화 되는 추세이다.

원격탐사 기술은 인공위성이나 항공기를 이용하여 취득한 데이터의 분석정확도를 향상시키려는 노력에 의하여 발전되 어 왔다. 이러한 노력은 크게 세 가지 측면 - 데이터의 상호 결합에 의한 해상력 향상, 분광특성을 고려한 데이터의 질적 개선, 분류기법의 고도화 - 으로 진행되어 왔으며, 그 결과 초기의 단순한 농작물 수확량 예측에서 현재는 복잡한 도시 의 공간분포 해석까지 가능한 수준에 이르고 있다. 국내에서 의 원격탐사 기술은 기상 및 해양 분야에서 주로 이루어지 고 있는 자연과학적 접근방법과 도시 관련분야에서 이루어 지고 있는 공학적 접근방법으로 나눌 수 있으며, 그 중에서 후자는 주로 토지피복분류에 의한 토지정보의 취득 및 분석 에 관한 것이다.

본 연구는 이러한 종합적인 상황 인식을 기반으로, 현재까 지 도시관련분야에서 이루어진 원격탐사 기술의 성과에 대 한 신뢰도와 실용성을 제고하고, 보다 고도화된 기술의 창출 을 목적으로 한다. 즉, 이 분야에 대한 기존의 기술을 면밀 히 검토함으로써 응용의 폭을 넓힘과 아울러, 보다 정확한 정보를 취득하기 위해 서로 다른 시기 데이터의 결합과 기 존의 영상강조기법 및 특정분류알고리즘을 병합하여 적용하 는 응용분류체계의 개발을 연구의 목적으로 한다. 이는 위에 서 언급한, 데이터의 분석정확도를 향상시키려는 노력의 세 가지 측면이 모두 함께 어우러진 방법의 시도라 볼 수 있겠 다. 구체적으로 말하면, 계량지리학과 경제학 분야에서 주로 적용되는 다변량통계분석기법 중에서, 원격탐사분야에서 영 상강조기법으로 널리 알려져 있으며 특성추출 및 분류수행 에 많이 이용되는 주성분분석(PCA: Principal Component

Analysis)과, 정준상관분석(CCA: Canonical Correlation

Analysis)을 응용한 영상분류기법인 정준상관분류(CCC:

Canonical Correlation Classifier) 알고리즘을 다중시기영상

에 함께 적용하여, 저해상도 Landsat 영상을 보다 정확하게 분석하는 기법의 개발에 관한 것이다.

본 연구와 관련하여 PCA를 이용한 최근까지의 연구동향

을 살펴보면, 외국의 경우, 주로 다중분광 및 하이퍼분광 영 상을 분석하는데 활용되었다. 즉, 원 영상에 있는 대부분의 정보를 서로 상관관계가 없는 변수들의 집합으로 바꾸면서, n차원에서 몇 개의 차원으로 줄이는 기술로 사용되었다. 최 근 사용된 예로서는Almedia-Filho와 Shimabukuro(2002)가 PCA를 적용하여 아마존의 황페화된 지역을 식별하였으며,

Mitternicht와 Zinck(2003)는 PCA방법이 원격탐사영상에서

비염류토양과 염류토양을 구별하는데 유용하다는 점을 발견 하였다. 이외에 변화탐지목적으로 Du et al.(2002)은 PCA방 법을 사용하여 동일 장소의 다중시기영상에서 선형관계를 찾 고, 영상을 방사 정규화 하였다. 그러나 한편으로 Cheriyadat 와 Bruce(2003)는 다중분광영상에서 대상체 탐지 및 분류에 사용할 특성을 추출할 때 PCA방법이 가장 적절한 방법은 아님을 검증하기도 하였다.

국내의 경우에 있어서는 많은 연구가 수행되지는 않았지만 주성분분석에 의한 Landsat TM 자료의 광역지질도 작성에 관한 연구가 있었으며(박종남와 서정희, 1988), Landsat 자 료를 이용한 도시환경 변화추출에서 주성분분석을 활용한 연 구(이기원 등, 1996)와 주성분분석을 이용한 수질관측에 관 한 연구가 수행되었다(Jeong and Yoo, 1998). 가장 최근에 는 표준화 주성분분석을 이용한 Landsat 위성자료 분류의 정확도 향상에 관한 연구가 수행된 바 있다(장훈, 윤완석,

2003). 이외에도 인공위성영상에 대해 PCA를 적용한 연구가

몇 가지 더 있으나, 본 연구에서와 같이 다중시기영상을 PCA로 사전처리한 후 정준상관분류알고리즘을 적용하여 토 지피복분류를 수행한 경우는 거의 없는 상황이다. 유사한 사 례로는 주로 다중시기영상에 대해 각 시기별로 주성분분석 이 적용된 후, 선택된 밴드들에 대해 최대우도분류기법

(Maximum Likelihood Classification)을 사용하여 토지피복

분류를 수행한 사례들이 있다. 따라서 본 연구는 “공간통계 와 다중시기영상에 대한 적용영역의 확대”라는 의미와, 정준 상관분석에 의한 영상분류에 사용되는 “사전정보의 주성분분 석에 의한 개량”이라는 관점에서, 제안한 응용분류체계와 같 은 적용방법을 연구해 볼 가치를 두며, 새로운 시도자체로서 도 수행해 볼 가치를 둔다. 현재로서는 본 연구의 결과를 기존의 분석방법과 비교하여 얻을 수 있는 장점과 효용성이 기대가 되지만, 연구결과로부터 이러한 시도의 장점과 효용 성을 입증할 수 없다고 할지라도, 위성영상으로부터 보다 정 확한 토지정보를 취득하기 위한 새로운 응용체계의 개발에 대한 시도가 이 분야에 신선한 연구의욕을 불러올 것임을 확신한다.

2. 적용이론

2.1 위성영상의주성분분석

2.1.1 주성분분석의 원리

주성분분석은 서로 상관되어 있는 많은 변수들 가운데서 상관관계가 높은 변수들을 동질적인 몇 개의 집단으로 묶음 으로써 자료의 복잡성을 줄이고 변수들 내에 존재하는 상호 독립적인 특성을 밝혀주는 기법이다. 이 기법은 변수들간의 공분산을 측정하는 것으로서, 각 변수의 변량을 축으로 나타 낸 다음 총분산의 양을 가능한 많이 설명할 수 있는 새로운

(3)

축을 설정하는 것이다. 즉, 첫 번째 설정되는 축은 총분산량 을 가능한 한 많이 설명할 수 있도록 하며, 두 번째 축은 설명되지 않고 남은 나머지 분산의 양을 되도록 많이 설명 할 수 있도록 설정하되 첫 번째 축과 직교하도록 한다. 세 번째 축은 두 축에 의해서 설명되고 난 나머지 분산을 최대 한도로 설명하도록 하되 두 축과 직교하도록 설정하는 것이 다. 이와 같은 방식으로 새로운 축을 설정해 나가면 p개의 변수군으로부터 h(hp)개의 서로 직교하는 축을 추출할 수 있 게 된다.

2.1.2 위성영상처리 응용

이론적으로는 주성분분석이 p차의 공간자료를 서로 직교하 는 새로운 p차 공간자료로 변환하는 기법이지만, 실제적으로 는 새로 형성된 p차의 공간축 중에서 상위 몇 개의 공간축 만으로도 변환전 자료의 정보를 대부분 설명할 수가 있다.

따라서 변환전 자료의 정보를 충분히 설명할 수 있는 공간 축을 각 축이 갖는 분산을 이용하여 선별함으로써 정보의 손실을 최소화하면서 자료의 압축을 행할 수 있다. 이것이 주성분분석을 위성영상처리에 이용할 수 있는 근거가 된다.

주성분분석 처리과정은 다음 순서와 같다.

1) 주성분분석을 위한 위성영상자료 행렬의 구성

여기서 zpi는 Band p의 Pixel i에 대한 값 xp를 표준화한 것이다.

2) 상관계수행렬(R)의 형성

여기서, rij = (1)

3) 주성분의 계산

고유값(eigenvalue) :

R의 특성방정식(|R - λI| = 0)의 해 λ

고유벡터(eigenvector) :

(R -λI)a = 0, aTa = 1의 연립방정식 해 a

4) 위성영상자료의 변환

(2)

(3)

(4)

여기서, h는 새로 형성된 직교축으로 h≤p이며, 압축변환된 자료의 구조는 다음과 같다.

여기서 lhi는 새로운 Band h의 Pixel i에 대한 표준화된 값 이다.

2.2 정준상관분류알고리즘

T/S : Training Sample, 분류기준용 표본데이터의 토지피복

항목

위의 작성된 수학적 모형은 정준상관분류를 화소별로 수행 하기 위한 기본자료구조가 된다(박민호, 2006). 토지피복항목 Band

Pixel 1 2 . . . p

1 z11 z21 . . . zp1

2 z12 z22 . . . zp2

· · · ·

· · · ·

i z1i z2i . . . zpi

· · · ·

· · · ·

n z1n z2n . . . zpn

Band

Band 1 2 . . . . i . . . . p

1 1 r21 . . . . ri1 . . . . rp1 2 r12 1 . . . . ri2 . . . . rp2

· · · ·

· · · ·

i r1i r2i . . . . 1. . . . rpi

· · · ·

· · · ·

p r1p r2p . . . . rip. . . . 1

1 n--- zikzjk

k=1

1

Band

Pixel 1 2 . . . h

1 l11 l21 . . . lh1 2 l12 l22 . . . lh2

· · · ·

· · · ·

i l1i l2i . . . lhi

· · · ·

· · · ·

n l1n l2n . . . lhn

L=ATZ

lij a1jz1i+a2jz2i+… a+ pjzpj akj

k=1

p zki

= =

l11l12… l1i… l1n l21l22… l2i… l2n

: : : :

lj1lj2… lji… ljn

: : : :

lh1lh2… lhi… lhn

a11a21… ai1… ap1 a12a22… ai2… ap2

: : : :

a1ja2j… aIJ… apj

: : : :

a1ha2h… aih… aph

z11z12… z1i… z1n z21z22… z2i… z2n

: : : :

zj1zj2… zji… zjn

: : : :

zp1zp2… zpi… zpn

=

기준변수(Q) 예측변수(P)

T/S

Band 1 2 ... q

1 2 . . n

x11 x12 ... x1q x21 x22 ... x2q

. . xn1 xn2 ... xnq

Pixel

Band 1

1 2 . . n

y1 y2 . . yn

(4)

의 표본데이터인 q개의 변수(기준변수)는 항공사진과 원래의 수치영상에서 식별이 분명하고 지형도에서 분류항목이 명확 한 대상들에 대한 training data이며, 자료행렬(data matrix) 의 각 요소값(xnq)은 각 밴드별로 training area별 화소값들 에 대한 평균값을 Z-score를 사용하여 변환한 값이다. 위성 영상에 대한 정준상관분류에서 예측변수군의 1개의 변수는 분류하고자 하는 수치영상의 모든 화소들 중 한 개이며, 크 기가 (row, column) = (m, n)인 직사각형 형태의 영상이므 로, 좌측상단에서 부터 우측하단 방향으로 순서대로 화소별 분류를 실시한다. 따라서 정준상관분류의 전체 수행과정이 총 화소 개수만큼 반복 실시된다.

이상과 같은 방법은 기준변수와 예측변수간의 정준상관관 계에 의해 산출되는 정준벡터를 이용하여 직접 분류를 수행 하는 영상분류기법이다. 예측변수군의 변수는 항상 1개이므 로, 새로 생성되는 정준변량 U1 의 정준벡터 a1은 정준가중 치가 항상 1로 고정된다. 기준변수군의 변수는 training area 항목의 개수에 따라 결정되며, 정준변량 V1의 정준벡터 b1

은 벡터요소로서 training area 항목 개수만큼의 정준가중치 를 갖게 된다(李喜演, 1991). 이 중 가장 큰 정준가중치 값 에 할당된 토지피복이 각화소의 토지피복으로 결정된다.

3. 연구방법

3.1 연구대상지역

실험을 위한 연구대상영역은 국립묘지와 동작대교, 반포지 역을 포함하는 다양한 토지피복으로 구성된 약 2.85km×2.14 km의 직사각형 영역이다. 토지피복은 나지(Bareland), 산림 (Forest), 풀밭(Grass), 도시역(Urban), 수역(Water)의 대략 5 가지로 구성되어 있으나, 나지와 도시역이 토지피복적으로 서로 유사한 특성을 가지고 있을 뿐만 아니라 지상실제데이 터의 구축시 나지와 도시역의 구분을 명확히 하기 어려웠 다. 결과적으로 토지피복분류결과에 대한 정확도평가에서 나 지와 도시역에 서로 혼동이 있어 나지의 경우 영역의 크기 및 화소수가 적으므로 나지의 정확도가 낮게 나타날 것으로 예견된다.

분류를 수행할 대상지역의 인공위성데이터는 Landsat-5

TM(Thematic Mapper) 데이터로서, 1994년 7월 26일과

1996년 9월 1일 취득된 2개시기 영상이며 Path-Row가

116-35인 서울을 중심으로 한 수도권 영역 데이터이고 취득

되는 밴드 수는 7개이다. 기하보정 후 지도좌표계와 일치된 영상으로부터 연구대상지역으로서 75pixels×100pixels(행×

열) 직사각형 영역을 최종적으로 절출해낸다. 연구대상지역 의 위성데이터를 위색(R, G, B에 4, 3, 2 밴드 合成, False

Color)으로 나타내면 그림 1, 2와 같다.

3.2 연구수행과정

위성영상처리에 주로 적용되고 있는 주성분분석은 여러 전 자기파장대에 의해서 관측된 동일 대상물 및 지역의 화상정 보에 중복해서 들어 있는 내용을 전체 정보량의 손실이 발 생치 않도록 효과적으로 제거함으로써 방대한 자료를 압축 시켜주는 목적에 주로 이용되고 있다. 실제적으로 주성분분 석에 의해 새로이 형성된 위성영상의 경우, 제1주성분 자료

는 모든 파장대의 정보를 최대한 설명할 수 있는 내용으로 변환되며 제2주성분 자료는 제1주성분 자료와는 직교되는 특 성의 자료들을 최대한 설명할 수 있는 내용으로 변환된다.

그러나 이러한 변환의 비밀은 각 파장대에 들어있는 정보들 중에서 중복된 부분을 소거시킴으로써 그 만큼의 자료압축 이 이루어지는 것에 불과하다. 변환된 자료의 경우, 특정한 분류대상에 대한 정보의 압축이 아닌 전체정보의 압축이라 는 점 때문에 주성분분석 자체만으로는 효과적인 위성영상 분석을 수행할 수가 없다. 따라서 주성분분석은 후속적인 분 류작업을 위한 사전작업에 지나지 않는다.

그러므로 주성분분석 후에 추출된 밴드들을 대상으로 정준 상관분류기법을 적용하여 후속적인 분류작업을 수행한다. 정 준상관분석은 두 변수군 간의 상관관계를 최대로 한다는 점 을 제외하고는 주성분분석과 거의 동일한 분석절차를 따른 다. 즉, 기준변수군으로는 주성분분석 후 선택된 밴드들에서 분류하고자 하는 토지피복의 Training Data 통계치를 사용하 고 예측변수군으로는 선택된 파장대의 위성영상자료 중 1 화소를 사용하여 기준변수군에 속해 있는 각 토지피복의 내 용을 최대한 설명하는 축을 설정한다. 그러나 이렇게 설정된 축을 이용하여 변환된 자료는 주성분분석과는 달리 각 토지 피복의 항목을 가장 잘 설명하는 내용이므로 정준상관분석 자체로도 분류작업이 효과적으로 수행될 수가 있다. 정준상 관분석의 원리를 기반으로 한 이 분류알고리즘을 프로그램 화하여, 주성분분석 변환된 다중시기(Multitemporal) Landsat

그림 1. 연구대상지역의위색영상(1994 7 26)

그림 2. 연구대상지역의위색영상(1996 9 1)

(5)

영상에 대해 정준상관분류를 수행하는 것이 본 연구의 주요 과정이다. 다음으로 이 결과를, “주성분분석을 수행하지 않 은 단일 영상에 대한 정준상관분류 및 다중시기 혼합영상에 대한 정준상관분류”의 결과와 비교함과 아울러 지상실제데이 터와 각각 비교하여 정확도 평가를 실시하고, 주성분분석과 다중시기영상이 정준상관분류기법과 함께 사용될 때 나타나 는 특성을 분석하여 그 장점과 효용성을 알아내는 것 또한 본 연구의 주요과정에 속한다.

Landsat TM 영상에 대한 조작, 기하보정 및 주성분 분석

은 원격탐사분야에서 널리 알려진 ERDAS Image Process-

ing System 소프트웨어를 사용하여 수행하였다. 원영상에 대

한 정준상관분류와 주성분분석 후 추출된 밴드들에 대한 정

준상관분류는 C 언어와 코딩형식이 비슷한 MATLAB 소프 트웨어를 사용하여 직접 프로그래밍하여 수행하였다.

이상의 전체적인 연구수행과정을 흐름도로 정리하면 그림 3과 같다.

4. 적용결과 및 정확도 평가

4.1 분류수행결과

그림 3의 연구수행과정에서 나타낸 바와 같이 4가지 분류 방법체계에 대한 총 5가지 경우의 분류수행 결과를 영상으 로 표현한 것이 그림 4, 5, 6, 7, 8이며, 이를 화소수로 나 타낸 것이 표 1, 2, 3, 4, 5이다. 표에서 GIS value는 각

그림 3. 연구수행과정흐름도

(6)

분류항목에 대한 화면상의 색 지정을 위해 임의로 정한 수 치이다. 그림에서 나지(bareland)는 흰색(white), 산림은 청록 색(dark green), 풀밭은 녹색(green), 도시역(urban)은 보라색

(violet), 수역(water)은 파란색(blue)으로 표현되었다.

4.2 분류정확도평가

이상의 4가지 분류방법적 체계가 실제 토지피복상황을 얼 마나 정확하게 분류하는지를 평가하기 위해서는 비교대상인 지상실제데이터(Ground Truth Data)가 필요하다. 본 연구에

서는 연구대상영역이 7,500개 화소로서 크지 않기 때문에 지상실제데이터로서 화소별 샘플을 채취하지 않고 대상지 전 그림 4. 단일영상의정준상관분류(1994 7 26)

그림 5. 단일영상의정준상관분류(1996 9 1)

그림 6. 2개시기혼합영상의정준상관분류(14밴드)

그림 7.시기별주성분분석후고유치상위 4개밴드씩병합된 8 밴드에대한정준상관분류

그림 8. 2개시기 14개밴드혼합영상을주성분분석후고유치상위 8개밴드에대한정준상관분류

1. 단일영상의정준상관분류결과(1994 7 26) Class

항목

bare-

land forest grass urban water 화소수 77 1658 1251 3017 1497

GIS Value 1 2 3 4 5

백분율 1.0% 22.1% 16.7% 40.2% 20.0%

2. 단일영상의정준상관분류결과(1996 9 1) Class

항목

bare-

land forest grass urban water 화소수 46 1752 884 3188 1630

GIS Value 1 2 3 4 5

백분율 0.6% 23.4% 11.8% 42.5% 21.7%

3. 2개시기혼합영상의정준상관분류결과(14밴드)

Class 항목

bare-

land forest grass urban water 화소수 51 1545 749 3281 1874

GIS Value 1 2 3 4 5

백분율 0.7% 20.6% 10.0% 43.7% 25.0%

(7)

체를 화소별로 비교할 수 있도록 영역전체에 대해 지상실제 데이터를 작성하였다. 지상실제데이터를 구축하기 위해 지형 도와 항공사진을 활용하였다. 지형도는 그림 9와 같으며, 축 척은 1/10,000 이고 1994년에 제작된 것이다. 항공사진의 축척은 1/20,000이며 촬영시기는 1995년 10월이다.

지형도와 항공사진을 기반으로 작성된 지상실제데이터에 대해 토지피복항목별로 GIS value를 할당하고 색을 지정하 여 화면에 도시하면 그림 10과 같다.

본 연구에서 채택한 분류항목이 분류가 잘 되었는지를 파 악하기 위해, 그림 4, 5, 6, 7, 8의 분류결과를 지상실제데 이터와 시각적으로 비교하였으며, 중첩하여 화소별 위치비교 를 수행함으로써 정확도를 평가하였다. 정확도를 평가하기 위해 정확도 평가방법으로 널리 사용되는 오차행렬표를 작 성하였으며, Kappa 계수를 계산하였고(Congalton and Green, 1999), 그 결과는 표 6, 7, 8, 9, 10과 같다.

시각적 비교는 그림 4, 5, 6, 7, 8을 그림 10과 함께 놓 고 분류항목별로 경계선 및 영역의 형태를 비교하여 수행한 다. 지상실제데이터를 기준으로 한 정확도평가는 분류결과의 각 화소별 GIS value를 마이크로소프트 엑셀프로그램에 입 력하여 자동으로 오차행렬표 및 Kappa 계수가 계산되도록 함으로써 수행되었다.

4.3 결과분석

지상실제데이터를 기준으로 각 분류결과영상을 살펴보면 4. 시기별주성분분석후고유치상위 4개밴드씩병합된 8개밴

드에대한정준상관분류결과 Class

항목

bare-

land forest grass urban water 화소수 381 1920 619 3094 1486

GIS Value 1 2 3 4 5

백분율 5.1% 25.6% 8.3% 41.3% 19.8%

5. 2개시기 14개밴드혼합영상을주성분분석후고유치상위 8 개밴드에대한정준상관분류결과

Class 항목

bare-

land forest grass urban water 화소수 145 1773 819 3587 1176

GIS Value 1 2 3 4 5

백분율 1.9% 23.6% 10.9% 47.8% 15.7%

그림 9. 연구대상지역의지형도

그림 10. 지상실제데이터의화면도시

6. 단일영상의정준상관분류정확도(1994 7 26) 지상실제

분류결과

bare-

land forest grass urban water 합계

bareland 38 0 0 39 0 77

forest 18 1226 201 207 6 1658

grass 134 105 562 440 10 1251

urban 125 75 182 2611 24 3017

water 36 9 52 645 755 1497

합계 351 1415 997 3942 795 7500 Producer's Accuracy User's Accuracy Overall

Accuracy bareland 10.8% bare-

land 49.4% 69.2%

forest 86.6% forest 73.9%

grass 56.4% grass 44.9% KHAT statistic urban 66.2% urban 86.5%

0.562 water 95.0% water 50.4%

7. 단일영상의정준상관분류정확도(1996 9 1) 지상실제

분류결과

bare-

land forest grass urban water 합계

bareland 33 0 0 13 0 46

forest 87 1129 197 331 8 1752

grass 82 96 507 194 5 884

urban 113 173 218 2675 9 3188

water 36 17 75 729 773 1630

합계 351 1415 997 3942 795 7500 Producer's Accuracy User's Accuracy Overall

Accuracy bareland 9.4% bare-

land 71.7% 68.2%

forest 79.8% forest 64.4%

grass 50.9% grass 57.4% KHAT statistic urban 67.9% urban 83.9%

0.542 water 97.2% water 47.4%

(8)

시각적으로도 그림 8(2개시기 14개밴드 혼합영상을 주성분 분석한 후 고유치 상위 8개밴드에 대한 정준상관분류)의 결 과가 실제 토지피복상황과 가장 유사함을 파악할 수 있다.

그림 8의 경우를 제외하고는 나머지 분류방법의 경우 모두 도시역내의 화소들 중 수역으로 분류된 화소들이 많이 나타 났다. 특히 주성분분석을 수행하지 않고 적용한 정준상관분 류의 결과에서 수역이 잘못 분류되는 경향이 강하였다. 이는 트레이닝 데이터와 독립화소별로 총 화소개수 만큼인 7500 번의 정준상관분석을 수행하는 정준상관분류기법의 특성상, 오분류시 나타나는 현상이다. 이러한 현상을 바로잡는 방법 으로 Landsat TM 2개시기 14개밴드 혼합영상을 주성분분석 한 후 정준상관분류를 수행하는 것이 매우 효과적임을 알 수 있었다.

시각적으로 동작대교가 도시역으로 나타나도록 분류된 것 은 5가지의 결과 중 그림 7의 경우만이며, 이는 시기별 주 성분분석을 수행한 후 고유치 상위 4개밴드씩 병합된 8개밴 드에 대한 정준상관분류 방법에서만 나타난 현상이었다.

각각의 분류방법에 따른 분류결과에 대한 정확도평가를 위해 작성된 오차행렬표인 표 6, 7, 8, 9, 10에서 보면 시 각적으로 판단되었던 바와 같이 표 10의 전체정확도가

76.9%로서 가장 높게 나타났다. 표 6, 7에서와 같이 단일영

상별로 정준상관분류를 수행한 결과는 분류정확도가 각각

69.2%, 68.2%로서 평균 68.7%로 나타났다. 1994년 7월

26일과 1996년 9월 1일의 2개시기를 혼합한 14개밴드 영상 을 사용한 정준상관분류의 결과는 분류정확도가 65.6%로서 오히려 약 3.1% 감소된 것으로 나타났다(표 8 참조). 또한 유효한 정보만을 선별함과 동시에 정보를 압축하는 효과를 주는 주성분분석을 적용한 영상데이터를 사용한 정준상관분 류는 표 9와 표 10에서 서로 다른 결과를 보여주었다.

표 9는 시기별 영상데이터에 대해 각각 주성분분석을 수 행한 후 고유치 상위 4개밴드씩 병합된 8개밴드에 대한 정 준상관분류결과이며, 예상과 달리 주성분분석을 적용하였음 에도 불구하고 분류정확도가 상승하지 않았으며, 63.6%로서 단일영상만을 분류한 경우보다 훨씬 낮게 나타났다. 그러나 표 10은 2개시기 14개밴드 혼합영상에 대해 전체적으로 주 성분분석을 수행한 후 고유치 상위 8개밴드에 대한 정준상 관분류결과로서, 단일 영상만으로 정준상관분류기법을 적용 한 경우보다 약 8,2% 높은 76.9%의 분류정확도를 보여주었 다. 이러한 결과는 분류정확도 상승면에서 매우 효과적인 결 과로 판단된다. 결론적으로 정준상관분류기법을 사용할 경우 다중시기 혼합영상 전체에 대해 사전에 주성분분석을 적용 하는 것이 분류정확도 상승에 매우 유효함을 알 수 있었다.

특히 주성분분석은 정준상관분류가 갖는 장점이면서도 단점 인 독립화소별로 분류함으로써 갖는 특성을 주변데이터와 어 울리도록 완화시켜주는 영향을 미치므로, 정준상관분류시 사 전에 주성분분석을 수행하는 것은 매우 유용한 것으로 판단 된다. 그러나 유의할 점은 다중시기영상을 사용한 토지피복 정보 추출에 있어, 전처리작업으로서 주성분분석시 시기별로 주성분분석을 수행하는 것은 전혀 효과적이지 않으며 오히 려 분류정확도를 감소시키는 결과를 가져왔다는 점이다. 즉, 다중시기영상이 갖는 장점을 살리기 위해서는 영상 전체에 대해 한 번에 주성분분석을 수행해야 함을 알 수 있었다.

8. 2개시기혼합영상의정준상관분류정확도(14밴드)

지상실제 분류결과

bare-

land forest grass urban water 합계

bareland 37 0 1 13 0 51

forest 12 1173 167 187 6 1545

grass 93 63 394 198 1 749

urban 162 170 342 2566 41 3281

water 47 9 93 978 747 1874

합계 351 1415 997 3942 795 7500 Producer's Accuracy User's Accuracy Overall Accuracy

bareland 10.5% bare-

land 72.5% 65.6%

forest 82.9% forest 75.9%

grass 39.5% grass 52.6% KHAT statistic urban 65.1% urban 78.2%

0.502 water 94.0% water 39.9%

9. 시기별주성분분석후고유치상위 4개밴드씩병합된 8개밴 드에대한정준상관분류정확도

지상실제 분류결과

bare-

land forest grass urban water 합계

bareland 71 64 82 155 9 381

forest 57 1154 371 330 8 1920

grass 54 28 201 306 30 619

urban 104 62 246 2638 44 3094

water 65 107 97 513 704 1486

합계 351 1415 997 3942 795 7500 Producer's Accuracy User's Accuracy Overall

Accuracy bareland 20.2% bare-

land 18.6% 63.6%

forest 81.6% forest 60.1%

grass 20.2% grass 32.5% KHAT statistic urban 66.9% urban 85.3%

0.480 water 88.6% water 47.4%

10. 2개시기 14개밴드혼합영상을주성분분석후고유치상위

8개밴드에대한정준상관분류정확도 지상실제

분류결과

bare-

land forest grass urban water 합계

bareland 95 0 3 47 0 145

forest 23 1269 250 225 6 1773

grass 112 76 431 197 3 819

urban 89 55 254 3186 3 3587

water 32 15 59 287 783 1176

합계 351 1415 997 3942 795 7500 Producer's Accuracy User's Accuracy Overall

Accuracy bareland 27.1% bare-

land 65.5% 76.9%

forest 89.7% forest 71.6%

grass 43.2% grass 52.6% KHAT statistic urban 80.8% urban 88.8%

0.656 water 98.5% water 66.6%

(9)

한편으로 오차행렬표를 세부적으로 검토해보면 bareland의 생산자 정확도가 주성분분석 수행 전에는 약 10% 정도로 낮음을 볼 수 있다. 이는 본 연구대상지역의 토지피복특성상 나타나는 현상으로 생각되어지는 바, bareland가 타 토지피 복항목과 상당히 혼동되어 있음을 파악할 수 있으며, 특히

urban 및 grass와 혼동됨을 확인할 수 있다. 그러나 주성분

분석후에 정준상관분류를 수행하였을 때, 생산자 정확도가

27.1%까지 상승하는 효과를 볼 수 있었다.

분류정확도평가측면에서 또 하나의 관심은 Kappa 계수에 관한 것이다. 오차행렬표에서 보면, 원래의 토지피복항목이 불규칙적으로 여러 가지 다른 토지피복항목으로 분류된 화 소들이 많기 때문에 Kappa 계수가 낮게 나타난 편임을 알 수 있다. 즉, 정준상관분류기법은 다른 종류의 분류기법에 비 해서는 약간 더 무작위 할당 성향의 단점이 있는 분류기법 의 경향을 보이고 있음을 알 수 있다.

5. 결 론

연구결과를 정리하면, 본 연구로부터 얻어진 최우선의 성 과는 정준상관분류기법을 사용한 토지피복정보 추출시 다중 시기영상과 주성분분석을 사용할 때의 유용성 확인이다. 즉 본 연구의 결과로 볼 때, 다중시기영상을 주성분분석 후 정 준상관분류기법을 적용하는 것은 어느 정도의 실용성을 보 여줄 수 있다고 판단되며, 그러한 성과의 활용은 분류정확도 의 상승에 달려있다. 예를 들어 여러 가지 토지피복이 혼합 된 복잡한 도시의 토지피복분포를 파악하는데 효과적인 분 류기법이 될 수 있는지 또는 식생분포 파악에 효과적인 분 류기법이 될 수 있는지와 같은 구체적 응용사례를 통하여 그 유용성을 확인할 수 있을 것이다.

본 연구의 수행결과에 대한 의미와 함께 기존의 분류방법 과 다른 특징, 장점 및 기대효과를 정리하면 다음과 같다.

1. Landsat TM 영상을 사용한 토지피복정보 추출시 분류정

확도를 높이기 위해서, 다중시기영상을 사전에 주성분분석 후 정준상관분류기법을 사용하면 효과적임을 확인하였다.

2.정준상관분류기법의 특징인 독립화소별 분류시 나타나는 단점을 주성분분석 작업에 의해 완화시킬 수 있음을 확인 하였다.

3.단순히 밴드수 만을 늘리는 경우로서 다중시기영상을 사 용하는 경우나, 단일시기별로 주성분분석을 수행한 후 병 합한 밴드를 사용하여 정준상관분류를 수행하는 것은 정 확도 상승에 효과가 없음을 확인하였다.

이상과 같은 결과로 판단해 볼 때 본 연구에서 시도된 분류체계는 토지정보를 분석하는데 매우 유용하며, 특히 복 잡한 도시역의 분류에 상당히 효과적임을 다시 한 번 강조 한다.

감사의 글

본 논문은 2001학년도 목포대학교 학술연구비 지원에 의 하여 연구되었음.

참고문헌

金勇日(1991) 人工衛星 遠隔探査 데이타의 分析 正確度 向上에 關한硏究-地形的分光反射特性補正과統計的 分類技法을 心으로. 박사학위논문, 서울대학교 대학원.

박민호(2006) 하이퍼스펙트럴영상 분류에서 정준상관분류기법의 유용성. 대한토목학회논문집, 대한토목학회, 제26권, 제5D호, pp. 890.

박종남, 서정희(1988) 식생이 무성한 지역에서의 Principal Component Analysis에 의한 Landsat TM 자료의 광역지질 도 작성. 대한원격탐사학회지, 대한원격탐사학회, Vol. 4, No.

1, p. 49.

이기원, 박성미, 지광훈(1996) Landsat자료를 이용한 도시환경 변화추출에서의 주성분분석과 퍼지집합연산의 응용. 대한원격 탐사학회지, 대한원격탐사학회, Vol. 12, No. 3, p. 257.

李喜演(1991) 地理統計學. 法文社.

장훈, 윤완석(2003) 표준화 주성분 분석(Standardized PCA)을 이용한 LANDSAT 위성자료 분류(Classification)의 정확도 향상. 한국GIS학회·대한원격탐사학회 2003 공동춘계학술대 회, 한국GIS학회, 대한원격탐사학회, pp. 151-156.

장훈, 윤완석, 신동준(2004) 혼합화소와 정준상관분석을 이용한 감독분류의 최적밴드선정에 관한 연구. 대한토목학회논문집, 대한토목학회, 제24권, 제6D호, pp. 963-970.

Almeida-Filho, R. and Shimabukuro, Y.E. (2002) Digital process- ing of a Landsat TM time series for mapping and monitoring degraded areas caused by independent gold miners, roraima state, Brazilian Amazon. Remote Sensing Environment, 79, pp.

42-50.

Cheriyadat, A. and Bruce, L.M. (2003) Why Principal Component Analysis is not an Appropriate Feature Extraction Method for Hyperspectral Data. IEEE, pp. 3420-3422.

Clark, D. (1975) Understanding canonical correlation analysis. Nor- wich: Geo Abstracts Ltd..

Congalton, R. and Green, K. (1999) Assessing the Accuracy of Remote Sensing Data: Principles and Practices, Roca Baton, Lewis.

Du, Y., Teillet, P., and Cihlar, J. (2002) Radiometric normalization of multitemporal high-resolution satellite images with quality control for land cover change detection. Remote Sensing Envi- ronment, Vol. 82, pp. 123-134.

Jeong, J.C. and Yoo, S.J. (1998) Water Quality Observation using Principal Component Analysis. Proceeding of International Symposium on Remote Sensing, Journal of Korean Society of Remote Sensing, p. 58.

Johnson, R.A. and Wichern, D.W. (2002) Applied multivariate sta- tistical analysis. Fifth Edition, Prentice Hall.

Mitternicht, G.I. and Zinck, J.A. (2003) Remote Sensing of Soil Salinity : Potentials and Constraints. Remote Sensing Environ- ment, 85, pp. 1-20.

(접수일: 2008.4.14/심사일: 2008.5.15/심사완료일: 2008.5.15)

참조

관련 문서

– the decrease in systolic arterial pressure frequently exceeds the normal decrease of 10 mmHg and the peripheral pulse may disappear completely during

• Pathology.. 출처: American Joint Committee on Cancer staging system for thyroid cancers using the TNM classification. Harrison 18 th Edition.. Postsurgical hypoparathyroidism.

Patterns for extracting narrative information nouns within the text are defined by applying a Korean natural language process technique to story data

• 음식물 폐기물: collected by trucks  food waste 

• Controlled decomposition of organic materials such as plant materials, animal waste, food.. waste, and wastewater sludge

Construction New construction sites, road repair sites, demolition of  buildings.

ƒ Precision forging(정밀단조), flashless forging(밀폐단조) : the part formed is close to the final dimensions, high forging load & capacity equipment needed..

Through the statistical analysis of marine accident reports, human factors which contribute to accidents is defined as the classification of accident causes