Automatic Classification by Land Use Category of National Level LULUCF Sector using Deep Learning Model

(1)

Korean Journal of Remote Sensing, Vol.35, No.6-2, 2019, pp.1053~1065

https://doi.org/10.7780/kjrs.2019.35.6.2.3 ISSN 1225-6161 ( Print )

ISSN 2287-9307 (Online)

Article

딥러닝모델을 이용한 국가수준 LULUCF 분야 토지이용 범주별 자동화 분류

박정묵 ¹⁾·심우담 ²⁾·이정수 ^3)†

Automatic Classification by Land Use Category of National Level LULUCF Sector using Deep Learning Model

Jeong Mook Park

¹⁾

·Woo Dam Sim

²⁾

·Jung Soo Lee

^3)†

Abstract: Land use statistics calculation is very informative data as the activity data for calculating exact carbon absorption and emission in post-2020. To effective interpretation by land use category, This study classify automatically image interpretation by land use category applying forest aerial photography (FAP) to deep learning model and calculate national unit statistics. Dataset (DS) applied deep learning is divided into training dataset (training DS) and test dataset (test DS) by extracting image of FAP based national forest resource inventory permanent sample plot location. Training DS give label to image by definition of land use category and learn and verify deep learning model. When verified deep learning model, training accuracy of model is highest at epoch 1,500 with about 89%. As a result of applying the trained deep learning model to test DS, interpretation classification accuracy of image label was about 90%. When the estimating area of classification by category using sampling method and compare to national statistics, consistency also very high, so it judged that it is enough to be used for activity data of national GHG (Greenhouse Gas) inventory report of LULUCF sector in the future.

Key Words: LULUCF, National forest inventory, Forest Aerial Photography, Deep learning model, Sampling method

요약 : 신기후체제에 대응하여 정확한 탄소흡수 및 배출량을 산정하기 위해 토지이용 범주별 통계량 산출은 활동자료로서 매우 중요한 자료이다. 본 연구는 효과적인 토지이용 범주별 판독을 위하여 산림항공사진(이하 FAP)에 딥러닝모델을 적용하여 토지이용 범주별 자동화 판독 분류를 한 후 샘플링기법을 통해 국가단위 통계 량을 산출하였다. 딥러닝모델에 적용한 데이터세트(이하, DS)는 국가산림자원조사 고정표본점 위치 기반 FAP

Received November 15, 2019; Revised November 29, 2019; Accepted December 10, 2019; Published online December 23, 2019

1)

강원대학교 산림산업 첨단융합기술 전문인력 양성센터 연구교수 (Research Professor, Human Resources Development Center for Convergence of Advanced Technologies in Forest Industry, Kangwon National University)

2)

강원대학교 산림경영학과 박사과정생 (PhD Student, Department of Forest Management, Kangwon National University)

3)

강원대학교 산림경영학과 정교수 (Professor, Department of Forest Management, Kangwon National University)

†Corresponding Author: Jung Soo Lee ([email protected])

This is an Open-Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License

(http://creativecommons.org/licenses/by-nc/3.0) which permits unrestricted non-commercial use, distribution, and reproduction in

any medium, provided the original work is properly cited.

(2)

1. 서론

LULUCF(Land Use, Land Use Change, Forestry) 분야의 토지이용 및 토지피복 통계량 산출은 국토를 관리하고 국토계획을 작성함에 있어 중요하다 (Kim, 2016). 특히, LULUCF 분야는 매년 온실가스 배출량 및 흡수량이 변 화하기 때문에 체계적인 모니터링이 필요한 상황이다 (Garciaoliva and Masera, 2004). IPCC에서는 LULUCF분 야 온실가스 배출 및 흡수량 산정의 활동자료 구축방법 으로 Sampling method(샘플링방법)과 Wall to Wall 방법 을 제시하고 있으며, 특히 샘플링방법은 국가단위 토지 이용 범주별 면적량과 토지이용변화 모니터링에 비용 효율적인 방법으로 제시되었다 (Achard et al., 2008). 국내 LULUCF분야에 대한 연구는 Yu et al.(2015)가 위성영상 자료와 KLIS(Korea Land Information System), 토지피복 자료를 이용하여 과거 10년간의 시·군단위 토지이용변 화를 분석하였으며 , Park et al.(2017)은 이용하여 표본강 도에 따라 토지이용을 구분하고 이에 대한 불확실성 평 가를 하였다. 또한, Park et al.(2016)은 IPCC(Intergovern - mental Panel on Climate Change) 단일 범주에 대해서 가 이드라인에 따라 온실가스 배출량 및 흡수량을 산정하 였다.

국가수준 토지피복변화 및 분류에 관한 연구는 2000 년대 초부터 QuickBird·IKONOS·KOMPSAT2와 같은 고해상도 영상을 사용하여 진행되었다 (Oh et al., 2010;

Li and Shao, 2013). 과거 원격탐사 자료의 영상분류방법 은 픽셀기반 분류방법과 객체기반 분류방법이 주로 사 용되었다 (Myint et al., 2011; Ke et al., 2010). 픽셀기반 분 류방법은 개별 픽셀의 분광정보가 픽셀의 각각의 분광 특성을 표현하지 않기 때문에 파장대의 정보가 혼합되 어 분류의 부정확함을 유발한다 (Lee et al., 2010; Welh and Riggan, 2010). 반면, 객체기반 분류방법은 객체의 모양

과 분광정보를 활용하여 인접 픽셀을 객체로 병합하여 객체를 분류 단위로 정하여 분류를 시행한다 (Johnsson, 1994; Lee and Wamer, 2006). 하지만, 픽셀기반과 객체기 반 분류방법은 인간에 의해 수동적으로 선정된 각각의 피처를 알고리즘에 따라 분류하기 때문에 정확도 향상 에 영향을 미치는 한계가 있다 .

딥러닝은 2006년 사용된 이후 영상인식, 패턴인식 등 의 부분에서 유용하게 사용되었으며 , 최근 딥러닝 기반 의 영상분류에 관한 연구가 활발히 진행되고 있다 (Lee and Kim, 2019). 딥러닝모델은 인공신경망이라는 인공 지능분야의 모형이 발전된 형태로 데이터세트에서 자 동으로 피처를 학습한다는 장점이 있다 . 특히, CNN (Convolutional Neural Networks)은 생물의 시각처리과 정을 모방하여 구축된 아키텍처(architecture)로 최근 이 미지 분류에 관한 연구에서 사용되는 모델이다 (Chung

et al., 2017). 딥러닝모델 중 Inception모듈은 TensorFlow

의 모델 중 하나로 신경망 차원의 개수를 증가시켜 많 은 이미지의 특징 찾는 장점이 있으며 , SENet은 모델의 매개변수를 강화시켜 정확도를 향상시키는 과정으로 모델의 분류결과를 강화시키기 위하여 사용된다 (Kim, 2019; Xia et al., 2019).

국가수준의 토지이용지도를 구축하거나 현장조사

를 통하여 통계량을 산출하는 것은 시간적 및 비용적 효

율성이 낮기 때문에 딥러닝모델을 적용한 LULUCF분

야 토지이용 범주별 자동화 판독 분류 모델을 개발하는

것이 필요하다 . 따라서 본 연구는 국가산림자원조사

(National Forest Inventory, 이하 NFI) 위치 기반 산림항

공사진 (Forest Aerial Photography, 이하 FAP) 이미지에

딥러닝모델을 적용하여 국가수준 토지이용 범주에 따

라 자동화 판독 분류하였다 . 또한, 샘플링기법을 통해

추정된 토지이용 범주별 면적을 국가통계와 비교·분석

하여 신기후체제에 대응하기 위한 국가 온실가스 인벤

의 이미지를 추출하여 훈련데이터세트(이하, 훈련DS)와 시험데이터세트(이하, 시험 DS)로 구분하였다. 훈련 DS는 토지이용 범주별 정의에 따라 이미지별 레이블을 부여하였으며, 딥러닝모델을 학습하고 검증하였다. 검 증 시 모델의 학습정확도는 학습 횟수1500회에서 정확도가 약 89%로 가장 높았다. 학습된 딥러닝모델을 시 험DS에 적용한 결과, 이미지 레이블의 판독 분류정확도는 약 90%로 높았다. 샘플링기법을 통해 범주별 분류 결과에 대해 면적을 추정하여 국가통계와 비교한 결과 정합성 또한 높아 향후LULUCF(Land Use, Land Use Change, Forestry)분야 국가 온실가스 인벤토리 보고서의 활동자료로 활용하기에 충분하다고 판단된다.

(3)

토리 보고서 (National Inventory Report, 이하 NIR)의 활 동자료로서의 활용 가능성을 입증하였다 .

2. 연구대상지 및 방법

1) 연구대상지

연구대상지는 위도 33°~38°, 경도 125°~131°에 위 치한 대한민국 전국으로 선정하였다 . 국내 행정구역은 1개 특별시, 1개 특별자치시, 6개 광역시, 8개 도, 1개 특 별자치도로 구분되며, 전체 국토 면적은 2019년 지적통 계 기준 , 약 10,038 천ha이다. 전체 국토 면적 중 임야는 약 63%(6,371 천ha)로 가장 많은 면적을 차지하고 있으며, 농경지 (전, 답, 과수원) 약 19%(1,945 천ha) 순으로 분포 하고 있다 (Ministry of Land, Infrastructure and Transport, 2019)(Fig. 1).

2) 연구자료

딥러닝모델 적용을 위한 영상자료는 FAP를 이용하 였다 . FAP는 산림청에서 NFI를 수행하기 전에 임분의 사전정보를 취득하기 위하여 사용하는 자료이며, 본 연 구는 전용된 토지의 토양탄소가 안정화되는 기간인 20 년을 고려하여 1996년부터 2005년에 촬영된 4차 FAP을

이용하였으며, 4차 FAP는 흑백영상으로 전국 단위 산 림항공사진을 토지이용 범주에 따라 분류하고자 사용 하였다 (IPCC, 2019). FAP는 샘플링기법을 적용하기 위

Fig. 1. Republic of Korea map.

Fig. 2. NFI_4 km map and 4th Forest Aerial Photography.

(4)

하여 영상 일부분의 이미지를 추출하였으며 , 이미지 추 출의 기준이 되는 위치는 제6차 NFI 고정표본점 자료를 이용하였다 . NFI는 산림자원의 변화를 주기적으로 파 악하기 위해 전 국토에 표본강도 4 km단위(전국) 또는 표본강도 2 km단위(광역시 및 제주도)의 일정한 간격으 로 표본점을 배치하는 계통추출법 (Systematic sampling) 을 적용한 표본점 자료이다 (Korea Forest Service, 2017;

Korea Forest Service, 2019)(Fig. 2). 또한, 토지이용 범주 별 면적 추정 결과와의 정합성 비교를 위한 국가통계는 지적통계 , 임업통계연보, 농업면적조사 자료를 이용하 였다 . 공간분석과 딥러닝 분석 프로그램은 각각 ArcGIS Pro와 Pycharm을 활용하였다.

3) 연구방법

본 연구에 적용된 딥러닝모델은 Inception-V4 및 SENet의 아키텍처 기반으로 구축하였다. 딥러닝모델 적용을 위한 데이터세트 (Dataset, 이하 DS)는 NFI고정 표본점 위치 기반 2km 표본점을 생성하여 표본점 위치 기반 FAP의 이미지를 추출하였다. DS는 딥러닝모델을 훈련시키기 위한 훈련 DS(4 km 위치 기반 이미지)와 훈 련된 딥러닝모델을 적용하는 시험 DS(2 km 위치 기반 이미지)로 구성하였다. 훈련DS는 토지이용 범주에 따 라 육안판독에 의해 레이블을 정의하고 , 학습과 검증을

통하여 딥러닝모델 최적의 학습횟수를 선정하였다 . 마 지막으로 학습과 검증을 통해 평가된 딥러닝모델을 시 험 DS에 적용하여 추출된 이미지에 대한 토지이용 범주 별 레이블을 예측하였다 . 또한, 샘플링기법을 이용하여 토지이용 범주별 면적을 추정하여 국가통계와 비교·분 석하였다 (Fig. 3).

(1) 딥러닝모델

딥러닝모델의 아키텍처는 Google社에서 개발한 Inception-V4와 2017년 ILSVRC(ImageNet Large Scale Visual Recognition Challenge)에서 우수한 성능을 보인 SENet의 아키텍처를 활용하였다. Inception모델은 독립 적인 4개의 층(Stem, Inception-A, Inception-B, Inception- C)으로 구성된 다층 네트워크로, 그 중 3개의 층은 합성 곱층 (Convolution Layer)과 활성화 함수로 구성되며, 마 지막 층은 합성곱층과 풀링층(pooling Layer)으로 구성 된다 . Inception모델은 일반적인 딥러닝 모델보다 깊은 네트워크망으로 구성 되어있기 때문에 기본구조는 병 렬 형태로 구성되며 , 1×1 크기의 합성곱층을 통해 매개 변수 (Parameter)의 양을 줄여 이미지 연산량을 감소시 키고, 분석결과의 과적합(Overfitting)문제를 완화시킨 다 (Szegedy et al., 2017; Spanhol et al., 2016)(Fig. 4).

SENet은 Alexnet, VGGnet 등 일반적인 딥러닝 모델

Fig. 3. Study method.

(5)

과는 달리 , Block 형태의 구조로 구성되며, 합성곱층의 연산결과를 바탕으로, 가중치를 조절하는 역할을 수행 한다. SENet의 장점은 딥러닝 아키텍처 내의 어떤 층에 도 유연하게 적용할 수 있으며 , 추가적인 계산량에 비 해 정확도 증가량이 높다는 장점이 있다 (Hu et al., 2018).

토지이용 범주별 분류정확도를 향상시키기 위해서 는 다른 알고리즘의 장점을 결합하여 모델을 구축하는 것이 필요하다(Chitroub, 2010). 본 연구는 국가수준의 FAP 데이터를 사용하기 때문에 Inception-V4 모델을 활 용하여 딥러닝모델의 네트워크망을 깊게 구성하고 학

습의 수준을 높였으며 분석결과의 과적합 문제를 해결 하였다. 또한 Inception 네트워크 내 4개의 층에 각각 SE- Block을 결합하여 SE-Inception모델을 구축하여 활용하 였다 . 딥러닝모델의 입력이미지는 DS 이미지의 크기 (160 m×160 m), 공간해상도(80 cm), 흑백(gray scale)이미 지임을 고려하여 이미지크기와 채널 수를 ‘ 200×200×1’

로 변경하여 적용하였다(Fig. 5).

(2) 데이터세트 구축

DS에서 FAP 위치의 기반이 되는 표본점은 NFI고정 Fig. 5. Deep learning model.

Fig. 4. General deep learning and Basic construction of Inception.

(6)

표본점을 이용하였으나 표본강도 2 km의 고정표본점은 광역시 및 제주도에만 배치되어 있기 때문에 , 추가적으 로 표본강도 2 km단위 표본점 22,119개를 생성(NFI_2 km+)하였다. 생성된 NFI_2 km+ 위치를 기반으로 FAP 이미지를 추출하여 DS를 구축하였으며, 표본강도에 따 라 훈련 DS와 시험DS로 구성하였다.

(3) 훈련DS의 학습 및 검증

훈련 DS는 토지이용 범주별로 레이블 정의가 필요 하며, Murray et al.(2018)은 Landsat TM 및 SPOT 위성영 상 이미지를 육안으로 판독하여 토지피복 지도를 구축 하였다. 따라서, 훈련DS는 표본강도 4 km 위치 기반

FAP에서 추출한 이미지를 구글지도를 참조하여 육안 으로 판독하고 토지이용 범주별 레이블을 부여하였다 (Rwanga and Ndambuki, 2017). 표본강도 4 km단위 이미 지는 전체 6,260개 이미지 중 민간인통제선 이북 지역과 군사시설 등 육안판독이 불가한 이미지와 기하학적으 로 오차가 발생한 이미지 1,247개를 필터한 5,013개의 이미지를 사용하였다 . 토지이용 범주의 정의는 IPCC 기준 (IPCC, 2001; IPCC, 2019) 및 주요 선진사례와 국내 국가통계자료 및 공간주제도의 토지이용 범주별 정의 를 참조하고 , 국내 토지이용 특성에 적합하도록 범주별 정의를 정립하였다(Table 1).

딥러닝모델을 적용한 훈련DS는 일관성 있는 평가를

Table 1. Land use category Land use

category Subcategories Training and verification Dataset Overseas NIR

reference

Forest land

Coniferous forest, Deciduous forest, Non-stocked forest land,

Miscellaneous, Cutting area

New Zealand, Finland

Cropland

Paddy field, Upland, Orchard, Green house, Abandoned paddy field, Cropland additional facility

New Zealand, Germany

Grassland Waste Land, Pasture,

Seedbed New Zealand,

Germany

Wetlands

Salt pan, Ditch, Marsh, River, Potential flooding land,

Ocean

Germany, Japan

Settlements

Site, Factory site, School site, Warehouse site, Bank, Park,

Gymnastic site, Graveyard, Miscellaneous land, Construction site, Empty lot,

Road, Railway site, Other transportation facility

New Zealand, Germany,

Japan,

Finland

(7)

위하여 훈련 DS_A(2,507개)와 훈련DS_B(2,506개)로 구 분하였으며 , 각각의 DS에 대하여 학습과 검증을 실시 하였다 . 훈련DS는 DS_A와 B로 번갈아 선정하여 DS_A 와 B로 구분하였으며 DS_A와 B의 정확도를 비교한 후 이를 학습에 사용하였다 . 딥러닝모델 학습 시 학습횟 수는 학습정확도와 학습시간을 고려하여 딥러닝모델 이 최적화되는 시기로 선정하였다 . 학습된 딥러닝모델 의 검증은 토지이용 범주별 정밀도(Precision), 포괄성 (Recall), F₁(F-score), 정확성(Accuracy)의 산출식을 이용 하였다(Rouhi et al., 2015; Huang and Rust, 2018)(Eq. (1), (2), (3), (4)). 정밀도는 딥러닝모델로 1개 범주를 예측했 을 경우 육안판독 분류 결과와 일치의 정도를 판단하는 지표이며 , 포괄성은 육안판독 분류 결과를 딥러닝모델 분류 결과가 어느 정도 추정하는지를 보여주는 지표이 다 (Li, 2016).

TN

Precision = ———— (1)

TN + FP

TP

Recall = ———— (2)

TP + FN

2 × Precision × Recall

F1

= —————————– (3)

Precision + Recall

TP + TN

Accuracy = ————————– (4)

TP + TN + FP + FN

(4) 시험DS의 분류 및 분류정확도 평가

시험 DS는 표본강도 NFI_2 km+ 위치 기반 FAP에서 추출한 이미지로 전체 25,098개 이미지 중, 훈련DS와 마 찬가지로 영상미제공 지역과 기하오차가 발생한 이미 지 2,979개를 제외한 22,119개의 이미지를 사용하였다.

시험DS는 검증된 딥러닝모델을 적용하여 토지이용 범 주별 레이블을 자동화 판독 분류하였다. 자동화 판독 분 류결과의 분류정확도는 4 km 단위 위치 기반 이미지를 대상으로 육안판독 분류 결과와 혼동행렬을 이용하여 비교·분석하였으며 , 오분류 사례를 검토하여 딥러닝모 델의 적용시 개선점을 파악하였다 .

(5) 토지이용 범주별 면적 추정 및 국가통계와의 정합성 평가

딥러닝모델을 이용하여 분류된 토지이용 범주별 면적 은 샘플링기법을 이용하여 추정하였으며 , 추정면적의 불 확실성은 표준오차 및 상대표준오차로 평가하였다 . 면적 추정에 사용된 총 면적은 4차 FAP 촬영의 마지막 연도인 2005년을 기준으로 지적통계의 국토 면적을 사용하였다 (Statistics Finland, 2019; Ministry of Land, Infrastructure and Transport, 2019). 불확실성은 국가단위 토지이용 면 적을 추정할 시 , 추정면적의 표준오차에 의하여 추정치 를 신뢰할 수 있는 확률로 수치가 낮을수록 추정된 면 적이 정확함을 의미하며 , Eq. (5)와 Eq. (6)을 이용하여 산출하였다 (Yim et al., 2015).

s(Ah

) = (5) Relative standard error (%) = × 100 (6)

A

h

: Estimated area of land-use category h 샘플링기법을 이용하여 추정된 범주별 면적은 국가 온실가스 인벤토리 MRV 지침(GIR)에 따라 국가통계 자료 (지적통계, 임업통계연보, 농업면적조사)를 이용하 여 정합성을 분석하여 신기후체제에 대응하기 위한 NIR의 활동자료로서의 가능성을 판단하였다.

3. 결과 및 고찰

1) 딥러닝 모델의 학습 및 검증

훈련 DS_A와 DS_B를 이용한 딥러닝모델 학습은 학 습횟수를 2,000회로 제한하여 관찰하였다. 훈련DS의 학습정확도와 학습시간을 고려하여 딥러닝모델이 최 적화되는 학습횟수를 경험적으로 선정한 결과 , 1,500번 의 학습을 진행하였을 때 학습정확도는 두 훈련 DS 모 두 평균 약 89%로 딥러닝모델의 성능이 유지되어 학습

ph

(1 – p

h

)

n – 1

s(Ah

)

Ah

Table 2. Deep learning interpretation and visual interpretation confusion matrix

Type Deep learning

interpretation positive Deep learning

interpretation negative Sum

Visual interpretation truth TP (True Positive) FN (False Negative) TP + FN Visual interpretation false FP (False Positive) TN (True Negative) FP + TN

Sum TP+FP FN+TN TP + FN + FP + TN

(8)

을 종료하였다 (Fig. 6).

딥러닝모델의 범주별 F₁은 훈련DS_A의 경우 산림지 96.4%, 농경지 80.3%, 습지 76.6%, 정주지 57.1% 초지 10.6% 순으로 높았으며, 훈련DS_B의 경우 산림지 94.8%, 농경지 88.5%, 정주지 86.3%, 습지 51.1%, 초지 48.7% 순으로 높았다(Table 3). F₁이 낮은 습지와 초지의 학습정확도는 Jo et al.(2019)의 연구결과와 유사하게 학 습정확도가 낮았다 . 범주별 학습정확도는 범주별 훈련 DS의 이미지 개수가 다른 범주에 비해 상대적으로 적 기 때문에 데이터의 불균형이 발생하여 정확도가 낮은 것으로 판단된다 (Wang et al., 2016).

2) 딥러닝모델을 적용한 토지이용 범주별 자동화 판독 분류

4 km단위 위치 기반 FAP의 육안판독 분류결과와 딥 러닝모델을 적용한 자동화 판독분류 결과와의 전체 정 확도는 89.8%로 선행연구보다 7.9% 낮았지만, 이는 딥 러닝모델의 입력이미지 채널 개수와 아키텍처 구성의 차이로 인하여 전체 정확도가 낮게 나타난 것으로 판단 된다 (Scott et al., 2017)(Table 4).

범주별 정확도는 학습정확도와 동일하게 산림지와 농경지가 각각 95.3%, 84.5%로 타 범주에 비해 높았으며, Fig. 6. The accuracy of training dataset.

Table 3. Precision, Recall, F

1

of Deep learning model

Rate (%)

Land use category Training set Precision (%) Recall (%) F

1

(%)

DS_A DS_B DS_A DS_B DS_A DS_B DS_A DS_B

Forest land interpretation 1,684 1,529 94.7 97.7 98.3 92.2 96.4 94.8

Cropland interpretation 525 654 85.5 84.4 75.8 93.2 80.3 88.5

Grassland interpretation 20 48 20.0 52.1 14.3 86.2 10.6 48.7

Wetlands interpretation 102 60 67.6 58.3 88.5 45.5 76.6 51.1

Settlements interpretation 176 215 59.1 80.9 55.3 92.6 57.1 86.3

Table 4. DS_A+B Verification

Land use category Deep learning interpretation

Forest land Cropland Grassland Wetlands Settlements Sum Recall

Visual interpretation

Forest land 3,088 82 27 16 28 3,241 95.3%

Cropland 74 1,001 7 26 76 1,184 84.5%

Grassland 11 13 29 2 2 57 50.9%

Wetlands 15 29 – 104 7 155 67.1%

Settlements 25 54 5 14 278 376 73.9%

Sum 3,213 1,179 68 162 391 5,013

Precision 96.1% 84.9% 42.6% 64.2% 71.1%

Overall accuracy=89.8%

(9)

초지와 습지가 각각 42.6%, 64.2%로 낮았다(Table 4). 초 지와 습지의 경우 본 연구가 우리나라 전체 지역을 대 상으로 토지이용 범주별 분류를 하였기에 초지와 습지 의 분류정확도가 낮았다 . 이러한 점을 보완하기 위하여 차후 훈련 DS 개수가 부족한 초지와 습지의 데이터를 추가하여 토지이용분류를 해야하며 , 데이터 변조 및 증 대 기법을 적용한 추가적인 연구를 통해 개선할 수 있 을 것으로 판단된다(Perez and Wang, 2017).

한편, 딥러닝모델을 적용한 범주별 자동화 판독 분류 에서 육안판독 분류결과와 비교하였을 때 딥러닝모델 이 오판독한 사례는 대부분 산림지와 정주지를 농경지 로 분류한 경우와 농경지를 습지로 분류한 경우이다 (Fig. 7). 농경지의 과수원과 산림지는 분광특성이 유사 하며 , 시험DS의 이미지가 농경지의 과수원과 산림지가 혼합되어 있는 경우 오판독 되었으며 , 특히, 영상촬영 시기의 영향을 받는 논의 경우 물을 댄 논이 습지로 혼 동하여 오판독 된 것으로 사료된다 (Yeam et al., 2011). 이 러한 문제점 해결을 위해서는 다양한 분광범위를 가진 다중분광 영상 자료가 필요하며(Song, 2017), 훈련DS 구 성 시 토지이용 범주별로 데이터를 충분히 확보하고 하 위범주를 세분화해야 한다 (Lee and Kim, 2019; Bergado

et al., 2016). 본 연구는 NIR의 활동자료로서 활용하기 위

하여 딥러닝모델을 20년전 확보할 수 있는 1채널 흑백 FAP에 적용하였지만, 추후 현재 연도에 대한 자동화 판

독 분류 연구 시 고해상도 다중분광 이미지에 적용할 수 있기 때문에 분류 정확도를 향상시킬 수 있을 것으로 기 대된다 .

3) 토지이용 범주별 면적 추정 및 국가통계와의 정합성 평가

토지이용 범주별 자동화 판독 분류 결과를 샘플링기 법을 이용하여 면적을 추정한 결과, 산림지 6,159 천ha (61.8%), 농경지 2,340 천ha(23.5%), 정주지 852 천ha(8.5%), 습지 421 천ha(4.2%), 초지 192 천ha(1.9%) 순으로 높았 으며 , 불확실성은 산림지 0.5%, 농경지 1.1%, 정주지 2.5%, 습지 4.3%, 초지 6.8% 순으로 낮았다. 추정면적이 넓은 산림지와 농경지는 불확실성이 0.5%와 1.1%로 다 른 범주에 비해 낮은 반면 , 추정면적이 적은 습지와 초 지는 4.3%와 6.8%로 불확실성이 높았다. 한편, 핀란드 의 경우 산림지는 불확실성이 1.0%로 가장 낮았으며, 농경지 , 정주지, 초지는 평균 약 10% 이내, 습지는 17.6%

로 불확실성이 가장 높아 본 연구결과의 경향과 유사하 였다 (Statistics Finland, 2019)(Table 5).

샘플링기법을 이용하여 추정된 면적을 국가통계 자 료와 비교한 결과 , 추정면적은 지적통계보다 산림지 -322천 ha(-3.2%), 습지 -162 천ha(-1.6%)는 과소 추정되었 으며 , 농경지는 306 천ha(+2.8%), 초지 135 천ha(+1.4%), 정주지 73 천ha(+0.7%)는 과대 추정되었지만, 범주별 (a) Cropland → Forest land (b) Settlements → Cropland (c) Cropland → Wetlands

Fig. 7. Visual interpretation-Deep learning.

Table 5. 2 km_NFI result applied deep learning model

Forest land Cropland Grassland Wetlands Settlements Sum

Point number 13,671 5,195 427 935 1,891 22,119

Area rate 62% 23% 2% 4% 9% 100%

Estimated area 6,159 2,340 192 421 852 9,965

(10)

면적 비율 대비 평균 약 5% 이내 차이를 보여 자동화 판 독 분류의 정확도를 입증하였다 . 산림지의 경우 추정면 적은 임업통계연보보다 235 천ha 과대 추정되었으며, 농경지의 경우 추정면적은 농업면적조사보다 -516 천ha 과소 추정되었다 . 이는 이미지 분류 시 토지이용 범주의 경계 부분에 인접하여 부정합되었으며 , 특히 농로와 경 지에 경계에 인접한 하천 등을 모두 경지에 포함하여 차 이가 발생한 것으로 판단된다 (Cai et al., 2019; Statistics Korea, 2019)(Table 6).

4. 결 론

본 연구는 NFI 위치 기반 FAP에 딥러닝모델을 적용 하여 새로운 국가수준의 통계산출 방법과 신기후체제 에 대응하기 위한 NIR의 활동자료로서의 활용 가능성 을 입증하고자 하였다 . 딥러닝모델은 훈련DS를 이용하 여 학습하였으며 , 학습된 딥러닝 모델을 시험DS에 적 용하여 토지이용 범주별 자동화 판독 분류하였다 . 도출 된 결과와 육안판독 결과를 비교하여 분류 정확도를 평 가하고 , 국가통계와 정합성을 비교·분석하였다. 본 연 구의 결과를 토대로 두가지의 결론이 도출되었다 . 첫째, 토지이용 범주별 자동화 판독 분류한 결과의 전체 분류 정확도는 89.8%이었으며, 범주별 분류 정확도는 산림지 96.1%, 농경지 84.9%, 정주지 71.1%, 습지 64.2%, 초지 42.6% 순이었다. 초지 및 습지는 타 토지이용 범주에 비 해 면적이 작기 때문에 데이터의 불균형이 발생하여 분 류 정확도가 낮았으나 , 딥러닝모델 적용 시 DS에 다중 분광해상도를 적용하고 DS의 충분한 데이터확보, 범주 별 하위범주의 세분화 학습을 통한 연구를 진행한다면 , 분류 정확도를 개선할 수 있을 것으로 판단되었다 . 둘째, 자동화 판독 분류결과에 샘플링기법을 이용하여 추정

한 면적은 산림지 , 농경지, 정주지, 습지, 초지 순으로 분 포하였다 . 습지와 초지 항목에서 딥러닝모델의 성능이 낮음에도 불구하고 , 추정된 면적의 비율은 국가통계의 면적비율과 5% 이내의 차이를 보여 국가단위 토지이용 통계산출에서의 활용 가능성을 입증하였다 .

본 연구는 국가단위 FAP와 NFI자료의 활용 가능성을 파악하였으며 , 딥러닝모델을 적용하여 육안판독보다 신 속히 토지이용의 현황을 파악할 수 있다는 점에서 효율 적이었다 . 하지만 습지와 초지의 경우 산림지, 농경지, 정 주지에 비해 데이터가 적어 정확도가 현저하게 떨어졌 으며 흑백 영상을 사용하여 분류의 한계가 있었다. 향후 진행될 연구는 습지와 초지의 데이터 비율 증가를 증가 시키고 다중분광영상을 활용하여 딥러닝모델에 적용한 다면 분류정확도를 높여 분류의 신뢰성을 높일 것이라 판단된다 . 특히 다중분광영상 분류는 흑백영상에 비하 여 토지이용 범주별 차이를 명확하게 나타내 분류정확 도를 향상시킬 것이다 . 아울러 국가수준의 토지이용에 대한 효율적인 모니터링을 위한 기초적인 자료제공 및 NIR의 LULUCF분야의 활동자료로도 활용될 것으로 기 대된다 .

사 사

이 논문은 산림청 (한국임업진흥원) 산림과학기술 연 구개발사업 (2017045A00-1919-BB01)의 지원에 의하여 이루어진 것입니다 .

References

Achard, F., G. Grassi, M. Herold, M. Teobaldelli, and Table 6. Comparison of deep learning model and national statistics

Category Deep learning interpretation

(2 km unit) Cadastral statistics Forest Basic Statistics Agricultural Area Survey

Forest land 6,159 6,480 6,394 –

Cropland 2,340 2,064 – 1,824

Grassland 192 57 – –

Wetlands 421 584 – –

Settlements 852 779 – –

(11)

D. Mollicone, 2008. Use of satellite remote sensing in LULUCF sector, Proc. of the IPCC

Expert Meeting, Jena, Germany, May 13-15,

vol. 33, pp. 1-25

Bergado, J.R., C. Persello, J. Ray, and C. Gevaert, 2016.

A deep learning approach to the classification of sub-decimetre resolution aerial images, Proc. of

2016 IEEE International Geoscience and Remote Sensing Symposium (IGARSS), Beijing, China,

Jul. 10-15, pp. 1516-1519.

Chitroub, S., 2010. Classifier combination and score level fusion: concepts and practical aspects,

International Journal of Image and Data Fusion,

1(2): 113-135.

Chung, Y. J., S.M. Ahn, J.H. Yang, and J.J. Lee, 2017.

Comparison of Deep Learning Frameworks:

About Theano, Tensorflow, and Cognitive Toolkit,

Journal of Intelligence and Information Systems,

23(2): 1-17 (in Korean with English abstract).

Cai, G., H. Ren, L. Yang, N. Zhang, M. Du, and C. Wu, 2019. Detailed Urban Land Use Land Cover Classification at the Metropolitan Scale Using a Three-Layer Classification Scheme,

Sensors, 19(14): 3120.

Garciaoliva, F. and O.R. Masera, 2004. Assessment and measurement issues related to soil carbon sequestration in land-use, land-use change, and forestry (LULUCF) projects under the Kyoto Protocol, Climatic Change, 65(3): 347-364.

Hu. J., L. Shen, and G. Sun, 2018. Squeeze-and-Excitation Networks, Proc. of the IEEE conference on

computer vision and pattern recognition, Salt

Lake City, USA, Jun. 18-22, pp. 7132-7141.

Huang, M.H. and R.T. Rust, 2018. Artificial Intelligence in Service, Journal of Service Research, 21(2):

155-172.

IPCC, 2009. Good Practice Guidance and Uncertainty

Management in National Greenhouse Gas Inventories, vol. 4, IPCC, Geneva, Switzerland.

IPCC, 2019. 2019 Refinement to the 2006 IPCC

Guidelines for National Greenhouse Gas Inventories, vol. 4, IPCC, Geneva, Switzerland.

Jo, W.H., W.H. Lim, and K.H. Park, 2019. Deep learning based Land Cover Classification Using Convolutional Neural Network: a case study of Korea, The Korean Geographical Society, 54(1):

1-16 (in Korean with English abstract).

Johnsson, K., 1994. Segment-Based Land-Use Classification from SPOT Satellite Data, Photogrammetric

Engineering and Remote Sensing, 60(1): 47-54.

Ke, Y., L.J. Quackenbush, and J. Im, 2010. Synergistic use of QuickBird multispectral imagery and LIDAR data for object-based forest species classification,

Remote Sensing of Environment, 114(6): 1141-1154.

Kim, C. M., 2016. Land use classification and land use change analysis using satellite images in Lombok Island, Indonesia, Forest Science and Technology, 12(4): 183-191.

Kim, Y. H., 2019. Age Estimation Method based on

Comparative Convolutional Neural Network using Inception Module, Master’s thesis, Kyungpook

National University, Daegu, Korea (in Korean with English abstract).

Korea Forest Service, 2017. 7th National Forest Resource

Survey and Forest Health and Vitality Survey Guideline, Korea Forest Service, Daejeon, Korea.

Korea Forest Service, 2019. 4th Forest Aerial Photography, http://www.forest.go.kr/newkfsweb/html/Html Page.do?pg=/fgis/UI_KFS_5003_010300.html&

mn=KFS_02_04_03_04_08&orgId=fgis/, Accessed on Mar. 5, 2019.

Lee, H.J., J.H. Ru, and Y.G. Yu, 2010. Extracting High Quality Thematic Information by Using High- Resolution Satellite Imagery, Journal of the Korean

Society for Geospatial Information Science,

18(1): 73-81 (in Korean with English abstract).

Lee, J.Y. and T.A. Warner, 2006. Segment based image classification, International Journal of Remote

Sensing, 27(16): 3403-3412.

Lee, S.H. and J.S. Kim, 2019. Land Cover Classification

(12)

Using Sematic Image Segmentation with Deep Learning, Korean Journal of Remote Sensing, 35(2): 279-288 (in Korean with English abstract).

Li, W., H. Fu, L. Yu, and A. Cracknell, 2017. Deep learning based oil palm tree detection and counting for high resolution remote sensing image, Remote

Sensing, 9(1): 22

Li, X. and G. Shao, 2013. Object-based urban vegetation mapping with high-resolution aerial photography as a single data source, International Journal of

Remote Sensing, 34(3): 771-789.

Ministry of Land, Infrastructure and Transport, 2019

Cadastral Statistics yearbook, SeJong, Korea.

Murray, N.J., D.A. Keith, D. Simpson, J.H. Wilshire, and R.M. Lucas, 2018. An online remote sensing application for land cover classification and monitoring, Methods in Ecology and Evolution, 9(9): 2019-2027.

Myint, S.W., P. Gober, A. Brazel, S. Grossman-Clarke, and Q. Weng, 2011. Per-pixel vs. object-based classification of urban land cover extraction using high spatial resolution imagery, Remote Sensing

of Environment, 115(5): 1145-1161.

Oh, C.Y., S.Y. Park, H.S. Kim, and C.U. Choi, 2010.

Comparison of Landcover Map Accuracy Using High Resolution Satellite Imagery, The Korean

Association of Geographic Information Studies,

13(1): 89-100 (in Korean with English abstract).

Park, J.W., H.S. Na, and J.S. Yim, 2017. Comparison of Land-use Change Assessment Methods for Greenhouse Gas Inventory in Land Sector, Journal

of Climate Change Research, 8(4): 329-337 (in

Korean with English abstract).

Park, S.J., C.H. Lee, M.S. Kim, S.G. Yun, Y.H. Kim, and B.G. Ko, 2016. Calculation of GHGs Emission from LULUCF-Cropland Sector in South Korea,

Korean Society of Soil Science and Fertilizer,

49(6): 826-831 (in Korean with English abstract).

Perez, L. and J. Wang, 2017. The Effectiveness of Data Augmentation in Image Classification using Deep

Learning, arXiv preprint arXiv:1712.04621.

Rouhi, R., M. Jafari, S. Kasaei, and P. Keshavarzian, 2015. Benign and malignant breast tumors classification based on region growing and CNN segmentation, Expert Systems with Applications, 42(3): 990-1002.

Rwanga, S. and J.M. Ndambuki, 2017. Accuracy Assessment of Land Use/Land Cover Classification Using Remote Sensing and GIS, International

Journal of Geosciences, 8(4): 611-622.

Scott, G.J., M.R. England, W.A. Starms, R.A. Marcum, and C.H. Davis, 2017. Training Deep Convolutional Neural Networks for Land-Cover Classification of High-Resolution Imagery, Geoscience and

Remote Sensing Letters, 14(4): 549-553.

Statistics Finland, 2019. Greenhouse Gas Emissions in

Finland 1990 to 2017, Statistics Finland, Helsinki,

Finland.

Song, A.R. and Y.I. Kim, 2017. Deep Learning-based Hyperspectral Image Classification with Application to Environmental Geographic Information Systems,

Korean Journal of Remote Sensing, 33(6): 1061-

1073 (in Korean with English abstract).

Spanhol, F.A., L.S. Oliveira, C. Petitjean, and L. Heutte, 2016. Breast cancer histopathological image classification using Convolutional Neural Networks,

Proc. of 2016 International Joint Conference on Neural Networks, Vancouver, Canada, Jul. 24-

29, pp. 2560-2567.

Statistics Korea, 2019. Agricultural Area Survey in

2018, Statistics Korea, Daejeon, Korea.

Szegedy, C., S. Loffe, V. Vanhoucke, and A.A. Alemi, 2017. Inception-v4, inception-resnet and the impact of residual connections on learning, Proc.

of Thirty-First AAAI Conference on Artificial Intelligence, San Francisco, USA, Feb. 4-9.

Wang, S., W. Liu, J. Wu, L. Cao, Q. Meng, and P.J.

Kennedy, 2016. Training deep neural networks on

imbalanced data sets, Proc. of 2016 International

Joint Conference on Neural Networks, Vancouver,

(13)

Canada, Jul. 24-29, pp. 4368-4374.

Welh, R.C. and N.D. Riggan, 2010. Object-based classification vs. pixel-based classification:

comparative importance of multi-resolution imagery, The International Archives of the

Photogrammetry, Remote Sensing and Spatial Information Sciences, 38(4): C7.

Xia, X., Y. Wu, Q. Lu, and C. Fan, 2019. Experimental study on crop disease detection based on deep learning, IOP Conference Series: Materials

Science and Engineering, 569(5): 052034.

Yeom., J.H., J.H. Lee, D.J. Kim, and Y.I. Kim, 2011.

Hierarchical Land Cover Classification using IKONOS and AIRSAR Images, Korean Journal

of Remote Sensing, 27(4): 435-444 (in Korean

with English abstract).

Yim., J.S., R.H. Kim, S.J. Lee, and Y.M. Son, 2015.

Land-use Change Assessment by Permanent Sample Plots in National Forest Inventory, Journal

of Climate Change Research, 6(1): 33-40 (in

Korean with English abstract).

Yu, S.C., W. Ahn, and J.A. Ok, 2015. A Study on

Construction Plan of the Statistics for National

Green House Gas Inventories (LULUCF Sector),

Journal of Korean Society for Geospatial Information Science, 23(3): 67-77 (in Korean