SUMMARY - 지적재조사를 위한 인공지능기술 활용방향 연구

A Study on Utilization of Artificial Intelligence Technology for Cadastral Resurveying

Kim Dae-jong, Hwang Myung-hwa, Lim Si-yeong, Lim Keo-bae, Kim Yeong-min, Hong Seong-eon,

Key words: Artificial intelligence, cadastral resurveying, spatial boundary

The objective of this study is to find applicability of artificial intelligence (AI) technology to cadastral resurveying project. The cadastral resurveying project has been carrying out by Ministry of Land, Infrastructure and Transportation since 2012. However, the project is behind the schedule due to lack of budget, difficulty in determining project site, cadastral boundary and reestimated land price. Artificial intelligence technology may be an opportunity to deal with these issues.

The research is mainly composed of three chapters; diagnosis of current issues in cadastral resurveying project, the concept of AI technology and applications, and application direction of AI for cadastral resurveying. We investigated activities and input/output data in the process of cadastral resurvying. Then we classified those activities into four category; planning, decision making, civil affair response and evaluation of output quality. As a

result of brainstorming with experts in AI and cadastre, it would be difficult to apply AI to planning and evaluation part because those activities are creative and human-intended. Meanwhile, there is high applicability of AI in decision making and civil affair response because AI can provide relevant information if we can train it with previously accumulated data.

It requires researches in three aspects to apply AI for cadastral resurveying project. First, a prerequisite research need to be done to identify issues and causes, to establish a customized system to support the project based on target site type, to structure civil affair data, and to develop how to utilize produced data in cadastral resurveying project. Second, a pilot study should be done to develop an exploratory algorithm to identify project sites for cadastral resurveying, to deal with civil affairs, to make decision of new parcel boundary, and to recalculate the changed land price. Third, research and development for AI technology is necessary for natural language processing on spatial questions, for spatial question processing of data fusion/visualization/spatial analysis etc., for spatial data mining, and for deep analysis of spatial image data.

APPENDIX

1.

□

∙ 자연어 처리는 사람의 언어를 컴퓨터가 자동으로 해석하고 사람과 상호작용하 는 기술을 연구하는 분야

∙ 지적재조사 과정에서 생산되는 대부분의 텍스트 데이터는 자연어 처리를 통해 자동으로 분석될 수 있을 것

∙ 관련된 세부 연구 분야는 다양하나 주로 문서 분류, 대화형 시스템, 토픽 모델 등 을 직접 활용할 수 있을 것으로 생각하며 그 외에도 목적에 따라 감성 분석, 정보 추출, 자동 요약 등도 활용할 수 있을 것임

□

∙ 문서 분류는 스팸 분류와 마찬가지로 주어진 데이터 샘플, 여기서는 문서를 자 동으로 그에 맞는 카테고리에 분류하는 것임

∙ 분류 기준이 무엇이냐에 따라 스팸 분류가 될 수도 있고 사용자 의도 분류가 될 수도 있음

∙ 민원을 자동으로 처리하기 위해 우선 사용자의 질의 의도가 어떤 민원 분야에 속하는 지 분류할 수 있을 것이며 이 때 문서 분류 기법이 쓰임

∙ 분류 알고리즘은 다양하게 존재하나 SVM, ANN 기반의 방법들이 좋은 성과를 내고 있음

∙ 분류에서 중요한 것은 문서 데이터 표현 방법임

∙ 기본적으로 문서상의 각 단어의 빈도수를 세어 하나의 문서를 하나의 벡터로 표 현하고 이를 기반으로 자동 분류 모델을 적용

∙ 아래 그림은 벡터로 표현된 문서(d)를 역시 벡터로 표현된 질의(q)와 비교하는 과정을 설명한 도식으로 사용자 질의는 벡터로 표현되어 대상이 되는 법령이나 Q&A 리스트에서 가장 가까운 답변을 찾아오는 원리로 자동 검색이 이루어짐

_ 1 |

: Kim, Y. M. 2010. Document clustering in a learned concept space (Doctoral dissertation). p.2.

∙ 최근 이미지 분석에서 좋은 성과를 보이고 있는 CNN을 자연어 처리에도 적용 할 수 있음

∙ 아래 그림의 연구에서는 단어가 아닌 알파벳 캐릭터 각각이 문서를 표현하는 하 나의 속성이 되어 이를 마치 이미지처럼 2차원 입력으로 생각하여 CNN을 적용

∙ 최종적으로 문서 분류하는 fully connected layer 를 통해 입력 문서가 어떤 카테 고리에 속하는 지 예측할 수 있게 됨

_ 2 | Character-level Convolutional Networks for Text Classification

: Zhang, X., Zhao, J., & LeCun, Y. 2015. Character-level convolutional networks for text classification. In Advances in neural information processing systems. p.651.

□

∙ 최근 챗봇으로 대표되는 대화형 시스템을 산업 각 분야에서 적용하려는 시도들 이 이루어지고 있음

∙ Google이나 IBM, Amazon 등 인공지능 분야의 최고의 기업들이 간단히 챗봇을 만들 수 있는 API들을 공개하고 있으며 음성인식 비서로 대표되는 대화형 시스 템은 현재 다양한 형태로 출시되고 있음 (휴대폰 앱, 인공지능 스피커, 웹 서비스)

∙ 이러한 대화형 시스템은 내부적으로 자연어 처리의 다양한 기술들을 사용

∙ 우선 사람의 음성을 컴퓨터가 분석하여 텍스트로 변환해주는 음성인식 기술, 그 리고 변환된 텍스트를 다시 기계가 이해할 수 있도록 분석해주는 기술이 필요함

∙ 여기서 분류, 클러스터링, 차원 축소, 감성 분석, 정보 추출 등의 세부 기술이 사

∙ 사용자의 의도가 파악이 되었다면 이에 대한 답변을 위해 대화를 생성하는 과정 도 필요하며 여기서도 딥러닝 기반의 기술들이 사용

∙ 아래 그림은 딥러닝을 사용한 대화 생성 기법으로, 사용자의 입력을 이해하고 그게 가장 잘 맞는 대답을 만들어 주기 위해 Recurrent Neural Network(RNN)을 활용한 네트워크의 원리를 설명한 것임

_ 3 | HRED(Hierarchical Recurrent Encoder-Decoder)

: Serban, I. V., Sordoni, A., Bengio, Y., Courville, A. C., & Pineau, J. 2016. Building End-To-End Dialogue Systems Using Generative Hierarchical Neural Network Models. In AAAI. p.3779.

∙ 대화형 시스템 컴퓨터가 인간의 말을 잘 알아듣고 적절한 대답을 줄 수 있는 방 향으로 다양하게 발전

∙ 아래 그림과 같은 최근 연구에서는 대화형 시스템끼리의 대화를 통해 이미지를 언어로 설명하고 이를 다시 가장 비슷한 이미지로 표현하는 것까지 이루어지고 있는 상황임

_ 4 | (Q-BOT – A-BOT)

: Das, A., Kottur, S., Moura, J. M., Lee, S., & Batra, D. 2017. Learning Cooperative Visual Dialog Agents with Deep Reinforcement Learning. arXiv preprint arXiv:1703.06585. p.1.

□

∙ 위에서 소개한 자연어 처리 기법들을 사용하기 위해서는 수작업으로 구축한 정 답값을 포함한 학습 데이터가 필요

∙ 반면, 토픽 모델은 그러한 작업이 필요하지 않는 비지도 학습 방법임

∙ 방대한 텍스트 데이터가 어떤 주제를 포함하고 있는 지 자동으로 추출할 수 있 는 방법으로 학습이 완료된 후에는 주제(topic) 별로 그 주제를 가장 잘 표현하는 단어들이 확률로서 표현

∙ 지적재조사와 관련해서는 민원 상담 기록이나 관련 법령 등 텍스트화된 자료들 이 많음. 이를 서로 매칭하는 것 뿐 아닌, 방대한 자료를 효율적으로 구조화하기 위해서도 토픽 모델을 적용 가능

∙ 주제별로 표현된 단어를 이용하여 문서 표현을 좀 더 효과적으로 할 수 있고, 이 는 다시 문서 분류나 질의 검색, 대화형 시스템에서 성능을 높이는 데 사용될 수 있음

∙ 2000대 초 학문분야로 자리 잡은 토픽 모델은 현재 다양한 응용 분야에서 문서 를 처리하는 방법으로 적극 활용

∙ 아래 그림은 토픽모델의 사용처를 표현한 그림임. 우선 토픽 모델 학습 후 왼편 과 같이 주요 단어와 그들의 확률로 이루어진 토픽들이 추출되고 이 후 각 문서 의 단어들이 주로 어떤 토픽들로부터 나왔는지를 알 수 있음

∙ 이를 통해 해당 문서가 어떤 주제의 문서인지를 확률적으로 표현할 수 있음

_ 5 |

: Blei, D. M. 2012. Probabilistic topic models. Communications of the ACM 55(4). p.78.

2. SW

□ SW , SW

1)2)

∙ 연구용으로 개발된 SW 프레임워크 뿐만 아니라 최근 구글, 마이크로소프트, 아 마존 등의 전문IT업체에서도 자체 개발한 딥러닝 프레임워크를 오픈소스 형태 로 공개 제공

∙ 딥러닝에 특화된 프로그래밍 언어뿐만 아니라, 자바, 파이썬, R 등의 범용 언어 및 플랫폼과도 호환되는 오픈소스 프레임워크가 다수 제공되어 딥러닝 사용자 범위가 확대

∙ 최근에 개발된 딥러닝 프레임워크는 주로 알고리즘 성능 개선, GPU 컴퓨팅 및 병렬 컴퓨팅 지원에 초점을 둠

□ 2017 SW ,

1) “ ,

, API ”

TensorFlow

Brain 2015

Python C++ R

CPU/GPU ,

Theano Python , CPU GUP

GPU

Keras Python ,

Theano, Tensorflow

Caffe

Berkeley Vision and Learning Center(BVLC)

C++ Python

torch

Lua , , ,

Python PyTorch

deeplearning4j (DL4J)

Java

, Spark

MxNet R, Python, C++, Julia

GPU

Microsoft CNTK Python. C++

, Generative Adversarial Networks(GAN) ,

BigDL

Apache Spark

Spark Hadoop

_ 1 | SW

: -10 - - https://www.nextobe.com/single-post/2017/08/01/ ( : 2017.10.20.) https://www.slideshare.net/JunyiSong1/ss-75552936 ( : 2017.10.20.)

: https://svds.com/getting-started-deep-learning/ ( : 2017.10.20.)

_ 6 | SW

_ 7 | SW

3.

□ LX

∙ 2009년 경계정비지침에 따라 실시된 지적불부합지 추출과정에서 담당자, 작업 자, 관리자 등이 판단하는 불부합지에 대한 입장이 다름(매칭율의 차이)

- 따라서, 2009년 불부합지+연속지적도+위성영상이미지를 중첩시켜 동일한 매칭율을 적용해 볼 필요가 있음(인공지능기술 활용) / 매칭율의 정도를 다르게 해서 필지별로 판단해 보는 것도 함께 진행했으면 좋겠음

∙ 도로, 하천, 유지 등이 불필요하게 여러 필지로 나눠져 있음, 1번 작업 수행 시 함 께 조사해서 필지를 합쳐주는 작업 필요(실제로 사업이 필요한 필지만 산정해서 정확한 사업추진예산 및 기간 등의 판단이 가능해 질 것)

∙ 경계면적 증감 발생 시 보상금을 내는 것만큼이나 보상해주는 것에 대한 민원도 더 많이 발생함(보상금액이 공시지가(시가 70%정도)로 환산한 액수임)

∙ AI를 통해 공시지가+주변 감정평가 data+거래 data 등을 이용하여 필지별 증감 내역을 예상하고, 사업지구의 우선순위 지정에 사용 가능할 듯

∙ 조정금을 산정하기 이전에 감정평가사, 소관청 담당자, 소유자에게 미리 조정금 을 알려준다면 관련 업무에 도움을 줄 수 있음

∙ 전반적으로 AI활용하면 지적재조사사업기간 단축이 가능할 것으로 판단

□

∙ 민원 대응의 기초적 역할 수행 : 민원인들에게 사업 시행 이유, 경과, 홍보 등에 대한 기초적인 질의응답 제공에 적용

∙ 사업지구 주민설명회 질의응답에 적용

∙ 민원인의 개인적 특성에 알맞은 서비스 제공 : 경계협의 등 민원발생 시 민원인 의 성별, 연령대별, 지역별, 지가별 등 개인적 특성을 인공지능을 통해 맞춤형 응 대서비스 제공에 적용

∙ 지금처럼 국소지역 재조사가 아닌 도곽단위(하나의 동)로 사업이 이루어져야함

∙ 인공지능을 이용해 현재의 재조사 방법(국소적 : 지역 전체 대상) vs 국소적 재 조사(하나의 동 대상) vs 하나의 동 전체지역 재조사 방법을 비교하여 가장 효율 적인 지적재조사사업 방향 제시하는 데 적용

□

∙ 도로, 구거, 하천 등의 국공유지 여러 필지로 구분되어 있음 - 하나의 필지로 구성하는 데 법적 제약이 존재(관계 법령 확인 필요)

∙ 남원시의 경우, 시 전체 필지의 9%가 불부합지이고, 그 중 2017년 현재, 14% 사 업 완료(2012~2017) : 예산 등의 문제로 2030년까지 완료 어려울 듯

∙ 주민설명회 개최 시 활용 방향 → 이론적인 질의가 많음

∙ 미리 대략적인 조정금을 토지소유자 등에게 알려줬었던 지자체 존재 - 큰 효과를 보지 못했으며, 만약 미리 액수를 알려줄 경우 사업자체를 거부

∙ 사업지구 선정

(1) 소관청에서 대상지역에 찾아가 직접 설명 후 설득하는 방법 (2) 지역민들이 소관청에 직접 찾아와 사업지구 선정을 의뢰하는 방법

- 현재는 신청자순으로 사업을 시행하고 있으나, 급한 지역(분쟁 발생 지역 등) 존재 시 우선 순위로 진행

- “급한 지역”을 판단할 때, 소관청 담당자가 직접 실사해서 여러 근거로 판단(판단과정 : 최소 7일정도 소요)

∙ 경계설정 및 결정 시 미세조정 단계 활용 가능성(실제 경계확정 단계에서 실수 발생)

∙ 농촌의 경우 실제 땅을 더 갖고 싶어 하는 사람들이 더 많이 존재

문서에서 지적재조사를 위한 인공지능기술 활용방향 연구 (페이지 99-115)