• 검색 결과가 없습니다.

평가

문서에서 저작자표시 (페이지 39-44)

다음 [그림 5-1]은 본 연구를 이용한 NLIDB의 예시를 나타낸다.

[그림 5-1] NLIDB 예시

[그림 5-1]과 같이 본 연구를 통해 특별한 학습과정이나 DB에 관한 지식이 없는 일 반인도 자연어로 된 질의문을 통해 쉽게 DB를 이용하여 원하는 정보를 검색할 수 있 고, SQL을 공부하는 학습자를 위한 학습 도구로 사용할 수 있을 것으로 기대된다.

Ⅴ. 결론 및 제언

본 논문에서는 DB와 SQL의 지식이 없는 일반인들도 일반적인 컴퓨팅 성능으로 DB 를 이용하고 검색할 수 있는 방안을 목적으로 질의문의 자연어 처리를 통해 DB 검색 이 가능하도록 SQL문으로의 변환 방법을 제안했다. SQL문의 Select절과 조건절을 보 다 정확히 변환하고, 변환 시간을 단축하기 위해 질의문의 WH- phrase(의문사구)와 Noun phrase(명사구)를 추출하였다. 각 의문사구와 명사구에서 Select절의 Column name과 조건절의 Column값을 추출하여 SQL문을 생성하였고, 매칭 정확도와 결과를 분석하였다. N-gram을 통한 컬럼 매칭 정확도를 향상시키기 위해 WH- 의문사들에 대한 개체명 사전을 구축하여 Select절의 정확도를 향상시켰고, 조건절의 경우 중복되 는 Column값들의 명사구와 Column name간의 비교를 통해 정확도를 향상 시킨 결과 를 볼 수 있었다.

본 연구는 일반인들도 DB를 이용하고 검색할 수 있도록 질의문을 통해 SQL문 변환 방법을 제안했다. 실험 결과 Select절의 Column name 매칭의 경우 질의문의 의문사구 에 찾고자 하는 데이터의 값을 정확히 입력 할 경우, 보다 정확한 Select절을 생성할 수 있었다. 조건절의 Column 매칭의 경우 찾고자 하는 데이터의 값들을 문장의 강조 나 도치 등을 쓰지 않고 불필요한 용어가 없는 간결한 조건으로 이루어진 질의문으로 이루어 졌을 경우, 보다 정확한 조건절을 생성할 수 있었다.

향후 연구로는 Select절과 조건절을 질의문을 통해 보다 정확하게 생성하기 위한 규 칙의 추가 및 수정을 통하여 보강할 예정이며, Select절의 경우 질의문의 의문사구 문 법 규칙 등을 정규화하는 방법을 이용한다면 보다 빠르고 정확하게 프로세스 모델링을 할 수 있을 것이다. 또한 질의문의 SQL변환 방법을 이용하여 사용자들이 편리하고 용 이하게 DB를 이용하고 검색할 수 있도록 다양한 기능이 추가된 편리한 유저인터페이 스를 개발하여 NLIDB기술의 고도화를 목표로 한다.

참고문헌

[1] 이충권, “빅데이터 정보시스템의 구축 및 사례에 관한 연구”, 한국스마트미디어학 회, Vol.4, No.3, pp.56-61, 2015.

[2] Bates M., R. Bobrow. “Information retrieval using a transportable natural language interface”, SIGIR '83 Proceedings of the 6th annual international ACM SIGIR conference on Research and development in information retrieval, pp.81-86, June 1983.

[3] Bates M., R. Bobrow, R. Ingria, D. Stallard. “The Delphi natural languageunderstanding system”, In Proceedings of the fourth conference on Applied naturallanguage processing, Oct 1994.

[4] Waltz D., “An English Language Question Answering System for a LargeRelational Database”, Communications of the ACM, Vol.21, No.7, July 1978.

[5] Martin P., D. Appelt, B. Grosz, F. Pereira, “TEAM: an experimental transportablenatural-language interface”, In Proceedings of 1986 on fall joint computer conference, Nov 1999.

[6] Barros, F., A. De Roeck, “Resolving Anaphora in a Portable NaturalLanguage Front End to a Database”, In Proceedings of the 4th Conference on AppliedNatural Language Processing, Stuttgart, Germany, pp.119-124, 1994.

[7] Templeton M., J. Burger, “Problems in Natural Language Interface to DBMSwith Examples from EUFID”, In Proceedings of the 1st Conference on Applied NaturalLanguage Processing, Santa Monica, California, pp.3-16, 1983.

[8] Hafner C., K. Godden. “Portability of syntax and semantics in DATALOG”, ACMTransactions on Information Systems (TOIS), Vol.3, No.2, pp.141-164, Apr 1985.

[9] Yates A., O. Etzioni, D. Weld, “A Reliable Natural Language Interface toHousehold Appliances”, In Proceedings of the Conference on IUI'03, Miami, Florida, USA, 2003

[10] 윤상호, 김영대, 황찬규, 유재형. “자연어 처리를 이용한 통계정보 검색 시스템 (NEIS) 개발”, 한국통신학회 종합 학술 발표회 논문집 (하계) 2007, pp.545-548,

2007.

[11] 한용진, 박세영, “질의 생성을 이용한 자연어 인터페이스”, 정보과학회논문지 : 소 프트웨어 및 응용, 39(12), pp.998-1004, 2002.

[12] F. Meng and W. W. Chu, “Database Query Formation from Natural Language using Semantic Modeling and Statistical Keyword Meaning Disambiguation", CSD-TR 990003, University of California, June 1999.

[13] I. S. Kang, S. H. Na, J. H. Lee, and G. J. Yang, “Lightweight Natural Language database Interfaces", Proceedings of the 9th International Conference on Application of Natural Language to Information Systems. pp. 76-88, June 2004.

[14] J. H. Wang, H. J. Kim, and M. G. Jang, “Information Extraction Based on Property Patterns to Construct a Knowledgebase for Encyclopedia Person Domain", The 2004 KIISE Autumn Conference, Vol.31, No.2, pp.793-795, Nov 2004.

[15] R. Cooper, S. Ali, and C. Bi, “Extracting Information from Short Messages", NLDB 2005, LNCS 3513, pp.388-391, June 2005.

[16] B. H. Yun, “Natural Language Processing based Information Extraction for Newspapers", Journal of Korean Institute of Information Technology, Vol.6, No.4, pp.188-195, Aug 2008.

[17] C. N. Seon, H. S. Kim, and J. Y. Seo, “Information extraction using finite state automata and syllable n-grams in a mobile environme", Proceedings of the ACL-08: HLT Workshop on Mobile Language Processing, pp.13-18, June 2008.

[18] C. N. Seon, H. S. Kim, and J. Y. Seo, “Efficient appointment information extraction from short messages in mobile devices with limited hardware resources", Pattern Recognition Letters 32, pp.127-133, Jan 2011.

[19] Saikrishna Srirampur, Ravi Chandibhamar, Ashish Palakurthi, Radhika Mamidi.

“Concepts identification of an NL query in NLIDB systems”, 2014 International Conference on Asian Language Processing (IALP), pp.230-233, Oct 2014.

[20] Victor Zhong, Caiming Xiong, Richard Socher, “Seq2SQL:Generating Structured Queries from Natural Language using Reinforcement Learning”, arXiv, Nov

문서에서 저작자표시 (페이지 39-44)

관련 문서