• 검색 결과가 없습니다.

Text/Voice Recognition & Translation Application Development Using Open-Source

N/A
N/A
Protected

Academic year: 2021

Share "Text/Voice Recognition & Translation Application Development Using Open-Source"

Copied!
2
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

한국컴퓨터정보학회 하계학술대회 논문집 제25권 제2호 (2017. 7)

425

오픈소스를 이용한 문자/음성 인식 및 번역 앱 개발

윤태진O, 서효종*, 김도헌*

O*경운대학교 항공소프트웨어공학과

e-mail: [email protected]O, [email protected]*, [email protected]*

Text/Voice Recognition & Translation Application Development Using Open-Source

Tae-Jin YunO, Hyo-Jong Seo*, Do-Heon Kim*

O*Dept. of Aeronautics & Software Engineering, Kyungwoon University

● 요 약 ●

본 논문에서는 Google에서 지원하는 오픈소스인 Tesseract-OCR을 이용한 문자/음성 인식 및 번역 앱에 대해 제안한다. 최근 한국어를 포함한 외국어 인식과 번역기능을 이용한 다양한 스마트폰 앱이 개발되어 여행에 필수품으로 자리잡고 있다. 스마트폰 의 카메라기능을 이용하여 촬영한 영상을 인식률을 높이도록 처리하고, Crop기능을 넣어 부분 인식기능을 지원하며, Tesseract-OCR의 train data를 보완하여 인식률을 높이고, Google 음성인식 API를 이용한 음성인식 기능을 통해 인식된 유사 한 문장들을 선택하도록 하고, 이를 번역하고 보여주도록 개발하였다. 번역 기능은 번역대상 언어와 번역할 언어를 선택할 수 있고 기본적으로 영어, 한국어, 일본어, 중국어로 번역이 가능하다. 이 기능을 이용하여 차량번호 인식, 사진에 포함된 글자를 통한 검색 등 다양한 응용분야에 맞게 앱을 개발할 수 있다.

키워드: 인식(recognition), 번역(translation), 오픈소스(open-source)

I. 서론

해외여행이 보편화되고 다양한 외국어를 이해할 필요가 늘어나고 있어 항상 휴대하는 스마트폰만으로 외국어 인식과 번역을 동시에 제공하는 스마트폰 앱들이 날로 증가하고 있다.

따라서, 손쉽게 응용할 수 있는 open-source를 이용한 문자/음성 인식과 번역을 할 수 있는 스마트폰 앱을 개발하고 제안하여 한다.

스마트폰의 카메라를 이용하여 직접 촬영하거나 전송받은 이미지에서 문자를 인식하기 위해 Google에서 지원하는 문자인식 오픈소스 Tesseract-OCR을 이용하고, 음성인식을 위해 Google 음성인식 API 를 이용하며, 기계 번역을 위해 네이버 오픈 API를 이용하여 안드로이 드 스마트폰 앱을 개발하였다.

II. 본론

1. Open-Source의 활용

2006년부터 Google에서 지원하여 제공하는 문자인식 open-source인 Tesseract-OCR은 github에서 쉽게 이용 가능하고, train data를 통해 인식률을 향상시킬 수 있으며, 음성인식을 위해 인식률이 향상된 Google Speech API, STT(Speech To Text), TTS(Text To Speech)를 이용하고, 번역에는 NAVER에서 제공하는

API를 사용하여 안드로이드 운영체제기반 스마트폰 앱을 구성하였다.

2. 제안한 앱의 기능과 인터페이스

개발한 문자/음성 인식 및 번역 앱에서 문자인식은 한글, 영어, 일본어, 중국어 4가지 언어를 인식이 가능하고, 인식률을 높이기 위해 필요한 부분을 발췌하는 Crop기능과 영상보정 기능을 추가했다.

음성인식은 4가지 언어 중 하나를 선택하여 원하는 언어를 인식할 수 있고, 보다 정확한 인식을 위해 유사한 3~5개 번역결과를 선택하도 록 개발하였다. 재활용을 위해 검색기능과 다른 SNS로 전송하는 기능도 포함하고 있다.

Fig. 1. Application Function

(2)

한국컴퓨터정보학회 하계학술대회 논문집 제25권 제2호 (2017. 7)

426

Fig. 2 Text Crop Fig. 3. Text Recognition

Fig. 4. Choice 3~5 Character

String Fig. 5. Voice Recognition

Fig. 6. Translation

III. 결론

제안한 스마트폰 앱은 해외여행이나 외국어를 급하게 이해해야 할 때 편리하게 스마트폰 앱으로 문자인식, 번역까지 하기 위해 개발하 였다. 외국어 간판, 안내문 등을 찍어서 문자 인식과 번역 기능을 활용할 수 있고, 외국인과 음성으로 대화하여 번역할 수도 있어 매우 편리하다. 이러한 기능을 오픈소스로 개발할 수 있고, 앞으로 수요에 따라 다양하게 변형하여 응용할 수 있다.

REFERENCES

[1] http://blog,naver.com/hoya4206/220468123180 [2] http://github.com/rmtheis/tess-two

[3] http://github.com/tesseract-ocr/tesseract/

wiki/TrainingTesseract

[4] http://cosmosjs.blog.me/220953900408(translation) [5] http://www.androidside.com/bbs/board.php?bo_table

=B56&wr_id=26206(voice recognition)

수치

Fig.  1.  Application  Function
Fig.  2  Text  Crop Fig.  3.  Text  Recognition

참조

관련 문서

모드 단일 노드 인스턴스로 되어있는 standalone mode 다수의 노드 인스턴스들을 관리할 수 있는 domain mode...

Use Tanzu Application Catalog and deploy open source with confidence:. Align Developers and IT around velocity,

‒ 사료생산형은 축산농가가 늘어나면서 조사료나 사일리지 생산을 위해 이루어지는 2모작 재배유형으로, 논에 벼를 재배한 다음 부산물인 볏짚을 조사료로

저기압 과 저중력 환경에서 국물이 포장으로 흡수되도록 했고, 압력 평 형 기능이 있는 기체 투과 필터를 넣어 포장을 뜯었을 때 내용물 이

개인적인 상상이지만 같은 논리와 과정으로

따라서 본 연구에서는 얼굴 표정의 인식 개선을 위한 무표정 감정을 분석하기 위해 얼굴 표정 이미지에서 얼굴 인식을 하고, 얼굴 인식이 안 되는 경우 전 처리 하는

사용하다보니 이동하는 거리만큼 돈이 적립된다는 사실을 알았습니다... 설상가상으로

A Study on the Evaluation of Space Recognition Space Recognition Space Recognition in the Space Recognition in the in the in the Concourse of Hospital using the