(19) 대한민국특허청(KR) (12) 공개특허공보(A)
(11) 공개번호 10-2011-0066007 (43) 공개일자 2011년06월16일 (51) Int. Cl.
G06F 3/02 (2006.01)
(21) 출원번호 10-2009-0122729 (22) 출원일자 2009년12월10일 심사청구일자 2009년12월10일
(71) 출원인
한국전자통신연구원
대전 유성구 가정동 161번지 (72) 발명자
이대하
대전광역시 유성구 하기동 송림마을@ 306동 1705 호
김재홍
대전광역시 중구 태평동 파라곤아파트 305-1904 (뒷면에 계속)
(74) 대리인 특허법인지명 전체 청구항 수 : 총 10 항
(54) 매개 인터페이스 장치를 이용한 한/영 타이프라이터 시스템 및 문자열 입력 방법 (57) 요 약
매개 인터페이스 장치를 이용하여 입력된 단어를 사전 기반으로 보정하여 정확한 단어를 인식할 수 있는 타이프 라이터 시스템 및 문자열 인식 방법이 제공된다. 매개 인터페이스 장치를 통해 입력되는 문자열로부터, 문자의 인식결과를 인식순서에 따라 배열한 문자 인식순서셋을 참조하여 다수의 문자열이 조합되고, 조합된 문자열을 완 전한 단어를 이루는 문자들의 누적 셋인 부분단어들로 구성된 부분단어 인덱스 맵을 이용하여 필터링한다. 부분 단어 인덱스 맵을 통과한 부분단어들에 대하여 특정한 범주의 단어 집합으로 이루어지는 문맥정보를 포함하는 사 전을 이용하여 다시 필터링함으로써 정확한 단어를 인식할 수 있다. 부분단어 인덱스 맵을 이용하여 더 이상 조 합하여도 사전단어가 될 수 없는 부분단어들을 미리 제거함으로써 인식의 효율을 높인다.
대 표 도
(72) 발명자 장민수
대전광역시 서구 둔산2동 둥지@ 106-1305호 박찬규
대전광역시 중구 용두동 미르마을아파트 114동 10 3호
조현성
대전광역시 유성구 반석동 반석마을@ 509-902 강상승
대전광역시 유성구 노은동 열매마을아파트 1108-404
박천수
대전광역시 유성구 신성동 하나 @ 110-1003호 손주찬
대전광역시 대덕구 송촌동 461-1 선비마을아파트 306-303
이재연
대전광역시 유성구 어은동 한빛아파트 131-1501 정연구
대전광역시 유성구 관평동 대덕테크노밸리 아파트 1014-902호
이 발명을 지원한 국가연구개발사업 과제고유번호 2008-F-039-01 부처명 지식경제부 연구관리전문기관
연구사업명 IT원천기술개발
연구과제명 인간-로봇 상호작용 매개 기술 개발 기여율
주관기관 한국전자통신연구원
연구기간 2008년 03월 01일 ~ 2012년 02월 29일
특허청구의 범위 청구항 1
매개 인터페이스 장치와,
상기 매개 인터페이스 장치를 통해 입력되는 문자의 인식결과를 인식순서에 따라 배열한 문자 인식순서셋과, 상기 문자 인식순서셋을 참조하여 상기 매개 인터페이스 장치를 통해 입력된 문자열을 조합하고 조합된 상기 문 자열을 사전을 이용해 보정하는 타이프라이터부를 포함하는 타이프라이터 시스템.
청구항 2
제1항에 있어서, 상기 타이프라이터부는,
상기 매개 인터페이스 장치를 통해 입력된 문자열을 조합하는 단어조합기와,
완전한 단어를 이루는 문자들의 누적 셋인 부분단어들로 구성된 부분단어 인덱스 맵을 포함하는 타이프라이터 시스템.
청구항 3
제2항에 있어서, 상기 부분단어 인덱스 맵은,
한글 부분단어 인덱스 맵과 영어 부분단어 인덱스 맵을 포함하는 타이프라이터 시스템.
청구항 4
제2항에 있어서, 상기 타이프라이터부는,
특정한 범주의 단어 집합으로 이루어지는 문맥정보 저장부를 더 포함하는 타이프라이터 시스템.
청구항 5 제1항에 있어서,
상기 매개 인터페이스 장치와 상기 문자 인식순서셋 및 상기 타이프라이터부는 하나의 장치로 구성되는 타이프 라이터 시스템.
청구항 6 제1항에 있어서,
상기 문자 인식순서셋 및 상기 타이프라이터부는 상기 매개 인터페이스 장치와 별도의 장치로 구성되어, 상기 매개 인터페이스 장치와 무선통신 방식으로 송수신하는 타이프라이터 시스템.
청구항 7
매개 인터페이스 장치를 통해 문자열을 입력받는 단계와,
상기 매개 인터페이스 장치를 통해 입력되는 각 문자의 인식결과를 인식순서에 따라 배열한 문자 인식순서셋을 기반으로, 입력된 상기 문자열에 대응하는 하나 이상의 단어를 조합하는 단계와,
사전을 기반으로, 조합된 상기 하나 이상의 단어 중 하나를 선택하는 단계를 포함하는 매개 인터페이스 장치를 이용한 문자열 입력 방법.
청구항 8
제7항에 있어서, 상기 선택하는 단계는,
조합된 상기 단어를 완전한 단어를 이루는 문자들의 누적 셋인 부분단어들로 구성된 부분단어 인덱스 맵과 비교
하여, 상기 부분단어 인덱스 맵에 포함된 하나 이상의 단어를 선택하는 단계를 포함하는 매개 인터페이스 장치 를 이용한 문자열 입력 방법.
청구항 9
제7항에 있어서, 상기 부분단어 인덱스 맵은,
한글 부분단어 인덱스 맵과 영어 부분단어 인덱스 맵을 포함하는 매개 인터페이스 장치를 이용한 문자열 입력 방법.
청구항 10
제7항에 있어서, 상기 선택하는 단계에서는,
특정한 범주의 단어 집합으로 이루어지는 문맥정보를 참조하는 매개 인터페이스 장치를 이용한 문자열 입력 방 법.
명 세 서
발명의 상세한 설명 기 술 분 야
본 발명은 한/영 타이프라이터 시스템 및 문자열 입력 방법에 관한 것으로서, 더 상세하게는 매개 인터페이스 [0001]
장치를 이용해 입력된 문자를 보정하여 원래 의도했던 단어를 찾아내는 한/영 타이프라이터 시스템 및 문자열 입력 방법에 관한 것이다.
본 발명은 지식경제부 IT원천기술개발사업의 일환으로 수행한 연구로부터 도출된 것이다[과제관리번호: 2008-F- [0002]
039-01, 과제명: 인간-로봇 상호작용 매개 기술개발].
배 경 기 술
제스처 입력장치, 예를 들면, 가속도 센서나 적외선 센서를 장착한 장갑이나 막대장치 등이 있는데, 이런 장치 [0003]
로 어떠한 제스처나 문자를 표현할 수 있다. 그리고, 이러한 제스처 입력장치를 통해 로봇이나 다른 시스템을 제어할 수 있는데, 사람과 기계 사이에서 어떠한 정보를 대신 전달한다 하여 이러한 입력장치를 매개 인터페이 스 장치라고 부른다. 이하 이러한 입력장치를 매개 인터페이스 장치라고 한다.
매개 인터페이스 장치를 통하여 로봇에게 어떠한 명령을 내리려고 할 때, 기본적으로 제스처 표현을 사용하게 [0004]
된다. 제스처에는 방향 지시나 감성 표현 또는 문자 표현 등이 있는데, 방향 지시를 통해 로봇의 움직임을 제어 할 수 있고, 감성 표현을 통해 현재 사용자의 상태를 로봇에게 전달할 수 있으며, 문자 표현을 통하여 구체적인 명령 의도를 전달할 수 있게 된다. 이러한 제스처 표현들은 제스처 인식 기술 또는 문자 인식 기술 등을 통해 알 수 있게 된다.
매개 인터페이스 장치를 통해 연속적인 문자 표현, 즉, 단어 정보를 로봇에게 전달한다면, 단일 문자로 명령하 [0005]
는 것보다는 더 많은 의미정보를 주고받을 수 있게 되어, 궁극적으로 인간과 로봇의 상호작용을 좀 더 활성화할 수 있을 것이다. 하지만, 매개 인터페이스 장치에 있는 센서의 오류나, 문자 인식 오류로 인해, 원래 의도하려 고 했던 단어가 아닌 잘못된 단어가 입력될 수도 있다. 따라서, 기존의 매개 인터페이스 장치에서 내부 오류나 인식 시스템 오류가 발생하더라도 원래 의도했던 단어를 찾아내어 인식할 수 있다면 더욱 원활한 인간로봇 상호 작용을 실현할 수 있을 것이다.
발명의 내용
해결 하고자하는 과제
본 발명은 상기와 같은 과제를 해결하기 위해 안출한 것으로서, 본 발명은 매개 인터페이스 장치로 문자를 입력 [0006]
하고, 이를 이용하여 단어인식을 수행하려고 할 때, 오류가 나는 문자를 보정하여 원래 의도했던 단어를 찾아냄 으로써 인식성능을 개선하는 것을 그 목적으로 한다.
즉, 본 발명은 매개 인터페이스 장치로 입력된 문자열을 사용자의 의도에 맞게 정확하게 인식하도록 함으로써 [0007]
원활한 인간로봇 상호작용을 실현하고자 하는 것이다.
과제 해결수단
이와 같은 목적을 달성하기 위한 본 발명의 타이프라이터 시스템은, 매개 인터페이스 장치와, 상기 매개 인터페 [0008]
이스 장치를 통해 입력되는 문자의 인식결과를 인식순서에 따라 배열한 문자 인식순서셋과, 상기 문자 인식순서 셋을 참조하여 상기 매개 인터페이스 장치를 통해 입력된 문자열을 조합하고 조합된 상기 문자열을 사전을 이용 해 보정하는 타이프라이터부를 포함하여 이루어진다.
여기에서 상기 타이프라이터부는, 상기 매개 인터페이스 장치를 통해 입력된 문자열을 조합하는 단어조합기와, [0009]
완전한 단어를 이루는 문자들의 누적 셋인 부분단어들로 구성된 부분단어 인덱스 맵을 포함할 수 있으며, 상기 부분단어 인덱스 맵은, 한글 부분단어 인덱스 맵과 영어 부분단어 인덱스 맵을 포함하는 것이 바람직하다.
또한, 상기 타이프라이터부는, 특정한 범주의 단어 집합으로 이루어지는 문맥정보 저장부를 더 포함할 수 있다.
[0010]
상기 매개 인터페이스 장치와 상기 문자 인식순서셋 및 상기 타이프라이터부는 하나의 장치로 구성되거나, 상기 [0011]
문자 인식순서셋 및 상기 타이프라이터부가 상기 매개 인터페이스 장치와 별도의 장치로 구성되어, 상기 매개 인터페이스 장치와 무선통신 방식으로 송수신할 수 있다.
본 발명에 따른 매개 인터페이스 장치를 이용한 문자열 입력 방법은, 매개 인터페이스 장치를 통해 문자열을 입 [0012]
력받는 단계와, 상기 매개 인터페이스 장치를 통해 입력되는 각 문자의 인식결과를 인식순서에 따라 배열한 문 자 인식순서셋을 기반으로, 입력된 상기 문자열에 대응하는 하나 이상의 단어를 조합하는 단계와, 사전을 기반 으로, 조합된 상기 하나 이상의 단어 중 하나를 선택하는 단계를 포함한다.
여기에서, 상기 선택하는 단계는, 조합된 상기 단어를 완전한 단어를 이루는 문자들의 누적 셋인 부분단어들로 [0013]
구성된 부분단어 인덱스 맵과 비교하여, 상기 부분단어 인덱스 맵에 포함된 하나 이상의 단어를 선택하는 단계 를 포함할 수 있다.
효 과
이상에서 설명한 바와 같이, 본 발명은 매개 인터페이스 장치를 통해 단어인식을 수행할 때, 오류가 난 문자로 [0014]
인해 잘못 인식된 단어를 바로잡을 수 있으므로, 사용자의 의도에 따른 정확한 문자 인식이 가능하며, 매개 인 터페이스 장치를 통해 인간과 기계간의 직관적이면서도 원활한 의사소통을 가능하게 한다.
발명의 실시를 위한 구체적인 내용
본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시 [0015]
예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 것이며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 하며, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다. 한편, 본 명세서에서 사용된 용어는 실시예들을 설명하기 위한 것이며 본 발명을 제한하고자 하는 것은 아니다. 본 명세서에서, 단수형은 문구에서 특별히 언급하지 않는 한 복수형도 포 함한다. 명세서에서 사용되는 "포함한다(comprises)" 및/또는 "포함하는(comprising)"은 언급된 구성요소, 단계, 동작 및/또는 소자는 하나 이상의 다른 구성요소, 단계, 동작 및/또는 소자의 존재 또는 추가를 배제하지 않는다.
이하에서 첨부한 도면을 참고로 하여 본 발명의 바람직한 실시예를 설명하기로 한다.
[0016]
도 1은 본 발명의 실시예에 따른 한/영 타이프라이터 시스템의 전체 구성을 나타낸다.
[0017]
본 발명의 실시예에 따른 한/영 타이프라이터 시스템은 크게 입력부인 매개 인터페이스 장치(100)와, 문자 인식 [0018]
순서셋(200), 단어를 인식하고 보정하는 부분인 타이프라이터부(300)를 포함하여 이루어진다.
매개 인터페이스 장치(100)와 문자 인식순서셋(200) 및 타이프라이터부(300)는 하나의 장치로 통합된 구성을 갖 [0019]
거나, 둘 이상의 장치로 구성되어 필요한 정보를 상호간에 무선통신 방식으로 송수신할 수 있다.
매개 인터페이스 장치(100)는 사용자가 제스처를 통해 단어를 입력하는 장치로서, 가속도 센서나 적외선 센서를 [0020]
장착한 장갑이나 막대장치 등이 될 수 있다. 매개 인터페이스 장치(100)를 통해 단어가 입력되면, 각 문자의 인 식순서셋(200)을 참조하여 단어에 대한 문자셋을 생성한 다음, 생성된 문자셋이 타이프라이터부(300)로 전달된
다.
각 문자의 인식순서셋(200)은 미리 만들어져 있는 것이 아니라, 매개 인터페이스 장치(100)에서 입력되는 문자 [0021]
에 대한 인식결과들을 인식순서에 따라 동적으로 구성한 것이다. 예를 들면, 매개 인터페이스 장치(100)에서 알 파벳 'A'를 입력했을 때, 문자인식을 통해 이를 'A'로 85% 인식하고, 'H'로 50%, 'N'으로 30% 인식하게 된다면, 결과적으로 입력된 문자는 인식률이 가장 높은 'A'로 인식되게 된다. 이 때, 'A', 'H', 'N'을 문자 인식순서셋 이라고 한다.
매개 인터페이스 장치의 내부오류 및/또는 문자인식에서의 오류로 인해, 의도했던 문자가 다르게 인식되고, 그 [0022]
로 인해 원래 의도한 단어를 전송할 수 없는 경우가 발생하는데, 이러한 문제점을 해결하기 위해 단어조합기 (310)에서 입력된 각 문자의 인식순서셋을 조합하고, 사전연동을 통해 원래 의도하려고 했던 단어를 찾는 과정 을 거치게 된다. 이는 각 문자가 잘못 인식되더라도, 그 문자의 인식순서셋에는 최소한 원래 입력하려고 했던 문자가 있다는 가정을 전제로 하고 있다.
그런데, 단어조합기(310)에서 가능한 모든 경우에 대해 단어를 조합하게 되면, 생성되는 단어의 수가 많아지고, [0023]
그로 인해 메모리 소모 및 시간지연이 발생한다. 이러한 문제를 해결하기 위해, 본 발명의 실시예에 따른 한/영 타이프라이터 시스템에서는 완전한 단어를 이루는 문자들의 누적 셋인 부분단어들로 구성된 부분단어 인덱스 맵 (320)을 만들어 더 이상 조합해도 사전에 있는 단어가 되지 않는 부분단어들을 미리 제거하여 불필요한 단어의 생성을 막는다.
부분단어 인덱스 맵(320)을 통과한 부분단어들(330)은 사전(340)을 통하여 한 번 더 필터링된다. 이 때, 특정한 [0024]
범주의 단어 집합으로 이루어지는 문맥정보(350)를 이용하여, 상황에 맞는 단어들(360)을 찾을 수 있다. 문맥 정보는, 예를 들면 초등학생 수준의 단어집단에서 필요한 단어를 찾는다든지, 공학관련 부분에서 단어를 찾는 등으로 구분하여 필요한 단어를 찾는 작업을 할 수 있게 한다.
이와 같이 하여 최종 검색된 결과들 중에 매개 인터페이스 장치를 통해 입력하려고 했던 단어를 찾아낼 수 있게 [0025]
된다.
도 2는 부분단어 인덱스 맵(320)을 생성하는 과정을 좀 더 상세히 보여주는 도면이다.
[0026]
도 2에 나타난 바와 같이, 우선 사전(340)에서 각각 영어 단어 인덱스 맵(342)과 한글 단어 인덱스 맵(344)을 [0027]
만든다. 영어 단어 인덱스 맵(342)과 한글 단어 인덱스 맵(344)은 완전한 영어 및 한글 단어를 가진다. 다음, 영어 부분단어 인덱스 맵(346) 및 한글 부분단어 인덱스 맵(348)은 영어 단어 인덱스 맵(342)과 한글 단어 인덱 스 맵(344)에서 각각의 단어들을 추출하고, 각 단어들이 이루는 문자들의 누적셋을 이용하여 만들어진다. 예를 들면, 단어 "abc"가 있다고 했을 때, 부분단어들은 "a", "ab", "abc"가 된다. 이렇게 부분단어 인덱스 맵(346, 348)을 생성해 놓으면, 단어조합기(310)에서 단어가 생성될 때마다 비교하여, 더 이상 조합을 하여도 사전단어 가 될 수 없는 부분단어들을 미리 제거할 수 있다. 이와 반대로, 부분단어 인덱스 맵을 이용하지 않고 단순 단 어조합을 한다면, 불필요한 부분단어들이 생성되고, 그로 인해 메모리 소모 및 시간지연이 발생하게 된다.
표 1은 단순 단어조합을 이용해 단어를 검색하는 경우와 부분단어 인덱스 맵을 사용해 단어를 검색하는 경우를 [0028]
비교한 표이다.
표 1
[0029] 예제 단어조합형태 단어조합수(개) 단어조합
시간(ms)
매칭단어수 (개)
사전검색 시간(ms)
소요시간 (ms) [영어]
circumstance
단순단어조합 531441 516 1 955 1471
부분단어 인덱스맵
1 5 1 5 10
[한글]
원숭이
단순단어조합 19683 2239 1 35 2274
부분단어 인덱스맵
1 21 1 5 26
표 1에서는 영어 단어 "circumstance"와 한글 단어 "원숭이"에 대해서 단순 단어조합과 부분단어 인덱스 맵을 [0030]
사용했을 때의 단어조합 수와 소요시간을 비교하고 있다. 영어 단어 "circumstance"는 12개의 문자로 이루어져 있고, 각 문자가 3개의 인식문자셋을 가진다고 했을 때, 단순 단어조합을 했을 경우 생성되는 단어의 수는 3^12
= 531,441개가 되고, 각 단어의 평균길이를 8이라 했을 때, 필요한 메모리는 3^12 * 8 * 1 byte ≒ 33Mbytes가 된다. 531,441개의 부분단어들을 사전검색 하는데 걸리는 시간은 955ms이고, 전체 소요시간은 1471ms가 된다.
이는 부분단어 인덱스 맵을 이용했을 때 걸리는 시간 10ms의 약 140배가 되고, 메모리 소모도 비교할 수 없을 만큼 크게 된다.
도 3은 본 발명의 실시예에 따른 매개 인터페이스 장치를 이용한 문자열 입력 방법의 예를 보여준다.
[0031]
도 3에 나타난 바와 같이, 매개 인터페이스 장치(100)에서 입력하려고 했던 원래의 단어(301) "HOME"이 외부 및 [0032]
내부의 오류로 인해 오인식된 단어(303) "NOMF"로 되었다.
이를 먼저 문자 인식순서셋(200)을 기반으로 단어 조합(310)을 수행하고, 부분단어 인덱스 맵(320)를 사용하여, [0033]
사전단어가 될 수 있는 부분단어들(330)을 필터링한 다음, 이를 다시 사전(340)과 문맥정보(350)을 이용하여 필 터링하면, 최종적으로 문맥에 적합한 단어들(360)을 검색할 수 있다. 여기서 문맥정보(350)는 다양한 범주로 구 분될 수 있는데, 예를 들어 대학생 수준의 단어를 나타내는 문맥정보(352)를 이용하여 단어를 필터링할 수 있다.
본 발명의 실시예에 따른 매개 인터페이스 장치를 이용한 문자열 입력 방법은 컴퓨터로 읽을 수 있는 기록매체 [0034]
에 컴퓨터가 읽을 수 있는 코드로서 구현되는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템 에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매 체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 하드 디스크, 플로피 디스크, 플래쉬 메모리, 광 데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들면 인터넷을 통한 전송)의 형태로 구현되는 것도 포함된다. 또한 컴퓨 터가 읽을 수 있는 기록매체는 컴퓨터 통신망으로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 읽을 수 있 는 코드로서 저장되고 실행될 수 있다.
이상에서 바람직한 실시예를 기준으로 본 발명을 설명하였지만, 본 발명의 한/영 타이프라이터 시스템 및 문자 [0035]
열 입력 방법은 반드시 상술된 실시예에 제한되는 것은 아니며 발명의 요지와 범위로부터 벗어남이 없이 다양한 수정이나 변형을 하는 것이 가능하다. 첨부된 특허청구의 범위는 본 발명의 요지에 속하는 한 이러한 수정이나 변형을 포함할 것이다.
도면의 간단한 설명
도 1은 본 발명의 실시예에 따른 한/영 타이프라이터 시스템의 전체 구성을 나타내는 도면, [0036]
도 2는 본 발명의 실시예에 따른 한/영 타이프라이터 시스템에서 사용되는 부분단어 인덱스 맵의 생성과정과 구 [0037]
조를 나타내는 도면,
도 3은 본 발명의 실시예에 따른 한/영 타이프라이터 시스템을 이용하여 문자열을 입력하는 예를 나타내는 도면 [0038]
이다.
도면 도면1
도면2
도면3