테크브릿지 - (19) 대한민국특허청(KR) (12) 공개특허공보(A)

(1)

(19) 대한민국특허청(KR) (12) 공개특허공보(A)

(11) 공개번호 10-2017-0038223 (43) 공개일자 2017년04월07일 (51) 국제특허분류(Int. Cl.)

G06F 3/16 (2006.01) G10L 13/02 (2006.01) (52) CPC특허분류

G06F 3/16 (2013.01) G10L 13/02 (2013.01)

(21) 출원번호 10-2015-0137278 (22) 출원일자 2015년09월30일 심사청구일자 없음

(71) 출원인

한국전자통신연구원

대전광역시 유성구 가정로 218 (가정동) (72) 발명자

길연희

대전광역시 유성구 배울2로 19, 대덕테크노밸리9 단지아파트 909-1502

유초롱

대전광역시 유성구 지족로 343, 반석마을아파트 이준석

대전광역시 유성구 엑스포로 448, 엑스포아파트 207-1103

(74) 대리인 특허법인지명 전체 청구항 수 : 총 1 항

(54) 발명의 명칭 전자문서 내 표 데이터의 음성 변환 장치 및 방법 (57) 요 약

본 발명은 전자문서 내 표 데이터의 음성 변환 장치 및 방법에 관한 것이다. 본 발명에 따른 장치는 전자문서가 입력되면 입력된 전자문서로부터 표 데이터를 추출하여 헤더 구조 및 셀 구조를 분석하고, 헤더 정보 및 셀 정보 를 추출하는 분석부, 상기 분석부의 헤더 구조 분석 결과에 근거하여 헤더 구조 기반으로 헤더 정보에 대응하는 텍스트를 생성하고, 헤더 정보에 대응하는 텍스트를 기반으로 셀 정보에 대응하는 텍스트를 생성하는 텍스트 생 성부, 및 상기 텍스트 생성부에 의해 생성된 텍스트를 음성 신호로 변환하는 음성 변환부를 포함한다.

대 표 도 - 도1

(2)

명 세 서 청구범위 청구항 1

전자문서가 입력되면 입력된 전자문서로부터 표 데이터를 추출하여 헤더 구조 및 셀 구조를 분석하고, 헤더 정 보 및 셀 정보를 추출하는 분석부;

상기 분석부의 헤더 구조 분석 결과에 근거하여 헤더 구조 기반으로 헤더 정보에 대응하는 텍스트를 생성하고, 헤더 정보에 대응하는 텍스트를 기반으로 셀 정보에 대응하는 텍스트를 생성하는 텍스트 생성부; 및

상기 텍스트 생성부에 의해 생성된 텍스트를 음성 신호로 변환하는 음성 변환부 를 포함하는 것을 특징으로 하는 전자문서 내 표 데이터의 음성 변환 장치.

발명의 설명 기 술 분 야

본 발명은 전자문서 내 표 데이터의 음성 변환 장치 및 방법에 관한 것이다.

[0001]

배 경 기 술

시각장애인은 점자책이나 텍스트 정보를 기반으로 음성을 녹음한 DTB(Digital Talking Book)과 같은 대체자료를 [0002]

통해 도서자료를 접할 수 있다.

하지만, 대체자료는 노동집약적인 제작 과정으로 인해 제작에 이르기까지 많은 시간이 소요되며 비용도 많이 들 [0003]

어 많은 수의 대체자료를 제작하기 어려운 실정이며, 그로 인해 시각장애인의 독서 접근성은 상당히 낮은 수준 이다.

최근, 스마트 기기의 확산으로 인해 전자책이 증가하여 화면에 나타난 텍스트를 음성으로 읽어주는 TTS(Text- [0004]

to-Speech) 기술이 발전하고 있으며, 시각 장애인은 이러한 TTS가 적용된 전자책을 통해 도서에 접근하는 것이 용이해졌다.

그러나, 전자문서에 표 데이터가 포함된 경우 음성 변환은 단순히 셀의 내용을 순차적으로 읽어주는 방식으로 [0005]

수행되기 때문에 출력되기 때문에 표 데이터의 내용을 정확하게 전달할 수 없어, 시각 장애인이 표의 내용을 파 악하는 것은 쉽지 않았다.

선행기술문헌 특허문헌

(특허문헌 0001) 국내공개특허 제10-2014-0019167호 [0006]

발명의 내용 해결하려는 과제

본 발명의 목적은, 디지털화된 전자문서의 표 데이터에 대한 표 구조를 반영하여 음성 신호로 변환하는 전자문 [0007]

서 내 표 데이터의 음성 변환 장치 및 방법을 제공함에 있다.

또한, 본 발명의 다른 목적은, 표 데이터의 헤더 구조를 분석하여 두 개 이상의 헤더가 병합된 구조를 반영하여 [0008]

헤더 정보를 변환하고, 변환된 헤더 정보를 근거로 셀 정보를 변환함으로써 음성을 통해 표 구조를 쉽게 인식할 수 있도록 한 전자문서 내 표 데이터의 음성 변환 장치 및 방법을 제공함에 있다.

(3)

본 발명의 기술적 과제들은 이상에서 언급한 기술적 과제들로 제한되지 않으며, 언급되지 않은 또 다른 기술적 [0009]

과제들은 아래의 기재들로부터 당업자에게 명확하게 이해될 수 있을 것이다.

과제의 해결 수단

상기의 목적을 달성하기 위한 본 발명에 따른 전자문서 내 표 데이터의 음성 변환 장치는, 전자문서가 입력되면 [0010]

입력된 전자문서로부터 표 데이터를 추출하여 헤더 구조 및 셀 구조를 분석하고, 헤더 정보 및 셀 정보를 추출 하는 분석부, 상기 분석부의 헤더 구조 분석 결과에 근거하여 헤더 구조 기반으로 헤더 정보에 대응하는 텍스트 를 생성하고, 헤더 정보에 대응하는 텍스트를 기반으로 셀 정보에 대응하는 텍스트를 생성하는 텍스트 생성부, 및 상기 텍스트 생성부에 의해 생성된 텍스트를 음성 신호로 변환하는 음성 변환부를 포함하는 것을 특징으로 한다.

한편, 상기의 목적을 달성하기 위한 본 발명에 따른 전자문서 내 표 데이터의 음성 변환 방법은, 전자문서가 입 [0011]

력되면 입력된 전자문서로부터 표 데이터를 추출하는 단계, 추출한 표 데이터로부터 헤더 구조 및 셀 구조를 분 석하고, 헤더 정보 및 셀 정보를 추출하는 단계, 헤더 구조 분석 결과에 근거하여 헤더 구조 기반으로 헤더 정 보에 대응하는 텍스트를 생성하는 단계, 헤더 정보에 대응하는 텍스트를 기반으로 셀 정보에 대응하는 텍스트를 생성하는 단계 및 상기 생성된 텍스트를 음성 신호로 변환하는 음성 변환부를 포함하는 것을 특징으로 한다.

발명의 효과

본 발명에 따르면, 전자문서에 포함된 표 데이터의 구조를 분석하고 분석한 구조 정보를 반영하여 변환한 텍스 [0012]

트를 음성으로 출력함으로써 시각장애인 및/또는 책을 읽기 어려운 사용자에게 전자문서에 포함된 표 데이터의 내용을 음성을 통해 쉽게 전달할 수 있는 이점이 있다.

도면의 간단한 설명

도 1은 본 발명에 따른 전자문서 내 표 데이터의 음성 변환 장치의 구성을 도시한 도면이다.

[0013]

도 2 내지 도 5는 본 발명에 따른 전자문서 내 표 데이터의 음성 변환 장치의 동작을 설명하는데 참조되는 실시 예를 도시한 도면이다.

도 6은 본 발명에 따른 전자문서 내 표 데이터의 음성 변환 방법에 대한 동작 흐름을 도시한 도면이다.

도 7은 본 발명에 따른 음성 변환 장치가 적용된 컴퓨팅 시스템의 구성을 도시한 도면이다.

발명을 실시하기 위한 구체적인 내용

이하, 본 발명의 일부 실시예들을 예시적인 도면을 통해 상세하게 설명한다. 각 도면의 구성요소들에 참조부호 [0014]

를 부가함에 있어서, 동일한 구성요소들에 대해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 부호를 가지도록 하고 있음에 유의해야 한다. 또한, 본 발명의 실시예를 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 발명의 실시예에 대한 이해를 방해한다고 판단되는 경우에는 그 상세한 설명은 생략한 다.

본 발명의 실시예의 구성 요소를 설명하는 데 있어서, 제 1, 제 2, A, B, (a), (b) 등의 용어를 사용할 수 [0015]

있다. 이러한 용어는 그 구성 요소를 다른 구성 요소와 구별하기 위한 것일 뿐, 그 용어에 의해 해당 구성 요소 의 본질이나 차례 또는 순서 등이 한정되지 않는다. 또한, 다르게 정의되지 않는 한, 기술적이거나 과학적인 용 어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가진다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들 은 관련 기술의 문맥상 가지는 의미와 일치하는 의미를 가진 것으로 해석되어야 하며, 본 출원에서 명백하게 정 의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.

도 1은 본 발명에 따른 전자문서 내 표 데이터의 음성 변환 장치의 구성을 도시한 도면이다.

[0016]

도 1을 참조하면, 본 발명에 따른 전자문서 내 표 데이터의 음성 변환 장치(이하에서는 '음성 변환 장치'라 칭 [0017]

하도록 한다.)는 제어부(110), 입력부(120), 음성 출력부(130), 저장부(140), 분석부(150), 필터부(160), 텍스 트 생성부(170) 및 음성 변환부(180)를 포함할 수 있다. 여기서, 제어부(110)는 음성 변환 장치의 각 부간에 전 달되는 신호를 처리할 수 있다.

(4)

입력부(120)는 사용자로부터의 제어 명령을 입력받기 위한 수단으로, 음성 변환 장치 외부에 구현되는 키 버튼 [0018]

이 해당 될 수 있으며, 음성 변환 장치의 디스플레이 상에 구현되는 소프트 키가 해당 될 수도 있다. 또한, 입 력부(120)는 마우스, 조이스틱, 조그 셔틀, 스타일러스 펜과 같은 형태의 입력 수단일 수도 있다.

음성 출력부(130)는 음성 변환 장치의 동작 상태 및 음성 변환 결과로 생성된 음성 데이터를 음성으로서 출력하 [0019]

는 스피커를 포함할 수 있다.

저장부(140)는 음성 변환 장치가 동작하는데 필요한 데이터와 프로그램 등을 저장할 수 있다. 저장부(140)는 음 [0020]

성 변환의 대상이 되는 전자문서가 저장될 수도 있다.

또한, 저장부(140)는 음성 변환 장치의 동작을 위한 설정값이 저장될 수 있다. 일 예로서, 저장부(140)는 입력 [0021]

된 전자문서 내에서 표 데이터를 추출하기 위한 동작 조건이 저장될 수 있으며, 표 데이터의 문자를 음성으로 변환하기 위한 동작 조건이 저장될 수 있다. 또한, 저장부(140)는 기 저장된 동작 조건에 따라 전자문서 내 표 데이터의 문자를 음성으로 변환하기 위한 알고리즘이 저장될 수도 있다.

여기서, 저장부(140)는 플래시 메모리 타입(Flash Memory Type), 하드 디스크 타입(Hard Disk Type), 멀티미디 [0022]

어 카드 마이크로 타입(Multimedia Card Micro Type), 카드 타입의 메모리(예를 들면, SD 또는 XD 메모리 등), 자기 메모리, 자기 디스크, 광디스크, 램(Random Access Memory, RAM), SRAM(Static Random Access Memory), 롬(Read-Only Memory, ROM), PROM(Programmable Read-Only Memory), EEPROM(Electrically Erasable Programmable Read-Only Memory) 중 적어도 하나의 저장매체를 포함할 수 있다.

분석부(150)는 음성 변환을 위해 선택된 전자문서가 입력되면, 입력된 전자문서를 분석하여 해당 전자문서로부 [0023]

터 표 데이터를 추출하도록 한다.

또한, 분석부(150)는 전자문서로부터 추출한 표 데이터의 표 구조를 분석하도록 한다. 이때, 분석부(150)는 표 [0024]

데이터를 헤더와 셀로 구분하여, 헤더 구조 및 셀 구조를 분석하도록 한다. 여기서, 분석부(150)는 헤더 및/또 는 셀이 싱글 구조를 갖는지 혹은 병합 구조를 갖는지를 분석할 수 있다.

분석부(150)는 표 데이터의 헤더 및 셀에 포함된 정보를 추출할 수 있다.

[0025]

일 예로, 분석부(150)는 전자문서의 HTML 태그 정보를 분석하고 HTML 태그에서 <table> 태그 또는 </table> 태 [0026]

그로부터 표 데이터를 추출할 수 있다. 이때, 분석부(150)는 표 데이터의 HTML 태그에서 <th> 태그 또는 </th>

태그를 헤더로 인식하고, <td> 태그 또는 </td> 태그를 셀로 인식하여 해당 정보를 추출하고, 추출된 정보로부 터 헤더 구조 및 셀 구조를 분석할 수 있다. 일 예로, <th> 태그 또는 </th> 태그는 표 데이터의 항목 정보를 정의할 수 있으며, <td> 태그 또는 </td> 태그는 각 항목에 포함된 데이터 정보를 정의할 수 있다.

또한, 분석부(150)는 <a href> 태그 또는 </a href> 태그를 해당 헤더 또는 셀에 대한 부가 정보로 인식하여 추 [0027]

출할 수 있다. 일 예로, <a href> 태그 또는 </a href> 태그는 헤더 또는 셀 정보 대한 하이퍼링크, 단위 정보 등을 정의할 수 있다.

한편, 분석부(150)는 표 데이터의 HTML 태그에서 <style> 태그 또는 </style> 태그를 디자인 또는 스타일과 관 [0028]

련된 정보로 인식하여 추출할 수도 있다. 일 예로, <style> 태그 또는 </style> 태그는 폰트 타입, 폰트 크기, 정렬 타입 등을 정의할 수 있다.

이때, 분석부(150)는 표 데이터의 구조 분석 결과 및 추출된 정보를 필터부(160) 및/또는 텍스트 생성부(170)로 [0029]

전달할 수 있다.

여기서, 표 데이터로부터 추출된 <style> 태그 또는 </style> 태그와 같이 디자인 또는 스타일과 관련된 정보 [0030]

는 필터부(160)에 의해 표 데이터에서 제거된 후에 텍스트 생성부(170)로 전달될 수 있다.

전자문서에 포함된 표 데이터의 실시예는 도 2와 같이 나타낼 수 있으며, 도 2에 도시된 표 데이터에 대한 HTML [0031]

태그는 도 3과 같이 나타낼 수 있다.

전자문서에서 추출된 표 데이터는 도 2에 도시된 바와 같이 행에 해당하는 헤더(210) 및 열에 해당하는 헤더 [0032]

(220)를 포함할 수 있으며, 각 헤더에 대응하는 셀(230)을 포함할 수 있다.

도 2의 표 데이터에서 행에 해당하는 헤더(210)는 도 3의 도면부호 310과 같이 HTML 태그로 표현될 수 있다. 이 [0033]

때, 분석부(150)는 도면부호 310에 해당하는 HTML 태그 중 <th> 태그에 대응하는 행 헤더 정보, 즉, "Model",

"Launch", "Code name", "Bus interface", Core clock", 'Memory clock", "Core config", Fillrate",

(5)

"Memory", 'MOperations/s", "MPixels/s", "MVertices/s", "Size","Bandwidth", "Bus type", "Bus width"를 추출할 수 있다. 또한, 분석부(150)는 도면부호 310에 해당하는 HTML 태그 중 <th> 태그 엘리먼트 내의

"rowspan=" "colspan=" 속성정보를 통해 행 헤더의 병합 구조 정보를 획득할 수 있다.

도 2의 표 데이터에서 열에 해당하는 헤더(220)는 도 3의 도면부호 320과 같이 HTML 태그로 표현될 수 있다. 이 [0034]

때, 분석부(150)는 도면부호 320에 해당하는 HTML 태그 중 <th> 태그에 대응하는 열 헤더 정보, 즉, "GeForce3 Ti200", "GeForce3", "GeForce3 Ti500"를 추출할 수 있다.

도 2의 표 데이터에서 각 헤더에 대응하는 셀(230)은 도 3의 도면부호 330과 같이 HTML 태그로 표현될 수 있다.

[0035]

이때, 분석부(150)는 도면부호 330에 해당하는 HTML 태그 중 <td> 태그에 대응하는 셀 정보를 추출할 수 있다.

일 예로, 분석부(150)는 열 헤더 "GeForce3 Ti200"을 기준으로 각 행 헤더 "Model", "Launch", "Code name", [0036]

"Bus interface", "Core clock", "Memory clock", "Core config", "Fillrate", "Memory", "MOperations/s",

"MPixels/s", "MVertices/s", "Size", "Bandwidth", "Bus type", "Bus width"에 대응하는 셀 정보 "October 1, 2001", "NV20", AGP 4x PCI", "175", "400". "4:1:8:4", "700", "700", "1400", "42.75", "64/128",

"6.4", "DDR", "123"를 추출할 수 있다.

여기서, 필터부(160)는 디자인 및 스타일 요소가 텍스트로 변환되는 것을 방지하기 위해, 도 3에 도시된 HTML [0037]

태그 중 733 열에서 <table class> 태그 엘리먼트 내의 "style=" 속성정보(341)를 제거할 수 있다. 또한, 필터 부(160)는 도 3에 도시된 HTML 태그 중 756 열에서 <td> 태그 엘리먼트 내의 "style=" 속성정보(345)를 제거할 수 있다.

텍스트 생성부(170)는 표 데이터를 음성으로 변환하기 위한 텍스트 데이터를 생성하는 역할을 한다.

[0038]

먼저, 텍스트 생성부(170)는 분석부(150)에 의해 분석된 표 데이터의 헤더 구조와 추출한 헤더 정보를 [0039]

이용하여, 헤더에 대응하는 텍스트를 생성하도록 한다. 이때, 텍스트 생성부(170)는 분석부(150)로부터 전달된 헤더의 병합 구조 정보를 참고하여 텍스트를 생성할 수 있다.

텍스트 생성부(170)에서 헤더 정보를 텍스트로 변환하는 동작은 도 4의 실시예를 참조하도록 한다.

[0040]

도 4를 참조하면, (a)에 도시된 표 데이터의 경우 'Fillrate'는 'MOperations/s' 및 'MPixels/s'와 병합 구조 [0041]

를 가지며, 'Memory'는 'Size(MB)' 및 'Bandwidth(GB/s)'와 병합 구조를 갖는 것을 확인할 수 있다.

이에, 텍스트 생성부(170)는 도 4의 (a)에 도시된 표 데이터에서 도면부호 410에 도시된 'MOperations/s' 및 [0042]

'MPixels/s'에 대응하여 (b)에 도시된 도면부호 415와 같이 변환된 텍스트를 생성할 수 있다.

다시 말해, 텍스트 생성부(170)는 'Fillrate'와 'MOperations/s'의 병합 구조에 따라 'MOperations/s'에 대해 [0043]

"Fillrate의 MOperations/s"와 같은 텍스트로 변환하도록 한다. 마찬가지로, 텍스트 생성부(170)는 'Fillrat e'와 'MPixels/s'의 병합 구조에 따라 'MPixels/s'에 대해 "Fillrate의 MPixels/s"와 같은 텍스트로 변환하도 록 한다.

또한, 텍스트 생성부(170)는 도 4의 (a)에 도시된 표 데이터에서 도면부호 420에 도시된 'Size(MB)' 및 [0044]

'Bandwidth(GB/s)'에 대응하여 (b)에 도시된 도면부호 425와 같이 변환된 텍스트를 생성할 수 있다.

다시 말해, 텍스트 생성부(170)는 'Memory'와 'Size(MB)'의 병합 구조에 따라 'Size(MB)'에 대해 "Memory의 [0045]

Size(MB)"와 같은 텍스트로 변환하도록 한다. 마찬가지로, 텍스트 생성부(170)는 'Memory'와 'Bandwidth(GB/s)'의 병합 구조에 따라 'Bandwidth(GB/s)'에 대해 "Memory의 Bandwidth(GB/s)"와 같은 텍스트 로 변환하도록 한다.

이후, 텍스트 생성부(170)는 분석부(150)에 의해 분석된 표 데이터의 셀 구조와 추출한 셀 정보를 이용하여, 셀 [0046]

에 대응하는 텍스트를 생성하도록 한다.

텍스트 생성부(170)에서 셀 정보를 텍스트로 변환하는 동작은 도 5의 실시예를 참조하도록 한다.

[0047]

도 5를 참조하면, (a)에 도시된 표 데이터에서 열 헤더 'GeForce3 Ti200'을 기준으로 각 행 헤더 "Launch", [0048]

"Fillrate", "Memory", "MOperations/s", "MPixels/s", "Size(MB)" 및 "Bandwidth(GB/s)"에 대응하는 셀 정보 는 도면부호 510에 표시된 정보, 즉, "October 1, 2001", "700", "700", "64/128", "6.4"와 같다.

이때, 텍스트 생성부(170)는 열 헤더의 텍스트 정보와 도 4에서 변환된 행 헤더의 텍스트 정보에 근거하여 (b) [0049]

에 도시된 도면부호 520과 같이 셀 정보에 대한 텍스트를 생성하도록 한다.

(6)

다시 말해, 텍스트 생성부(170)는 싱글 구조를 갖는 헤더 'GeForce3 Ti200'와 'Launch'에 대응하는 셀 정보 [0050]

'October 1, 2001'에 대해 "GeForce3 Ti200 Launch는 October 1, 2001"와 같은 텍스트로 변환하도록 한다.

한편, 텍스트 생성부(170)는 병합 구조를 갖는 헤더 'GeForce3 Ti200'와 'Fillrate의 MOperations/s'에 대응하 [0051]

는 셀 정보 '700'에 대해 "GeForce3 Ti200 Fillrate의 MOperations/s는 700"과 같은 텍스트로 변환하도록 한다. 또한, 텍스트 생성부(170)는 병합 구조를 갖는 헤더 'GeForce3 Ti200'와 'Fillrate의 MPixels/s'에 대응 하는 셀 정보 '700'에 대해 "GeForce3 Ti200 Fillrate의 MPixels/s는 700"과 같은 텍스트로 변환하도록 한다.

마찬가지로, 텍스트 생성부(170)는 병합 구조를 갖는 헤더 'GeForce3 Ti200'와 'Memory의 Size(MB)'에 대응하 [0052]

는 셀 정보 '64/128'에 대해 "GeForce3 Ti200 Memory의 Size(MB)는 64 및 128"과 같은 텍스트로 변환하도록 한 다. 또한, 텍스트 생성부(170)는 병합 구조를 갖는 헤더 'GeForce3 Ti200'와 'Memory의 Bandwidth(GB/s)'에 대 응하는 셀 정보 '6.4'에 대해 "GeForce3 Ti200 Memory의 Bandwidth(GB/s)는 6.4"과 같은 텍스트로 변환하도록 한다.

이와 같이, 텍스트 생성부(170)에 의해 변환된 텍스트, 예를 들어, "GeForce3 Ti200 Fillrate의 MOperations/s [0053]

는 700"는 표 데이터의 헤더 정보 및 셀 정보, 그리고 헤더의 병합 구조를 모두 포함하게 된다.

텍스트 생성부(170)에 의해 변환된 텍스트는 실시간으로 음성 변환부(180)로 전달될 수 있으며, 저장부(140)에 [0054]

저장되고 텍스트 변환이 완료된 후에 음성 변환부(180)로 전달될 수도 있다.

이에, 음성 변환부(180)는 텍스트 생성부(170)에 의해 생성된 텍스트를 TTS(Text-To-Speech) 방식을 이용하여 [0055]

음성 신호로 변환하도록 한다. 음성 변환부(180)에 의해 변환된 음성 신호는 제어부(110)에 의해 음성 출력부 (130)로 출력될 수 있다.

따라서, 텍스트를 읽은 수 없는 사용자는 음성 출력부(130)를 통해 출력된 음성 신호로부터 표 데이터를 쉽게 [0056]

인지하는 것이 가능하게 된다.

상기와 같이 구성되는 본 발명에 따른 제어 장치의 동작 흐름을 보다 상세히 설명하면 다음과 같다.

[0057]

도 6은 본 발명에 따른 전자문서 내 표 데이터의 음성 변환 방법에 대한 동작 흐름을 도시한 도면이다.

[0058]

도 6을 참조하면, 음성 변환 장치는 전자문서가 입력되면(S110), 입력된 전자문서로부터 표 데이터를 추출하도 [0059]

록 한다(S120). 이때, 음성 변환 장치는 전자문서의 HTML 태그 중 <table> 태그 또는 </table> 태그를 통해 전 자문서 내에 포함된 표 데이터를 인식하여 추출할 수 있다.

음성 변환 장치는 추출한 표 데이터의 표 구조, 예를 들어, 헤더 구조 및 셀 구조를 분석하도록 한다(S130). 이 [0060]

때, 음성 변환 장치는 표 데이터의 명확한 의미 전달을 위해 음성 변환을 위한 텍스트를 생성하기 이전에 디자 인 및 스타일 요소를 필터링할 수 있다(S140).

이후, 음성 변환 장치는 표 데이터의 헤더 정보 및 셀 정보에 대응하는 텍스트를 생성하도록 한다. 여기서, 음 [0061]

성 변환 장치는 헤더의 병합 구조를 반영하여 헤더 정보에 대응하는 텍스트, 즉, 헤더 콘텐츠 텍스트를 먼저 생 성하고(S150), 이후 헤더 콘텐츠 텍스트에 기반하여 셀 정보에 대응하는 텍스트, 즉, 셀 콘텐츠 텍스트를 생성 하도록 한다(S160).

음성 변환 장치는 헤더 콘텐츠 텍스트에 기반하여 생성한 셀 콘텐츠 텍스트에 대해 TTS 변환을 수행하고(S170), [0062]

'S170' 과정의 결과로 생성한 음성 신호를 외부로 출력하도록 한다(S180).

상기에서와 같이 동작하는 본 실시예에 따른 음성 변환 장치는 독립적인 하드웨어 장치 형태로 구현될 수 있으 [0063]

며, 음성 변환 장치의 분석부(150), 필터부(160), 텍스트 생성부(170) 및 음성 변환부(180)는 프로세서로서 구 현될 수 있다. 한편, 본 실시예에 따른 음성 변환 장치는 적어도 하나 이상의 프로세서(processor)로서 마이크 로 프로세서나 범용 컴퓨터 시스템과 같은 다른 하드웨어 장치에 포함된 형태로 구동될 수 있다.

도 7은 본 발명에 따른 음성 변환 장치가 적용된 컴퓨팅 시스템을 도시한 도면이다.

[0064]

도 7을 참조하면, 컴퓨팅 시스템(1000)은 버스(1200)를 통해 연결되는 적어도 하나의 프로세서(1100), 메모리 [0065]

(1300), 사용자 인터페이스 입력 장치(1400), 사용자 인터페이스 출력 장치(1500), 스토리지(1600), 및 네트워 크 인터페이스(1700)를 포함할 수 있다.

프로세서(1100)는 중앙 처리 장치(CPU) 또는 메모리(1300) 및/또는 스토리지(1600)에 저장된 명령어들에 대한 [0066]

처리를 실행하는 반도체 장치일 수 있다. 메모리(1300) 및 스토리지(1600)는 다양한 종류의 휘발성 또는 불휘발

(7)

성 저장 매체를 포함할 수 있다. 예를 들어, 메모리(1300)는 ROM(Read Only Memory) 및 RAM(Random Access Memory)을 포함할 수 있다.

따라서, 본 명세서에 개시된 실시예들과 관련하여 설명된 방법 또는 알고리즘의 단계는 프로세서(1100)에 의해 [0067]

실행되는 하드웨어, 소프트웨어 모듈, 또는 그 2 개의 결합으로 직접 구현될 수 있다. 소프트웨어 모듈은 RAM 메모리, 플래시 메모리, ROM 메모리, EPROM 메모리, EEPROM 메모리, 레지스터, 하드 디스크, 착탈형 디스크, CD-ROM과 같은 저장 매체(즉, 메모리(1300) 및/또는 스토리지(1600))에 상주할 수도 있다. 예시적인 저장 매체 는 프로세서(1100)에 커플링되며, 그 프로세서(1100)는 저장 매체로부터 정보를 판독할 수 있고 저장 매체에 정 보를 기입할 수 있다. 다른 방법으로, 저장 매체는 프로세서(1100)와 일체형일 수도 있다. 프로세서 및 저장 매 체는 주문형 집적회로(ASIC) 내에 상주할 수도 있다. ASIC는 사용자 단말기 내에 상주할 수도 있다. 다른 방법 으로, 프로세서 및 저장 매체는 사용자 단말기 내에 개별 컴포넌트로서 상주할 수도 있다.

이상의 설명은 본 발명의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 발명이 속하는 기술 분야에 [0068]

서 통상의 지식을 가진 자라면 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가 능할 것이다.

따라서, 본 발명에 개시된 실시예들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 [0069]

것이고, 이러한 실시예에 의하여 본 발명의 기술 사상의 범위가 한정되는 것은 아니다. 본 발명의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리범위 에 포함되는 것으로 해석되어야 할 것이다.

부호의 설명

110: 제어부 120: 입력부 [0070]

130: 음성 출력부 140: 저장부 150: 분석부 160: 필터부

170: 텍스트 생성부 180: 음성 변환부

도면 도면1

(8)

도면2

도면3

(9)

도면4

(10)

도면5

(11)

도면6

(12)

도면7