• 검색 결과가 없습니다.

II. XML의 이론적 배경과 기반 기술

2. VoiceXML의 개요

이런 특성은 종종 IVR(Interactive Voice Response)라고 불리며 이미 텔레뱅 킹이나 고객지원서비스에서 유용하게 사용되고 있다. 이 기능의 애플리케이 션을 개발하기 위해서는 지금까지는 상당히 전문적인 지식과 장비가 필요했 는데 바로 VoiceXML은 그런 종류의 애플리케이션의 제작을 빠르고 손쉽게 해주어 그 분야의 전문개발자가 아닌 사람도 다룰 수 있게 해주고 있다.11)

VoiceXML은 음성인식기술과도 깊은 관련이 있다. 음성인식이란 간단히 11) Eve Astrid Adnersson, Stephen Breitenbach, Tyler Burd, Nirmal Chidambaram, Paul Houle, Daniel Newsome, Xiaofei Tang, Xiaolan Zhu저, 강유, 김동준 역, “VoiceXML”, 에이콘, 2002.

말해서 음성신호를 컴퓨터를 이용하여 음성의 특징 parameter를 추출하여 컴 퓨터로 하여금 인지하도록 하는 것이다. 우리가 컴퓨터를 사용할 때 불편한 점 중 하나는 명령을 키보드로 입력하는 것이다. graphic interface의 발달로 마우스와 키보드를 병용함으로써 편의성이 많이 개선되었으나 지구상에서 가 장 오래되고 많이 사용하는 사람끼리의 대화에 비하면 아직 불편하기 그지없 다. 음성인식기술은 이러한 human interface를 편리하고 자연스럽도록 개선 시켜 줄 핵심기술 중 하나이다.12)

가. VoiceXML의 정의

VoiceXML은 차세대 인터넷 문서 규격인 XML(eXtened Markup Language)에서 파생되어 음성과 관련된 부분을 별도로 지원하기 위하여 발 표된 규약이다. VoiceXML 문서는 정보제공자가 자기 마음대로 새로운 태그 세트와 속성을 정의할 수 있으며, HTML이 지원하지 않는 객체 지향적 구조 혹은 데이타베이스 스키마의 구성을 위해 필요한 여러 번의 중첩을 허용하고 있으므로 MS(Microsoft), 오라클, SUN 등의 대형 업체에서 지원을 강화하고 있는 추세이다.13)

나. VoiceXML의 출현 배경

IBM, Motorola, AT&T와 같은 대형 IT 및 통신사들은 수년동안 텔레포니 와 인터넷의 기술을 통합하는 쪽으로 방향을 잡아가고 있었다. 이러한 목표 를 이루는 과정에서 VoxML, speechML 그리고 PhoneML(PML)과 같은 Markup Language를 만들어 냈다. 이들 업체들은 다시 VoiceXML 포럼 (http://www.voicexml.org)이란 조직을 만들면서 Voice XML 1.0 표준을 만

12) 전남대학교 신호처리 실험실, “Automatic speech recognation", http://dsp.chonnam.ac.kr

13) 삼보정보통신, "VXML", http://www.tgicc.com

들어 W3C에 2000년 3월 제출해 5월에 인정을 받았으며 2001년 11월에는 Voice XML 2.0을 제출하였다. W3C 내에서는 W3C Voice Browser Working Group (http://www.w3.org/Voice)에서 VoiceXML에 관한 사항들 을 담당하고 있다.14)15)

다. XML에 기반한 VoiceXML

VoiceXML은 XML에서 파생된 기술로서 XML 표준을 사용하기 때문에 플 랫폼에 자유롭고 확장성이 우수한 장점을 가지고 있다. VoiceXML 문서 작 성을 위해서 만들어진 전용 편집기가 많이 있지만 어떤 종류의 편집기로도 소스 코드를 쉽게 작성할 수 있다.

VoiceXML 역시 XML에 기반한 기술이기 때문에 XML기반 자료를 XSLT(Extensible Stylesheet Language for Transformation)를 이용해 VoiceXML 문서로 변환할 수 있다. 이것은 VoiceXML의 커다란 장점이다.

하나의 원본 XML 자료를 XSLT를 이용해 원하는 자료포맷(WAP, HTML, VoiceXML)으로 변환할 수 있기 때문에 voice Portal 구축시 유지보수 측면에 서 유리하다. 이 경우 XML을 위한 웹 인프라가 이미 구축되어 있으므로 인 터넷의 발전과 같이해온 웹 관련 기술들을 대부분 사용할 수 있다.16)

14) 에이블컴 기술연구소, “VoiceXML 개요”, 2001 15) VoiceXML Forum, "http://www.voicexml.org"

16) 에이블컴 기술연구소, “VoiceXML 개요”, 2001

[그림 2] XML 자료의 변환

자료출처 : Yamada yoshihiro, “바로 활용하는 XML 예제 활용집”, 영진닷컴, 2002.

라. VoiceXML 해석기 구현 현황

VoiceXML 문서를 음성으로 출력시키거나 음성을 인식하여 VoiceXML 문 서로 만들기 위해서는 음성 인식이 가능한 Gateway가 필요한데 이를 VoiceXML Gateway라고 한다.

사용자는 유무선 전화를 통해 VoiceXML Gateway에 접속한다. 사용자가 음성 또는 전화기 버튼을 눌러 입력하면 VoiceXML Gateway에서 인식하여 웹서버로 보내주게 된다. 웹 서버에서는 필요에 의하여 DB 검색 등을 수행 하여 동적으로 VoiceXML 문서를 생성하여 VoiceXML Gateway에 보내줄 수 도 있다.

VoiceXML 애플리케이션을 개발하기 위해서는 이와 같이 VoiceXML Gateway가 필수적으로 요구된다. VoiceXML Gateway를 직접 설치할 수도 있으나 고가의 장비이므로 국내외 사이트에서 제공하는 서비스를 이용할 수

도 있다.

[그림 3] VoiceXML 인터페이스 구조

자료출처 : 와이더덴닷컴(http://www.widerthan.com)

VoiceXML 개발자들이 VoiceXML 문서를 개발하고 테스트할 수 있는 환경 을 제공하는 대표적인 웹사이트들은 [표 4]와 같다.

구 분 사이트명 사이트주소

국외

Be Vocal Café http://cafe.bevocal.com IBM WebSphere Voice Server

SDK http://222-4.ibm.com

Motorola Mobile Application

Developer's Kit http://developers.motorola.com Tellme.Studio http://studio.tellme.com VoiceGenie Developer Workshop http://developer.voicegenie.com

Nuance VBuilder Desktop GUI Developer's Tool

http://www.nuance.com/products/v builder.htm

국내

㈜와이더덴닷컴 VXGate 개발자

커넥션 http://voicexml.widerthan.com

한국전산원 http://vxml.nca.or.kr

[표 4] VoiceXML 개발자용 사이트

자료출처 : 와이더덴닷컴(http://vxml.widerthan.com)

이 가운데 ㈜와이더덴닷컴의 VXGate 개발자 커넥션 사이트는 개발자가 만

* Internet Appliance와의 밀접한 결합

[표 5] VoiceXML의 주요 활용 분야

자료출처 : 쌍용정보통신, "음성인식과 내추럴 스피킹 기술", http://itclub.sicc.co.kr/message/1215message.htm