• 검색 결과가 없습니다.

Automatic Speech Recognition Research at Fujitsu

N/A
N/A
Protected

Academic year: 2021

Share "Automatic Speech Recognition Research at Fujitsu"

Copied!
10
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

S2

후지쯔에 있어서의 음성 자동인식의 현상과 장래

Automatic Speech Recognition Research at Fujitsu

나라 야스히로f 기부라 신타扌 김 경 호*

*富上通究所

(Yasuhiro Nara, Shinta Kimura, K. H. Loken-Kim)

본 논무에서는, 후지쯔의 음성 자농인식 관련 제품 개발의 역사, 현채의 상품, 二L 리고 앞으로의 연구 개발에 대해 서 上개한다. 현재는 단어로 부티 12,000단어를 인식하는 특정 호}자형의 F2360, 17단어를 인식하는 불특정 호}자 형의 b'2355 L/S를 판매하고 있으녀, 앞으로의 연구 개발로는 음소 변형예 적극적으로 대처하고, 자연적인 발성을 인식하기 위한 기초 기술을 개발할 계획에 있다. 인식할 단어의 문자 표기에 음향 segment 변형 규칙을 적용하여 음향 segment network블 자몽 생성하여서 입력 음성과의 조합을 행한다. 이 기초 기술을 대어휘 단어 음성 인식에 응용하기 위해서 필요한 단어 후보 선택 방식, 문절 발성을 문장 입력에 응용하기 위한 문절 후보 생성 방식과 분 검사 방식에 대해서도 시술한다.

ABSTRACTS

The history of automatic speech recognition research, and current and future speech products at Fujitsu are introd - uced here. The speech recognition research at Fujitsstarted in 1970. Ourresearch efforts have resulted inthe prod­ uction of a speaker dependent 12,000 word discrete / connected word recognizerF2360), and a speaker independent 17 word discrete word rcognizer(F2355L / S). Currently, we are working on a larger vocabulary speech recognizer, in which an input utterance will be matched with networks representing possible phonemic variations. Its application to text input is also discussed.

I.서 론

당사(후지즈?는 일본 만국박람회 1970년)에 특정 하자 7단어 음성 인식 장치의 응용시스템을 공개

°한 이래, 음성 자동 인식의 연구개발을 하여 왔다.

1980년에는 단음절 이산 발성의 음성 인식 장치를 시작(試作)⑵하였지만, 입력 속도가 느리고 발성이 부자연스러워 보급되지는 못하였다.

1983년예는 불특정 화자 17단어의 이산 단어 인식 기능을 개발하고, 전화기를 단말로 한 온라인시스템 에 이미 개발된 F2353를 부가하여서 F2355로 상품 화하였다. 본 제품은 그 후에도 기능을 강화하였고, 현재는 F2355L/S(다음 장 참조)로 판매하고 있 다.

(2)

xl% o ] <

83 특성 화사의 난어 이식 상치는 256단어의 깃을

EX4넌에 늘}# 아은{나■. 몬 삼지익 .느 징- *-섯 아성 J yiPAROCOR 稱 ■"니i 瞬 -■■: 합 싱 弟 w,쳐 가 지 고 으 선 니; 하 시 八 曰】 음 吁 선 훈、 .土 있 드 弓 •히 점이다 본 제품을 개 량하고, 가격을 으¥ 1 / io. 성능 을 약 10배로 한 것이 나음 절에서 설멍하-" F23 )이다.

단음설 발성의 음성 인 식 장치 을 시 작(試作-:) 한 후, 문장 입력에는 무절로 부터 분정도의 발성 난위 의 음성 인식 장치가 핌요하다고 하는 깃을 가하 였다. 문절 또는 문이 라고 하는. 소위 언속 음성에는 각종 다양한 음소 변형이 호한되다. 예늘 들먼 二림 1은 단순한 음소 변형의 예生시 모음의 날낙(早싱 화)을 보여주고 있지만, 이 섯 이외에」「一 이음화. 중성 호}, 구개화를 비롯한 다양한 변형이 포함된다. 여기 서 우리 는 3장에 설명뇔 깃」斗 같은 음소 변형 을 예측하고, 음소 년형에 적극적으로 대처하는 방식을 개발하고 있다.

IL 현재의 제품

2. i F236VCU广 y* a 7'7 r

* J、八八丿、, '■ ■5*- ...T T 't ' e

vuajj iiiiininedC1U11 Olill ) tr 음」公 에 의한 대화시스템을 子축하기 위한 장치로서 설계

안 섯 이 고, 음성 인 식 기 능에 1하여, 음성 축적

그림 2. F?;"의 외관

그림 1. 난순한 음生 변형의 예

(3)

84 韓國音響學會誌101(1991) 재 솅 기 * 삿세 하였。一며, Optior리- 寸칙 음성

합 성 史 〃 늘£ 제 M하고 있 니. 음 성 인 식 으里는 4 ,()()()난이 ioption으& 12,()()()단어)으」 인식이 가능하

5L. 이산 발성 mode와 연속 발싱 mode를 갖추고 있다. 장치 외관을 -2에 나타내었다.

본 장치■” GPIB interface를 경유하여 서 person^il compuBr등의 host computer외- 저속하게 뇌이 있

F, 음싱 template와 축적 읍성 data의 고속 전송이 가능하 깃 외에 1개의 interface port!5대끼-지으」

VCU를 접속하는 것이 가능하다. 이러한 특징과 무신 기 -7■나 회 선 제 어 상치등의 option에 의 해 다양 application 시△텐을 성 할 수 있도록 되 어 있다 (그림 3).

2.2. F2355L/S⑶

F2355L/S는 공중전화망과 hostcomputer 사이 에 서, host내의 음성처 리 support package의 제어에

의 해 dial 전화기와 pushphone-g단말로 하는 대화 처리를 할 수 있고, 음성 인식 기능은 불특정 화자 17단어의 이산 단어 인식이며,0~9의 열개의 숫자와

「예」,「아니오」등 7종의 제어어를 인식할 수 있다 F2355host interface가 두 개이며, 최대 32개의 전화회선을 support하고, F2355host interface 한 개이며, 최대 8회선을 support하는 model이다.

H1. 앞으로의 연구개발

3.1. 음소 변형에 대처한 음성 인식 방식"⑵ 1장에서 서술한 것과 같은 음소 변형에 적극적 으로 대처하기 위해, 음소 변형 현상을 생성 음운론 으로 사용하고 있는 문맥 의존형 규칙의 형식을 사용하여서 표현하는 것을 시도하였다⑹ 1,000단어 X10명의 음성 data에 포함되는 음소 변형을 317 개의 규칙으로 기술하여, 36명(여성 6명을 포함)의

⑵ 6。음성입출력장치 (VCU)

— 시스넴의 확광에 대응하는 하드웨어 一

호스트 췅游터

))))))))))

무선기 (고귕 국)

건파법개정에 대응한 무선기의 日공 무선기告 활을한 다양한 작업넝랰레 4 GP I B

언터게이수에 외한 박수대里到 하장

회선刈어장치■ 사응한 건화및 비플 겅보처리 단말로 할응

회신제어장치

VCU F2361B

\

취에인식어수 4.000 o 12.000

이삭어수화창 기구의 후가

무선기 (이동국)

그림 3. F2360에 의한 시스템 구성 예

(4)

소- 시 (-;J ol <1 " 서 사농5 I싱 冲 85

그림 4. F2355" S의 子싱

그림 6. 음소 변형 발음의 이음

N' — M' / ( M. B, P)

모음익 장음화

E. I. T (E, I. E2)

그림 7. 음향 segment • network으】 예

음성 data로 이 것을 평가한 결과, 평 가 data에 출현 하는 음소 변형중 97.6%cover할 수 있는 것을 학이하였다⑻

칙의 기술법

나읍어L 이들 규칙을 음성 인식에 이용하기 우「한 빗비을 고안하영다 인식할 단어 의 사나(力) 표기 를 음소 변형 을 함하지 않는 발성의 음향 segment 계일로 변환한 뒤, 음소 변형 규칙을 적용하고,가능 한 변형을 주가하여 서 n어:work로 하였다"以⑵. 인식 할 전 단어의 network를 준비하여, 입력 음성고卜 netw- ork 와의 matching 및 거 리 계산을 하고' 최소 거 리의 category를 인식 결과로 한다 matching으로는 음향 segment길이 규■칙을 병용한다. 이것은 network의각 node인 음향 segment의 지속 시 간의 평균치와 표준

(5)

86 韓國音響學會誌101(1991

成心" 미너』(語頭). 발사문데(語中), 말普(語末)

Q..K 분하여 시 기 술한 것 이 다.

3.2. 음소 상세 식별爵瑯

321. 음성 현 상 동기(同期) 방식

윽싱 인식을 위한 음성 분석의 종래 방식으로는 음성 현상과는 무관계한 등간적의 분석주기(예를 들면 5ms로. 분석하였다. 따라서, 예를 들면 파열 자음의 파열 시 점과 분석창과의 위치 관계 가 농기 하 지 않고, 분석창의 중심으로 되기도 하고 가장자리가 되기도 하는 섯이 불안정하게 일어났다(그림 8).

극단적인 예로는, 녹음 tape에 녹음된 음성을 되풀이 이식하면 옳게 인식하기도 하고 잘못 인식하기도

그림 8. 종래의 비동기 분석섬

그림 9. 자음부 시(時) 계열의 특징 추출법

하는 것이 부규칙하게 발생하였다.

우리는 음성 인식 중에서도 특별히 정밀도가 요구 되는 유-사 사음간의 식별에는 음성 현상에 동기한 분석을 하여야 한다고 생각하여 파열자음① T9:

(鼻) 자음 무성 마찰 자음의 각 자음군 내의 식별에 대해서 음성 현상 동기분석법을 연구하여 왔다 그림 9예 고卜열 자음의 경 우의 분석창 설 정 예를 나타내었다. 파열시점과 성대 진동 개시점의 사이를 (n-1 등분하고, 각각 등분점이 중심이 되도 록 하여 ri예를 들면 4개 )의 분석창을 설 정 하었 다.

3.2.2. Neural network의 이용

자음의 식별로 neural nwork(이하, 뉴랄넷)의 이용을 검토하였다⑵). 앞절에서 서술한 동기 분석의 결과를 주성분 분석에 의해 차원 압축한 것을 parameter 로 하고, 각종 식 별 수법과의 비교를 중]-였 다. 그 일부를 그림 10에 나타내었다. Multi-template 1(이하 MTI )는 미지 pattern근방의 K개의 tempiate증에서 가장 많이 속한 class를 선택하는 방법 이 고, multi templateU ( 이 하 MT[1 )는 class K개의 근방 template와의 평균 거리에 의한 것이 다; 뉴랄넷 I hidden layer 한충과 12소자, 초기 w&ght로서 난수(亂數)를 사용한 것이다. 선형 판별 함수법은 뉴랄넷보다도 높은 식별율을 나타내고,

°1」

J

口一선형판별법

▲-멀티템플리터 I

•-뉴랄냇I

■一2차판별법

一멀티템플리터!!

O~뉴랄넷 D

그림 10. 각 수법의 식별율

(6)

시쓰成。「'"스"싱 사농인! '! :, 87

동시에 뉴랄넷과 동일하게 내 적(內積) 연산으로 구성되는 것에 주목하, 선형 간별 함中의 계수를 뉴랄넷과 초기치로 하는 방법을 고안하였다(그림 중의 뉴랄넷!! ). 뉴랄넷의 식별율이 낮은 것은 학습 에 사용한 data중에 고급이 algorithm으로도 식별 곤란한 data가 있어서 그것을 억지로 학습하려고 하기 때문에 판부9녀 이 복집部게 되。」버녔다,생 각 하였다. 여기서, 계산량이 낞지만 징밀도가 높은 MT[] 의 인식 결과를 뉴랄넷에 한습시 키 : 시 도

(NNMT)를 하였다四 그一 결과, 적 절한 K員 선태하 NNMTMTU 이상의 식별육을 나다내: 것E 판명되었다.

3.3. 대어휘 단어 음성 인식으로의 전개 소수 드、어의 음성 인식에서는 복수 등록등。一 어느 정도의 을上 변형에 대 처하는 것이 사능하다•

3.1 절에서 서술한 음소 변형에 대처한 음성 인식 방식(그림 2)은 전 단어를 등록할 수 없는 대어휘 단어의 음성 인식예서 위력을 발휘하는 것이지만, 이 방식은 매우 복잡한 처리를 필요로 하기 때문에 처리 시산에 문제가 있다.

따라서, 본소합( 本照合丿 을 하기에 앞 시 비 교* 처리량이 적은 방법으로 후보를 선택하는 것을 검토 하였다. 음향 처리부에서 출력되는 frame주기 마다 의 분석 결과를 8fiame씩 정리하여 서 압죽함과 동시 에, 음향 segment 계속 시 간길이법칙을 사용하지 않는 것에 의해서 처리량을 1/泓)로 절감하였다.

10만 단어를 이 방식으로, L000단어로 선택하는 경우에 대해서 평가한 결고" 탈락율은 ().3%였.다•.

그림 12. 음향 segment - network<- 사욤한 음성 인 식

(C

그림 13. 난어 후보 선택 방식

3.4. 문장 입력으로의 전개하⑵)

일본어 문장의 음성 입력을 고려할 경우, 저H장에 서 서숙한 것 같이 단음절 발성으로는 사용하기 이려울 뿌마아니라 단이 발성 또한 비현실적이다.

이것은 단어가 복잡하게 변화되어서 접속하기도 하고, 극단으로 쌃은 소사등의 단어가 존재하기 때문 이다. 예% 打"L '을시 '寺니나」라고 하는 부은

「걷十지 + 않+습+니 + 디-」로 분할하여서 발성하지 않으년 안된다. 문 단위의 발성이 이상적이지마.

현채의 기술로 다룰 수 있는 어휘수•는 1,000단어 정도이다. 음성으로 일반 문장을 입력하는데 10만단 어 이상의 어휘를 대상으로 하지 않으면 안되기 때문에, -우-리는 문절 단위의 발성을 당면의 target 으로 생각하고 있다.

각 무절음 각각의 단이. 예를 들면「나는」고+「내

(7)

*、、‘ 韓國音響學會誌101(1991

Sentence

人力 本:去 人京寸力、

i(2058) 本左(2%7) 住人,一《,'京寸力、(2407)

*^Z:tt(2497) 6(2636) 人,京寸力、(2706) 紀,SjW)須,* (2582) 0(2644) 人人吝 Q)zFS、(2779)

^^^^(2706) 本〈匕(3100) 京寸力、(2847)

% ,花子넝: (2731) 公圜 <Z) (3176) ‘MX^m'(293)

■山田域(2753) 本力<(3180) 人,京寸一力、(2975) (2804) ^-^(3267) -,一{只><>1京寸力、(3012)

中^(2821) 6(3314) 答;리G'3一力、(3042)

그림 15. 무■설 라티스의 예

noun "o"

Sentence

Verb sentence

、A-T

Verb sentence (Kaku cluster) A 호 Y

(KakuduUrt))j-V (KakudusterJl-V

I I

(A"ga' kakL^cluster )«y (Kaku 너uf스Y

fwa"屈而 bunsetsu)! T (碁广 kaku clusler)« 丫 (A Verb terminal form ) / ( A noun )1 -waB 村 kaku ^>unsetsu )1- T 아헌"

(A noun )«

(Verb sentence)

(Verb end of sentence form I 14

(Kaku duster

Sentence

(K

u u&terO)A=Y (Kaku cluster

ence

(Verb sentence) A*T

"kaku cluster )= f bunseisA

(inoun )= "wa"

"Q ) 正 Y (Verir^nd 어 sentehce form

. 14

(A。kaku 이 uster )= Y (I Verb terminal form) = -. "ga""o"

u bunsetsu ) A = Y (A noun )="o"

그림 16. C 구조

(8)

车지쯔에 있어서의 음싱 자농인식의 현상과 장래

89 j룰 서로 전부 관련이 없는 별개의 단어라고 고려

힌다면, 대이휘 딘어 %銘 인^ 기술에 의한 실현이 小 그사내* t 山민의 T 히코부터 2()익의 문설의 파생이 가능하게 된다. 여기서. 우리느 무절 음성이 식의 제일보는 발성으로부터 개괄적인 특징을 추출 하고, 문절 문법에 비춰시 수천 정도의 문절후보를 생성하는 것이 라고 생 각하고 있다. 야 46,000어휘로 비교적 단순한 문절 문법 model을 사용하고, 문절 발성으로부터 VCV(모음- 자음- 모음 연쇄)를 추출 한 경우에 문절 후보가 어느 정도 삭감될 수 있는가 를 검토하였다. 二l 결과, 하나의 VCV가 정확하게 추출될 수 있으면 문절 후보의 수는 약 1/10 되는 것이 판명되었다. 실제로는 복수의 VCV 추출할 수 있고, 그것들의 순서 관계도 이용할 수 있는 능정적인 면과. VCV 추출에는 애매함이 있으 브로 복수 후보를 고려하지 않으면 안된다고 하는 부정적인 면을 생각할 필요가 있다.

다음에, 삭감한 문절 후보를 단어라고 간주하고, 앞절에 서술한 대어휘 음성 인식 방식으로 인식하게 된다. 대어휘 음성 인식 방식은 높은 정 밀도를 갖고 있지만, 인식 결과를 언제나 하나의 의미로 결정할 수 있다고는 생각하기 어렵다. 거기서 二림 15 나타내는 것과 같은 문절 라티스로부터 문으로서, 문법적 또는 의미적으로 읋은 것을 선택하는 것과 같은 언어 처리가 필요하게 돈1다.

라티스 중에서 차례로 후보 문을 생성하고, 각 후보 문에 대해서 언어 처리에 의한 check를 한다.

후보문 생성은 depth first search를 사용하는 것이 가장 단순하지만, 정해(正解)의 가능성이 높은 것을 가능한한 먼 저 생 성 하는데는 인식 score가 근접흔 후보늘을 그룹화하여®best first search S 하는 깃,

이 효과적이나.

현재는 문법 처리를 검토하고, 또한 의미 처리에의 제일보로서 표층격의 검사를 검토하고 있다. 표층격 이라는 것은, 예를 들면「讀七'」라고 하는 동사가

「一力〜坛, —1-, 라고 하는 격을 지배할 수 있다고 한 것이다. 우리는 언어 처리의 당면의 과제 LFGLexical Functional Grammar)를 고려하고 있다. 단문을 대 상으로 한 단순한 문비을 BNF 기 법 으로 정의하고, 吁문 해석한 걸과를 그림 16에 나타

내었다. Parser가 문법에 의해 해석한 결과를 먼저 pnra^ sirucUHLFG토는 C十조)로 나타-낸다.

나눔에 여 주식에 피라서 정보를 전파시키면 一^■림 17애 나타냬M 겅과 갇은 F구조를 언을 수 있다.

이 예로는「力,'格, 在格, I더各, ^格」을 지배할 수 있는 동사에 대해서, 실제로「力* 」과「在格」가 나타 낸 것을 표시하고 있고. 옳다고 판단하지만 지배할 수 있는 격 이외의 격이 나타나면 옳지 않다고 판단 한다 금후는 이것을 술어가 지배할 수 있는 어(語)

의 의미 속성을 검사할 수 있도록 확장할 필요가 있다.

—'

"gakaku cluster [ noun [ uwaM)

verb terminal form [M ga" "o"]

_ HoM kaku cluster [ noun HoK]

그림 17. F 구조

인사말

본 논문은 19905월, 동북대학에 서 개최된「음성 인식의 현상과 장래」에 관한 심포지움에 발표한

것을 ATLAS-JK 일한기 계 번역시스템을 사용하여

번역한 것이다. 번으녁에 힘이 되어 주신 한국후지쯔의 김 병원과장님, 김동욱씨께 감사드린다.

參考文獻

1. 에다가오H技川), 이또오(伊勝) 등 :음성정보처리의 approach, FUJITSU Vol. 21, No. 3, pp. 401'419, 1

)70.

2. 시 라도리( 口鳥): 음성 처 리의 실적, 사무와 경 영, 19 801(월호, pd. 54〜书. 1980.

3. 도미다(富田), 나카무라(中村) 등 : 음성 처리장치, FUJITSU Vol. 32, No. 3, pp. 419〜425, 1983 4. FACOM 2370 음성입 력시스템, FUJITSU V시. 35,

No. 5, pp. 581〜588, 1984.

X M. Y。아lida, et al :Technology for Pattern Informa- tion Processing, FUJITSU Scientific and Technical Journal Vol. 25, No. 2, pp. 81 〜H2, 1989.

6. 기무라■(木村), 나라(奈良) : topdown 음소 segmentation

(9)

韓國••響學會.1011991

® v! J ' > l <' ■'!,• :L : J 「徉":J :. 1985'J .■■■'.< ':」"I HS,'\

* 「4」」:.tcqxiowi; '/. 乂乂注¥心13"‘』刁'方'」W

: F 기 "긴'서! 3L시、" ",普뜨〔j 7. ⑴85 W -"! 11. 19S5.

\ 以 < e 口 : :■-./ 비지 ■;- 치 r 준 시위 시;닏!, 令익 i5 :!-?i. 19Sf;M 3윗’ ;-1 I I. 19Sfi.

< 、“ i : 니 ; 마사叫 旨上 비 힝세 V 하 기 喚,

""膏吟} ,. H'<! 3 ,M, 19S(i.

1(), "1•(木V: f:-/. wgmoE network에 의:社 廿이 5시 이 n "«!、;나* ) 상孑' 1!用F 10우!、1-5-21. 1 9S7.

11. ' -i(木云叫 5항 氐即心汀의 긴 번등 二사、음•하(3부) :"l W曲니 3윈. I 2-U. 1988.

*

12. M 누 3木村), 시나나(眞. 溟) :: -;Y'^ segment net - work 苦 사 €-한 닌 이 싱 인 中세 있어 서 의 칙 으」

넝 기. 음 학( 學 E" 3別넌 1()월. 1 3-20, 1988.

13. 바아시(小林), 이와B 다(巖버JH) 능-:弁성 파열

■44 식버에 관하 土누“ 冬학(音學) 강心 19%9 10월. 2 1-11, 19K5.

11. 上나바시냬" E 와미다(巖나」M 둥 : 유성 파열 자늠 시벌에 있서시의 과上부 듀싱 추촐,십의 검토-, 음학( 音學)감… 以湘닌 3윌. ? 11. IfM.

15. 이오卜미다(巖出), 二'一나시(小林)등: 平성 파얼 사음 식별에 과한 검도. 음하( 汁學)강연、19863월, 2 1-2, 1986.

16. 이와미다(巖見山), 니리(奈口) : 早섬 피-일 자음 식벌 에 있 에 서의 시 게 업 '; 징 子줄 稱 의 거 보, 음 학( ”學 ) 상돈-, 19861()윌, 1-HK, 1986.

17. 이와叫다(巖田), 나나(良) : 파열 자음 식브3 있、이서의 파연 시짐의 자동검출-, 음하(苻學)상론, 1 9X73 2-5-1S, 1987.

18. 이외미가(巖以JH. 사나나(眞由) 능- : 인속 음성 중의 나익 사음 식 변의 검 도, 음-학( 汚學 )강-료, 1988M I L ! 3 2. 19KH.

19. 시나(小烏), 기早랴(小村) : 불특정 화자 早싱,가찰 사음의 식별. 신학적(當學全) 1990년 봄. A-227, 19 9().

20. 이와미다(巖見由): 새방점 동기 '분석에 의한 비(鼻)

사음 식널의 건 토-, 음학(音學)장론-, 19883월,1 2 9, 1988.

21. 사나다(眞H!), 이오!■니다(巖兒田) 등 : 불특정 호}자 자음 식별에 있어서의 neural network오+ 각종 수법의 , 음학( 音學)강론, 198810월, 2 P13, 1988.

22. 사나다(眞田), 기무라(木村) : multitemplate법의 식별 기구를 학습한 neural network, 음-학(音學)강론, 19 891()월, 1124, 1989.

23. 기무니-(木村) : 음향 segment network에 의한 단어 후보 선택, 음一학( 音學)강론, 198910월, 2-?, 1 989.

24. 야E■사끼 (山崎), 기부라(木村) : 음향 segment netw­ ork 를 사용한 10만 단어 인식, 음학(音學)강론-, 19 903월, 1 3-24, 1990.

25. 다나까(田中). 나라(奈良) : VCV에 의한 문절 후보 삭감 효과의 검토, 음학(音學)강론 19893월, 3- 6-1, 1989.

26. Loken-Kim, Nara, et al, :A POSTPROCESSOR FOR A LARGE VOCABULARY JAPANESE SPEECH RECOGNITION SYSTEM, Eurospeech 1989, Vol. 2, pp. 1 〜4, 1989.

27. Loken-Kim,Nara, et al,: LANGUAGE PROCESS­ ING FOR A LARGE VOCABULARY ISOLATED SPEECH RECOGNITION SYSTEM, 정 처전(情處 全), 西89년 후기, 7-E-8, 1989.

筆者紹介}

▲나나 야스히로

1975 넌 : 에 이 오 대 학 전 기 공 학 고卜 졸-업( 공학사)

1977넌 : 게이오대학 전기공학 고卜 (공학석사)

1977현재 : 후지쓰 연

▲ 기무라 신다

1978년 : 고오베대학 전기공학 과 졸업(공학사)

1980년 : 고오베대학 전자공학 과 (공학석사 1980현재 : 후지쯔 연구소

(10)

辛시坐에 인이H 사긍 •即시이 허사과 잔래 91

▲김 경 호

1977넌 : 한양대 학 금속 공학円 졸업 ( 공학사 .}

1982년 : 노스케롤라이나대학 스卜업 공학 고 t< 학■ 석 사)

1988 넌 : 노스구” 돌 라 이 나대 학 업 공方卜고!( 공학박 사)

1988년~현재 : 후지쯔 연구소

수치

그림  1.  난순한 음生 변형의 예
그림  16.  C  구조

참조

관련 문서

워드 임베딩 방법을 이용한 미등록어의 단어 대체 방법은 미등록어를 벡터 값으로 변환하여 벡터 공간상에서 미등록어와 유사한 값을 가지는 단어들을 대체 후보 단어로

커뮤니케이션은 분명 발화에 있어 어휘들의 의미를 인식하는 것뿐 아니라 화자들이 발화를 통해 의미하는 바 를 인지하는 데 달려 있다...

(linguistic units)이 speech production에 연관되어 있다는 것을 보여줌.. Speech errors의 형태. i) 음성적 자질 (phonetic features)이 서로 인접한 음소끼리 바뀜.

단어 중에서 어떤 부류는 전치 조동사 ก าลัง의 뒤에 나타나 면서 후치 조동사 แล้ว앞에 나타나는 통사적 분포를 갖는다... 태국어의 단어 중에서 어떤 부류는

*단어 사이의 공통성과

– 단어의 시작 문자를 대문자로 : AverageScore, TotalScore – 단어 사이에 _를 붙인다 : average_score,

캡슐화 디지털정보와 접근에 필요한 정보를 함께 보존하는 방식 디지털정보만을

다음 제시된 단어 가운데 알맞은 것을 골라 빈 칸을 채우세요.. 지금도 중국인들의 차