• 검색 결과가 없습니다.

依한

N/A
N/A
Protected

Academic year: 2022

Share "依한"

Copied!
23
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

f콸響音좋쫓學的 方、法에 依한 -칠‘語合成

金 韓 坤

(서 울 大 學 校)

말이 성립되는 과정을 살펴는 데는 두 가지 판접이 있을 수 있다. 첫채는 말이 추상적 기능체계라 보고 그 체계를 이루는 치본단위(가 되는 요소플)와 그들 상호간의 판계를살 피는 입장이며, 울째는 말하는 이와 듣는 이 사이에 이루어지는 한 장연의 말을 몇 단계로 냐누어서 살펴는 업장이다. 전자와 같은 판점은 다른 모국어를 말하는 두 사람은 의사를 통할 수 없고 다만 한 방언(넓은 의마의)권 안의 사람끼리만 의사소통이 가능함을 생각 할 예 언어연구에 있어 빼놓올 수 없는 판접임을 알 수 있다. 가령 옴운물에서 옴소위주 의 연주를 하는 것이라든가, 변별적자질을 인간이 옴성을 가려 들을 수 있는 指標(내지는 신호 즉 cue)로서 설정하는 등。1 이런 판점에 속한다 할 수 있다 둘째 판점은 말하는 이 와 듣는 이 사이의 언어성립과정을 단계별로 나누되 예컨데 크게 구분하자연 조옴커판의 웅직임 및 역할과 공71 중의 옴파가 가치는 성질, 청각기판의 71 능의 셋으로 나누어 그 각 단계에 대해 고찰하는 것이다. 예시한 3 단계는 조옴이전의 단계안 심리적 의마흔적인 고 려 나 청 각기 판의 기 능과 認知작용 (peπeption) (또는 심 리 작용)과의 판계 등에 대 한 고려 를 얼단 피한 구분이다. 이들중 첫 단계가 조옵옴성학 (articulatory phonetics), 둘해 단계가 옴향옴성학 (acoustic phonetics), 세째 단계가 청읍옴성학 (auditory phonetics, psychological

l 이것은 변별석자질의 이혼이 전척으로 기놓위주의 것이라든가 한 개별언어 기슐융 위한 것이란 의 "'1 는 아니다. 근래에까지 Jakobson 이나 Halle 퉁이 발전시쳐온 연별석자질은 어다까지나 그 옥요가 universal(오둔 개별언어에 공통되는 자질)에 있.E..으로 개별 언어 하나 하나에 대한 독자적 옴운체계 흩 의。l 연멸의 기능을 위주로 하여 짜혹이 설정하는 주£주의 융운흔과는 근본적£로 다르다. 그려 나 변별적자질£ 기능의 테두리률 완전히 벗어난 본질 (substance) 이라고는 말할 수 없을 것 갇다. 2 향대립 자체가 본길이 아년 대럽의 법주이며 α} 라서 구조주의식 의마벤별의 기능은 아닐지라도 두가 지 엉주의 차이흩 쿠운하는 기능에 기반윷 두고 있다. 필자의 소견으로는 쿠£주의석 융소혼과 변별 걱 자섣의 이론과의 근본적 차이는 전자가 기능의 단위툴 크게 잡아 의 "'1 흩 변멸하는 것에 둔 까닭 으로 그 적용을 개별언어기술에 국한할 수 밖에 없게 된데 반하여 후자는 기농의 단위훌 그..!i!.닥 작 게 잡옴 A 로써 개별언어는 이 삭은 단위의 집합(즉 연별적 자질의 집함).E..흐써 기울할 수 었게 하여 이 소단위(연옐적 자질)의 활용가능 엄위를 넓힌데 있다고 생각된다. 이렇게 생각하연 변별걱 자질 도 기능의 단위업에는 옴소와 다름이 없고 옹소가 개별언어의 기능만올 위주로 했다연 변별적 자질 은 보다 광법위한 (universal) 기능의 모씩의 결과라고 한 수 있을것 같다. 그러한 의마에서 이 이흔 은 기능체계와 본질 (substance) 과의 거리흩 훤씬 더 좁혀 준 것이라고 생각된다. 변별적자질 이혼의 문제 점 에 판하여 는 EIi Fischer.Jtþrgensen(1958) p.137 ff; 金芳짧(1967) 둥을 참조. 이 혼 자체 에 대 하 여 는 Jakobson and Halle(1956); Jakobson, Fant and Halle(195Z); 李承歲(1 967); 깅 친우(1 958) 툴 참 죠. 오둔 참고문헌은 뼈註에서는 저자영과 연도(그리고 애로 핀요하연 창조 페이지)얀 표시하고 문 헌영은 끝에 함께 묶어 둔다.

- 4 9 -

(2)

50 용홈!훌iiJf究 W 卷 • 1

study of perception) 의 연구분야라 할 수 있 다. 그러 나 이 러 한 다른 판점 이 냐 단계 의 구분 들은 서로 판련시킴이 없이 순선히 독자적 연구가 가능한 것은 아닐 것이다. 기능워주의 연구도 본칠 (substance) 에 대한 연구를 천혀 떠나서는 있올 수 없고, 조음 옴향, 청음

(auditory perception)도 3 자 사이에 어떤 연관이 전혀 없이 독립할 수는 없는 것이다. 음

향옴성학의 발달에 힘입어 조음과 옴향, 음향과 청읍커판의 짧知작용 (auditory perception), 조옴과 짧知작용 등의 상호 판계의 연구가 활발해지고 있옴도 언어연구의 목적이 결국은 의사소통과정 (communication process) 의 연구에 있는 까닭이라고 생각띈다.

1. 음향음성 학과 言語슴成

위에 이 01 비친 바와 같이 말을 불리적 읍파로서 판찰하는 것이 。l 운야의 일이다 . . 그 러나 읍파의 연구는 순전히 울리적 성질의 규영에 그칠 수 없고 이것을 조응71 판의 연구 와 판련시킴 A로써, 또한 아직도 0] 개척 분야인 청음꿇知작용과 판련시킴으로써 언어학 적 의의가 커지는 것이다. 다시 말하연 옵향읍성학의 목표는 옴파의 물리적 성질을 규명 하여 음향줌의 指樓、 (acoustical cues) 와 단위 (acoustical units) 를 발견하며 , 그것틀을 조옴과 판련시키고, 청음작용과도 판련시킴으로써 음향이 가진 교량적 역할의 정체를 밝히고 궁 국적£로는 조음과 청읍작용과를 판련짓는 것이다. 이와 같은 연구와 목표달성에 효과적 인 방업으로 인위적 言語슴成 (speech synthesis) 의 분야가 있다.

발성기판에 의한 자연적 짧話가 아넌 방법으로 인조옴성을 만드는 시도는 18 세기 말 엽부터 있었던 일이라 한다 그러나 보다 더 본격적인 연우는 역시 옴향분석커 (sound spectrograph) 의 발영으로 급속히 발전한 옴향옴성학에서 비훗하였다고 말할 수 있다.

옴향옴성학적 방법에 의한 언어합성의 목표는 순수연구 (experimental research)와 응용 (application) 의 둘로 대별할 수 있다. 순수한 연구란 위에서 이미 말한 바와 같이 언어의 음향의 본질을 파악하여 그 음향지표 (acoustical cues) 를 찾으며 조옴, 청옴작용과 판련시 키는 등, 언어의 본질올 탐구하는 일이다. 그 웅용으로서는 맹언을 위한 독서기계, 可聽 周波를 이용하지 않고 電信信號를 이용한 무선전화 (telegraph speech), 말하는 컴뮤우터 (talk-back computer)등 그 응용범 위 가 넓 을 것 으로 생 각되 고 있 다.

2. 합성의 방법

언어합성은 그 방법흔에서 두 가지 다른 연을 생각할 수 있다. 첫째, 말의 토막을 어 느 정도로 세분하여 그 세분된 단위를 합성에 이용할 것인가의 문제이다. New York 의

2 H. Dudley T. H. Tarnoczy C! 950) 에 의 하Wolfgang von Kemplen 1791 년에 말하는 지 안을 닥고 ]oseph Faber, Wheatston von Kemplen 하는 시 도룰 으며 , Helmholtz, Kernig, Stun, Sir Richard Paget 웅의 서 도도 었 다.

(3)

훌.홉훌훌 51

Haskins Laboratories 의 연구원들은 이와 판련하여 세 가지 방법이 가능하다고 하였다3

(1) 마리 녹옴펀 말을 옴칠단위로 분할하여 놓고 이것을 필요에 따라 순서대로 배열 하 여 합성한다.

(2) 청옴짧知 (perception)와 판련된 음향指樓 (acoustical cues) 애 대한 지식을 활용하여 옴 소단위의 합성을 한다.

(3) 옴소보다 더 세분된 단위 (subphonemic dimensions) 를 섣정하고 이것들 중에서 청옴 짧‘知에 판련 펀 다고 생 각되 는 것 올 7] 초로 하여 합성 한다. 가명 소옴방엽 (manner of artic- ulation) , 조옴정 (point of articulation) 같은 것 에 상응하는 옴향指標률 합성 에 참착하는 방 법이다.

이상에서 (1)의 방법은 합성을 전부 인위적으로 하지 않고 마리 녹옴된 말의 토막률에 서 가장 7] 본형이 될 수 있다고 생각되는 단위를 수정하여 그런 단위의 ι생풀을 再集成하

는 것이다. 이혜 7] 본단위를옴절이하로 하지 옷하는 까닭은구조언어학에셔 음소가뭇 변 별의 기본단위라고 말하지만 실지의 말에서는 옴소들은 그 옴가가 얼정치 않을뿐더러 앞 뒤의 옴과 융합되어 있으므로 무착정하고 옴소를 수집 배열해 놓으연 말아 들을 수 있융 만한 말올 합성할 수 없커 까말이다. 이는 옴소를 認知의 (추상적)기본단위로 인정하더라 도 옴향상으로는 구분이 그렇게 간단하지 않다는 말이 된다. 이 방법에서도 음소단위의 집성이 가능하기는 하나, 그렇게 하려면 각 옴소마다 그 변이옴 (allophonic variants) 을 준 비해 놓고 옴성환경에 따라 다른 변이음올 사용하여야 하기 예문에 준비해 두어야 할 기 본단위가극히 방대한 수효에 이르는 홈이 있다. 음절을 단위로 하는 경우도 소요되는 단 위수가 많기 해문에 이러한 방법은 아주 비능률적인 것이다.

(2) 의 방법은 말의 토막을 일단 옴스단위로 斷節 (segmentation) 하고, 단걸하여 얻은 각 옴소가 가진 음향적 특정을 고찰한다. 합성에는 옴소단위로 하되 각 옴소마다 가지는 옴 향적 특칭을 참조하여 합성규칙을 만들어 놓고, 이 규칙에 의하여 합성하는 방법이다. 이 런 방법은 (1)의 방법보다는 훨씬 차원이 높고 말달된 것이나 각 옴소마다 규칙을 만들어 놓아야 하기 돼운에 그 수효가 많고 (3) 의 방법보다 번거러운 단점이 있다. 독자걱 옴소 를 각커 특정짓는 것은 음향상A로 보아 요읍의 경우는 뒤에 설명할 포요먼트 (formant) 이나, 자음의 경우는 뒷따르는 요음의 포오멘트를 보아 판단할 수 있는 로우커스(Iocus) (뒤에 설명)가 주요 指標이므로 이 (2) 의 방법에서는 이 두가지 指樓를 기초로 한다. 이 방법의 포 다른 실지상 문제점은 옵소를 독립적으로 규칙화하려 하는 까닭으로옴소가 서 로 접경하고 있을 해 생기는 여러가지 현상을 제대로 再現하기가 힘들며, 조옴점은 같으 나 조옴법이 다른 자음들도 분열하기가 힘드는 등 문제점이 많다.

(3) 의 방법은 음소에 구애됨이 없이 조음접 조옴방법 등 조음기판의 활동에 판련뇌는 a A. M. Liberman. Frances Ingemann. Leigh Lisker. Pierre Delattre. and F. S. Cooper(1959).

(4)

52 3홈훌liJf究 W 卷.1

옴향指聽를 각기 媒介變數 (parameter)로 택 하고, 듣는이 가 認知에 지 장이 없 올 만한 최 소 한 수효의 媒介變數만을 정하여 규칙화하려는 방법이다. 이 경우에도 斷節法 (segmentation) 을 전혀 무시할 수 있는 것은 아니지만 옴소 낱낱에 대한 규칙이 아니라 최소한 필요한 수효의 변수를 짜로 따로 調整해 나가며 읍소는 어느 한 순간에 있어서의 樓數의 總和로 서 나다나가 때문에 (2) 의 방법에서 문제되었던 난판이 해결된다. 다만 남은 과제는 몇개 의 媒介變數를, 그리고 어떤 종류의 媒介變數를 설정할 것얀가 하는 문제인데 이것은 음향 옴성학 전체에 걸천 중요 과제로서 학자의 해석에 따라 견해차이도 있올 수 있는 운제이 므로 이 논문에서는 4 절에서 미쉬건대학의 變數체계를 소개한다. 다른 조건이 동일한 한 에서는 변수의 수효를 늘리는 펀이 합성된 말이 자연음성에 가까와져서 그 영료도 (intelli­

gibility) 가 높아질 것이 집작되나 불필요하게 수효만 늘리연 합성의 수고를 늘럴뿐더러 영 료도도 저하시키는 결과가 될 것이다.

지금까지 합성의 단위를 어느 정도 크게 잡을 것인가를 중심으로 합성의 방법론상의 일 면을 논술하였다. 언어의 합성은 자연인간의 발성 초음71 판을 사용치 않고 인위적 망업에 의하여 말을 만들어 내는 일이므로 그런 인위적 방법은 말성 기판과 꼭 같은 구조는 아닐 지라도 기능상 유사점이 있어야 할 것이다. 바꾸어 말하여 언어합성은 相似擬構 (analog) 를 사용하여 발성조음기관의 기능올 모방하는 일이다. 이때 相似機構가 어떤 것인가가 언 어 합성 방엽 혼상 고려 하여 야 할 또 하나의 연 이 다. 相似機構에 는 A體相似機構 (physiological analog 포는 acoustical analog) 와 結果相似機構 (terminal analog) 가 있다. 인체상사기 구란 말성조옴기관의 생리구조와 흉사한 물리적 내지 옴향걱 구조롤 가진 것올 말한다. 제 1도4

J.

(c)

제 I 도 용웹相似機빼 , (a) 인체의 기판, (b) 인채상 사기 구, (c) 결 과상사기 쿠(혐氣的)

이 도표는 R. L. Mi1ler(1959), p.668 에서 벌어 왔다.

(5)

품짧홈 g훌훌 .53

에서 (b) 는 (a)의 구조와 꼭 갇지는 않을지라도발성기(인체 a 에는 성대, 상사 71구 b 에는 말진기), 共嗚室 cl> C2 를 가집으로써 그 옴향적 특성이 비슷하게 띈다. 이처럼 그 물리적 구조 자체와 옴향효과가 인체 발옴기판 구조와 흡사한 것을 A體相似機構라 하며 읍향분 석기가 발명되기 이전의 언어합성응 대개 이 부류에 속한다. 둘째, 結果相似擬構란 기구 자 체의 음향적(즉 물리적) 특성은 인체의 발성조옴커판과 같은 정이 없지만 그 치쿠가 가진

효과의 총화가 최 종적 으로는 (terminal 즉 거 구의 끝에 이 르러 서 는) 인체 발음치 관의 그것

과 흡사하게 나타냐는 상사치 구를 말한다. 떤재 사용되 는 것 은 제 1 도 (c) 와 같은 전기 회 로이다. (c) 엔서 발진기는 공기진동을 주는 물리적 발진기 (b 의 경우처럼)가 아니라 인체 성대의 옴파형과 흡사한 파형을 가진 전커진동을 발생시키는 장치이다. 20란 말진기 자체 의 내부 입파던스(impedence) 를 나타낸다. 회로중 성도(聲道)라고 된 부분이 인체의 성도 와 흡사한 기능을 가진다. C1 콘덴(condcncer)로서 기 진동에 대해 비교적 악단스 (capacitive reactance) 를 가지므로 (a) 나 (b) 의 C1부분과 같은 기능을 가진디. 즉 (a) 나 (b)의 C1 이 진동파에 대 해 낮은 저 항을 가지 는 것 과 마찬가지 로 (c) 의 C1 은 발진 기에서 요는 선거진동에 대해 낮은 임피던스 (impedence) 를 가지는 것이다. Ll 은 코일。l 으 로 전 기 진동에 대 해 높은 레 악단스 (inductive reactance) 를 가져 서 (a) 냐 (b) 의 Ll 부분과 같은 효과를 가진다. 즉 (a) 나 (b) 의 Ll 부분이 진동파에 대해 어떤 저항을 가지는 것과 같이 (c) 의 Ll 은 전커진동에 대해 임피먼스 (impedence) 를 가진다. (c) 의 C2와 L2 마찬가지 원리로 (a) 나 (b) 의 C2, L2갇은 효과를 가진다. 이상을 바꾸어 말하면 콘덴 사(즉 ca paci tance) 는 전커진동의 주파수가 높아질수록 저항이 줄어지는 반면에 쿄일은 주 파수가 높아질수록 저항이 느는 성질이 있기 혜문에 (c) 의

C

l> C2는 발옴기판 안의 공기 가 잘 통하는 부분(Cl> C2) 과 같은 ‘효과를 가지 (c) 의 Ll' L2 는 말옴71 판에 서 아찰도 가 높은 Ll' L2부분과 같은 역할을 하는 것이다. 그래서 C1, Ll> C2, L2회로가 기진 에 매해 가지는 종합효과는 말옴기판의 성도가 성대의 옴파에 대해 마치는 효과와흡사한 결과가 된다. 그러으로 전기진통의 파형이 성대의 파형과 홉사한 경우에는 이 회로끝에 냐다냐는 전기진동을 녹음테입에 녹음했다 재생을 하연 인조옴성을 영을 수 있게 된다.

도표의 (c) 에서 방사 (radiation) 의 부분은 구강(口홈) 밖의 공기가 마치는 負혜에 해당 한다.

이상으로써 언어합성의 방법론상의 문제로서 기본단위 설정과 相似機構의 원리를 설영 하였다. 이 논문에 소개코자 하는 말의 합성에는 옴소보다 세분된 단위를 쓰는음향적 媒 介變數의 방법과 결과상사71 구 (electrical terminal analog) 를 사용하였음을 여 71 에서 말해 둔다.

(6)

語!톨~究 W 卷1

54

연극L

순수 연구목적올 위한 언어함성에서는 홉정쩌]작용에 대해 이마 연구가 이루어진 결과툴

。 l 용하여 합성을 시도함으로써 그것을 재확인 또는 수정할 수투 있고 認知작용에 대한가 정을 하고 그에 따라 언어합성을 하여 認知상태를 실험함으로써 새로운 사실의 발견에 노

청 음짧았l 작용 (speech perception) 에 대 한 음향음성 학적

3.

력할 수도 있다. 어행던 합성을 위하여는 認쩌]작용에 판련된 옴향指標、에 대한 연구를 개 판할 펄요가 있다. 그러나 우려말에 대하여는 이 분야의 연구가 전혀 없으므로 외국 학자

논술의 편의를 위해 우선 모옴과 자음 으로 나누고 이를 중심으로 살펴며 그 밖의 운제는 활애하기로 한다.

들의 연구결과를 중심으로 간단히 살펴기로 한다

모음의 옴향적 연구는 19세기에 시작되었고 읍향분석기 출현 이후에 급속한 진전을 보 았다. 지금까지의 연구 결과로 알려진 가장 중요한 옴향指뺑는 포오먼트(formant) 의 주파

r‘。vιiι

...

'1 '.!:lU 。,

r.~‘,,,,'5. IJ

0.

,

o‘4

[ <:;) ]

[ e ]

5 짧知작용이나 발의 함성에 대하여는 우리말이l 판한한 전혀 말요 또는 연구된 것이 아직 없 A 나 일 반석 인 옴향운석 윤 진 행 중에 있 다 University of Southern California 의 Mieko S. Han 교수가 우 리 말 의 운석걸과왈 실험보고했고 (1963, 1964, 1965), 그 밖에 현재 IIIinois 대학에 재직중인 깅진우교수가 미 국 언 어 학회 의 1965 년 따추모 임 에 서 On the Autonomy of the Tensity Feature in Stop Classification"

융 발표했 A 며, Leigh Lisker and Arthur S. Abramson(1964)애도 약간의 언급이 있다. 국내에서 발 표된 연구로는 李xg 淑(1966), 했寅燮 (1965) 이 있다. 그러 나 鄭펴엎교수의 이 논문은 그 내용을 그대 로 받아 들일 것이 옷펀다.

저l 2

(7)

흡¥W 홉훌 55

수 상 의 분포상태 로 알려져 있다. 표오먼 트의 해섣은 본고의 목표에서 벗어냐는 일이묘로 상혼을 파 하고 간 단히 정의만 한다. 포오먼 트 란 制減作用 (damping) 이 걸려 있는 類似周

期複雜波 (quasi-periodic complex wave) 를 倍홈分析 (harmonic analysis, 즉 Fourier analysis)

했올 얘, 에너지의 분포가 어느 한 周 iEZ數를 중심으로 인근 倍홉一帶에 E용第하여 있을 경

우 이 에너지가 밀집한 倍흡周波뺨를 포오먼트라고 부른다6 따라서 포오먼트는 덤波數帶 域상의 분포의 중심위치를 주파수로써 표시하여 나다낸다. 이해의 펀의를 위하여 우리나 라 모옴(筆者자신의) [eJ (매)와 [dJ(↑)를 持續的으로 발음하여 얻은 스돼트러그렁을 제 2 도에 에시한다 廣帶域 (broad band) 을 보나, 斷層 (section)을 보나, [eJ 는 제 1포오먼트가 450싸이클 제 2포오먼트가 2 , 350 짜이클에 있으며 [dJ 는 제 1포오먼트가 500 까이를, 제 2 포요먼트가 1,100 싸이를에 있음을 볼 수 있다. 우리말 모옴 하나하나를 (필자의 옴성으 로) 분석한 결과를 알아보기 쉽게 약식으로 포오먼트를 그리연 제 3 도와 같다. 이 자료는 持總的으로 발음띈 모옴의 것이며 실지 말로막의 안에서는 어느 음소나 그 포오먼트가 한

주파 수에 머므르는 일은 거의 없 이 유동걱 이다. 또한 포요먼 트는 각기 그 帶域 l隔 (band

3 .. 00

-

( ι

u )

~I-

4

',0

r

... ---

i

‘ ’ )

(셔 1 > (치 e ) (..>.1)

ε 애)

ul

‘-)

a

(-q

a. ~) ‘..l.) 。u,lT)

3

width) 이 있다. 제 3도에서 포오먼트를 표시하는 션의 두께로서 帶域帳을 나타낼 수 있는 데 여커서는 福은 고려하지 않았다. 또 하나 다른 문제는 각 모음이 가진 포요먼트의 수효는 둘만이 야넌데 제 1, 2 포오먼트는 결정적으로 청옴認知애 영향을 마치나 제 3포오 먼트에 대해서는 就이 다르다 Gordon E. Peterson교수는 제 1, 2포요먼트만으로써 분별 하71 힘투는 모옴드 듣는이가 구별지어 들올 수 있는 것은 제 3포먼트의 역할에 의존하는 것 이 라고 주장하고, 지 긍까지 두 포오먼 트만올 고려 하여 =次元的 모옴 차아트를 그리 던

8 옹향옴성 학의 기 본 이 론은 Martin Joos(1948) 악 Peter Ladcfoged (1 962)륜 참고 그러 자는 알 기 쉽게 쓰여 있는 반연에 harmonic analysis판 증싱한 彼때폐(wa ve theory) 에만 치중하여 실제 spectrogram 은 다루지 않았다 spectrogram 을 위 주로한 report 로서는 R. K. Potter, G. A. Kopp, and H. C. Green(1 947) 이 있 다

7 본고에 실렌 스펙 트러 그럼 은 모두 University of Michigan 의 Communication Sciences Laboratory 에 BTL 2 Sound Spectrograph (Bell Telephone Company 에 서 제 작펀 것)로써 만둔 것 이 다

(8)

56 語쩍용liIf究 W 卷1

것 을 개 량하여 3 차웬 석 (立體的) 표시 방업 을 제 안하었 다 그러 나 Eli Fischer.]~rgensen 온 이를 부인하였다. 그 근거로는 인성한 두 포오먼트는 그 사이의 주파수매에 있는 한개의 포오먼트와 동얼한 청음認知효과를 가지며 두 폭요먼트중 어느 하나가 더 세연 그만큼 더 그 쪽A로 끌려 들렌다는 것이다 2 포오먼트說이건 3 포요먼트說이건 간에 오음식별의 가장 중요한 음향指樓는 포오먼트의 相對的 분폭위치라는 것을 알았다.

]~rgensen 은 포요벤트의 분포상태 이외에도 고려하여야 할 문제로서 (1) 帶域!偏도 필요

한 것인가(즉 認知에 영향을 주는가), (2) 포요먼트의 수효는 몇이 필요한가(위에서 논숭),

(3) 포오먼트의 주파수는 그 절대치가 認知에 영향올 주는가 아니연 相對個가 영향을 주 는가, (4) 포오먼트와 聲道안의 共嗚室과의 판련은 어떤것인가 등의 문제를 다루고 있 다 10 이들은 다 중요한 문제플이지만 본고의 목적에서 멀어지므로 생략하고 자옴A 로 넘 어가기로 한다.

Liberman 은 자음의 옴향指標를 마찰 (constriction) , 조옴정 , 조옴엽 의 세 타업 으로 나누고 있다 11 음향指標를 구-분하는데 이 갇이 調홉홉聲學 (articulatory phonetics) 的 분류를 하는 까닭은 초옴의 차이 에 상응되 는 현상이 음향指標에 나타나가 혜 문이 다. 그는 Haskins Laboratories 의 연구원들이 pattern playback 이 라는 언어 합성 기 계 를 개 발하여 認知와 음향 指標와의 관계 를 연 구한 결 과플 종합하여 그런 구분을 했 다. pattern playback 이 란 많은 자연옴성의 스돼트러그럼을 초사분석하여 71 본 패턴올 작성하고, 그 패턴을 투영한 세루 로이도I않에 그려서 기계에 얹고 동작 시키연 음성이 재생되는 장치이다 이 때 패턴을 여 러가지로 바꾸어 그려서 실험함으로써 스펙트러그럼上의 어떤 指標가 認知에 어떤 작용 을 가지는가를 실험할 수 있다. 제 4 도는 일곱개 다은 모읍 앞에서의 영어의 [b], [d], [gJ

4

8 Gordon E. Peterson and Har이d L. Barney(1952); Godon E. Peterson (1952 and 1954).

9 Eli Fischer.Jif>rgensen 진계서 (1958), p.121 (註l 창조).

10 풍서 p.119

11 A. M. Liberman(1957), p. 117 ff

(9)

예W 홉훌!얻 57

먼저 [bJ 를 보연 각 모옴의 포오먼트는 제각기 다르냐 제 2 포오먼트의 의 실험결과이다 12

첫끝은 한결같이 720 싸이클線을 가리키고 있옴을 볼 수 있다. [dJ 에서도 마찬가지로 제 2 jξ요먼트의 첫끝이 모두다 1 , 800싸이를線을 가리키고 있다. 다얀 [gJ 에서만은 제 2 표오먼

그 첫끝이 3, 000 싸이클올 가리키 볼 수 있다. 이렇게 제 2포오먼트가 가리키는 겹의 주 프가 약 1200 싸이클 이상인 경우(즉 도표의 전반부)만

고 있으며 나머지는 불규칙적염을

파수가 각 자옴의 조음접의 指標로서 자음식별의 표식이 된다고 가정하고 이 가상점을그 자옴의 로우커스(Iocus 복수는 loci) 라 이름 붙였다. 많은 자료의 분석 결과 로우커스는 주 로 폐 쇄 음 (stops) 과 비 옴(nasals) 의 조음정 의 指많가 되 며 제 1 포오먼 트는 조옴점 과는 상 판 없음이 밝혀졌다. 로우커스理論에서 하나 주의할 것은 로우커스는스펙트럼上 눈에 보 이게 나타나는 것이 아니고 어느 특정한 자읍의 경우에 제 2 포오먼트가 가려킨다고 생각 [bJ 의 로우커스는 720 싸이클, [dJ 는 1 , 800 싸이클, [gJ 는 제 4 도에서

3 , 000 싸이클이다. 로우커스 주파수에서 제 2포요먼트의 첫머리까지 점선 A로 표시된 분은 심지로 보이지 않으나 포오먼트 끝이 그런 방향으로 연결되어 있다고 생각되는 가상

-.

H

되는 假想뾰이다.

;;z.

장판 없이 같음을 볼 수 있다. -‘- 오는 다른 요소들과 곁들 션이다.

제 4 도에서 제 1 포오먼트는 [bJ, [d], [gJ 등 자옴에

옴정의 指標언 제 2 포오먼트와는 달리 제 1 포오먼트는 그 앞에

죠 흩 점 (PLACE 01' ARTκULATI애 ]

' - 1 、­

j밤 I-~

{-}=--냐 }

、‘­ !번-

‘ 、-

~

~ na

흥 t 」를|

,,--

J컨-

,-- , - -

----L즈-

=,,-

~

를르 ma

πι*。‘M쇄요g 융서gRKRia

--u

음잉 (흥-툴3ciq

*

Zr4i)

저l 5

말견되었다. 이런 판계를 도해하연 제 5도와 같다 q 먼저 [ba], 조읍법의 指많가 됨이

[da], [gaJ를 보연 조음점의 指標를 주는 제 2포요먼트는 다르나 제 1폭오먼트와 그 직전 이 짧홉帶는 유 의 짧막한 썩치 모양의 j찢흡帶(resonance bar 또는 voice bar) 는 모두 같다.

종요한 옴향指웰이다. 다음 [paJ, [taJ, [kaJ 에서는 聲홉뺨가 없는 대신 포요 이것은무성폐쇄 성폐쇄읍의

먼트 첫끔에 點點으로써

12 Pierre C. Delattre, Alvin M. Liberman, and Franklin S. Cooper (1955). 이 도표는 p.770 있는 것올 Liberman (1 957)융 창작하여 약간 수정한 것이나 실험내용 자체에는 연합이 없다.

13 Alvin M. Liberman(1957), p.120 서 벌 응-‘

표시한 잡음(즉 이 래에는 업깅소리)이 따른다.

(10)

58 짧學7iff1e N 卷• 1

음이 가지는 입김 [hJ 표시이다. 여 71 에서도 제 2 포오먼트는 유성폐쇄옴에서와 같다. 또한 폐쇄읍의 특정은 이같은 모음의 표오벤트가 시작되 71 직전이 완전한 폐쇄상태이므로스돼 트러그럼에도 (이미 말한 유성의 낮은 짧흡웹를 제외하고는) 아무것도 나타나지 않는 것 이다. [maJ, [naJ, [oaJ 에서는 제 1표오먼르 직전에 그 上下로 나뉘어 가느다란 聲즙帶 의 다발이 나타난다. 이것은 바음 (nasal)의 음향指標가 된다.

마찰음 (fricatives) 은 亂雜波 (random wave) 이기 때문에 스펙트그럼上에도 넓은 주파수펌 域에 번진 홉L雜홉 (random noise) 으로서 나타난다. 예를 들연 제 6 도에서 [sJ, [\J, [s’]등이 분명한 패턴이 없고 넓은 주파수帶域에 걸친 불규칙한 (홉L雜한) 선의 모임 비숫하게 보인 다. 그러나 Strevens 에 의하연 이런 옳L雜홉에도 각 마찰음 특유의 스펙트럼의 분포가 있다 고 한다 14 끈년에까지 나온 중에서 가장 신벙도 높은 연구라고 생각되므로 마찰음에 대

8

해서는 그의 연구결과를 요약소캐하는 릿으로 다}신하겠다. 그는 Edinburgh University 의 음성학과 직원과 연구생 13 명을 대상으로 녹음을 시켜 그것을 전부 옴향분석한 결과 지1 7 도와 같은 결과를 얻 었 다. 表(제 7 드)는 각각 [φJ , [fJ, [9J, [sJ, [IJ, [çJ, [xJ, [XJ, [hJ 등 마찰옴에 대한 스펙트럼分布이다 .X축(수평)에는 A,B

,

C, ... 등 실험대상이 띈 시-람들올 표시했고 Y축(수직)에는 키로싸이플 (kc) 단위의 주파수가 표시되어 있다. 그러므로 線의 길이는 각 사람의 (해당 마찰읍의〕 스펙트렴이 분포(분산)되어 있는 주파수帶의 폭을 나 타낸다. 線에 찍힌 水zp點은 해당 주파수에 비교적 집중적인 에너지의 봉우리 (peaks of energy) 가 있옴을 나타낸다. 이 水平點에는 봉우리의 높이(즉 강도)라든가 그 I團같은 것 은 고려되어 있지 않다. 이 자료의 분석으로 Strevens 는 다음과 같은 결론을 얻었다 먼 저 。 1 9 개 마찰옴은 서로 공통접올 가진 것끼리 세꾸룹으로 구별할 수 있으며 이 꾸룹들 은 조옴점과 밀접한 판계가 있음을 발견할 수 있다. 첫째 앞의 꾸룹에 [φ,f,8J, 중간 꾸 룹에 [s,\,çJ, 그리고 마지막 꾸룹에 [x,X,hJ 를 넣을 수 있다.

I

Peter Strevens(1960)

(11)

훌j . g용걷톰 59

[혀

s,.빼 ..

.,

Fricciw N짜· H _ SP<<'1t

&

7

·b

5 4 1

,‘ ‘

&

1 b

s

3

2

~""IJ.UI

(c) _ _ .... ~LM

(1))

‘-‘’·‘.-

&

7 b S 4

1 2

M

&

7

i。

5 4 3 2

(.)

&

7 b S

@ ]

2

--‘’GÞtl.l.“

(d)

P. l

.. ‘."~I..I'U‘

(1)

&

7 6 5 4

3

z

때 ...,’‘’ .. ’J<<“

-

-,,‘,----’

”””””

| |

l

i -

-!

j””川川川””’h

l

””””“”

·L

Ju

“”

----

--

(.) 1 b

l

4 3 2

... -.... ι.“

&

7 b

‘ s

,

2

..: .... u_

--, ’‘·

@ ω @’

7 저|

앞 꾸룹 [φ,f,8]: 5,000 내치 6 , 000 짜이를의 넓이에 걸치는 긴 스펙트렁. 에너지 봉우리

는 2,000 cps 이하에서 생기나 일정한 형태가 없고 뾰죽함. 세기 (intensity) 는 3 자중 가

장 약함.

중간 꾸룹 [s,\,ç]: 3,000 내지 4 , 000 싸이블 법위에 걸친 비교적 짧은 스펙트럼. 분포의 꾸룹 중 세기가 가장 강함.

중간 길이의 스펙트 봉우리. 세

뒷 꾸룹 [x,

x

,hJ: 4,000 내 지 5,500 싸이 클 폭으로서 세

렴. 에너지의 봉우리라치보다 포어먼트에 가까운 정도의 에너지 집중이 꾸룹중에서 중간 연저리에 하나 또는 두개의 에너지

1,500 cps 에 꾸룹 중의 중간.

나타냥. 강도는 세

(12)

가정적 語뿔&f究 W 1

Strevens 는 한 결음 뎌 나아가 각 꾸룹 안에서 세 옵을 구멸하는 옴향指않까지 으로 정하고 있다. 이것까지 포함하여 이상의 결흔을 요약한 것을 소개한다.

60

꾸훌내의 구운

(여 에녀지 우게 중심이 가장 닛옴 길다 )

(5.000-6.α)0

í

f 에녀지 우게 중심이 중간에 있옴 }이골

l 8 에녀지 우게 중심이 가장 높옴 스펙트럽쪽

강도

약항 조음점에 따를 꾸룰

앞(순옴, 치옴)

c----,,‘---­

Ac

·φ

f 8

/s 밑의 한계 가장 높융

! 윗 한계 가장 높옴 합다

1\

밀 한계 가장 낮옹 (3.900:-4.000

I

윗 한계는 중간 싹이플) μ 밑 한계는 중간

윗 한계 가장 낮응 중간(경순, 구개) 강합

중간 (X 밀 깐계 가장 높옹 (4.000-5.500 1

싹이 물)포오언 { x 밑 한계 풍간임 트 갇윤 에녀지l

용우리 \h 맡 한계 가장 낮옴

그 조음점에 따라 짝짓는 우성옴들과 요소가 있어 에너지가 그 쪽에 소모되 71 혜 유성마찰옴은 각기

같다. 다만 차이점은 유성옴에서는 유성적인 문에 마찰부분의 세기가 훨씬 떨어지는 접이다.

다옴으로

[rJ .

[1J 등 유읍(流홉)이 었으나 아직 연구된 자료가 많지 옷하고 수중의 자료 우성마잘옴인데

이상은모두

푸 충분치 못하여 생 략하며 推移홉〔또는 만모옴 glide or semi-vowel) 에 대 해 서 는 우리 말 의 [wJ, [띠J , [yJ (또는 디]로 표시)에 대한 李趣淑교수의 논문을 국내에서 구할 수 있으 묘로 참조하기 바란다 15

이상으로써 Liberman 이 말한 마찰, 조읍접, 초읍법과 관련시쳐 옴향指標의 홍젖짧만을 소개해 보았다. 그러나 이것은 가장 기본적인 (최소한의) 것에 불과하고 이로부터 출발하

요약하였다. 여 허다한 문제가 있지만 언어합성을 소개하기 위한 배경으로서 간단히

結果相似機構 릎語合成機

2 섣에서 相似機構에 대한 대강을 설영했으므로 본절에서는 結果相ψ.機構의 원리에 의 한 미쉬건대학의 言語合成機(Michigan CSL Speech Synthesizer)16를 소개하고 5 절에 가서 실제 합성의 예를 을기로 한다.

4.

15 뼈랍5 참초.

16 CSL 언어 합성 기 (Communication Sciences Laboratory Speech Synthesizer) 는 Bell Telephone Company 의 연쿠실에서 spectrograph흘 처용 발선시킨 연구원의 한 사랑이었고 그후 며쉬간대학의 Communication Sciences Department 의 科흉, 동실험 실의 director 로 있 던 Gordon E. Peterson 교수와 전기석 nlíl1t뼈빼의 첫 개발자의 한사람인 H. K. Dunn 교수가 중심이 되어 마쉬건대학애서 제작한 것 이다. 본절 (4)에서 소개하는 내용은 1965 년 여톰학기의 Peterson교수의 강의내용과 뼈印動.3'. 없 휴가 그 슴成機로써 실험해 본 경협풍을 골자로 한 이다.

포함하여 슴없에 필요한 媒介變數를 생각해 언저 위 3젤에서 설영을 뭇한 부분까지

(13)

홉뺑흡 j흩!J! 61

연 다옴과 같다.

(1) 옴파에 는 그 服動이 주기 적 인 파형 (pulse wave) 과 옳L雜한 파형 (randorn wave) 의 두 종류가 있으므로 옴파發生器 (wave generator) 는 이 두 가지가 따로 있어야 한다.

(2) 홉調 (tone) 는 基홉周波數 (fundarnental frequency) 에 따막 결정되므로 (1)에서 말한 R따動波(pulse wave) 의 주파수를 조정하는 장치가 필요하다. 亂雜波는 基홉周波數를 갖지 않은 것으로 다루으로 그럴 펄요가 없다.

(3) 조옴에 의한 옴의 구별을 모옴, 비옴, 마찰옴의 셋요로 구분한다. 폐쇄음, 유읍,

추이음 등은 위 셋을 적절히 조절함으로써 얻을 수 있다.

(4) 위 (3) 의 조절에는 첫째, 모옴에 매해서는 포오먼트의 주파수와 帶域福을 조절해 야 한다. 둘해, 비옴의 요소와 세해, 마찰옴의 요소에 대하여는 각각 포오먼트와 antiresonance 의 주파수 빛 帶域l隔을 조절하여 야 한다.

(5) 위 (4) 의 전부(즉 오옴부, 비 음부, 마찰옴부)에 대 하여 각기 그 세 71 (arnplitude) 를 조절해야 한다.

(6) 이상의 모든 조걸요소는 시간융 기준으로 이루어져야 한다. 즉 각 조절요소는 단위 시간에 따라 그 장단을 정하여 합성해야 한다.

이상과 같은 媒介雙數를 조절 통제 (co ntrol) 하기 위하여 사용되는 CSL 언어합성 71 의 機

~~ @~ @<ll

-" • _ •• -- - _ •••• -FR.ICATIVE BANK.... . . . . . . _ ... - - -. ----

8 CSL 언 어 합성

(14)

語!톨liJf究 W 양 1

構團는 제 8 도와 같다. 맨 처옴(왼쪽)에 짧生器로서 服動波를 위한 것 (pulse generator)과 亂雜波를 위 한 것 (noise generator) 의 둘이 있 다. 이 혜 진동은 물론 물리 적 인 것 이 아니 라 전기진동임을 다시 커억해야겠다. 版動波는 周期가 분명하여 음조 (tone) 의 기본이 되므로

62

@에 의하여 그 주파수조절을 한다. 71 본단위는 cps(cycles per second) 이다. 다옴으로 服 動波와 홉L雜波는 각커 세 갈레로 나뉘어 증폭기 (amplifier) 1, 2. 3호로 들어간다. 이 때 모옴部 (oral bank)로 들어가는 것은 @과 @에 의해, 비음부 (nasal bank) 로 들어가는 것은

@으로 각기 그 세기 版動증폭기 (pulse amplifier 3) 에 는

들어가는 것은 마찰옴부 (fricative bank)로

그리고 조절한다.

μ 얘 씨%

--

· n

1H

l

뺑 빼

마찰옴부로 들어가는 번호를

것이어서 이 부분을 동작치 않고 있었기 돼문이 단계 에 서 는 @@.

00.

p비se amplifier 3 과 @ 등에 서 조절띈 R따勳派외- 홉L雜%

를 합해 주는 混成器 (mixer) 가 각 부마다 있 다. 흔성

71

1 호를 거 친 出力은 F •• F3. F2• FI

등 포요먼 트초철 기 를 거 쳐 나와 혼성 증폭기 (mixer amplifier)로 들어 간다. 혼성 기 2 호를 거친 출력은 Fn3. Fn2 • Fnl 과 anti-resonant Fan 을 거쳐 흔성증폭기로 들어 간다 혼성기 3 호흘 거 친 출력 은 Fb3. Fb2• Fbl 과 anti-resonant F.b 를 거 쳐 시 역 시 흔성 증폭기 로 들어 간다. 이얘 F" F2• F3. F4는 각치 제 1포요언투, 제 22t.오먼트, 치I 32t.요먼트, 제 4 포오 언드(모옴부에는 4포오먼트를 섣치했옴에 주옥)를 조잘한다. 이 포오먼트 조절깅-치가 게

소개한 것과 그 회로가 꼭 갇은 것은 아니지만 짙은 원리에 의해 동작하는 회로 안붙인 까닭은 이 커계가 아직 실험중인

다. 셋째

l도에서

입은 물흔이다. Fnl. Fn2 • Fn3 은 비음부의 포오먼드 조절 F.n 은 비옴부 anti-resonant 조절, 다옴으로 Fb" Fb2• Fb3 는 마찰옴부의 재 1.2.3 포오먼트(모음과 같은 것이 아니라 에너지의 봉우리 ) 이 며 anti-resonant F'b 가 있 다 포오먼 르는 모두가 그 중심 주파수 (central frequency)

모옵부, 비옴부,

혼성증폭기에 플어간 와 帶域福(bandwidth) 으로 조절된다. 이렇게 하여

녹옴되거나 한 혼성되어 스피이커를 울리거나 늑음테업에

마찰옴부의 세 파형은 이곳에서

붙은 것은 필자가 실험한 당시0965 다. 제 8도에서 각 조절장치에

CD.@ .... .

@의 번호가

년) 통작되던 부분이고 기타는 미완성상태였다. 여기서 amp( == amplitude). cps. bw등으로 조절기는 전부가 전 71적인 조절입올 잊지 말아야겠다. amp( ==amplitude) 는 증폭기 표시된

의 총이 득 (gain)올 조절하연 되며 • cps 는 주파수 조절 • bw 는 펌域l團 (bandwidth)의 조절이 혼성 증폭기 (mixer amplifier) 를 거 쳐 나요는 전커 진동은 스피 커 를 울리 거 다. 이렇게 해서,

정밀히 되어 스패트러렵 나 녹옴했다가 재생하연 합성한 말이 되는 것이다. 71계설계 자체는 상당히

영료도 (intelligibility) 는 초걸자료 (control data 즉 또는 있으므로 합성된 말의

정말을 커해 분석)에 거의 좌우된다. 한가지 덧붙여 두어야 할 것은 이와 같이

말토박의

조철하치는 어려우므로 조절자료는 왼천히 전 수효도 많은 썼介變數를 手動으로

야 하며

천자계산기로 하여금 모든 자계 산기 (IMB computer) 를 써 서 자료화 (data processing)하여 ,

것올 조절하도록 되어 있다.

(15)

훌훌짧!톨 63

5. /Yd[)iga was’ dYO/C“영 희 가 왔어 요")의 분석

합성을 위한 말로막으로 “영희가 왔어요”를 택했다. 첫째 이렇게 짧은 문장을 택한 것 은 불과 1. 06 秋 미만안 이것을 다루는 태도 상당 분량의 자료를 다루어야 했기 예문예 그 혜의 여건으로서 부득이 했다. 물해로는 우리말의 옴향분석 연구가 거의 전무했던 까닭 으로 필 수 있는 한 문제점이 많은 옴을 가진 문장을 피하고 싶었다. 먼저 이 문장울 여 성 資料提供者 (informant) 로 하여 금 Ampex 350 (633 A microphone) 으로 7. 5 inches/ second

속도로 녹옴케 하고 이것을 BTL2 음향분석기로 분석하여 스펙트러그렴을 얻었다(채 9

도, 제 10 도).

제 9 도 A 는 종합진폭표시 (overall amplitude display) 란 것으로 아래 시 간척도(t. scale) 에 표시펀 시간의 연화에 따라 달라지는 순간순간의 세기를 데시벨 (decibel) 단위로 나타낸 것 이다. 가령 아래 시간척도상 0.5 초의 순간에는 종합진폭은 그 최고봉 (peak) 이 39 데시벨 에 있옴을 볼 수 있다. 다옴으로 제 9 도 B 는 廣帶域스페트러그럽 (broad band spectrogram)

이란 것으로서 300 싸이을 帶域福의 필타 (filter) 를 써서 만든 것이다. 광대역 스펙트러그 럼은 포오먼트를 보치에 아주 펀리한 것이다. t. scale 은 이마 말한 바와 같이 쟁‘ 단위의 시간척도이며 이 말토막은 0.1초의 순간부터 1. 16초의 순간까지, 그러니까 약 1. 06초의

걸이업을 알 수 있다 card no. 란 이 말을 재합성하기 위해서 사용한 컴퓨우터 카아도의

변호이다. 합성자료는 3 번 카아드에서부터 주기 시작하나 71 계 착동 시작을 위한 1 , 2 번 카아드까지 하여 모두 55 애의 카아드를 사용하였다. 이 카아드는 이혼상 단위시간에 대 해 매수를 늘릴수록 재합성된 말이 더 자연스럽고 매끈해질 것이지만 필요이상으로 늘려 서 개선되는 것은 아니다. 시시각각 변하는 포요먼트냐 에너지 분포상황을 55 매(즉 55개) 로 쪼개어 보면 변화해 가는 상태는 최소한 이 말로악의 실지에 가깝게 표시되었다고 생 각된다. t. in terval 은 번호붙은 앞뒤 카아드 사이의 시간간격이다. 그 간격을 숫자로 표시 하지는 않았지만 앤 윗쪽에 있는 t. scale 에 바추어 보면 그 시간을 알 수 있다 segmentation 은 이 합성에서 택한 옴소야하단위 합성법 (subphonemic synthesis) 에 필요한 것은 아니지 만 스돼트러그렴을 옴소단위로 斷節해 본 것이다. 제 10 도는같은 말둥막을 俠帶域스펙트 러 그럼 (narrow band spectrogram) 으로 만든 것 이 다. fj훌뺨域의 300 싸。l 클 帶域順의 필 타와 는 달리 45 싹이클 帶域l圖의 필다를 사용하였기 얘문에 {숍륨 (harmonics or overtones) 이 잘 나타나 있어 그 주파수를 측정함에 펀려하다. 그링에서 10 벤 하아모닉에는 흰선을 그려 서 음조 (tone) 연화를 위한 주파수 측정에 사용하였다. 주파수 측정이 펀리하도록(즉 주파 수 변화가 두드러지도록) 주파수 표시를 위한 수직척도 (frequency in cps) 를 4 인치폭으로 넓혀 走훌했다. 포오먼트의 연화는 그렇게 안해도 충분히 들어나으로 제 9 도 B 는 흔히 쓰는 2 인치폭의 走훌를 했다.

(16)

A

.。

-쇼+*E 。 gi‘ ,。

t

64 S홈쩔&f:;'è IV@' 1

t ‘"tLrrðt

S~‘n~“

9

ι

ι

c

i

,

r

r

‘<r“‘Û~C‘ 3 a OJ a. S y

10

(17)

츰훌촬聲 65

스펙트러그럼의 설명을 이상으로써 끝내고 그 분석에 들어가기 전에 이 싣험의 절차를 단계로 나누연 다음과 같다.

(1) 합성용 말토막을 녹옴하여 스펙트러그럼을 만들고 아래와 갇은 절차로 분석처리한다.

(가) 시 간척 도에 의 거 하여 말토막을 필 요에 따라 짜른다. (이 에 따라 IBM 컴 푸우터 카아도의 수효와 시간의 持續이 결정됩. )

(냐) 제 10 하아모닉 의 주파수를 측정 하여 10 으로 나눌셈 하여 基흡주파수 (fundamentaf frequency) 를 정한다. (제 19도 참조)

(다) 모옴의 세 표오먼트를 측정한다. (합성기계의 모옴부가 다 작동하게 되연 제 4

포오언트도 필요하게 됨. 제 8드 참조.) 측정은 처19 드 B 의 廣帶域스펙트러그렴으 로한다.

(라) 유성자음의 聲홉·帶 (voice bar) 를 측정한다. (제 9 도 B)

(마) 마찰옴 에 너 지 분포의 주파수를 측정 한다. (제 9 도 B)

(바) 포오먼트나 마찰옴 에녁지분포의 帶域I團 (bandwidth)과 진폭 (amplitude) 을 측정한 다. <이 부분은 본 실험에서는 측정치 않고 실험싣에서 정해 놓은 자료에 따랐다.

>

(2) 이 상의 절 차에 약라 완성 된 자료를 도표화하고 그것 올 IBM 컴 퓨우터 카아드에

n

孔한다.

(3) IBM 에 카아드를 넣어 자료표를 만들고 찰못。l 있으연 교정한다.

(4) 교정띈 카아드 뭉치플 7] 계에 넣어 합성올 한다.

위 과정 의 (3) 까지 를 다 마쳐 서 얻 은 자료표는 제 1 표 (pp.66-67)와 같다. 이 표를 위 에 말한 과정과 판련시켜 낱낱이 분석설영하면 다옴과 같다. card no.는 합성을 위해 컴퓨우 터를 사용하였기 매문에 그 카아드의 변호이다. 이 번호들은 제 9 도의 것과 일치한다.

time은 한 카아드에 커록(즉 打孔)띈 조절자료 (control data) 가 지속되어야 할 시간을 나타 낸다. 1 번 카아드는 시간이 0 으로, 2 번 카아드는 1 , α)() mili-seconds(즉 1초)로 되어 있는 까닭은 말이 시작되기 전에(즉 3 번 카아드가 동착하 7] 이전에) 가계가 조정된 상태로 플 어가기 위한 총분한 시간여유를 주기 위한 것이다, 그 다음 3 번 카아도는 스돼트러그럼에 말이 나타나기 시 작한 0.1 초의 순간보다 0.02 초 (즉 20 mili-seconds)만큼 앞당겨 조작시 키고 있는데 이것 역시 커계가 가지는 다성을 참착한 것이다. fo 는 7] 본주파수의 변화를 통제하는 부분이다. 이것은 제 10도의 게 10 하아오닉(흰 선으로 그렌 것)의 주파수를 각 컴퓨우터 카아드에 해당하는 순간마다 측정하여 이것을 10 으로 나눈 값이다. 10 으로 나눈 이 유는 제 10 하아오닉 은 基륨(fundamen tal) 주파수보다 10 배 가 높치 해 문이 다. Vowels 의 부분은 제 8 도의 oral bank 부분의 조절자료이 다. 제 1 (Fj ), 제 2 (F2) , 제 3 (FJ) 포오먼트에

서 처 음 왼쪽 수는 주파수이 며 바른 쪽 (b.w) 부분은 각 帶域뼈이 다. 걷홈域福은 따로이 측정 하지 않고 Fj 에 는 표오먼 트가 안나타나는

우에

는 40

, 나타나는 경 우에 는 50 올 사용했

(18)

66 훌훌훌liII究 W 卷1

card tIme Fricative

no. (m.s.)

(cps) I F

(b.w.)1 F2

(b.w.)\ 90 Fa(b.w.)90 \pu띠씨Is패 .. 0 INOi "\ F nHb. w.) \ Fbl

I

Fb2 jNoise

21 1,000 40 90 90’ 0

3 40 300 40 2,800 90 3,300 90 0 300 401 0 4 10 245 550 50 2,600 100 3,200 100 99 300 50. 25 5 10 247 600 50 1,900 100 3,150 100 99 300 501 50 6 40 248 680 50 1,750 100 3,100 100 99

7 20 252 680 50j 1,750 100 3 , α)() 100 300 50! 99

8 10 252 900 501 1,750 100 2,980 100 300 50: 50

9 40! 252 1,000 40 90 90 0

10 10 260 300 40 90 90 0 300 50i 9

11 10 261 300 50 2,800 100 3,400 100 25 300 !l0; 5 12 40 262 300 50 2,800 100 3,400 100 99 300 50: 25 13 30 265 300 50 2,750 100 3,400 100 99 300

~~!

15

14 30 260 300 50! 2,700 100 3,300 100 99 300 50 10

15 30 255 300 40 2,650 90 3,100 90 0 250 40 0 0

16 10 255 40 90 90 01 99 01 1,400 5,000 99

17 10 270 400 40 2,000 90 2,800 90 01 99 01 1,400 7,000 50 18 20 270 450 50 1,950 100 2,800 100 50 50 O! 1,400 7,000 0

19 20 270 500 50 1,850 100 2,725 100 99 0 0 o

20 20 260 550 50 1,800 100 2,700 1001 99 0 0 0

21 20 262 650 50 1,800 100 0 0

22 20 264 650 50 1,450 100 2, 700 ~~i 99 23 10 265! 450 50 1,200 100 2,700 100' 99 24 20 265: 350 50 1,000 100

25 20 350 50 1,000 100 2,600 100i 99 26 30 650 50 1,250 100 Z 없씌 % 27 10 ;401

875 50 1,500 100 2,650 100! 99

28 30 236| 875 50 1,850 100 2,700 100j 99 0 4,000 7,000 0

29 20 875 50 1,950 100 2,780 100; 99 25 4,000 7,000 50

30 20 700 50 2,100 100 2,800 90 50 50 4,000 7,000 50 31 7 230 600 40 2,100 90 2,900 90 01 99 4,030 7,030 99 32 13 225; 600 40 2,200 90 2,950 90 01 99

4’엽짧 7, 060

99

33 20 222 40 2,300 90 3,000 90 01 99 4, 1001 7,100 99

34 20 2,600 3,200 99 4,30017,300 99

35 20 2,800 3,300 99 4,5001 7,500 99

36 20 4,500 7,500 99

37 27 235 350 401 2, 400 901 3, 050 90r 01 99 4,250 7,250 99 38 13 239 350 501 1, 950 1001 2, 900 1001 991 0 4 , α)() 7,000 50

;\9 20 240 350 50: 1,950 1001 2,900 1001 991 0 4,000 7,000 0

40 20 240 4,000 7,000 0

41 15 239 350 501 2,100 1001 2,950 1001 99j 0 42 25 235 350 5~ 2,500 1에OOj 3, 000 1001 99 43 20

1 238 350 501 2,600 100i 3,000 100[ 99;

(19)

흩!r 4¥ f훌훌훌 67

44' 20 240

45 242 400 50!

1:

750 1001 ;:

~OO 1~1

;;1

46 248 450 501 1,400 1001 2,600 1001 99 47 248 400 50! 1, 200 100! 2, 600 1001

99 ~

48 20 350 50! 1:

;:~~ ~~~ I ;: ;;~ 1~1 ~~!

49 20 240 300 50! 1: 000 1001 2: 580 1001 ;;1 50 10 23b6;! 300sS %oO11 9% lm 2,s4O

lm 에

51 20

300 :~, 900 ~~i :' :~~ 1~1 99;

52 30 230

,

300 50 850 100i 2, 500 901 99 53 20 222 300 501

800 100 901 501

222100

~~I

;~I

54 40 300 50 90

55 40 40 90 90 0

Data Chart of the Synthesized Utterance.

l

으며 F2' F3 에

90 과 100

석 용하였다. pulse

이 최 저 , 99 가 최 고 amplitude 로서 직선적 조절로 돼 있는데 스펙트라그럼에서 따로이 측정하지 않고 0, 25, 50, 99넷으 로 대멸하여 포오먼트의 출현상태를 참작하여 적절히 처리하였다 n01se 의 경우도 요령은 pulse 에 서 와 같이 했지

noise pulse 는 시 간상으로 보아 상호교처l 하는 판계 에 있옴에 주목할 일이다. Nasal의 부분은 18도의 nasal bank를 위한 조절자료이다. 주파수나帶域

福에

대하여는 vowels의 경우와 같아 설영이 불필요하며 pulse는 있지만 noise가 없는 것

nasals의 특정이 다. 다만 한가지 주목껴야

할 점은

리가 무십기에는 「휘」가 [Y<lOiJ로 플리 는 것 같지 만 스펙 트러 그럼 (서19 도)을 보면 }佳移홉(glide)인 [yJ 에 서 부터 디]

에 이르기까지

l

흡이 오초리 미옴化 되어 있옴을

수 있다. 이융자료(제 l 표)에서 3벤

"-' 15 번 카아드에 300"-'250 싸이 달의 미 읍셈域올 줄곧 두는 이 유가 그런 까닭이 다 Fricative 는 16"-' 18번 카아도와 28"-'40번 카아드결쳐 있다. 16"-'18벤 카아드의 것은 「영희가」

의 [gaJ 에서 [gJ에 약간의 氣息(aspiration)이 따르는 것을 나타내려는 것아다. r영희」에서 는 짐작할 있는 바와 감이 [hJ옴은 전혀 없응을 볼 수 있다. 다옴 28"-'40 벤 카아도의 마찰음은 「왔어 요J [was’<lyoJ 에 서 [s’]음을 위 한 것 이 다. 제 9 도의 segmentation 에 는 [s’]

의 시작이 31번 카아도로 되어 있으냐 사실상 마찰은 28번카아드의 순간에 이01 시작 되어 있으므로 그대로 했다. 에너지 분포는 그 봉우리(energy peak)두개 있어 보이며 각각 시간에 따라 그 주파수가 달라지는 듯이 보이므로 (제 9도 28"-'38벤 카아드 해당부 분의 스펙트러그럼에 친 흰 선을 참고) 제 l표의 자료에도 그것을 반영했다. 다만 운셋점 우리말 [s’]에 대한 자료가 전혀 없£므로 다른 옴과 같이 참고자료를 구할 수 없어 서, [s’]는 [sJ보다 그 마찰도가 심하으로(즉 더 된소리이므로) 주파수대가 높아질 것으 로 짐작하여 처리했다. 또한 fricative는 그 帶域福이 대만히 넓기 혜문에 주파수대만 표시하연 帶域福올 표시 안해도 무난하며 기계자체도 미비한 「상태여서 noise의 증폭도

(amplitude)만을 조절토록 했다. 한가지 덧붙혀

설영

이 필요한 것운 半母륨(semi-vowels)

참조

관련 문서

탄산 칼슘은 Tums로 알려진 약제의 활성 성분으로 작용 - 염기인 탄산 이온은 하이드로늄 이온을 중화한다. - 적은 양의 탄산 칼슘(분피로 또한

경찰권의 근거와 한계 경찰하명과 경찰허가 경찰작용과

실외 놀이터에서 흥미에 따라 활동적 또는 조용한 놀이를 함으로써 큰 근육 훈련의 기회를 갖게 되고 풍부한 에너지를 발산할 기회를 가지며 인지적(認知

망각곡선처럼 시간이 지남에 따라 회상이 줄어듬(기억의 일시성, 기억은 영원하지 않다), 그러나 잊고 싶지만 잊지 못하는 지속적 기억도 있음(부정적 기억은

[r]

(뒤쪽 슬라이드 참조.) 그의 관성 개념은 운동을 하려면 외부에서 계속 힘이 작용 해야 한다는 아리스토텔레스의 운동 개념에서

제트엔진을 사용하는 비행기의 경우 작용 반작용의 법칙을 이용하여 추력을 얻는다.. 제트엔진에서 고온 고압의 가스를 압축 후 비행기의

뒤샹의 의도: 미술에서 지적(知的)인 바탕을 강조하고, 그럼으로써 미술창작과정에 동반되는 신체적 활동과 손재주에 대한 관심을 지적인 것으로 돌리려는 것이었다. 즉