• 검색 결과가 없습니다.

근원-목표 영역의 개념적 은유를 위한 상위어(Hypernym) 인식

문서에서 저작자표시 (페이지 46-55)

개념적 은유는 개념적 영역에 걸친 일반적인 사고의 대응이다. 이 대응은 근원 영역, 목표영역, 그리고, 근원-목표영역 사이의 관계와 같은 공통적인 구조로 되 어있다. 근원 영역의 개념은 목표영역의 개념에 해당한다. 개념적 은유 대응은 목표영역의 고유한 구조와 일치하는 방식으로 근원 영역의 인지적인 구조를 보 존해야 한다. 이는 개념적 은유를 사용할 때 근원 영역에 대한 지식을 사용하여 목표영역의 도메인에 대해 추론하기 때문이다.

문장 내 어휘들의 의미 관계는 일반적으로 반의 및 동의 관계, 상위-하위 관 계, 부분-전체 관계 등으로 나눌 수 있다. 특히, 상-하위 관계와 부분-전체 관계 는 의미 관계가 계층 구조를 이룬다는 점에서 계층적 관계로 분류한다. 단어 그 룹에서 상위어 인식을 위해서는 문장 내에서 의미적으로 계층적 관계를 이루고 있는 추출하는 방법이 요구된다. 예를 들어, ‘such X as {Y1, Y2, Y3…}’의 패턴을

이루는 문장을 살펴보면, ‘……works by such authors as Herrick, Goldsmith, and Shakespeare.’에서 ‘authors’는 ‘Herrick’, ‘Goldsmith’, ‘Shakespear’의 상위어로 판 별할 수 있다. 이는 Hearst가 제안한 방법으로 Hearst Pattern이라고 부른다. 텍스 트에서 상-하위 의미 관계를 추출하는 방법으로, 패턴 인식과 의미 관계를 이용 하는 것이 구문 분석하는 것보다 정확하고 효과적인 방법이라고 제안하였다[21].

Hearst Pattern은 다음 표 16과 같이 6개의 패턴을 정의하고 있다[22].

① NP0 such as {NP1 ,NP2 ...,(and | or)} NPn

② such NP as {NP,}* {(or|and)} NP

③ NP {,NP}* {,} or other NP

④ NP {,NP}* {,} and other NP

⑤ NP {,} including {NP,}* {or | and} NP

⑥ NP {,} especially {NP,}* {or | and} NP

표 16. Hearst 상-하위 관계 패턴

이러한 패턴을 이용하여 문장 내에서 추출된 상위 개념에 대한 하위 단어를 하위어(Hyponym)라고 하고, 하위 개념을 포함하는 상위 개념의 단어를 상위어 (Hypernym)라고 한다. 예를 들어, “GDP in developing countries such as Vietnam will continue growing at a high rate.” 문장에 대한 품사 태깅과 종속 구문 분 석을 수행하면 다음 표 17과 같이 나타난다.

토큰 종속 구문 태그 POS 태그

GDP nsubj PROPN

in prep ADP

developing amod VERB

countries pobj NOUN

such amod ADJ

as prep ADP

Vietnam pobj PROPN

will aux AUX

continue ROOT VERB

growing xcomp VERB

at prep ADP

a det DET

high amod ADJ

rate pobj NOUN

. punct PUNCT

표 17. 예제 문장에 대한 품사 태깅

그림 17. 예제 문장의 종속 구문 트리 분석

구문 분석을 수행 후, Hearst Pattern 중 ‘X such as Y’ 패턴을 추출하기 위해서 다음 표 18과 같은 패턴 구문을 정의한다. 패턴 구문을 이용하여 추출된 결과는

‘countries such as Vietnam’이고, ‘Vietnam’의 상위 개념은 ‘countries’ 임을 알 수 있다.

{‘POS' : ’NOUN'} - {‘LOWER' : ’such'} - {'LOWER' : 'as'} - {‘POS' : ’PROPN'}

표 18. ‘X such as Y’ 패턴을 추출하기 위한 패턴 구문

본 논문에서는 근원 영역과 목표영역의 상위어 인식을 위해 POS 태깅으로 구 성된 Hearst Pattern와 종속 구문 트리 패턴을 표 19와 같이 정의한다. 본 논문 에서는 종속 구문 분석을 통해 관계를 인식하기 때문에, 종속 구문 트리 패턴에 의한 Hearst Pattern 추출이 필요하다.

Hearst Patterns Dependency Patterns

NPx such as NPy

case(NPyHead, such) nmod:such as(NPxHead, NPyHead)

Such NPx as NPy

amod(NPxHead, such) case(NPyHead, as) nmod: as(NPxHead, NPyHead) NPx including NPy

case(NPyHead, including) nmod:including(NPxHead, NPyHead)

NPy and | or other NPx

cc(NPyHead, and | or) amod(NPxHead, other) conj(NPyHead, NPxHead) NPx especially NPy

advmod(NPxHead, especially) dep(NPxHead, NPyHead) NPy is a NPx

nsubj(NPxHead, NPyHead) cop(NPxHead, was | were | is | are) 표 19. Hearst Pattern에 대한 종속 구문 트리 패턴 정의

일반적으로 문장은 NP(Noun Phrase, 명사구)에서 의미적 관계가 형성된다. 명 사구는 구문 분석을 기반으로 하는 구문 패턴으로 식별된다. 종속 관계는 단어 간의 구문 관계를 나타내지만, 위에서 정의한 종속 구문 트리 패턴은 NPxHead 의 개념을 사용하여 명사구 사이의 상위어 관계를 식별할 수 있다. 종속 구문 트리 패턴이 문장과 일치하면 상위어(NPxHead)와 하위어(NPyHead)를 식별합니다.

그런 다음, 상위어 단어와 연관된 NP와 하위어 단어와 연관된 명사구 사이의 상 위어 관계가 식별됩니다. 단어와 NPHead가 동일한 단어인 경우, 명사구는 하의 어 또는 상위어와 연관된다.

개념적 은유는 감정, 아이디어, 개념 등을 표현하고 전달하는 데 중요한 역할 을 한다. 이는 효과적인 의사소통을 위해 일상에서 은유를 사용한다. 은유적 표 현을 이해하기 위해서는 다양한 개념에 대한 지식이 필요하다. 개념적 은유가 의 미가 있으려면 근원 영역과 목표영역의 두 개념 중 하나가 명시적으로 정의되어 야 한다. 근원-목표 쌍을 식별하기 위해서는 은유적 문장을 인식해야 한다. 이를 위해, 우선 개념적 은유의 경우, Is-A 관계의 개념을 파악하는 것이 중요하다.

Is-A 패턴이 있는 문장은 잠재적으로 은유 문장이 될 가능성이 크다. Is-A 문장 의 첫 번째 명사는 목표영역의 대상이고, 두 번째 명사는 근원 영역의 대상이다.

목표영역 어휘와 근원 영역 어휘를 집합으로 묶은 후, 문장에서 해당 집합에 대한 지식이 있는지 확인한다. 본 논문에서는 6가지 패턴으로 정의된 Hearst Pattern을 확장하여 더욱 풍부한 개념적 은유 패턴을 찾는 방법을 고려하였다. 표 20은 확장 된 Hearst Pattern 목록이다.

분류 패턴 패턴 검색식

기존 패턴

NPx such as NPy (NP_\\w+ (, )?such as (NP_\\w+ ?(, )?(and |or )?)+) Such NPx as NPy (such NP_\\w+ (, )?as (NP_\\w+ ?(, )?(and |or )?)+) NPx including NPy (NP_\\w+ (, )?include (NP_\\w+ ?(, )?(and |or )?)+) NPy and | or other

NPx

((NP_\\w+ ?(, )?)+(and |or )?other NP_\\w+)

NPx especially NPy (NP_\\w+ (, )?especially (NP_\\w+ ?(, )?(and |or )?)+) NPy is a NPx (NP_\\w+ (, )?is a (NP_\\w+ ?(, )?(and |or )?)+)

표 20. Hearst Pattern의 확장된 패턴 정의

확장 패턴

NPy and | or any other NPx

((NP_\\w+ ?(, )?)+(and |or )?any other NP_\\w+) NPy and | or some

other NPx

((NP_\\w+ ?(, )?)+(and |or )?some other NP_\\w+) NPy and | or be a

NPx

((NP_\\w+ ?(, )?)+(and |or )?be a NP_\\w+) NPy and | or NPx (NP_\\w+ (, )?like (NP_\\w+ ? (, )?(and |or )?)+) such NPy as NPx and

| or such (NP_\\w+ (, )?as (NP_\\w+ ? (, )?(and |or )?)+) NPy and | or like

other NPx

((NP_\\w+ ?(, )?)+(and |or )?like other NP_\\w+) NPy and | or one of

the NPx

((NP_\\w+ ?(, )?)+(and |or )?one of the NP_\\w+) NPy and | or one of

these NPx

((NP_\\w+ ?(, )?)+(and |or )?one of these NP_\\w+) NPy and | or one of

those NPx

((NP_\\w+ ?(, )?)+(and |or )?one of those NP_\\w+) example of NPy be

NPx and | or example of (NP_\\w+ (, )?be (NP_\\w+ ? (, )?(and |or )?)+)

확장 패턴

NPy and | or be example of NPx

((NP_\\w+ ?(, )?)+(and |or )?be example of NP_\\w+) NPy for example NPx

and | or (NP_\\w+ (, )?for example (, )?(NP_\\w+ ?(, )?(and |or )?)+) NPy and | or one

which be call NPx

((NP_\\w+ ?(, )?)+(and |or )?which be call NP_\\w+) NPy principally NPx

and | or (NP_\\w+ (, )?principally (NP_\\w+ ? (, )?(and |or )?)+) NPy type NPx and |

or one (NP_\\w+ (, )?type (NP_\\w+ ? (, )?(and |or )?)+) NPy and | or NPx

type ((NP_\\w+ ?(, )?)+(and |or )? NP_\\w+ type) NPy whether NPx and

| or (NP_\\w+ (, )?whether (NP_\\w+ ? (, )?(and |or )?)+) compare NPy and |

or one with NPx

(compare (NP_\\w+ ?(, )?)+(and |or )?with NP_\\w+) NPy compare to NPx

and | or (NP_\\w+ (, )?compare to (NP_\\w+ ? (, )?(and |or )?)+) NPy NPx and | or for

instance (NP_\\w+ (, )? (NP_\\w+ ? (, )?(and |or )?)for instance)

본 장에서는 개념적 은유의 근원-목표영역 개념과 관계 추출을 위해 Top2Vec 모델을 기반으로 개념 후보를 추출하고, 개념적 은유 패턴을 기반 의미 관계를 정의하고, 이를 모델링 하였다. 또한, 근원-목표영역의 개념 후보 선정을 위해 상 위어 인식을 위한 Hearst Pattern의 확장된 패턴을 정의하였다. 개념 후보와 의미 관계 추출 방법을 이용하여 상위어 후보 추출을 수행하였다. CNN 뉴스 데이터를 Top2Vec 알고리즘을 통해 학습을 시킨 후, 해당 모델을 이용하여 ‘Money’와 연관된 단어는 다음 표 21과 같이 분류되었다.

money, tax, price, pay, income, taxis, dollar, bank, currency, profit go, say, get, tell, friend, ask, girl, woman, love, meet

leave, return, back, go, send, decide, eventually, bring, soon, come make, although, even, though, much, however, still, less, remain, often take, give, place, player, hand, position, order, name, play, allow

letter, deliver, express, scandal, trial, public, accuse, private, dismiss, publicly company, corporation, system, agency, service, local, government, business, management, public

political, support, policy, issue, concern, public, campaign, make, criticism, seek game, player, run, deal, baseball, card, home, pitcher, season, hit

attack, kill, police, murder, victim, crime, death, cause, arrest, result film, good, award, receive, win, awards, academy, critic, review, actor win, world, cup, play, championship, olympic, team, event, club, since write, john, guitar, band, author, ray, mark, book, drummer, guitarist however, attempt, result, despite, fail, successful, prove, due, fall, continue law, court, case, legal, act, right, jurisdiction, amendment, supreme, judge car, company, sell, manufacturer, model, brand, market, sale, product, ford

표 21. ‘Money’ 연관단어 순위

그림 18. ‘Money’ 연관단어 그룹

각 임베딩 차원에 대한 관련어이고, 그림 18과 같이 “Money’와 의미적으로 가장 가까운 그룹이 가장 높은 순으로 나타났다. 다음 그림 19는 ‘Book’과 연관된 유사 단어 그룹핑 결과이다.

그림 19. ‘Book’ 연관단어 그룹

개념적 은유의 근원-목표영역의 파악하기 위해 두 영역에 동시에 출현하는 상위어 관련 어휘를 그룹핑 할 필요가 있다. 예를 들어, “Love”과 “Waepon”이 동시에 출현했을 때, 관련 어휘를 그룹한 결과는 다음 그림 20과 같다.

그림 20. “Love” & “Waepon” 관련 어휘 그룹

문서에서 저작자표시 (페이지 46-55)

관련 문서