• 검색 결과가 없습니다.

원문 기반 학술정보 분석 연구

N/A
N/A
Protected

Academic year: 2021

Share "원문 기반 학술정보 분석 연구"

Copied!
92
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)
(2)
(3)

ii

표 차 례

(4)

iii

그림차례

(5)
(6)
(7)
(8)
(9)
(10)
(11)
(12)
(13)
(14)
(15)

2.3 원문 텍스트의 문서 표현

앞 절에 기술한 과제의 원문 텍스트에 대해, 개별 원문 텍스트를 문서 (Document)로 간주하고 문서 간 유사도 비교를 시도하였다. 이를 위해, 다음과 같은 전처리 과정을 거쳐 개별 원문 텍스트를 문서 표현 (Document representation)으로 변환하였다. ● 단계-1: 형태소 분석 (Morphological analysis) ● 단계-2: 품사 태깅 (Parts-of-speech tagging) ● 단계-3: 명사구 추출 (Extraction of noun phrases)

단계-1에서는 하나의 원문 텍스트에 대해 형태소 분석을 수행한다. 이 후, 품사 태거를 통해 텍스트 내 각 단어의 품사를 결정한다. 마지막으로, 품사 태깅된 결과에서, 일반 명사, 고유 명사, 명사 추정 미등록어, 명사-명사 열 (Noun sequences), 영어 단어들을, 정규 표현 기반 매칭을 통해 자동 추출하였다. 즉, 하나의 문서는, 해당 문서 내에 출현하는 명사류 용 어(Term)들의 모음으로 표현된다. [표 1]은 테스트 대상 원문 텍스트에 대응하는 문서 집합의 통계 정보로, 문서 개수와 문서 당 평균 용어수를 보여 준다. 문서 당 평균 용어 수는 용어 추출 이후 (즉, 위의 단계-1에 서 단계-3까지를 모두 거친 이후) 얻어진 문서 표현에서 용어 개수의 평 균을 구한 것이다. 문서 유형 문서 개수 문서 당 평균 용어 수 용어 추출 전 용어 추출 후 Description document (D-doc) 3,679 3,678 744.66 Keyword document (K-doc) 3,119 2,425 51.18 [표 1] 테스트 원문 텍스트에 대응하는 문서 집합의 통계

(16)
(17)
(18)

델에서의 질의-문서 유사도 수식들인데, 이들은 하나의 문서가 질의로 쓰였는지 검색 대상이 되는 색인 문서로 쓰였는지에 따라 각기 다른 문서 -문서 유사도 값을 계산해 낸다. 연구 성과물의 원문 텍스트 사이의 유사도 비교에 있어서는, 질의로 사 용되는 원문 텍스트와 검색 대상이 되는 원문 텍스트들의 크기가 상이할 수 있음을 고려할 필요가 있다. 즉, [그림 1]에서처럼, 질의 문서(Query document)가 검색 대상이 되는 색인 문서(Indexed document)와 비교하 여 상대적으로 크거나 적을 수 있어서 각 경우에 대한 상이한 해석이 가 능할 수 있기 때문이다. 물론, 코사인 수식의 경우, 비교 대상이 되는 두 문서의 크기를 고려하고 있기는 하나 문서-문서 유사도가 하나의 지표 값으로 계산되므로, [그림 1]의 두 경우를 구별해 내는 지표로 활용되기 에는 무리가 있다. [그림 1] 질의 문서와 색인 문서 사이의 크기 차이 이 연구에서는, 비대칭적 문서-문서 유사도의 하나로, [수식 1]과 같이 질의 문서와 색인 문서 사이에 공유되는 용어의 상대적 비율을 각각 계산 하는 유사도 수식을 사용한다. [수식 1]에서, Q와 D는 각각 질의 문서와 특정 색인 문서 하나를 나타 내며, qi와 dj는 각각 Q와 D에서 i번째와 j번째 출현한 용어를 의미한다.

(19)
(20)
(21)
(22)
(23)
(24)

1) Query Coverage와 Document Coverage가 모두 1에 가까운 경우 - 연구 계획서와 연구 결과 보고서가 내용이나 범위에서 상당히

유사한 경우로, 계획 대비 연구 진척도가 낮은 것으로 판단할 수 있다.

2) Query Coverage와 Document Coverage가 모두 1보다 많이 낮은 경 우

- 연구 계획서와 연구 결과 보고서가 내용이나 범위에서 상당히 상이한 경우로, 계획과 실제 수행 결과가 다른 것으로 판단할 수 있다.

(25)

1) Query Coverage와 Document Coverage가 모두 1에 가까운 경우 - 과거 연구와 지원 연구가 내용이나 범위에서 상당히 유사한 경

우로, 중복 연구일 가능성이 높은 것으로 판단할 수 있다.

2) Query Coverage와 Document Coverage가 모두 1보다 많이 낮은 경 우

- 과거 연구와 지원 연구가 내용이나 범위에서 상당히 상이한 경 우로, 중복 연구일 가능성이 낮은 것으로 판단할 수 있다.

3) Query Coverage가 1보다 많이 낮고 Document Coverage가 1에 가까 운 경우

- 과거 연구가 지원 연구보다 내용이나 범위에서 작은 경우로, 지 원 연구가 과거 연구를 계승 발전시키는 것으로 판단할 수 있 다.

4) Query Coverage가 1에 가깝고 Document Coverage가 1보다 많이 낮 은 경우 - 지원 연구가 과거 연구보다 내용이나 범위에서 작은 경우로, 지 원 연구가 과거에 이미 수행되었던 연구로 판단할 수 있다.

3.1.3 심사 적합도 분석

심사 적합도 분석은 심사자의 지원 연구에 대한 평가 가능 여부를 파악 하기 위한 응용 분야로서 심사자의 연구 성과 (논문, 저서, 연구 결과 보 고서 등)와 지원 연구 간 비교를 통해 이루어진다. Query Coverage는 심 사자의 연구 성과가 지원 연구에 얼마나 포함되는가를, Document Coverage는 지원 연구가 심사자의 연구 성과에 얼마나 포함되는가를 의 미한다. 다음 세 가지 경우로 나누어 적합도를 파악할 수 있다.

(26)

유사한 경우로, 심사자와 지원 연구 책임자 간 연구자 네트워크 를 통해 둘 간의 관계를 파악할 필요가 있는 것으로 판단할 수 있다.

2) Query Coverage와 Document Coverage가 모두 1보다 많이 낮은 경 우

- 심사자의 연구 성과와 지원 연구가 내용이나 범위에서 상당히 상이한 경우로, 심사자의 심사 적합도가 낮아 심사에 부적합한 것으로 판단할 수 있다.

(27)
(28)
(29)
(30)
(31)

참고문헌

[1] Manning, C. D., Raghavan, P., & Schu"tze, H. (2007). "Introduction

to Information Retrieval".

(32)
(33)
(34)
(35)
(36)
(37)
(38)
(39)
(40)
(41)
(42)

과제 ID 연구 책임 자 연구수행 기관 과제명 QC DC 과제 ID 연구 책임 자 연구수행 기관 과제명 0 4 1 _ 2 0 0 5 _ 1 _ A 00632 이재성 부 산 대 학 교 포스트모던 윤리학과 노장의 도 사상을 통한 『더버빌가의 테스』연구 0.719 9 0.673 9 321_200 6 _ 2 _ A 0 1035 이재성 부 산 대 학 교 차이의 윤리에서 합일의 윤리로의 이동: 데리다, 레비나스, 라캉과 노 자에서 들뢰즈와 장자로 0 4 3 _ 2 0 0 4 _ 1 _ A 00087 홍정표 한 국 외 국 어대학교 김동인의 단편소설 <배따라 기>에 나타난 정념의 기호학 적 분석 0.718 6 0.838 5 043_200 5 _ 1 _ A 0 0097 홍정표 한 국 외 국 어대학교 김동리의 단편소설 <황토기>에 나 타난 질투의 기호학적 분석 0 0 5 _ 2 0 05_2_J1 5601 박재연 선 문 대 학 교 우리말 고어대사전 편찬 0.703 0.377 9 071_200 4 _ 1 _ A S 3017 박재연 선 문 대 학 교 조선시대 번역소설에 대한 원전정 리 및 주석연구(A Study on the Annotating and the Adjusting Original Text of Translated Novels in Chosun Dynasty)

(43)
(44)

과제 ID 연구 책임 자 연구수행 기관 과제명 QC DC 과제 ID 연구 책임 자 연구수행 기관 과제명 4 3 1 _ 2 0 0 6 _ 1 _ A 00021 윤소영 한 서 대 학 교 일본대중잡지를 통해 본 일제 시기 근대문화의 단층-일본어 잡지<<모던일본 조선판>>을 중심으로 0.666 7 0.017 4 075_200 5 _ 1 _ A 0 0008 윤소영 한 서 대 학 교 근대 공간 속의 조선인과 일본인, 상극과 융화의 흔적 0 3 4 _ 2 0 04_1_I0 2195 이상경 한 국 여 성 문학학회 여성문학연구 0.666 7 0.003 7 041_200 4 _ 1 _ A 0 0397 이상경 한 국 과 학 기술원 북한여성작가의 작품에 나타난 여 성 정체성에 대한 연구 0 3 4 _ 2 0 0 6 _ 1 _ A 00269 최신한 한 국 해 석 학회 해석학연구 0.666 7 0.003 3 041_200 5 _ 1 _ A 0 0188 최신한 한 남 대 학 교 마이어와 데이빗슨 - 해석에서 ‘동 등성의 원리’와 ‘자비의 원리’ 0 2 8 _ 2 0 0 6 _ 2 _ A 00201 이승진 한 국 브 레 히트학회 브레히트 사후 50주년 기념 심포지움: 디지털매체 시대의 브레히트 0.666 7 0.003 2 074_200 4_1_AM 0127 이승진 원 광 대 학 교 독일어권 공연예술 연구 - 장르별 공연양식분석 및 작품컨텐츠 DB구 축 0 3 4 _ 2 0 04_1_I0 1784 김인중 한 국 프 랑 스사학회 프랑스사연구 0.666 7 0.003 1 035_200 5 _ 1 _ A 0 0015 김인중 숭 실 대 학

(45)
(46)
(47)
(48)
(49)
(50)
(51)
(52)

-과제 ID 연구 책임 자 연구수행 기관 과제명 QC DC 과제 ID 연구 책임 자 연구수행 기관 과제명 0 7 4 _ 2 0 0 4 _ 1 _ A S0104 박찬부 경 북 대 학 교 마르크시즘과 정신분석: 마르 크스, 프로이트, 알튀세르, 라 캉, 지젝 0.607 7 0.724 1 079_200 5 _ 1 _ A S 0155 박찬부 경 북 대 학 교 자연과 문화, 역사와 기억: 포스트 모더니즘의 대항담론으로서 실재의 정치성과 트로마 이론 0 4 1 _ 2 0 0 4 _ 1 _ A 00101 이충진 한 성 대 학 교 칸트 법철학·정치철학 연구 200년 - 복권(復權)에서 대 안(代案)까지 0.607 6 0.687 6 321_200 6 _ 2 _ A 0 0365 이충진 한 성 대 학 교 공공성(公共性)에 관한 철학적 연 구 - 칸트 정치철학의 현대적 함 의 -3 2 1 _ 2 0 0 6 _ 2 _ A 00563 강석한 인 천 대 학 교

A Study on the Asymmetry Between Production and Perception 0.605 4 0.321 2 908_200 4 _ 1 _ A 0 0059 강석한 연 세 대 학 교 영어 파열음 유,무성성의 음향과 인지 비대칭성 연구 0 0 2 _ 2 0 0 4 _ 1 _ A 00148 임진희 남 서 울 대 학교 한국계 미국문학의 한국성 0.603 7 0.546 6 041_200 5 _ 1 _ A 0 0638 임진희 남 서 울 대 학교 한국어의 탈지역과 한국적 이산의 미학 0 2 8 _ 2 0 05_1_I0 0509 김희자 한 국 독 어 학회 한국독어학회 제7회 학술대회 0.6 0.75 028_200 6 _ 2 _ A 0 0199 김희자 한 국 독 어 학회 한국독어학회 제9회 정기학술대회 0 0 3 _ 2 0 0 4 _ 1 _ A 00163 정연재 건 국 대 학 교 ( 충 주 캠퍼스) 라캉 정신분석을 통한 에드가 앨런 포우의 단편 소설 연구 0.6 0.632 8 321_200 6 _ 2 _ A 0 0974 정연재 건 국 대 학 교 ( 충 주 캠퍼스)

(53)
(54)
(55)
(56)
(57)
(58)
(59)
(60)
(61)
(62)
(63)
(64)
(65)
(66)
(67)
(68)
(69)

과제 ID 연구 책임 자 연구수행 기관 과제명 QC DC 과제 ID 연구 책임 자 연구수행 기관 과제명 3 2 3 _ 2 0 0 6 _ 1 _ A 00011 전인갑 인 천 대 학 교 현대 중국의 문화보수주의와 ' 중국적 보편'의 재구성 0.462 0.247 6 079_20 05_1_A S0020 배경한 신라대학 교 현대중국의 정당과 정치문화 -1920,30년대 중국국민당과 '당치 체제' 0 3 5 _ 2 0 0 5 _ 1 _ A 00015 김인중 숭 실 대 학

교 Les Lieux de Memoire

0.453 4 0.246 6 079_20 05_1_A S0011 주경철 서울대학 교 숙적에서 동반자로 : 독일과 프랑스 의 역사적 화해 0 3 5 _ 2 0 0 5 _ 1 _ A 00049 이신철 한 국 헤 겔

학회 Philosophie der Mythologie I

(70)
(71)
(72)

과제 ID 연구 책임 자 연구수행 기관 과제명 QC DC 과제 ID 연구 책임 자 연구수행 기관 과제명 0 0 2 _ 2 0 0 4 _ 1 _ A 00129 강옥선 동 서 대 학 교 노예제 담론과 여성의 글쓰기 Slavery Discourse and Women's Writing 0.677 6 0.198 4 074_20 04_1_A S0101 김종갑 1 9 세 기 영어권문 학회 제국주의와 저항의 담론: 19세기 영 어권 문학과 성, 인종, 자연 0 0 5 _ 2 0 0 4 _ 3 _ A 00001 김건태 성 균 관 대 학 교 ( 인 문 사 회 과 학 캠 퍼 스) 일본제국주의의 팽창과 동아시 아 0.433 0.194 9 079_20 05_1_A M0008 하원호 성균관대 학 교 ( 인 문사회과 학 캠 퍼 스) 근대 한러관계 연구- 러시아문서보 관소 소장 한국관련 자료를 중심으 로 -0 4 2 _ 2 -0 0 5 _ 1 _ A 00067 이창희 고 려 대 학 교 옥소(玉所) 권섭(權燮) 연구 0.318 1 0.192 9 042_20 04_1_A 00008 임학성 고려대학 교 16세기 일기자료를 통해 본 양반사 대부의 일상과 의식 0 4 2 _ 2 0 0 4 _ 1 _ A 00069 이인섭 한 국 외 국 어대학교 이라크전 이후 아랍신문의 대 한국관, 한국 이미지 연구 0.432 2 0.183 3 074_20 04_1_A M0066 이종화 명지대학 교 ( 서 울 캠퍼스) 동서 고전 문학의 교류-인도설화의 아랍과 유럽 문학으로의 전이과정 연구-0 3 5 _ 2 연구-0 0 5 _ 1 _ A 00015 김인중 숭 실 대 학

교 Les Lieux de Memoire

(73)
(74)

조건들-과제 ID 연구 책임 자 연구수행 기관 과제명 QC DC 과제 ID 연구 책임 자 연구수행 기관 과제명 0 0 5 _ 2 0 05_2_J1 5602 양승민 선 문 대 학 교 《韓中古典小說 人名&#8228; 地名 大辭典》 편찬 0.559 8 0.142 9 071_20 04_1_A S3017 박재연 선문대학 교 조선시대 번역소설에 대한 원전정리 및 주석연구(A Study on the Annotating and the Adjusting Original Text of Translated Novels in Chosun Dynasty)

(75)
(76)
(77)
(78)
(79)
(80)
(81)

과제 ID 연구 책임 자 연구수행 기관 과제명 QC DC 과제 ID 연구 책임 자 연구수행 기관 과제명 4 3 1 _ 2 0 0 6 _ 1 _ A 00142 이유선 동 덕 여 자 대학교 매체미학 - '이미지학' 연구 0.714 3 0.004 5 074_20 04_1_A S0118 장미영 이화여자 대학교 아포칼립스와 문학적 상상력- '죽음 의 무도'에서 테크노피아까지 4 3 1 _ 2 0 0 6 _ 1 _ A 00023 홍웅호 성 균 관 대 학 교 ( 인 문 사 회 과 학 캠 퍼 스) 근대 한러관계 관련 러시아 자 료 강독팀 0.7 0.004 4 079_20 05_1_A M0008 하원호 성균관대 학 교 ( 인 문사회과 학 캠 퍼 스) 근대 한러관계 연구- 러시아문서보 관소 소장 한국관련 자료를 중심으 로 -4 3 1 _ 2 0 0 6 _ 1 _ A 00081 정재영 한 국 기 술 교 육 대 학 교 구결학회 월례강독회-이두와 향찰 자료를 중심으로 0.307 7 0.004 3 078_20 05_1_A S0035 황선엽 성신여자 대학교 구결 사전 편찬 0 6 0 _ 2 0 05_1_I0 0054 천정환 성 균 관 대 학 교 ( 인 문 사 회 과 학 캠 퍼 스) <식민지 시기 잡지 매체와 근 대적 앎의 형성> 연구 모임 0.666 7 0.004 078_20 05_1_A L0003 임경석 성균관대 학 교 ( 인 문사회과 학 캠 퍼 스) 동아시아 근대 언론매체사전 편찬 및 디지털사전 DB 구축 4 3 1 _ 2 0 0 6 _ 1 _ A 00040 박우석 한 국 과 학 기술원 연구모임명: 한국논리학회 정 기 윤독회연구모임주제: Conceivability and Possibility

(82)
(83)
(84)
(85)
(86)
(87)
(88)
(89)
(90)
(91)
(92)

수치

[표  1]에서  Description  document  (D-doc)는  앞  절에  언급된  8개의

참조

관련 문서

구조주의 의식적 경험 정신의 구조 분석 분석적 내성법 기능주의 의식적 경험 정신의 기능 연구 내성법, 행동을 측정. 행동주의 관찰

업무 시스템의 이벤트 로그 데이터를 분석하여 실제 프로세스를 도출하고, 프로세스 개선을 지원하는 프로세스 마이닝 기반

• FortiAI 버추얼 보안 분석가(VSA)의 시나리오 기반 엔진 (악성코드 동작 방식과 시간대별 공격 패턴을 인지) 을 통해서 네트워크 경로를 통한 시간대별 감염 패턴

한국직업능력개발원의 중・고등학생을 위한 직업적성검사」가 갖는 교육 적 효과를 다각적으로 밝힌 본 연구는 그 결과가 적성검사의 활용과 관련된 이론적 논의에

논리, 규칙 기반 연결 기반 통계기반 딥러닝 기반... 윤리헌장을 살펴보면

논리, 규칙 기반 연결 기반 통계기반 딥러닝 기반... 윤리헌장을 살펴보면

논리, 규칙 기반 연결 기반 통계기반 딥러닝 기반... 윤리헌장을 살펴보면

- 정기간행물인 “주간 동북아 에너지 시장”과 “Northeast Asia Energy Focus”를 동북아시장분석 과제에서 분리하여 독립적인 발간체제 확립. - “주간