ii
표 차 례
iii
그림차례
2.3 원문 텍스트의 문서 표현
앞 절에 기술한 과제의 원문 텍스트에 대해, 개별 원문 텍스트를 문서 (Document)로 간주하고 문서 간 유사도 비교를 시도하였다. 이를 위해, 다음과 같은 전처리 과정을 거쳐 개별 원문 텍스트를 문서 표현 (Document representation)으로 변환하였다. ● 단계-1: 형태소 분석 (Morphological analysis) ● 단계-2: 품사 태깅 (Parts-of-speech tagging) ● 단계-3: 명사구 추출 (Extraction of noun phrases)단계-1에서는 하나의 원문 텍스트에 대해 형태소 분석을 수행한다. 이 후, 품사 태거를 통해 텍스트 내 각 단어의 품사를 결정한다. 마지막으로, 품사 태깅된 결과에서, 일반 명사, 고유 명사, 명사 추정 미등록어, 명사-명사 열 (Noun sequences), 영어 단어들을, 정규 표현 기반 매칭을 통해 자동 추출하였다. 즉, 하나의 문서는, 해당 문서 내에 출현하는 명사류 용 어(Term)들의 모음으로 표현된다. [표 1]은 테스트 대상 원문 텍스트에 대응하는 문서 집합의 통계 정보로, 문서 개수와 문서 당 평균 용어수를 보여 준다. 문서 당 평균 용어 수는 용어 추출 이후 (즉, 위의 단계-1에 서 단계-3까지를 모두 거친 이후) 얻어진 문서 표현에서 용어 개수의 평 균을 구한 것이다. 문서 유형 문서 개수 문서 당 평균 용어 수 용어 추출 전 용어 추출 후 Description document (D-doc) 3,679 3,678 744.66 Keyword document (K-doc) 3,119 2,425 51.18 [표 1] 테스트 원문 텍스트에 대응하는 문서 집합의 통계
델에서의 질의-문서 유사도 수식들인데, 이들은 하나의 문서가 질의로 쓰였는지 검색 대상이 되는 색인 문서로 쓰였는지에 따라 각기 다른 문서 -문서 유사도 값을 계산해 낸다. 연구 성과물의 원문 텍스트 사이의 유사도 비교에 있어서는, 질의로 사 용되는 원문 텍스트와 검색 대상이 되는 원문 텍스트들의 크기가 상이할 수 있음을 고려할 필요가 있다. 즉, [그림 1]에서처럼, 질의 문서(Query document)가 검색 대상이 되는 색인 문서(Indexed document)와 비교하 여 상대적으로 크거나 적을 수 있어서 각 경우에 대한 상이한 해석이 가 능할 수 있기 때문이다. 물론, 코사인 수식의 경우, 비교 대상이 되는 두 문서의 크기를 고려하고 있기는 하나 문서-문서 유사도가 하나의 지표 값으로 계산되므로, [그림 1]의 두 경우를 구별해 내는 지표로 활용되기 에는 무리가 있다. [그림 1] 질의 문서와 색인 문서 사이의 크기 차이 이 연구에서는, 비대칭적 문서-문서 유사도의 하나로, [수식 1]과 같이 질의 문서와 색인 문서 사이에 공유되는 용어의 상대적 비율을 각각 계산 하는 유사도 수식을 사용한다. [수식 1]에서, Q와 D는 각각 질의 문서와 특정 색인 문서 하나를 나타 내며, qi와 dj는 각각 Q와 D에서 i번째와 j번째 출현한 용어를 의미한다.
1) Query Coverage와 Document Coverage가 모두 1에 가까운 경우 - 연구 계획서와 연구 결과 보고서가 내용이나 범위에서 상당히
유사한 경우로, 계획 대비 연구 진척도가 낮은 것으로 판단할 수 있다.
2) Query Coverage와 Document Coverage가 모두 1보다 많이 낮은 경 우
- 연구 계획서와 연구 결과 보고서가 내용이나 범위에서 상당히 상이한 경우로, 계획과 실제 수행 결과가 다른 것으로 판단할 수 있다.
1) Query Coverage와 Document Coverage가 모두 1에 가까운 경우 - 과거 연구와 지원 연구가 내용이나 범위에서 상당히 유사한 경
우로, 중복 연구일 가능성이 높은 것으로 판단할 수 있다.
2) Query Coverage와 Document Coverage가 모두 1보다 많이 낮은 경 우
- 과거 연구와 지원 연구가 내용이나 범위에서 상당히 상이한 경 우로, 중복 연구일 가능성이 낮은 것으로 판단할 수 있다.
3) Query Coverage가 1보다 많이 낮고 Document Coverage가 1에 가까 운 경우
- 과거 연구가 지원 연구보다 내용이나 범위에서 작은 경우로, 지 원 연구가 과거 연구를 계승 발전시키는 것으로 판단할 수 있 다.
4) Query Coverage가 1에 가깝고 Document Coverage가 1보다 많이 낮 은 경우 - 지원 연구가 과거 연구보다 내용이나 범위에서 작은 경우로, 지 원 연구가 과거에 이미 수행되었던 연구로 판단할 수 있다.
3.1.3 심사 적합도 분석
심사 적합도 분석은 심사자의 지원 연구에 대한 평가 가능 여부를 파악 하기 위한 응용 분야로서 심사자의 연구 성과 (논문, 저서, 연구 결과 보 고서 등)와 지원 연구 간 비교를 통해 이루어진다. Query Coverage는 심 사자의 연구 성과가 지원 연구에 얼마나 포함되는가를, Document Coverage는 지원 연구가 심사자의 연구 성과에 얼마나 포함되는가를 의 미한다. 다음 세 가지 경우로 나누어 적합도를 파악할 수 있다.유사한 경우로, 심사자와 지원 연구 책임자 간 연구자 네트워크 를 통해 둘 간의 관계를 파악할 필요가 있는 것으로 판단할 수 있다.
2) Query Coverage와 Document Coverage가 모두 1보다 많이 낮은 경 우
- 심사자의 연구 성과와 지원 연구가 내용이나 범위에서 상당히 상이한 경우로, 심사자의 심사 적합도가 낮아 심사에 부적합한 것으로 판단할 수 있다.
참고문헌
[1] Manning, C. D., Raghavan, P., & Schu"tze, H. (2007). "Introduction
to Information Retrieval".
과제 ID 연구 책임 자 연구수행 기관 과제명 QC DC 과제 ID 연구 책임 자 연구수행 기관 과제명 0 4 1 _ 2 0 0 5 _ 1 _ A 00632 이재성 부 산 대 학 교 포스트모던 윤리학과 노장의 도 사상을 통한 『더버빌가의 테스』연구 0.719 9 0.673 9 321_200 6 _ 2 _ A 0 1035 이재성 부 산 대 학 교 차이의 윤리에서 합일의 윤리로의 이동: 데리다, 레비나스, 라캉과 노 자에서 들뢰즈와 장자로 0 4 3 _ 2 0 0 4 _ 1 _ A 00087 홍정표 한 국 외 국 어대학교 김동인의 단편소설 <배따라 기>에 나타난 정념의 기호학 적 분석 0.718 6 0.838 5 043_200 5 _ 1 _ A 0 0097 홍정표 한 국 외 국 어대학교 김동리의 단편소설 <황토기>에 나 타난 질투의 기호학적 분석 0 0 5 _ 2 0 05_2_J1 5601 박재연 선 문 대 학 교 우리말 고어대사전 편찬 0.703 0.377 9 071_200 4 _ 1 _ A S 3017 박재연 선 문 대 학 교 조선시대 번역소설에 대한 원전정 리 및 주석연구(A Study on the Annotating and the Adjusting Original Text of Translated Novels in Chosun Dynasty)
과제 ID 연구 책임 자 연구수행 기관 과제명 QC DC 과제 ID 연구 책임 자 연구수행 기관 과제명 4 3 1 _ 2 0 0 6 _ 1 _ A 00021 윤소영 한 서 대 학 교 일본대중잡지를 통해 본 일제 시기 근대문화의 단층-일본어 잡지<<모던일본 조선판>>을 중심으로 0.666 7 0.017 4 075_200 5 _ 1 _ A 0 0008 윤소영 한 서 대 학 교 근대 공간 속의 조선인과 일본인, 상극과 융화의 흔적 0 3 4 _ 2 0 04_1_I0 2195 이상경 한 국 여 성 문학학회 여성문학연구 0.666 7 0.003 7 041_200 4 _ 1 _ A 0 0397 이상경 한 국 과 학 기술원 북한여성작가의 작품에 나타난 여 성 정체성에 대한 연구 0 3 4 _ 2 0 0 6 _ 1 _ A 00269 최신한 한 국 해 석 학회 해석학연구 0.666 7 0.003 3 041_200 5 _ 1 _ A 0 0188 최신한 한 남 대 학 교 마이어와 데이빗슨 - 해석에서 ‘동 등성의 원리’와 ‘자비의 원리’ 0 2 8 _ 2 0 0 6 _ 2 _ A 00201 이승진 한 국 브 레 히트학회 브레히트 사후 50주년 기념 심포지움: 디지털매체 시대의 브레히트 0.666 7 0.003 2 074_200 4_1_AM 0127 이승진 원 광 대 학 교 독일어권 공연예술 연구 - 장르별 공연양식분석 및 작품컨텐츠 DB구 축 0 3 4 _ 2 0 04_1_I0 1784 김인중 한 국 프 랑 스사학회 프랑스사연구 0.666 7 0.003 1 035_200 5 _ 1 _ A 0 0015 김인중 숭 실 대 학
-과제 ID 연구 책임 자 연구수행 기관 과제명 QC DC 과제 ID 연구 책임 자 연구수행 기관 과제명 0 7 4 _ 2 0 0 4 _ 1 _ A S0104 박찬부 경 북 대 학 교 마르크시즘과 정신분석: 마르 크스, 프로이트, 알튀세르, 라 캉, 지젝 0.607 7 0.724 1 079_200 5 _ 1 _ A S 0155 박찬부 경 북 대 학 교 자연과 문화, 역사와 기억: 포스트 모더니즘의 대항담론으로서 실재의 정치성과 트로마 이론 0 4 1 _ 2 0 0 4 _ 1 _ A 00101 이충진 한 성 대 학 교 칸트 법철학·정치철학 연구 200년 - 복권(復權)에서 대 안(代案)까지 0.607 6 0.687 6 321_200 6 _ 2 _ A 0 0365 이충진 한 성 대 학 교 공공성(公共性)에 관한 철학적 연 구 - 칸트 정치철학의 현대적 함 의 -3 2 1 _ 2 0 0 6 _ 2 _ A 00563 강석한 인 천 대 학 교
A Study on the Asymmetry Between Production and Perception 0.605 4 0.321 2 908_200 4 _ 1 _ A 0 0059 강석한 연 세 대 학 교 영어 파열음 유,무성성의 음향과 인지 비대칭성 연구 0 0 2 _ 2 0 0 4 _ 1 _ A 00148 임진희 남 서 울 대 학교 한국계 미국문학의 한국성 0.603 7 0.546 6 041_200 5 _ 1 _ A 0 0638 임진희 남 서 울 대 학교 한국어의 탈지역과 한국적 이산의 미학 0 2 8 _ 2 0 05_1_I0 0509 김희자 한 국 독 어 학회 한국독어학회 제7회 학술대회 0.6 0.75 028_200 6 _ 2 _ A 0 0199 김희자 한 국 독 어 학회 한국독어학회 제9회 정기학술대회 0 0 3 _ 2 0 0 4 _ 1 _ A 00163 정연재 건 국 대 학 교 ( 충 주 캠퍼스) 라캉 정신분석을 통한 에드가 앨런 포우의 단편 소설 연구 0.6 0.632 8 321_200 6 _ 2 _ A 0 0974 정연재 건 국 대 학 교 ( 충 주 캠퍼스)
과제 ID 연구 책임 자 연구수행 기관 과제명 QC DC 과제 ID 연구 책임 자 연구수행 기관 과제명 3 2 3 _ 2 0 0 6 _ 1 _ A 00011 전인갑 인 천 대 학 교 현대 중국의 문화보수주의와 ' 중국적 보편'의 재구성 0.462 0.247 6 079_20 05_1_A S0020 배경한 신라대학 교 현대중국의 정당과 정치문화 -1920,30년대 중국국민당과 '당치 체제' 0 3 5 _ 2 0 0 5 _ 1 _ A 00015 김인중 숭 실 대 학
교 Les Lieux de Memoire
0.453 4 0.246 6 079_20 05_1_A S0011 주경철 서울대학 교 숙적에서 동반자로 : 독일과 프랑스 의 역사적 화해 0 3 5 _ 2 0 0 5 _ 1 _ A 00049 이신철 한 국 헤 겔
학회 Philosophie der Mythologie I
과제 ID 연구 책임 자 연구수행 기관 과제명 QC DC 과제 ID 연구 책임 자 연구수행 기관 과제명 0 0 2 _ 2 0 0 4 _ 1 _ A 00129 강옥선 동 서 대 학 교 노예제 담론과 여성의 글쓰기 Slavery Discourse and Women's Writing 0.677 6 0.198 4 074_20 04_1_A S0101 김종갑 1 9 세 기 영어권문 학회 제국주의와 저항의 담론: 19세기 영 어권 문학과 성, 인종, 자연 0 0 5 _ 2 0 0 4 _ 3 _ A 00001 김건태 성 균 관 대 학 교 ( 인 문 사 회 과 학 캠 퍼 스) 일본제국주의의 팽창과 동아시 아 0.433 0.194 9 079_20 05_1_A M0008 하원호 성균관대 학 교 ( 인 문사회과 학 캠 퍼 스) 근대 한러관계 연구- 러시아문서보 관소 소장 한국관련 자료를 중심으 로 -0 4 2 _ 2 -0 0 5 _ 1 _ A 00067 이창희 고 려 대 학 교 옥소(玉所) 권섭(權燮) 연구 0.318 1 0.192 9 042_20 04_1_A 00008 임학성 고려대학 교 16세기 일기자료를 통해 본 양반사 대부의 일상과 의식 0 4 2 _ 2 0 0 4 _ 1 _ A 00069 이인섭 한 국 외 국 어대학교 이라크전 이후 아랍신문의 대 한국관, 한국 이미지 연구 0.432 2 0.183 3 074_20 04_1_A M0066 이종화 명지대학 교 ( 서 울 캠퍼스) 동서 고전 문학의 교류-인도설화의 아랍과 유럽 문학으로의 전이과정 연구-0 3 5 _ 2 연구-0 0 5 _ 1 _ A 00015 김인중 숭 실 대 학
교 Les Lieux de Memoire
조건들-과제 ID 연구 책임 자 연구수행 기관 과제명 QC DC 과제 ID 연구 책임 자 연구수행 기관 과제명 0 0 5 _ 2 0 05_2_J1 5602 양승민 선 문 대 학 교 《韓中古典小說 人名․ 地名 大辭典》 편찬 0.559 8 0.142 9 071_20 04_1_A S3017 박재연 선문대학 교 조선시대 번역소설에 대한 원전정리 및 주석연구(A Study on the Annotating and the Adjusting Original Text of Translated Novels in Chosun Dynasty)
과제 ID 연구 책임 자 연구수행 기관 과제명 QC DC 과제 ID 연구 책임 자 연구수행 기관 과제명 4 3 1 _ 2 0 0 6 _ 1 _ A 00142 이유선 동 덕 여 자 대학교 매체미학 - '이미지학' 연구 0.714 3 0.004 5 074_20 04_1_A S0118 장미영 이화여자 대학교 아포칼립스와 문학적 상상력- '죽음 의 무도'에서 테크노피아까지 4 3 1 _ 2 0 0 6 _ 1 _ A 00023 홍웅호 성 균 관 대 학 교 ( 인 문 사 회 과 학 캠 퍼 스) 근대 한러관계 관련 러시아 자 료 강독팀 0.7 0.004 4 079_20 05_1_A M0008 하원호 성균관대 학 교 ( 인 문사회과 학 캠 퍼 스) 근대 한러관계 연구- 러시아문서보 관소 소장 한국관련 자료를 중심으 로 -4 3 1 _ 2 0 0 6 _ 1 _ A 00081 정재영 한 국 기 술 교 육 대 학 교 구결학회 월례강독회-이두와 향찰 자료를 중심으로 0.307 7 0.004 3 078_20 05_1_A S0035 황선엽 성신여자 대학교 구결 사전 편찬 0 6 0 _ 2 0 05_1_I0 0054 천정환 성 균 관 대 학 교 ( 인 문 사 회 과 학 캠 퍼 스) <식민지 시기 잡지 매체와 근 대적 앎의 형성> 연구 모임 0.666 7 0.004 078_20 05_1_A L0003 임경석 성균관대 학 교 ( 인 문사회과 학 캠 퍼 스) 동아시아 근대 언론매체사전 편찬 및 디지털사전 DB 구축 4 3 1 _ 2 0 0 6 _ 1 _ A 00040 박우석 한 국 과 학 기술원 연구모임명: 한국논리학회 정 기 윤독회연구모임주제: Conceivability and Possibility