• 검색 결과가 없습니다.

□ 새로운 학술정보 유통 패러다임인 오픈액세스에 대한 관심이 고조되고 있 으며, 학술정보의 생산과 유통에 변화의 바람이 불고 있음.

- 전통적으로 학술정보 생산은 출판사와 배급자가 담당하고, 도서관과 정보 서비스 기관들이 정보유통을 담당하는 분화된 구조였음.

- 상업 출판사에 의한 저작권 독점 및 전자저널의 급격한 가격상승은 학술 정보 유통 위기를 초래하였으며 새로운 변화를 요구함.

□ 전 세계적으로 오픈액세스 기반 리포지터리 구축이 매우 활발하며, 특히 2006년 이후 기관 리포지터리 구축이 급격하게 증가하고 있음.

- 많은 대학이나 연구소에서 학술정보를 수집·장기보존·확산하기 위해 리포 지터리를 구축하고 있으며 향후 이런 움직임은 더욱 가속화될 것임.

⋅전 세계 리포지터리는 1,650개로 매일 평균 1개의 신규 리포지터리가 등록되고 있음(ROAR, http://roar.eprints.org, 2010.8).

- 해외 주요 리포지터리들은 정부의 지원과 연구자들의 참여로 다량의 학 술정보를 구축하여 공유하고 있으며, 활발히 이용됨에 따라 그 규모가 더 욱 확대되고 있음.

⋅전 세계적으로 리포지터리를 통해 2,300백만건 이상의 학술정보를 수집 하여 공유하고 있음(OCLC, http://www.oclc.org/oaister, 2010.8).

□ 국내 리포지터리의 경우 초기단계로 리포지터리에 대한 인식도 부족하고 정부지원도 미흡함.

- 국내에 총 5개 기관(KAIST, 서울대, 인하대, 지질자원연구원, 대외경제정 책연구원)에서 리포지터리를 구축ㆍ운영하고 있으며, 공식적인 기구에 등 록된 리포지터리는 KAIST의 KOASAS(KAIST Open Access Self Archi- ving System), 서울대의 S-Space, 대외경제정책연구원의 Korea Institute

for International Economic Policy임.

- 전 세계 리포지터리 웹 순위(Ranking Web of World Repositories, http://

re positories.webometrics.info)의 상위 400위에 국내 기관은 한 곳도 포 함되지 않음. 그러나 일본은 25개 리포지터리가 포함됨.

□ 본 리포트는 국내 리포지터리 운영 및 활성화 방안을 모색하기 위해 해외 주요 리포지터리를 중심으로 운영․지원․수집․관리․배포․이용활성화․

장기보존․저작권 정책을 집중적으로 조사 분석하여 시사점을 도출함.

2. 리포지터리 개요 및 성공요인

- 메타데이터를 수집(harvest)하여 공유할 수 있도록 개방형 표준 프로토콜인 OAI-PMH(Open Archives Initiative Protocol for Metadata Harvesting)를 지원함. 방적인 이용허락임(CCK, http://www.creativecommons.or.kr/, 2010.9).

3) 리포지터리 개발동향

□ 리포지터리에 등록된 콘텐츠 유형은 매우 다양하며 대부분 학술정보임.

구분 내용

□ Johnson(2002)은 기관 리포지터리 운영주체와 환경이 다양하지만 기관 리

그 연구영역을 빼앗길 위험이 있음.

⋅정확성 문제: 리포지터리 저작물은 동료심사 등을 거치지 않기 때문에 정확성 문제가 있을 수 있으며, 평판이 떨어지는 자료가 포함될 수 있음.

□ Westrienen과 Lynch(2005)는 리포지터리를 사용하지 않는 이유를 다음과 같이 정리함.

- 참여할 필요성을 납득할 수 없거나 지적재산권 문제에 대한 혼란과 불확 실성

- 리포지터리 콘텐츠가 어떻게 사용될 것인지에 대한 신뢰도가 낮거나 오픈 액세스로 제공되는 콘텐츠는 수준이 낮다는 인식

- 논문 제출 의무화에 대한 정책 결여

3. 해외 리포지터리 현황 및 주요사례 조사

1) 해외 리포지터리 현황

□ 해외 리포지터리 현황을 분석하기 위해 2010년 1월 스페인 국가연구위원회 (CSIC) 소속 사이버메트릭스연구실에서 발표한 세계 리포지터리 웹 순위 (Ranking Web of World Repositories)를 이용함. <그림 1>은 Ranking Web of World Repositories에서 제공한 상위 400개 리포지터리이며, 미국 에서 운영하는 리포지터리들이 최상위에 랭크됨.

<그림 1> Ranking Web of World Repositories의 Top 1~18

□ 스페인 사이버메트릭스연구실에서는 리포지터리를 크기, 가시성, 리치 파일, 구글 스칼라 문헌수 측면에서 평가하여 매년 순위를 발표하고 있으며 세부 내용 및 가중치는 다음과 같음(2010.4).

- 크기(size, S): 세계적으로 가장 큰 4개 검색엔진(Google, Yahoo, Live Search, Exalead)에 나타난 페이지 수

- 가시성(visibility, V): Yahoo와 Exalead로부터 확보한 사이트의 외부링크 총 수

- 리치파일(rich files, R): Google과 Yahoo로부터 수집한 PDF 파일 수 - 구글 스칼라 문헌수(scholar, Sc): Google Scholar를 이용하여 2001년에서

2008년 사이에 출판된 최근 논문과 총 논문수의 정규화된 평균을 계산 - 평가지표에 대한 가중치

⋅크기(20%) + 가시성(50%) + 리치파일(15%) + 구글 스칼라(15%)

□ 상위 400개 리포지터리의 국가별 분포는 미국, 영국, 독일, 일본 순임. 미국 이 101개(26%)로 가장 많고 그 다음 영국 45개(11%), 독일 32개(8%), 일본 25개(6%) 순임. 대부분 북미와 유럽 영어권 국가들로 아시아권은 일본(25 개), 중국(2개)이 포함되며 우리나라는 하나도 없음.

<그림 2> Top 400 리포지터리 국가별 분포

□ 상위 50위내 리포지터리 운영주체는 대학과 연구소로, 구축된 콘텐츠는 특 정주제 분야보다는 전 주제 분야가 대부분임. 상위 리포지터리들은 언어장 벽을 고려하여 자국어뿐만 아니라 영어를 병행 서비스하고 있음.

- 운영주체별 분포현황은 <그림 3>과 같이 대학이 32개(64%)로 가장 많고, 연구소 15개(30%), 출판사 2개(4%), 개인연구자 1개(2%)순임.

<그림 3> Top 50 리포지터리 운영주체별 분포

- 주제별 분포를 살펴보면 <그림 4>와 같이 전 주제 분야를 포괄하는 리포 지터리가 58%로 가장 많고 과학기술분야 22%, 인문사회분야 12%, 의학, 농학, 자연과학 분야가 8%를 차지하는 것으로 나타남. 대학에서 운영하는 리포지터리는 대부분 전 주제 분야를 다루고 있음.

<그림 4> Top 50 리포지터리 주제별 분포

- 상위 50위내 리포지터리는 홈페이지와 세부 페이지까지 모두 자국어와 영 어를 병행 서비스함으로써 언어장벽 문제를 해결하고 있음.

2) 주요사례 조사

□ 해외 리포지터리를 심층조사 분석하여 시사점을 도출하기 위해 상위 10위 내에 있는 Arxiv.org e-Print Archive 등 7개 주요 리포지터리를 선정함.

□ 심층조사 분석한 7개 주요 리포지터리의 개발배경, 운영정책, 콘텐츠 수집 및 관리정책, 서비스 특징 등을 요약하면 다음과 같음.

가. Arxiv.org e-Print Archive

① 개요

□ 코넬대학도서관(Cornell University Library)에서 운영하고 있는 arXiv는 학 술지 발표 이전의 논문을 공유하기 시작한 전자서고이자 배포서버로 1991 년 8월부터 서비스를 시작함. 국제적인 주제 리포지터리로 물리학, 수학, 컴 퓨터공학, 비선형과학, 계량생물학, 통계학 분야의 출판전 논문(preprint)을 아카이빙하고 있음.

□ 전통적으로 물리학 분야 연구자들은 논문을 투고하기 이전에 연구결과물을 동료들과 돌려보는 전통이 있었으며, 연구성과에 대한 우선권 확보 및 과학 기술정보의 생명인 속보성을 위해 출판전 논문(preprint)을 arXiv에 등록하 기 시작함.

<그림 5> arXiv 리포지터리

② 콘텐츠 수집 및 관리정책

□ arXiv는 최소한의 품질을 관리하기 위해 제출된 논문에 대한 인증절차가 있으며, 인증은 논문을 심사하는 것은 아니고 해당 분야에 적합한지 개략적 으로 검토하는 것임.

□ 등록한 연구자에 한해 다양한 포맷으로 학술논문을 제출할 수 있음.

□ 장기보존을 위해 제출한 파일은 포맷 등 문제가 없는지 확인하는 과정을 거침.

□ 모든 제출물의 영구적인 접근을 보장하며 다음과 같이 업로드 파일유형을

제한함.

- 이미 제출한 모든 버전은 삭제하지 않는 것이 원칙이지만, 삭제하길 원하 면 취소통지를 보내야함.

- 취소는 제출물을 삭제하는 것이 아니라 이전 제출물에 대한 문제점을 설 명하는 것을 허락하는 것임.

□ 제출물 사용

- 제출물은 공식적으로 심리에 소요되는 시간을 포함하여 1일 후에 서비스 함(금요일이나 주말에 제출한 경우는 예외).

□ 제출물 중재

- 모든 제출물은 승인과정을 거쳐 삭제되거나 몇몇 경우는 재분류됨.

④ 서비스

□ arXiv에서는 트랙 백(track back), 참조데이터, CiteBase 인용정보, 주제별 브라우징 등 다양한 서비스를 제공함.

□ 연구자들이 자신의 논문을 arXiv에 제출하고 이용자들은 등록된 논문을 무 료로 이용함. 관심있는 주제 분야에 신규 등록된 논문을 RSS와 이메일 알 리미 서비스를 통해 받아 볼 수 있음.

□ 연구를 위해 데이터 셋을 구축하거나 로컬 카피를 위해 다량의 논문을 빠 르게 다운로드하는 기능은 지원하지 않음.

나. CiteSeerX

① 개요

□ 사이트시어엑스(CiteSeerX)는 미국과학재단의 지원을 받아 펜실베이니아 주립대학교 소속 정보과학기술대학(IST)이 운영하는 오픈액세스 리포지터 리로 핵심 주제 분야는 컴퓨터 및 정보학임.

□ CiteSeerX는 1997년 NEC 연구원, 프린스턴, 뉴저지 등에 소속된 연구자들 이 공동으로 개발한 CiteSeer의 차세대 버전임.

□ CiteSeerX는 과학과 학술적인 지식접근을 위한 기능성, 유용성, 이용가능성, 편의성, 유효성, 적시성을 제고하고, 학술정보의 유통 활성화 및 비용 장벽 을 제거하기 위해 개발함.

<그림 6> CiteSeerX 홈페이지

② 콘텐츠 수집 및 관리정책

□ 연구자들이 학술논문을 등록하는 방식보다는 주로 웹 크롤러를 통해 학술 논문을 수집함.

□ 연구자들은 CiteSeerX에 부합하는 주제 분야의 콘텐츠라면 어떤 콘텐츠든 지 제출할 수 있으며, 제출 전 동료에게 검토 받는 것을 권장함.

□ 파일포맷은 PDF 파일을 권장하며 PDF, PostScript, 압축파일(zip·gz·z) 등 다양한 파일을 지원함.

□ 검색 서비스를 이용하기 위해 회원으로 등록할 필요는 없음. CiteSeerX에 논문을 제출하거나 정보를 주고받을 때, 질문하거나 의견을 제시하고 정보

갱신을 요구할 때 등록이 필요함. (Personal Content Portal)를 제공함.

다. DTIC Online

① 개요

□ DTIC는 미 국방부(Department of Defense, DoD)에서 운영 중이며, 연구개 발을 지원하기 위해 콘텐츠를 수집하고 데이터베이스를 구축하여 검색 서

비스를 제공하는 국가정보센터임.

□ DTIC(Defense Technical Information Center) online은 전 세계 리포지터 리 중에서 Google과 Yahoo에 PDF 파일을 가장 많이 제공하였으며, 지난 65년간 국방 분야 정보서비스 중심기관 역할을 수행하고 있음.

- 웨보메트릭스의 리포지터리 순위 3위에 있는 Scientific and Technical

- 웨보메트릭스의 리포지터리 순위 3위에 있는 Scientific and Technical

관련 문서