• 검색 결과가 없습니다.

나. 링크드 데이터 기반 근대문학자료 서비스 개편

현재 MARC(MAchine Readable Cataloging), 관계형 데이터베이스(relational database)를 기반으로 서비스하고 있는 국립중앙도서관의 근대문학자료 서비스를 중·장기적으로 링크드 데이터 기반으로 전환하여 서비스하는 방안도 검토가 필요 한 시점이다. 이는 근대문학자료 서비스를 단순히 현재의 기술적 트렌드인 링크드 데이터로 전환하기 위한 것이 아니라 서비스 활성화와 유관기관과의 효율적인 데이 터 연계를 위한 유효한 해결 방안의 하나로 판단된다.

근대문학자료의 서비스 활성화와 유관기관과의 효율적인 데이터 연계를 해결하기 위해서 링크드 데이터를 채택한 해외의 다양한 도서관 및 서지 서비스 사례들을 먼 저 검토하여 시사점을 도출하였다. 그리고 검토한 시사점을 기반으로 근대문학 서 비스를 개편 방안을 상세히 기술하였다.

1) 고품질 데이터 기반 새로운 서지 정보 서비스 사례 조사

도서관은 기계처리가 가능한 자동화된 목록 작성을 위해 MARC 표준을 준수하여 데이터를 구축하고 이용자 서비스를 수행해왔다. MARC는 도서관 간의 데이터 상호 운용성을 보장하는 형식이자 표준으로 효과적인 도서관 데이터의 교환, 관리, 서비 스의 중심적인 역할을 수행해온 것은 사실이다. 그러나 MARC는 도서관 이외의 지 식분야와의 상호운용성 확보의 어려움, 다양한 데이터와의 계층관계 표현의 어려움 과 같은 문제를 안고 있다.

최근 외부적 환경 변화로 XML(eXtensible Markup Language)과 같은 플랫폼 독립 적인 저비용 고효율 언어의 등장과 더블린 코어와 같은 새로운 메타데이터의 등장 은 도서관 데이터, 즉 서지데이터에 대한 새로운 형식의 구축과 공개를 요구하기에 이르렀다. 특히, 링크드 데이터의 성장은 도서관에도 새로운 형태의 데이터 구축, 개방, 서비스 개발을 요구하고 있다. 링크드 데이터는 웹을 공유된 데이터베이스처 럼 활용하기 위한 움직임이다. 링크드 데이터는 엄격한 표준 용어집 활용, 기계 처 리가 가능한 데이터(machine processable data) 구축과 더불어 기존 웹 표준 체계인 URI(uniform resource identifier)의 식별자 활용, HTTP 프로토콜을 활용을 필요로 한다. 물론 도서관은 기존에 구축한 막대한 양의 서지 데이터와 주제명, 저자명 데 이터를 보유하고 있다. 그래서 다른 어떤 정보기관보다 링크드 데이터화에 발 빠르 게 대응했으며, 새로운 서지 모형 연구개발, 서비스 구축 노력을 지속하고 있는 대 표적인 기관으로 볼 수 있다.

세계 각국의 국립도서관들은 자관의 데이터를 링크드 데이터로 변환하여 개방하

는 서비스를 이미 수행하고 있다. 고품질 데이터 기반 새로운 서지 정보 서비스 사 례 조사에서는 단순히 데이터를 개방하는 노력 외에 도서관 데이터, 정보에 대한 접근점 향상과 링크드 데이터라는 새로운 데이터 유형으로 보다 확장된 서비스를 제공하고 있는 기관의 서비스를 대상으로 하였다.

구체적인 사례조사 대상은 프랑스 국립도서관(Bibliothèque nationale de France, BnF)의 data.bnf.fr 프로젝트, OCLC(Online Computer Library Center)의 링크드 데이 터 서비스, 미국 의회도서관(Library of Congress)의 Bibliographic Framework 프로젝 트이다.

가) 프랑스 국립도서관의 프로젝트

프랑스 국립도서관은 자관의 데이터가 웹에서 보다 유용하게 잘 사용될 수 있는 방안을 찾기 위한 프로젝트를 수행하였는데 이것이 data.bnf.fr(http://data.bnf.fr)이다.

이 프로젝트는 기본적으로 기존 도서관 데이터를 변환하고, 내부 혹은 외부 정보자 원과 연결하여 데이터를 양적/질적으로 풍부하게 만드는 것이다. 이 프로젝트는 이 렇게 만들어진 데이터들을 상호연결해서 일반 이용자는 물론 검색엔진들이 해당 데 이터를 탐색할 수 있도록 HTML 페이지에 게시하는 것까지를 포함한다. 또한 원천 데이터인 MARC 형태의 도서관 데이터는 링크드 오픈 데이터 원칙에 따라 RDF 형 식으로도 활용할 수 있도록 하고 있다.

프랑스 국립도서관이 RDF(resource description framework) 즉, 링크드 데이터 기 반의 data.bnf.fr 프로젝트를 준비하고 실행한 배경에는 새로운 웹 환경에서의 도서 관 정보자원, 데이터 탐색의 어려움이 가장 크다고 할 수 있다. 최근의 정보화 환경 에서 웹을 통해 직접 프랑스 국립도서관의 데이터를 찾는 것은 어렵다. 프랑스 국 립도서관 데이터나 정보에 접근하기 위한 가장 좋은 방법은 도서관 홈페이지에 직 접 접속하는 것으로 사람들이 많이 찾는 검색엔진, 서비스에서는 도서관 데이터를 찾기 어렵다. 이는 해당 검색엔진들이 도서관 데이터를 색인하기 어렵기 때문이다.

비록 색인하였다 하더라도 도서관의 정보나 데이터를 적절하게 분류하기 어렵다.

일부 디지털 정보자원에 대해서는 저작권 없이 자유롭게 사용할 수 있는 경우가 아니라면 웹에서 자유롭게 접근이 어렵다. data.bnf.fr 프로젝트는 프랑스 국립도서 관의 디지털 도서관인 Gallica가 보다 많은 이용자에게 다가갈 수 있는 방법 또한 제공할 수 있도록 설계되었다. 무엇보다 도서관 목록의 경우는 대부분 관계형 데이 터베이스에 저장되고 검색 엔진에 의한 색인이 어렵기 때문에 도서관에 관심이 있

엔진, 서비스를 통해서 해당 자원에 접근하는 것은 어렵다.

<그림 6-10> data.bnf.fr 프로젝트

data.bnf.fr은 다양한 목록과 목록이 표현하고 있는 디지털 문서, 기술(설명) 데이 터를 수집해서 이용자들이 정보자원에 관한 정보를 찾게 해주는 웹 인터페이스로 정의할 수 있다.

도서관 목록은 모두 구조화되고 연결되어 있는 데이터로 프랑스 국립도서관의 경 우 1,200만개 이상의 레코드가 존재하며, 영구적인 접근을 보장하는 URI로 ARK가 모두 부여된 200만개의 저자, 단체, 주제에 대한 전거 레코드가 존재한다.

웹에서 국립도서관과 같은 공공기관이 제공하는 데이터의 경우는 유용한 정보, 신뢰할 수 있는 출처와 연결을 제공하기 때문에 높은 가치가 있다. 또한 ARK와 같 은 식별자는 정보자원을 식별하고 인용하고 접근하고 수집할 수 있게 해주기 때문 에 효용가치가 더 높다. 더불어 FRBR 모델을 참조하여 항상 새로운 서비스를 이용 자에게 제공하기 위한 정보자원을 관리할 수 있다. data.bnf.fr 모델링과 데이터 제 공, 서비스는 RDF를 기반으로 한다.

프랑스 국립도서관의 data.bnf.fr 프로젝트는 2011년 7월부터 “data.bnf.fr”을 통 해서 현재까지 지속적으로 확장 및 개편되고 있다. 이용자는 “data.bnf.fr”을 통해 서 웹으로부터 직접 프랑스 국립도서관의 자원에 도달할 수 있으며, 프랑스 국립도 서관의 자원과 관련된 외부 자원을 쉽게 탐색할 수 있다.

<그림 6-11> 프랑스 국립도서관 데이터 서비스 홈페이지

프랑스 국립도서관의 오픈 데이터 서비스는 프랑스 국립도서관의 데이터 정보자 원이 시맨틱 웹 표준에 따라 웹의 일부로 구축, 발행되는 데 있다. 주요 목적은 웹 에서 프랑스 국립도서관의 데이터가 좀 더 가시적으로 활용될 수 있는 것과 프랑스 국립도서관 내부 및 외부의 모든 목록이 상호 통합 운용되도록 하는 것, 신뢰도 높 은 구조화된 데이터 링크를 통해서 공동목록, 메타데이터 상호 운용이 가능하도록 하는 것, 마지막으로 오픈 라이선스에 따라서 누구나 메타데이터를 재사용가능하도 록 하는 것이다.

프랑스 국립도서관 오픈 데이터 서비스의 데이터 모델은 내부 응용시스템으로부 터 추출된 데이터 통합과 외부 정보자원과의 연결까지 가능하도록 구성하였다. 프 랑스 국립도서관에서 생산되는 자원(전거 및 목록레코드 등)은 ARK 식별자를 할당 하여 지속적인 연결을 유지할 수 있도록 하며, 첫 단계로 FRBR 모델에 기초한 서 지 프레임워크를 개발하였다. 프레임워크를 통해 구현되는 데이터는 구조화되고 기 계처리가 가능하고 외부 및 내부 데이터간의 상호운용성을 보장하도록 RDF 기술규 칙을 준수한다.

<그림 6-13> 프랑스 국립도서관 RDF 데이터 모델 개념

FRBR 모형에 기초하고 있는 프랑스 국립도서관의 오픈 데이터 서비스는 기존의 서지 정보 검색과 유사한 이용자 경험을 제공하며, 관련된 작품, 저자, 서로 다른 표현형, 구현형 관련 저작물의 일괄 검색과 연결 검색이 가능하도록 구성되어 있다.

또한 외부 데이터와 인터 링킹된 데이터를 이용자에게 제시함으로써 보다 풍부한 검색결과를 제시하고 유사한 또 다른 온라인 자료로 이동을 가능하게 하고 있다.

<그림 6-15> 외부 데이터셋과 연결된 검색결과 정보 제공 화면

data.bnf.fr 프로젝트는 오픈 데이터를 향한 프랑스 국립도서관의 전체 정책 추진 의 일환이며 이는 W3C에서 정의하고 있는 시멘틱웹과 링크드 데이터 표준을 따르 고 있다.

이는 기계적인 처리를 통해서 구조화된 자원이 보다 잘 활용될 수 있도록 하기 위한 것으로 프랑스 국립도서관은 더블린코어 기반의 목록, XML-EAD의 InterMarc 등 다양한 형식으로 생산된 데이터를 활용해서 RDF, 시맨틱 웹 언어로 발행한다.

발행 데이터는 RDF-XML, RDF-N3, RDF-NT, JSON 등 다양한 구문으로 활용이 가 능하다. 프랑스 국립도서관의 LOD 서비스, 데이터 서비스 전체에서 특징적인 부분 중의 하나가 자원에 대한 URI 명명 규칙으로 프랑스 국립도서관은 ARK 프로세스에

발행 데이터는 RDF-XML, RDF-N3, RDF-NT, JSON 등 다양한 구문으로 활용이 가 능하다. 프랑스 국립도서관의 LOD 서비스, 데이터 서비스 전체에서 특징적인 부분 중의 하나가 자원에 대한 URI 명명 규칙으로 프랑스 국립도서관은 ARK 프로세스에