• 검색 결과가 없습니다.

A Study on Integration of Internal Information Retrieval Systems using Mashup; National Institute of Korean History Information Systems

N/A
N/A
Protected

Academic year: 2021

Share "A Study on Integration of Internal Information Retrieval Systems using Mashup; National Institute of Korean History Information Systems"

Copied!
21
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

매쉬업을 적용한 기관 내 정보검색시스템 통합 방안 연구*1)

- 국사편찬위원회 정보시스템을 중심으로 -

A Study on Integration of Internal Information Retrieval Systems using Mashup; National Institute of Korean History Information Systems

이 혜 원** 윤 소 영***

Hye-Won Lee · So-Young Yoon

차 례

1. 서 론

2. 매쉬업 개념 및 적용 3. 도서관 정보시스템 통합검색을

위한 매쉬업 전략

4. 매쉬업 서비스 모델 설계 5. 결 론

참고문헌

초 록

본 연구에서는 실시간으로 질의를 처리하고, 이용자의 요구에 보다 동적으로 응답한다는 장점을 가 진 매쉬업을 이용하여 기관 내부 정보시스템을 통합검색하고자 하였다. 국사편찬위원회 기관 내부의 정 보시스템 각각은 개별 도서관시스템에 준하는 정보의 양을 보여주고 있다. 기관 내부의 여러 시스템에 대한 통합검색서비스 또한 매쉬업 등 웹 2.0 기술을 적용하여 기관 외부 정보와 연계하는 통합검색 시 도와 같은 맥락에서 볼 수 있다. 본 연구에서는 기관 내부에서 검색서비스를 제공하는 것을 전제로 하 여 역사콘텐츠를 위한 국사편찬위원회 OpenAPI를 설계하고 메타데이터 형식 및 내용을 제안하였다.

키 워 드

매쉬업, 정보시스템, 통합검색, 역사 콘텐츠, 디지털도서관, OpenAPI

* 본 연구는 2010년도 서울여자대학교 교내학술특별연구비 지원에 의해 수행되었음.

** 서울여자대학교 사회과학대학 문헌정보학과 전임강사

(Full-time Lecturer, Dept. of Library & Information Science, Seoul Women's University, [email protected])

*** 국사편찬위원회 사료연구위원(교신저자)

(Corresponding Author, Research Fellow, National Institute of Korean History, [email protected]) 논문접수일자: 2010년 8월 27일

최종심사(수정)일자: 2010년 9월 30일 게재확정일자: 2010년 10월 15일

(2)

ABSTRACT

Mashup service provides results by query in real time and responds to users’ request in dynamic. In terms of size, each of NIKH(National Institute of Korean History)’s internal Information Systems is equal to individual library system. As adapting mashup for information convergence with external resources, it was accepted for internal integrated search in the same context. This study designated NIKH OpenAPI and proposed metadata format for internal integrated search of historical contents.

KEYWORDS

Mashup, Information System, Integrated Search, Historical Contents, Digital Library, OpenAPI

1. 서론

도서관을 비롯한 정보제공기관의 정보검색 시스템은 자료의 성격이 유사하여 하나의 시 스템으로 구축되어야 함에도 불구하고 때로는 구축 목적이나 담당 주체에 따라 개별 시스템 으로 구축되어 관리되고 있다. 한 기관 내부에 존재하는 다양한 시스템이 제공하는 정보의 통합적인 제공에 대한 필요성과 중요성은 인 정하지만 현실적인 방안을 찾지 못하고 있다.

필요에 따라 기관 내부의 두 개별 정보시스템 간에 분산검색을 통해 혹은 메타데이터 제공 을 통해 정보를 공유하거나 기사나 날짜 등 특 정 단위로 자료를 직접 링크하는 방식으로 정 보를 공유하고 있다. 이러한 방법은 기관 내부 정보시스템의 구성과 제공하는 자료의 성격 및 유형이 다양하게 되면서 한계를 가지게 되

었다.

외부 자원과의 연계를 통한 통합검색서비스 를 제공하려는 시도는 이전부터 있었으며 각 자료의 메타데이터를 통합하여 DB를 구축하 고 검색을 제공하는 한국역사정보통합시스템 (이하 역통이라고 함)이나 국가지식포털 등이 그 대표적인 예이다. 그러나 이 방식은 DB를 구축하는 노력뿐만 아니라 실제 운영상의 문 제로 실시간 정보 상태를 파악하지 못해 최신 성이 떨어진다는 약점을 나타내고 있다. 최근 에는 매쉬업 서비스를 비롯한 웹 2.0 기술을 적용하여 외부 자원을 손쉽게 연결하여 단일 정보시스템이 가지는 정보자원의 한계를 극복 하고 있다. 기관 내부의 여러 시스템에 대한 통합검색서비스 또한 매쉬업 등 웹 2.0 기술 을 적용하여 기관 외부 정보와 연계하는 통합 검색 시도와 같은 맥락에서 볼 수 있다. 통합

(3)

검색을 제공하고자 하는 각 시스템이 기관 내 부에 있든 외부에 있든 웹 기술을 적용하는 데 있어서는 동일한 상황이라고 볼 수 있다. 오히 려 기관 내부적으로 정보시스템을 통합하거나 기존 시스템에 부담이 되지 않고 내부 정보의 통합검색에 대한 요구를 만족시킬 수 있으므 로 그 효과는 더 클 것이다.

본 연구에서는 매쉬업 기술을 이용하여 기 관내 다양한 정보시스템을 통합검색하는 모형 을 제안하기 위해 국사편찬위원회(이하 국편 이라고 함) 정보시스템을 대상으로 하였으며, 그 이유는 다음과 같다. 첫째, 국편 정보시스 템의 하나의 정보량이 개별 도서관의 전체 정 보시스템의 크기와 비슷하다는 것이다. 그러 므로 기관들 간의 시스템 통합을 응용하여 기 관 내부의 정보시스템 통합검색을 위한 모형 을 설계할 수 있겠다. 둘째, 역사라는 주제영 역을 가지고 있어서 매쉬업을 통한 정보서비 스 모델이 심화될 수도 있으며, 실제 환경에 적용될 가능성이 높아진다. 셋째, 국편 정보시 스템은 간략버전의 OpenAPI 모습을 갖추고 있으나 매쉬업 서비스의 본격적인 적용을 통 해 정보의 유기적 연계를 통한 정보서비스를 목표로 하고 있기 때문이다.

본 연구에서는 우선 다양한 정보시스템을 운영하고 있는 국편의 현황과 문제점에 대해 알아보고, 개별적으로 운영되고 있는 정보시 스템의 정보를 유기적으로 연계하여 서비스하 기 위한 통합검색 방식에 대해 살펴보았다. 기 관 내 이질적인 정보시스템의 통합검색을 위

해 매쉬업 서비스를 채택하여 기관 내부 정보 시스템을 위한 매쉬업 모델을 제시하고 국편 의 환경에 맞는 OpenAPI를 설계하였으며 메 타데이터 형식과 내용을 제안하였다.

2. 매쉬업 개념 및 적용

2.1 매쉬업 개념

매쉬업은 구글, 네이버, 아마존, 야후 등 대 표적인 국내외 인터넷 기업들이 해당 기관의 데이터를 자유롭게 공유하는 기반을 제공함으 로써 현재 웹 환경에서 가장 돋보이는 인터넷 기술로 쓰이고 있다. 또한 매쉬업 서비스 생성 도구가 빠르게 발전하고 있으며, 동시에 이러 한 기술적인 노하우들이 많은 이들에게 공개 됨으로써 보다 쉽게 매쉬업을 생성할 수 있는 환경이 마련되었다(Fichter 2009).

위와 같은 환경에서 매쉬업은 <그림 1>과 같은 정보환경의 구성요소를 변화시키고 있 다. 이용자 중심의 시스템을 구축한 정보기술 들은 각 이용자들의 정보나 생각들을 좀 더 적 극적으로 공유하기 위한 방안을 모색하였으 며, 이를 위해 매쉬업기반 서비스를 이용하였 다. 특히 ‘인간’을 중심으로 본 시스템은 그 인간의 정보나 생각을 전달과 표현에 중심으 로 두었다면 ‘커뮤니티’를 중심으로 한 시스템 은 인간들이 공유할 수 있는 상황을 동적으로 구축하는 것이다.

(4)

<그림 2> 매쉬업 개념

<그림 1> 매쉬업 관점에서 본 정보환경 구성요소의 변화

정보를 저장하고 전달하는 ‘컨테이너’의 개 념은 다양한 ‘미디어’를 통해 정보 저장 전달 뿐만 아니라 정보를 재생산하고 빠르게 접근 할 수 있는 환경으로 변화하였으며, 이러한 다 양한 ‘미디어’로의 접근이 매쉬업 기술에 의해 보편화되었다.

‘정보’를 바라보는 관점 또한 변화하였다.

특정한 사람에게 특정한 상황에서 유용한 ‘정 보’를 중요하게 다루었던 관점은 모든 이들이 활용하고 즐길 수 있는 ‘콘텐츠’의 개념으로 변화하고 있다. 하나의 기술(description)단위 로 ‘정보’를 다루는 관점과 달리, ‘콘텐츠’는 하나의 정보에 담긴 아이템들을 각각의 정보 단위로 보기도 하고, 대용량의 정보를 분석하 여 새로운 정보를 창출할 수 있는 정보 덩어리 들을 그 단위로 삼기도 한다.

웹이 출현한 후 정보의 활용은 저장이라는 개념에서 접근이라는 개념으로 변화하였다.

이러한 변화를 반영하기 위해 ‘이질의 시스템 들을 통합’하기 위한 노력들이 이루어졌다. 실 제적으로 시스템들의 요소들을 통합하고 중심 제어시스템을 구축함으로써 이와 같은 시스템 통합을 통한 정보접근 환경을 이용자들에게 제공하였다. 그러나 매쉬업기반 기술은 시스 템통합보다는 기존의 시스템들을 유지하면서 서로 자원을 공유할 수 있는 어플리케이션을 제공하였다.

<그림 1>은 매쉬업을 통해 정보환경 구성 요소들의 변화를 설명한 것이다. 실제 매쉬업 을 통해서 정보가 유통되면 네 가지의 구성요 소들이 구별되지 않고 하나의 통합 시스템으 로 제공된다(<그림 2> 참조). 예를 들면 ‘구글

(5)

의 맵이 특정 웹 사이트에 적용되고 그 웹사이 트는 스마트폰으로도 접근가능하며, 이용자들 의 참여에 의해 새로운 정보가 창출되는 장을 제공한다’라는 상황이 있을 수 있으며, 이 때 이용자는 여러 개의 구성요소들을 생각할 틈 도 없이 정보를 자유롭게 활용하는 데에만 가 치를 둘 것이다.

매쉬업의 대표적인 기술로는 OpenAPI(Open Application Programmer Interface)가 있 으며 대표적인 예로는 구글맵, 네이버 및 다음 의 도서검색 등을 들 수 있겠다.

2.2 매쉬업 적용 및 발전방향

매쉬업 서비스를 개발하기 위해서는 다른 이 용자들이 생성해 놓은 어플리케이션을 연구하 는 것이 바람직하다(Yee 2008). 특히 고려해 야 할 사항은 다음과 같다. 첫째, 무엇을 통합 할 것인가? 둘째, 여러 요소들을 왜 통합하려 하는가? 셋째, 어떤 사이트에서 리믹싱하고 재 조합할 것인가? 넷째, 어떻게 다양한 요소들 을 통합할 것인가? 이용자 인터페이스뿐만 아 니라 내부적인 시스템 구동에 대해서도 고려 해야 한다. 다섯째, 앞으로 매쉬업 서비스를 어떻게 확장할 것인가? 등이다.

매쉬업 서비스를 적용한 웹사이트들을 살펴 보면 위와 같은 매쉬업 개발 과정이 이해될 것 이다. <표 1>은 웹 2.0을 기반으로 한 매쉬업

서비스에 대한 안내 및 연구 활동을 제공하는 ProgrammableWeb 사이트1)를 이용하여 정 리하였다.

<표 1>에서 정리된 내용을 분석해 보면, 매 쉬업 기술을 이용한 웹사이트의 발전 과정에 서의 특성을 살펴볼 수 있다.

첫 번째 특성은 웹사이트의 자원 활용 중심 이 아니라 API 기술 개발차원에서 시스템 구 축이 진행되고 있다는 것이다. 이러한 특성은 API 기술을 기반으로 한 웹사이트의 개발에서 초기에 발생되는 것이며, 사이트 개발이 고도 화됨에 따라 극복될 수 있는 문제이기도 하다.

단순한 두 번째 특성은 소스 사이트의 API 서 비스에 종속적이다는 것이다. <표 1>의 Go-Go Google Gadget 사이트는 도서관의 이용자 대출정보, 신착 및 추천도서에 대한 정보를 구 글 가젯을 이용하여 처리하였으며, Readit.Me 사이트에서는 아마존과 페이스북과의 연계를 중심적으로 서비스화하였다. 세 번째 특성은 단순한 데이터의 연결을 기반으로 점차 이용 자중심의 다양한 서비스를 제공하고 있다는 것이다. <표 1>의 CodexMap 사이트는 지리 적인 정보를 통해 도서검색을 지원하는 방식 으로 도서명, 지역명 등 키워드 검색이 가능하 며, 검색과정 및 결과를 시각적인 인터페이스 로 표현하였다. GuruLib는 아마존 데이터뿐 만 아니라 세계 각국의 도서관의 정보를 활용 할 수 있다. Boulder Library with Amazon

1) ProgrammableWeb[http://www.programmableweb.com/popular] 사이트에서 ‘library’ 태그로 검색한 결과 이며, 표의 번호는 사이트 방문횟수를 기준으로 순위를 표시한 것임(2010. 9. 2을 기준으로 함)

(6)

번호 서비스명 URL APIs 설명

1

Go-Go Google Gadget

http://www.blyberg.net/2006/08/18/go-go-google-gad

get/ GoogleHomepage

구글 가젯을 이용하여 앤 아버(Ann Arbor) 지역도서관 이용자의 대출정보와 신착도서나 추천도서에 대한 정보를 제공함.

<표 1> 도서관에 적용된 매쉬업 서비스

Reviews는 Library Thing과 연계하여 도서 서평과 도서관 목록을 연결해주고 있다.

현재 매쉬업기반 웹사이트는 매우 빠른 속 도로 발전하고 있으며, 이와 관련하여 고려되 어야 할 사항들은 다음과 같다.

첫째, 요즘 들어 매쉬업 기술을 통한 정보 통합의 단계가 실제 웹에 적용되기 시작되어, 매쉬업 서비스의 양적인 증가를 이루고 있다.

양적인 증가도 중요하지만 앞으로는 도서관 및 정보센터에서 적용될 수 있는 새로운 매쉬 업 서비스 및 기술이 개발되는 등 매쉬업에 대 한 질적인 향상도 고려되어야 한다. iGoogle 이나 thefreedictionary.com처럼 이용자의 요 구에 의해 매쉬업 서비스를 구성 및 조합할 수 있어야 한다.

둘째, 소스 사이트의 종속적인 부분을 해소 하기 위해서는 먼저 소스 사이트의 신뢰성이 확보되어야 하며, 더 나아가서는 구체적인 협 력이 이루어지는 매쉬업 서비스 및 오픈소스 나 GNU GPL(General Public License) 등 을 활용하는 것도 바람직하다. 구글 테크놀로 지 유저 그룹(Google Technology User Groups;

GTUG)은 구글의 프로그래밍 기술에 관심이 있는 사람들을 위한 이용자 그룹이며, 안드로 이드 체계, App Engine, 유투브, 구글 캘린 더 등의 API, OpenSocial 등 다양한 인터넷 서비스 코드와 code.google.com에서 지원하 는 모든 기술 리스트를 제공하고 있다.

셋째, 정보의 통합에 중점을 두는 매쉬업에 서 정보가 지닌 의미를 공유할 수 있는 매쉬업 을 구축해야 할 것이다. 이는 도서관 및 정보센 터에서 가장 바람직한 매쉬업 서비스를 기획할 수 있는 기반을 제공할 것이다. 영국 Which- book.net은 주제를 상세하게 분류하여 이용 자가 의미기반 검색을 제공하였으며, 소설의 구성 및 성, 나이, 성향 등 또한 추가하였다.

전체적인 검색과정은 검색식에 맞는 도서를 제시하고, 영국 지도 이미지에서 이용자의 거 주지를 파악한 후 근처의 도서관으로 연결시 켜주는 프로세스이다.

앞으로는 지금까지 살펴본 매쉬업 기술의 적용 및 발전방향을 기반으로 하여 도서관 및 정보센터의 정보유통에 긍정적인 영향을 줄 수 있는 매쉬업 모델을 제안하고자 한다.

(7)

번호 서비스명 URL APIs 설명

2

GuruLib http://www.gurulib.com/ Amazon

웹상에서 나만의 도서관을 만드는 것을 도와주는 사이트로, 아마존 데이터뿐만 아니라 약 530여개의 전 세계 도서관의 정보(저자, 출연자, 시놉시스, 장르, 책 표지 등)를 활용할 수 있음.

3

Boulder Library with Amazon Reviews

http://nell.boulderlibrary.org/ LibraryThing

LibraryThing 서평과 미국 콜로라도주 볼더(Boulder) 공공도서관 온라인 목록 연계

[부가설명]ProgrammableWeb사이트에는 Amazon과 연계되어 있다고 표기되어 있지만, 현재 해당 사 이트에서는 LibraryThing과 연계하여 리뷰를 제공하고 있음. 또한 현 서비스명은 Programmable- Web에서 제공하는 이름을 그대로 사용하였음.

4

CodexMap http://codexmap.com/codexmap.php

LibraryThing, GoogleMaps, GeoNames, AmazonEC2 CodexMap는 이용자에게 지리적인 정보를 통해 도서를 찾을 수 있게 하는 서비스로서, 수집기를 통해 지속적으로 정보를 확보함.

5

Libraries

in Denmark http://www.findbiblioteket.dk/ GoogleMaps 덴마크 내의 도서관 정보를 제공하는 지도기반 서비스

6

Readit.Me http://readit.me/ Amazon

Facebook

독서 후 간단히 적는 다이어리 역할을 해주며, 해당 도서에 대한 정보를 친구들과 나눌 수 있음. 또한 아마존 목록과 페이스북과도 연결됨.

7

#Ask4Stuff:

WorldCat Twitter Search

http://community.oclc.org/cooperative/2010/06/sometim es-the-internet-is-just-not-big-enough-for-me.html

WorldCatSearch Twitter

#Ask4Stuff 태그로 트위터를 하면 WorldCat 검색결과를 제공하는 트위터기반 서비스

8

LeoGeo http://www.silucho.com/sze/work.html Geocoder 모바일을 이용하여 뉴욕공공도서관의 분원을 찾아주는 서비스로서, 구글 맵을 연동시켜 내비게이션 도 구를 제공함.

9

WorldCat + New York Times

http://www.worldcat.org/devnet/blog/2010/02/new_york _times_mashups.html

New York Times Best Sellers WorldCat Search 뉴욕타임즈의 베스트셀러와 WorldCat 도서관들을 연결함.

(8)

<그림 3> 정보시스템 통합검색의 변화

3. 도서관 정보시스템 통합검색을 위한 매쉬업 전략

3.1 도서관 정보시스템 통합검색

3.1.1 정보시스템 통합검색의 흐름

도서관내 또는 도서관간 정보시스템들의 통 합검색을 논의할 때 기존의 연구들은 중앙집 중형 검색 또는 분산검색에 대해 설명하였다.

정보의 양이 많을 경우, 접속자수가 많을 경우 와 같은 긍정적인 정보환경 또는 네트워크 환 경이 안정화되지 않은 경우, 전산비용이 충분 하지 않은 경우 등과 같은 부정적인 정보환경 등, 이 모든 상황들은 정보를 통합해서 하나의 인터페이스로 제공하는 데 방해요소로 작용한 다. 위와 같은 상황들을 고려해 보았을 때 많 은 도서관에서는 다양한 시스템을 통제할 수 있는 Integrated Library System(이하 ILS 라고 함)을 사이에 두고 중앙집중형 검색을 설

계하였다.

Jewell 등(2004)2)은 도서관에서 자관의 컬 렉션, 서비스, 운영 등에 전자자원을 포함시키 는 작업을 진행하였으나, 대부분이 기존의 ILS 가 새로운 자원을 지원하기에는 부족하다고 주장하였다.

도서관의 입장에서는 새로운 자원을 추가하 고 기존의 자원들을 연결하는 작업을 지속적 으로 진행해야 하며, 이를 위한 중앙집중형 검 색의 문제점을 해결해야 한다. 동시에 지금의 발전된 정보환경을 고려해 볼 때 동적이며, 적 극적인 정보 통합을 생각해 보아야 한다. 중앙 집중형 검색보다는 정보를 실시간으로 동적으 로 활용할 수 있는 분산검색을 고려할 수 있을 것이다.

본 연구에서는 분산검색의 형식으로 매쉬업 서비스를 활용하고자 한다. <그림 3>의 왼쪽 은 중앙집중형 검색을 중심으로 정보를 하나로 통합하여 이용자의 요구에 부합하는 자원을 제

2) Dahl, M., K. Banerjee, and M. Spalti(2006)의 연구에서 인용함

(9)

<그림 4> 디지털도서관의 발전방안으로서의 매쉬업

기관명 사이트 수 기관명 사이트 수

경북대학교병원 3 한국과학기술연구원 6

경상대학교병원 1 한국과학기술원(KAIST) 9

광주과학기술원 3 한국과학기술정보연구원 21

교원소청심사위원회 1 한국과학재단 4

교육과학기술부 3 한국과학창의재단 3

교육과학기술연수원 1 한국교육학술정보원 4

국가핵융합연구소 1 한국기초과학지원연구원 5

<표 2> 교육과학기술부 산하기관별 정보시스템 현황

공하는 것이고, 오른쪽은 OpenAPI 기술을 이 용한 매쉬업 기반 분산검색의 모델이다. Op- enAPI 기술을 이용한 매쉬업 기반 분산검색 의 장점은 핸들시스템과 같은 시스템적인 제 어장치가 필요 없으므로 자원을 자유롭게 확 장하고 활용할 수 있다.

즉, 본 연구에서는 디지털도서관의 발전방 안으로 매쉬업 서비스를 통한 정보시스템 통 합검색 구축방안을 제시하고자 한다(<그림 4>

참조).

3.1.2 정보시스템 통합검색의 범위

디지털도서관이라는 개념 등장 이후, 정보

저장에서 정보접근으로 패러다임이 전환되면 서, 정보접근의 범위를 확장하는 작업이 부각 되었다. 이와 동시에 자관에서는 소장 및 접근 이 가능한 자원들에 대해 새로운 가치 창출을 위해 지속적인 노력을 이어나갔다. 도서관의 입장에서는 자관의 정보시스템에 새로운 정보 덩어리를 추가하는 과정과 타 기관과의 연계 를 통해 정보를 통합하는 과정을 유사하게 진 행시킨다. 이런 맥락에서 본다면 도서관 내 존 재하는 이질의 정보시스템들 간의 통합과 다 른 도서관들과의 정보시스템 통합은 유사한 과정 속에서 진행된다고 할 수 있다.

<표 2>는 기관들이 자관의 다양한 시스템

(10)

<그림 5> 도서관에 적용할 수 있는 매쉬업 전략 단계

기관명 사이트 수 기관명 사이트 수

국립각급학교 한국선진학교 2 한국사학진흥재단 2

국립특수교육원 1 한국생명공학연구원 14

국사편찬위원회 5 한국원자력안전기술원 1

국제과학기술협력재단(KICOS) 1 한국원자력연구원 5

대구경북과학기술원 1 한국원자력통제기술원 2

동북아역사재단 4 한국천문연구원 2

부산대학교병원 2 한국표준과학연구원 3

사립학교교직원연금관리공단 1 한국연구재단 38

서울대학교병원 3 한국학중앙연구원 2

전북대학교병원 2 한국한의학연구원 3

제주대학교병원 2 한국항공우주연구소 1

충남대학교병원 2 한국항공우주연구원 11

평생교육진흥원 1 한국해양연구소 1

한국과학기술기획평가원(KISTEP) 2 한국해양연구원 1

* 교육과학기술부 ‘소속및산하기관 공공 I-PIN보급대상목록’에서 인용

** 개인정보 포함 사이트 대상이므로 실제 사이트의 수보다 적음

을 개발 관리하고 있다는 것을 보여주고 있다.

한국연구재단은 정보를 제공하는 사이트 38개 를 가지고 있으며, 한국과학기술정보연구원은 21개, 한국생명공학연구원은 14개로 조사되었 다. 이는 한 기관에서 다양한 정보를 여러 사이 트를 통해 제공하는 것을 보여주고 있다. 각 기 관들은 자관 시스템들 간의 의미적인 연계 및 시스템 상호운용성을 위해 노력하고 있다.

3.2 매쉬업 전략

3.1장에서 살펴보았듯이, 매쉬업은 도서관

내 외부에 존재하는 이질의 시스템들을 통합 전략으로 이용될 수 있다.

매쉬업에 대한 도서관의 적극적인 전략 수 립은 이용자들의 끊임없는 정보요구를 충족시 키는 준비로 간주될 수 있다. 앞으로는 지금의 매쉬업 서비스에서 흔히 제공되는 단순한 지 도 검색이나 도서 검색이 아닌 지식정보사회 의 이용자에 맞는 정보서비스를 기획해야 한 다.

도서관에서 적용할 수 있는 매쉬업 전략은

<그림 5>와 같으며, 첫 번째는 다양한 웹 포 털 데이터(용어)를 연결하는 매쉬업 전략이다.

(11)

이 전략에서는 매쉬업 기술인 (Open)API를 통해 간단하게 데이터 검색을 수행한다. 간단 한 도서검색이나 지도 연결이 그 예가 되겠다.

두 번째는 정보를 연결하는 매쉬업 전략이 다. 정보를 연결하기 위해서는 용어의 의미를 연결하는 툴을 제공해야 한다. 정보검색시스템 에 사전이나 간단한 시소러스 및 분류체계를 제공하거나 특정 개체와 관련된 이용자들의 의 견을 모아서 제공하는 것이 그 예가 되겠다.

세 번째는 콘텐츠와 콘텐츠를 연결하는 매 쉬업 전략이다. 의미적으로 유사한 다수의 정 보 아이템들을 다양한 정보유형 및 출처 등으 로 재조정하는 것이다. 주제어 기반으로 정보 를 검색한 후 그 결과를 멀티미디어의 유형으 로 나누거나 출처를 기준으로 재배치하는 것 이 그 예이다. 앞으로는 정보 재배치에 대한 설명이나 이용자가 직접 정보 재배치의 조건 을 조정할 수 있는 시스템을 제안해야 한다.

위의 세 가지 전략은 첫 번째 단계를 기준 으로 두 번째 또는 세 번째 단계로 발전하는 중이다. 첫 번째 단계에서 두 번째 단계로 발 전하는 것은 정보들의 의미를 분석하는 것으 로 김상균 등(2008)의 연구와 같이 온톨로지 를 이용한 정보검색 매쉬업 시스템을 제안할 수 있다.

첫 번째 단계에서 세 번째 단계로 발전하는 것은 주제의 성격이 비교적 유사한 시스템들 간의 매쉬업 서비스에 활용될 수 있다. 이러한 발전은 기존의 시소러스나 사전이 활용되고 있어서 의미적인 연결에 대해 새로운 요구가

없거나 주제영역이 확실하여 용어검색만으로 도 비슷한 정보 아이템들이 모일 수 있다는 것 을 전제로 한다.

본 연구는 역사라는 주제영역을 대표하는 국 사편찬위원회의 데이터 통합 검색을 위한 매쉬 업 시스템 구축 방안을 제시하고자 한다. 본 연구는 위에서 언급한 도서관에 적용할 수 있 는 매쉬업 전략 단계 중 첫 번째에서 세 번째 단계로 발전하는 과정을 기준으로 진행되었다.

4. 매쉬업 서비스 모델 설계

4.1 국사편찬위원회 정보서비스 현황

4.1.1 정보시스템의 현황

국편 정보검색시스템은 기초 사료 원전 및 인물, 연표 등의 가공데이터를 제공하는 ‘한국 사데이터베이스’, ‘승정원일기’, ‘조선왕조실록’, 그리고 대중콘텐츠를 지향하는 ‘우리역사넷’

등 4개의 원문검색시스템과 소장 수집 자료 를 제공하는 ‘전자사료관시스템’ 및 ‘전자도서 관시스템’으로 구성되어 있다(<그림 6> 참조).

2010년 8월 현재 총 604만1,272건의 레코드 를 제공하고 있는데 서비스 레코드의 기준은 도서 1건에서 신문기사 1건까지 각 사이트별 로 차이가 존재한다(<표 3> 참조). 현재 이외 에도 역사포털로서 역사관련 24개 기관 29개 사이트를 대상으로 검색서비스를 제공하는 ‘한 국역사정보통합시스템’(이하 역통)이 있다.

(12)

<그림 6> 국편의 정보시스템

사이트 레코드 수

한국사데이터베이스 3,875,886

조선왕조실록 395,647

승정원일기 1,266,793

전자사료관시스템 258,027

전자도서관시스템 229,726

우리역사넷 15,193

합 계 6,041,272

<표 3> 국편 정보시스템의 서비스현황(2010.08 현재)

국사편찬위원회(이하 국편)의 개개 정보시 스템은 시스템의 규모나 자료의 양으로만 보 아도 한 기관의 정보시스템 이상의 정보를 제 공하고 있다고 볼 수 있다. 각각의 정보시스템 은 시스템간 정보 연계를 통해 정보서비스의 시너지 효과를 내기에 충분하지만 현재 개별

적인 정보시스템으로 각각 제공되고 있어 그 장점을 살리지 못하고 있다. 일부 정보시스템 에 한해 한국사데이터베이스를 통한 분산검색 과 역사 포털인 역통에의 참여를 통해서 일부 통합검색이 가능한 상황이다.

(13)

4.1.2 통합정보검색 지원

3.1에서 언급하였듯이 국편을 비롯하여 한 기관 내에 다양한 정보서비스를 제공하는 정 보시스템이 다수 존재하고 있는 경우는 이미 일반적인 상황이 되었다 할 수 있다. 시스템 구축과정에서 여러 이유로 인해 각각 독립적 으로 사이트를 구성하고 서비스를 제공하고 있다 하더라도 정보의 유기적 연계를 통해 이 용자에게 효율적인 정보검색서비스를 제공할 뿐 아니라 기관 내 정보제공의 효율성 및 유연 성을 높여야 할 것이다.

국편의 정보시스템의 경우에도, 한국사데이 터베이스, 승정원일기, 조선왕조실록은 자료 의 성격상 통합시스템으로 제공되는 것이 바 람직하다고 할 수 있다. 그러나 10여 년 동안 개별시스템으로 구축, 운영되고 있고 원문제 공시스템별로 각각 특화된 서비스를 제공하고 있어 시스템 기반의 획일적인 통합은 오히려 기존 이용자들에게 혼란을 제공할 가능성이 있다. 따라서 단일 시스템으로의 통합이 아니 라 매쉬업 서비스를 이용한 통합검색 방식이 시스템간 정보를 공유하고 연계할 수 있도록 하는 현실적인 대안이 될 수 있을 것이다. 현 재 한국사데이터베이스에서 승정원일기와 조 선왕조실록을 대상으로 분산검색을 수행하여 한국사데이터베이스를 통해 정보를 제공하고 최종 콘텐츠는 각 사이트로 연결되도록 하고 있다. 또한 전자사료관시스템을 비롯한 기관 내 여러 시스템을 아우르는 연계 정보검색 서 비스에 대한 필요성은 인식하고 있으나 서비

스 방식이나 제공해야 할 메타데이터에 대한 기준의 설정, 그리고 이용자 인터페이스 구성 에 있어서의 어려움 등으로 가시적인 성과를 나타내고 있지는 못한다.

이러한 기관 내부 정보시스템간의 통합검색 에 대한 논의와 시도는 초기 단계에 머물러 있 는 반면, 유사한 성격 및 주제를 가지고 있는 기관들을 대상으로 한 통합검색서비스에 대한 시도는 2000년대 초반부터 활발히 이루어졌 다. 역사분야에서는 역통을 통해 다양한 기관 의 정보제공시스템에 대한 통합검색이 제공되 고 있다. 국편도 역통의 운영 주체기관이자 참 여기관으로서 한국사데이터베이스, 승정원일기, 조선왕조실록 등이 연계되어 있다. 역통은 구 축 초기에는 분산검색 방식을 채택하였으나 검색 속도 문제와 함께 각 사이트들의 불안정 으로 인해 성공하지 못하였고 그에 대한 대안 으로 OAI 기반의 OAI-PMH을 적용하여 메 타데이터를 수집하고 메타데이터베이스를 구 축하여 통합검색을 제공하고 있다(<그림 7>

참조). 각 기관의 정보시스템에서 역통에서 규 정하고 있는 표준적인 메타데이터 형식에 맞 추어 메타데이터를 추출, 수집하는 과정과 통 합데이터베이스를 유지, 운영하는 과정은 자 동화된 프로세스를 거치도록 되어있다. 그러 나 기관의 시스템 운영 정책변화, 방화벽 설정 등의 변수가 많아 자동화 프로세스가 제 기능 을 하지 못하고 관리자가 각 단계마다 개입하 여 수작업으로 관리하고 있다. 따라서 각 기관 의 정보시스템과 역통이 제공하는 정보가 실

(14)

<그림 7> 역통 구성도(출처: 윤소영 2009)

시간으로 연동되고 있지 못하고 약간의 차이 를 보이기도 한다. 이러한 상황은 기관 내부의 정보시스템에서도 각각 담당자가 다르고 부서 가 다른 경우가 일반적이어서 기관간 상황과 크게 다르지 않으나 기관 내부에서 일관된 정 책을 가지고 운영 가능하다는 면에서는 차이 가 있다. 이러한 측면에서 역통이 채택하고 있 는 메타데이터베이스 구축을 통한 통합검색 제공 방식을 국편 내부의 정보시스템간 통합 검색 방식으로 채택하는 것은 바람직하지 못 하다고 할 수 있다. 또한 역통을 국편이 운영 하고 있고 기관의 정보시스템이 역통에 안정 적으로 연계되어 있다하더라도 이는 기관 내 부 정보시스템의 통합을 위한 서비스를 제공 하기 위한 목적으로 만들어진 것도 아니다. 따 라서 기관 내부 정보시스템의 안정적인 서비 스를 바탕으로 OpenAPI를 적용한 매쉬업 서

비스를 채택하는 것이 최적의 현실적인 대안 이 될 수 있을 것이다.

4.2 매쉬업을 적용한 통합정보검색 모델 설계

4.2.1 매쉬업 서비스의 적용

이 연구에서는 국편 내부의 다양한 정보시 스템의 통합검색을 위해 매쉬업 서비스를 적용 하도록 제안하고 있다. API 형식으로 각 정보 시스템의 데이터를 요청하고 XML 데이터로 검색결과를 받아 통합검색을 제공하도록 하였 다. 국편의 정보시스템을 위한 API는 기관 내 부의 정보시스템 간에 정보를 주고받는 것을 목표로 하므로 외부에 공개하는 OpenAPI와 같은 방식으로 구성하거나 인증을 요구할 필 요는 없다. 그러나 기관 내부 정보에 제한하지

(15)

<그림 8> 매쉬업을 적용한 국편 통합검색 모델

<그림 9> 매쉬업을 적용한 국편 정보검색서비스

않고 외부 정보까지 통합검색하여 제공하는 서비스를 고려한다면 처음부터 외부 OpenAPI 형식으로 설계하는 것이 바람직하다. <그림 8>

은 API형식으로 매쉬업 서비스를 적용하는 국 편 정보시스템의 통합검색 모델을 보여주고 있다. 각각 독립적으로 정보를 제공하는 국편

정보시스템이 매쉬업 서비스 적용을 통한 통 합검색 제공으로 단위 정보시스템을 넘어서는 정보 융합 및 유기적인 연계가 가능해진다. 매 쉬업을 적용한 통합검색은 <그림 9>에서 볼 수 있듯이 각 정보시스템이 제공하는 OpenAPI 를 통해 HTTP로 정보검색을 요청하고 각 정

(16)

변수 형식 설명

query 검색을 원하는 질의, UTF-8 인코딩

SearchStartDate YYYY-MM-DD 검색 시작일 SearchFinishDate YYYY-MM-DD 검색 종료일

listperpg 페이지당 결과건수(기본:10)

totalCount 총검색결과건수

totalPage 총페이지수

set_id 검색결과셋 ID

currentPage 현재 요청 결과페이지

<표 4> 국편 OpenAPI 검색 요청 변수

보시스템이 보내주는 검색결과를 XML 데이 터 형식으로 받아 이용자 화면에 동시에 출력 해주는 형태로 구현될 수 있다.

4.2.2 국편 OpenAPI 데이터 설계

정보시스템 외부에서 어플리케이션을 통해 외부 시스템이나 이용자들이 REST 방식으로 호출하였을 때 데이터는 XML 형식으로 전송 한다. 이 때 API 호출, 즉 검색 요청 변수(re- quest parameter)는 기본적으로 <표 4>와 같 이 8개 데이터를 사용하도록 설계하였다. 검 색 후 다음 결과페이지를 받기 위해서는 to- talCount, set_id의 값을 필수적으로 전달하 여야 한다. 실제 검색결과와 같게 GET방식으 로 URL을 입력해주면 XML로 검색결과 리스 트를 보여주며 해당 검색 사이트들의 검색결과 를 공통의 XML 형식으로 받아서 통합적으로 메타검색을 시도한다. 인코딩 방식은 UTF-8로 하며 원문보기는 해당 정보검색시스템으로 직

접 연결하여 제어권을 넘기는 것으로 하였다.

API를 통한 검색 요청에 따라 각 정보시스 템이 출력하는 검색결과 필드는 각 정보시스 템이 제공하는 자료의 유형 및 성격에 따라 정 의하는 메타데이터가 다양하기 때문에 필드 정의에 있어 세심한 주의가 필요하다. 자료 유 형에 따른 메타데이터를 고려하여 정보시스템 에 따라 개별적으로 출력 결과 필드를 정의할 수도 있으나 한 시스템에서 제공하는 자료의 유형도 다양하기 때문에 그 부분 또한 쉬운 문 제는 아니다. 그 대안으로 동일 혹은 유사 주제 분야의 표준 메타데이터 요소를 따르는 것도 한 방법이 될 수 있다. 이 연구에서는 <표 5>

와 같이 한국역사정보종합센터를 중심으로 이 미 역사분야에서 표준으로 사용되고 있는 메 타데이터 요소를 준수하도록 출력 결과 필드 (response field)를 설계하였다. 이와 유사하 게 국가기록원에서는 국가기록물 검색 Open- API 서비스를 위한 출력 결과 필드를 정의하

(17)

이름 요소명 요소 설명

URL 위치정보 url encode된 상태(java.net.URLEncoder)

MDCENTER 정보시스템코드

MDCENTER.KHDP_NAME 정보시스템명

URI. 메타데이터 URI

TITLE 대표제목

ALTERNATIVE 대체제목

DOCSENDER 발신자

EDITOR 편찬자

AUTHOR 작성자

TYPE 자료유형

PUBLISHER 발행자

FORMAT.MEDIUM 파일형식 IMT ex) text/xml

DATEEVENT 사건발생일 YYY-MM-DD를 기반으로 음력윤달처리

L0: 평달, L1: 윤달 Ex) 1549-10-18L0

DOCCREATED 원자료생성일

DOCISSUED 원자료발행일

UNIT 단위 1:서명, 2:기사

SUBJECT.KHON 분류코드

<표 5> 역사분야 표준 메타데이터 요소

<그림 10> 국편 한국사데이터베이스 검색 결과 XML 데이터

여 제공하고 있다. <그림 10>은 역사분야 표 준 메타데이터 요소를 출력 결과 필드로 적용 하여 국편 한국사데이터베이스 OpenAPI를 통한 검색 요청에 따라 출력 결과를 제공하는

XML 데이터 예이다.

국편 정보시스템의 통합검색을 제공하기 위 해 매쉬업 서비스를 적용한 모델에 따라 Open- API를 설계하고 구현하는 실제 작업은 시스템

(18)

<그림 11> 한국사데이터베이스 검색 API 출력화면

<그림 12> 국편 정보시스템 통합검색 결과화면

환경 및 개발에 대한 후속 작업이 충분히 이루 어져야 가능하다. 현재 국편에서 API를 적용 해 제공하고 있는 통합검색은 <그림 11>과

<그림 12>에서와 같이 각 정보시스템의 검색

건수와 검색 결과리스트 URL만 제시하고 있 는 단순한 형태이다. 국편 OpenAPI 형식은 정보시스템 간에 콘텐츠 제공을 기본으로 하 고 기관 내부에서 검색서비스를 제공하는 것

(19)

을 전제하기 때문에 일반적인 OpenAPI와 다 르게 인증을 요구하고 있지 않고 API를 호출 하면 어느 시스템에서나 검색서비스를 제공받 을 수 있도록 하고 있다. 이러한 단순한 형태 의 API 데이터를 적용한 통합검색은 검색서비 스를 통한 콘텐츠의 유기적 연계 및 서비스 제 공이라는 목표를 달성하기 위한 가장 기초적 인 형태에 해당한다고 할 수 있다. 현재 각 사 이트마다 제공하는 콘텐츠를 위한 메타데이터 의 형식 및 내용에 대한 공통적인 합의를 통해 표준화된 형식의 검색결과 제공이 필요하다.

메타데이터의 경우에 역사분야에서는 역사포 털인 역통의 메타데이터 포맷을 표준으로 준 수하고 있으므로 앞서 제시한 표준을 따르는 것도 한 방법이 될 수 있다.

5. 결론

본 연구는 도서관간의 정보시스템 통합검색 과 도서관내 이질적인 정보시스템 통합검색에 대한 접근방식이 유사하다라는 전제로 시작하 였다. 또한 본 연구에서는 실시간으로 질의를 처리하고, 이용자의 요구에 보다 동적으로 응 답한다는 장점을 가진 매쉬업을 이용하여 기 관 내부 정보시스템을 통합검색 하고자 하였 다. 국편 기관 내부의 정보시스템 각각은 개별 도서관시스템에 준하는 정보의 양을 보여주고 있다.

도서관 정보시스템 통합검색에 적용될 수

있는 매쉬업의 단계를 정도에 따라 세 가지의 단계로 구분하였으며, 본 연구에서는 첫 번째 에서 세 번째로 진화하는 과정을 모형화하였 다. 이 모형은 역사라는 주제적인 성격이 강한 국사편찬위원회의 정보시스템들을 통합검색하 기 위한 연구에 적용되었다.

본 연구에서는 국편 내부의 다양한 정보시 스템의 통합검색을 위해 매쉬업 서비스를 적 용하도록 제안하였다. API 형식으로 각 정보 시스템의 데이터를 요청하고 XML 데이터로 검색결과를 받아 통합검색을 제공하도록 한 다. 이를 통해 각각 독립적으로 정보를 제공하 는 국편 정보시스템이 매쉬업 서비스 적용을 통한 통합검색 제공으로 단위 정보시스템을 넘어서는 정보 융합 및 유기적인 연계가 가능 해졌다. 매쉬업을 적용한 통합검색은 각 정보 시스템이 제공하는 OpenAPI를 통해 HTTP로 정보검색을 요청하고 각 정보시스템이 보내주 는 검색결과를 XML 데이터 형식으로 받아 이 용자 화면에 동시에 출력해주는 형태로 구현 되었다.

국편 정보시스템의 통합검색을 제공하기 위 해 매쉬업 서비스를 적용한 모델에 따라 Open- API를 설계하고 구현하는 실제 작업은 시스템 환경 및 개발에 대한 후속 작업이 충분히 이루 어져야 가능하다. 현재 국편에서 API를 적용 해 제공하고 있는 통합검색은 각 정보시스템 의 검색 건수와 검색 결과리스트 URL만 제시 하고 있는 단순한 형태이다. 이러한 형태의 API 데이터를 적용한 통합검색은 검색서비스

(20)

를 통한 콘텐츠의 유기적 연계 및 서비스 제공 이라는 목표를 달성하기 위한 가장 기초적인 형태에 해당한다고 할 수 있다. 현재 각 사이 트마다 제공하는 콘텐츠를 위한 메타데이터의 형식 및 내용에 대한 공통적인 합의를 통해 표 준화된 형식의 검색결과 제공이 필요하다. 메 타데이터의 경우에 역사분야에서는 역사포털 인 한국역사정보통합시스템의 메타데이터 포 맷을 표준으로 준수하고 있으므로 앞서 제시 한 표준을 따르는 것도 한 방법이 될 수 있다.

이 연구에서는 매쉬업의 발전 단계에서 대 용량의 정보를 비교적 쉽고 효율적으로 처리 할 수 있는 방법을 모색하였다. 이를 적용하여 앞으로의 연구에서 정보의 의미적인 연결에 초점을 맞추어 볼 수 있을 것이다. 특히 국사 편찬위원회에서 구축한 ‘한국역사용어시소러 스’를 이용한다면 더 나은 매쉬업 서비스를 구 축할 수 있을 것이다. 이 연구에서 제시하는 모델은 역사분야 뿐 아니라 기관 내 다양한 정 보시스템을 운영하고 있는 기관들이 직면하고 있는 시스템간 정보공유 및 활용을 위한 하나 의 방안으로 적용 가능할 것이다.

참고문헌

김상균, 김철, 장현철, 예상준, 송미영. 2008.

약재 온톨로지를 활용한 약재 검색 매쉬업 시스템. 『정보관리연구』, 39(4): 173-186.

김진한, 이병정. 2009. 웹 서비스와 OpenAPI를 사용한 SOA 기반 동적 서비스 합성 프레임

워크. 『정보과학회논문지: 소프트웨어 및 응용』, 36(3): 187-199.

오창훈. 2009. 『OpenAPI를 활용한 매쉬업 가이 드: HTML과 자바스크립트로 손쉽게 만 드는 AIR 애플리케이션』. 의왕: 에이콘.

최태만 편. 『한국 시각예술의 과제와 전망』. 서 울: 다할미디어.

Back, Godmar and Annette Bailey. 2010.

“Web Services and Widgets for Li- brary Information Systems.” Informa- tion Technology and Libraries, 29(2):

76-86.

Dahl, M., Banerjee, K., and Spalti, M. 2006.

Digital libraries : integrating content and systems. Oxford: Chandos Pu- blishing.

Digital Library Federation. [cited 2010.07.

15].

<http://www.clir.org/dlf.html>.

Engard, Nicole C. Eds. 2009. Library Mashups: Exploring New Ways to Deliver Library Data. New Jersey:

Information Today, Inc.

Google Technology User Groups; GTUG.

[cited 2010.10.15].

<http://www.gtugs.org/>.

Governor, James, Dion Hinchcliffe, and Duane Nickull. 2009. Web 2.0 Ar- chitectures Sebastopol. CA: O'Reilly.

iGoogle. [cited 2010.07.20].

(21)

<http://www.gooogle.com>.

Nicole C. Engard. ed. 2009. Library ma- shups; exploring new ways to deliver library data. New Jersey: Informa- tion Today, Inc.

ProgrammableWeb. [cited 2010.09.02].

<http://www.programmableweb.co m/popular>.

thefreedictionary.com. [cited 2010.08.25].

<http://www.thefreedictionary.com>.

Timothy D. Jewell, I. Anderson, A. Chan- dler, S. E. Farb, K. Parker, A. Riggio, and N. D. M. Robertson. 2004. Elec-

tronic Resource Management. Report of the DLF ERM Initiative. Digital Library Federation. [cited 2010.08.

21].

<http://www.diglib.org/pubs/dlf102/>.

Whichbook.net. [cited 2010.10.15].

<http://www.whichbook.net>.

Yee, Raymond. 2008. Pro Web 2.0 Mashups:

Remixing Data and Web Services.

New York: Apress.

Yu, Casati, and Daniel. 2008. “Understan- ding mashup development.” IEEE Internet Computing, 12(5): 44-52.

참조

관련 문서