• 검색 결과가 없습니다.

데이터에 대한 접근과 재이용

문서에서 외국도서관 정책자료 Ⅲ (페이지 29-35)

오픈 데이터

‘오픈 데이터는 저작권, 특허권, 또는 기타 제어 매커니즘의 제약 없이 누구나 무료로 이용할 수 있는 특정 데이터를 필요로 하는 철학이자 관행이다. 오픈 소스 또는 오픈 액세스 등과 같은 다수의 다른 “오픈” 활동 및 커뮤니티와 비슷한 정신을 가지고 있다.’

(위키피디아 - http://en.wikipedia.org/wiki/Open_data)

최근 웹 서비스와 기반시설 분야의 기술적 발전으로 인해 공동으로 데이터를 이용, 저 장, 시각화, 분석하는 절차가 대중화되고 있다.

수치 데이터를 시각화하거나 합하기 위한 '커뮤니티 중심’의 웹 2.0 기술을 사용하는 공동유틸리티의 예로는 매니아이스(Many Eyes), 스위블(Swivel), 인포침스(Infochimps) 등이 있 다. 또한 구글어스(Google Earth), 오픈스트릿맵(Open Street Map), 오픈레이어(Open Layers) 등 과 같이 위치기반정보(location-based information)를 주로 이용하고 활용하는 지도제작 도구, 지 구관찰뷰어(earth viewer), 지오브라우저(geo-browser)를 사용한 공간적 시각화 또는 매쉬업 (mashup) 전체도 공동유틸리티에 포함된다. 이들 유틸리티를 통해 연구자들은 ‘오픈된’ 역동적 환경에서 자신들의 데이터를 업로드하고 분석할 수 있다.(Macdonald, 2008 a, b)

리포지토리 개발자들에게 (예를 들어 API를 통해) 코드를 개방하거나 새로운 플러그인 (plug-ins) 또는 도구를 개발함으로써 리포지토리 환경 내에서 수치 및 공간데이터의 시 각화를 향상시킬 수 있다. 이로 인해 매력적인 잠재적 제출자를 확보하여 (정보) 생산 량을 늘리고 ‘부가가치’ 기능의 일부로서의 분석과 시각화를 제공할 수 있을 것이다.

참고: 오픈 데이터 재단(Open Data Foundation, http://www.opendatafoundation.org).

오픈지식재단(Open Knowledge Foundation, http://www.okfn.org)과 같은 비영리 조직

4.a 데이터 객체로의 접근

디지털 연구데이터는 찾기 쉬워야 하며, 이용의 편의성을 극대화하고 데이터를 수집하거나 창작한 이들의 권한을 보호하며, 데이터가 이용될 때 합법적인 이익을 가지는 이들의 권한 역시 보호하는 환경에서 접근이 제공되어야 한다.(RIN, p. 10)

오픈 액세스(Open Access)

오픈액세스 출판운동(open access publishing movement)14)은 2002년 2월 부다페스 트 오픈 액세스 이니셔티브(Budapest Open Access Initiative)와 그 가맹국들에 의해 시 작되었다. ‘오픈 액세스’란 인터넷을 통해 모든 이용자들이 무료로 자료를 읽고 이용 할 수 있는 접근을 의미한다.’(위키피디아, http://en.wikipedia.org/wiki/Open_access)

고려할 사항은 다음과 같다.

리포지토리 콘텐츠에 대중이 접근할 수 있도록 할 것인가? 접근이 허용된 다 할지라도 데이터 재이용은 제한될 수 있다.(4.b 데이터 객체의 이용과 재이용 참고)

접근 제어

일부 또는 모든 아이템에 대한 접근이 제한된다면, 리포지토리는 다음 사항에 근거하여 접근을 제한하도록 할 수 있다.

이용자 유형/지위 (일반 대중, 연구조직, 회원, 행정직원) 위치 - 특정 IP 주소 또는 물리적 위치를 기반으로 접근 제한 주어진 시간동안 자료에 동시 접근하는 이용자의 수

접근 제한

리포지토리는 여러 가지 이유로 인해 데이터에 대한 접근을 제한하도록 요구받 을 수 있다. 예를 들면 데이터세트가 이용자의 신원을 노출시키는 기밀정보를 포 함하고 있다든지 데이터세트가 특허상품 또는 상업적 상품으로 사용될 수 있는 정보를 포함하고 있다든지 하는 이유를 들 수 있다. 그렇다면 접근을 어떻게 제한 할 것인가? (Dulong de Rosnay, 2008)

접근 제한 조건은 어떻게 이행할 것인가?

리포지토리는 안전한 네트워크로 연결되지 않은 서버에 데이터를 저장하 고, 연구자 소유의 제한된 데이터세트를 이용하고 물리적으로 안전하게 저

14) 오픈 액세스(Open Access) : 전통적인 학술 저널의 구입 및 구독 비용이 지나치게 상승하여 학술자료 에 대한 새로운 접근 방식이 대두되었다. 오픈 액세스는 그 대표적인 대안으로 ‘직접적인 비용의 회수 를 기대하지 않고 이용자들에게 무료로, 온라인에서 저작물을 이용 가능하도록 만들어진 모든 배포 유형’이다. 오픈 액세스에 관한 최초의 중요한 국제적 성명서는 2002년 2월의 Budapest Open Access Initiative이다. 이는 오픈 액세스에 관한 정의를 제공했으며 오픈 액세스의 목적을 달성하기 위해 크게 두 가지의 보완적인 전략, 셀프 아카이빙과 오픈 액세스 저널을 제시하고 있다.

리포지토리의 연구 데이터를 위한 정책결정 지침 27

장하는 것에 대한 분명한 정책을 가지고 있다.

리포지토리는 아주 민감한 기밀 문제가 있는 제한된 데이터를 위해 ‘Data Enclave’15)를 제공한다. 이는 제출자 혹은 리포지토리 어느 쪽에서도 지시 할 수 있다. 이러한 데이터에 접근하는 유일한 형식은 엄격히 제어된 조건 하의 리포지토리의 안전하게 저장된 데이터에 대한 실지 분석을 통해서만 가능하다.(ICPSR, 2007a)

등록

고려할 사항은 다음과 같다.

데이터를 다운로드 받거나 접근하기 전에 반드시 등록을 해야 하는가?

모든 제출자가 의무적으로 등록을 해야 하는가?

로컬 등록 시스템을 실시해야 하는가? 아니면 (예를 들면 UK Access Federation, 또는 campus single sign-on과 같은) 다른 시스템에 통합할 것인가?

데이터에 대한 접근은 기관/부서 수준, 사용자 등록 수준에서 관리할 것인 가 아니면 데이터세트 수준에서 관리할 것인가?

모든 데이터세트에 서로 다른 권한, 허가 및 조건에 대해 개별적으로 태그 를 달아야 하는가?

이용자들은 허용 조건과 접근 조건을 확인해야 하는가?

다음 디지털 리포지토리 시스템은 사회과학 데이터 아카이브에서 이용하는 시스템이 다. 이 시스템들은 지역적으로 운영되며 오픈 소스가 아니며 비용이 수반될 수 있다. 이 시스템들은 데이터관리부터 온라인데이터분석까지 다양한 특징을 가지고 있다.

하버드대학의 데이터버스 네트워크 프로젝트(Dataverse Network Project) : 각 데이 터버스를 위한 광범위한 디지털도서관서비스는 ‘데이터 아카이빙, 보존 형식화, 목록작 성, 데이터인용, 검색, 변환, 서브세팅(subsetting), 온라인 통계분석 및 보급 등을 포함한 다. 각 데이터버스는 데이터세트의 계층적 구조를 보여주는데, 이 구조는 오직 데이터 버스 제작자(저자 또는 연구 프로젝트를 위한 데이터버스 제작자)가 생산한 연구 내용 만을 포함할 수도 있다. 이들 데이터버스는 (저널 논문을 위한 데이터세트의 사본과 같 은) 출판된 저작이나 (저널의 사본 아카이브 또는 대학 학과 및 하위 분과와 같은) 특정 커뮤니티를 위해 수집한 데이터세트와 연결된다.(http://thedata.org)

15) Data Enclave : 폐쇄된 연구 공동체 내에서 데이터세트를 공유하기 위한 도구

노르웨이사회과학데이터서비스의 네스타(NESSTAR) : ‘네스타(Nesstar)는 데이터 출 판 및 온라인 분석을 위한 소프트웨어 시스템이다. 네스타 소프트웨어는 데이터 제공자 가 데이터를 온라인상으로 보급할 수 있는 도구들로 구성되어 있다. 네스타는 텍스트 자료뿐만 아니라 조사 데이터와 다차원 표까지도 다루고 있다. 이용자들은 온라인상에 서 데이터를 검색하고, 불러오고, 분석할 수 있다.’(http://www.nesstar.com)

캘리포니아버클리대학의 문서화 조사 및 분석(SDA) : ‘SDA는 조사데이터에 대한 문 서화 및 웹기반 분석을 위한 프로그램 세트이다. 데이터세트의 맞춤형 서브세트를 만들 기 위한 과정도 있다.’(http://sda.berkeley.edu)

접근방법

데이터를 제공할 때 고려할 사항은 다음과 같다.

리포지토리는 전체 데이터 파일을 다운로드할 수 있는 링크를 제공한다.

일괄 처리 방식을 통해 데이터에 접근할 수 있다.

검색어기반시스템을 통해 데이터에 접근할 수 있다.

다운로드 목적으로 데이터를 선택하여 추출할 수 있으며 이용자가 기술(記 述) 및 통계자료를 만들 수 있다.

특정 소프트웨어 애플리케이션을 이용한 분석 작업이 온라인으로 제공될 수 있다.(예를 들어 셋업 파일이나 시스템 파일)

시각화 및 매핑 애플리케이션이 온라인으로 제공될 수 있다.

다른 웹 서비스들도 시스템의 데이터에 접근할 수 있다.

크리에이티브 커먼즈(Creative Commons)는 ‘저자, 과학자, 예술가, 교육자들이 자유롭게 옮 길 수 있도록 창작물에 쉽게 그 권한을 표기하여 다른 사람들과 공유하고, 다시 혼합하며, 상업적으로 사용하거나, 조합할 수 있는 도구를 무료로 제공한다.’(http://creativecommons.org) 사이언스 커먼즈(Science Commons)는 데이터 공유의 법적, 문화적 측면 탐색을 위한 미 국 기반 프로젝트이다. 사이언스 커먼즈 측에서는 데이터에 대해 저작물 이용 라이선스 (Creative Commons license)를 사용하는 것이 적절하지 않다고 보았으나, 영국의 오픈지 식재단(Open Knowledge Foundation)과 같은 다른 관계자들은 이와 같은 의견에 이의를 제기했다. 디지털큐레이션센터(Digital Curation Centre)는 브리핑을 통해 사이언스 커먼 즈에서 내린 이 같은 결론에 대해 다루고 있다.(Mcgeever, 2009)

오픈데이터커먼즈(Open Data Commons)는 PDDL(Public Domain Dedication and License), DDbl(Open Database License)과 같은 오픈데이터운동(open data movement)과 일치하는 데이터에 대한 라이선스 형식을 제공한다.

(http://www.opendatacommons.org)

리포지토리의 연구 데이터를 위한 정책결정 지침 29

4.b 데이터 객체의 이용 및 재이용

리포지토리는 이용자들에게 일어날 수 있는 제한사항에 대해 알려주는 정책을 가진다. 데이터를 다운로드하기 전에, 이용자는 온라인 상의 이용 조건에 동의해 야 하는가?

고려할 사항은 다음과 같다.

데이터는 공유 영역에 속하며 재이용을 제한하지 않는다.

속성에 대한 계약상의 제한, 비상업적 사용을 위한 제한, 데이터 수정금지, 또는 데이터 재분배나 변경의 제한 등으로 데이터를 처리한다.

데이터를 재이용하는 것은 금지한다.

이용자가 데이터를 재포맷하고 재분배할 수 있는 권리를 제한한다.

(예를 들면 요청 등에 의해) 개별적으로 제한을 가할 수 있다.

윤리적 방식 및 책임감 있는 방식으로 데이터를 이용해야 한다는 조건을 마련한다.

리포지토리 서비스는 제출자들로 하여금 저작물이용허가라이선스(Creative Commons license)를 첨부하도록 할 수 있다. 다음은 인터넷 애플리케이션에서 널리 사용되고 원저작물(copyrighted work)에 보편적으로 적용되는 저작물이용허가라이선스(Creative

리포지토리 서비스는 제출자들로 하여금 저작물이용허가라이선스(Creative Commons license)를 첨부하도록 할 수 있다. 다음은 인터넷 애플리케이션에서 널리 사용되고 원저작물(copyrighted work)에 보편적으로 적용되는 저작물이용허가라이선스(Creative

문서에서 외국도서관 정책자료 Ⅲ (페이지 29-35)