• 검색 결과가 없습니다.

I. K-Ecohub 개요

3. 연구개발 목표

상기에서 살펴본 장기생태 자료의 데이터 파편화와 통합 활용 문제를 해결하기 위해 본 사업에서는 국내 장기생태데이터의 효율적 관리, 검색 및 공유를 위한 K-ecohub라 는 연구환경을 시범구축한다. K-ecohub는 국내 장기생태데이터의 통합 저장소로써, 기 존 KNLTER 프로젝트에서의 프로토콜 부재, 데이터 파편화, 품질관리 부재, 효율적 데 이터 통합을 위한 저장소 부재, 해외연계 미흡 등의 문제를 해결하는 것을 목표로 한다.

<연구개발 목표>

4. 장기생태데이터 통합 모델

장기생태데이터의 통합 저장소 구축 모델은 통합의 수준에 따라 크게 3개정도로 구분 할 수 있다. 첫 번째는 가장 느슨한(loosely-coupled) 통합 모델로써 메타데이터 중심의 통합 모델이다. 데이터에 대한 사전 정의된 프로토콜은 존재하지 않지만, 표준화된 메타 데이터 표현 방법이 정의되어 있는 경우이다. 메타데이터는 데이터에 대한 제목, 저자, 키워드, 요약은 물론 데이터의 스키마 정보까지도 포함한다. 메타데이터의 효율적 검색 을 위해 Controlled Vocabulary를 제공하는 것이 일반적이며, 메타데이터의 해외 연계 를 위해 EML 표준을 기반으로 메타데이터를 publish하는 기능을 제공한다. 이와 같은 모델은 여러 국가를 포함하는 등 서로 다른 성격의 사이트가 많은 경우의 모델로써, 유 럽 LTER의 DEIMS 혹은 호주의 TERN 등에서 활용되고 있는 데이터 통합 모델이다.

두 번째는 중간 수준의 통합 모델로써 데이터 변환 가공을 통해 데이터 통합을 지원하 는 모델이다. 이 모델에서는 느슨한 통합 모델처럼 표준화된 메타데이터 표현 방법을 활 용함은 물론, 데이터 중 일부를 표준화된 형태로 변경 가공하여 통합 관리하는 모델이

다. 이와 같은 모델은 Legacy 데이터가 많은 경우로써, 미국 PASTA 혹은 호주의 AEKOS 등에서 활용되고 있는 데이터 통합 모델이다.

세 번째는 가장 밀접한 수준의(tightly-coupled) 통합 모델로써 사전 정의된 표준 프 로토콜에 따라 데이터를 수집 관리하는 모델이다. 이 모델에서는 표준 프로토콜은 물론 프로토콜에 따른 데이터 표현 방법까지도 사전 정의되어 있기 때문에, 데이터의 통합과 분석이 매우 용이하다. 영토가 크지 않은 단일 국가에서 추진체계가 잘 갖추어 졌을 때 활용 가능한 모델이며, 대표적으로 영국의 ECN에서 활용하고 있는 데이터 통합 모델이 다.

<국가별 보유시스템의 통합수준>

5. 과거 국가장기생태연구 사업 데이터 분석

- 주요 조사항목: year, species, plot, dbh, height, health, valid species

지소  조사 아

이템 수 Vitality 오류 Height 오류 DBH 오류 종이름 오류

남산 1,279 66 5.2% 286 22.4% 175 13.7% 117 9.1%

여천 1,779 205 11.5% 116 6.5% 115 6.5% 308 17.3%

지리산 1,861 391 21.0% 1,861 100.0% 500 26.9% 24 1.3%

점봉산 16,761 16,761 100.0% 16,761 100.0% 0 0.0% 896 5.3%

월악산 2,090 2,090 100.0% 2,090 100.0% 0 0.0% 155 7.4%

성 검사를 지원하고, 데이터 관리자와 데이터 리뷰어를 통해 데이터 품질을 높이는 워크 플로우를 반영하여 K-ecohub를 개발하였다. 과거 장기생태연구사업의 식생동태 데이터 는 K-ecohub의 데이터 관리 정책에 따라 초기 입력부터 제어를 받아 오류를 발생시켰 다. 향후 장기생태연구에서는 이러한 데이터 품질 저해 요소를 사전에 방지하여 데이터 입력자가 최대한 데이터 상의 오류를 줄이고, 데이터 관리의 중요성을 인지하여 데이터 축적에 노력이 필요해 보인다.

관련 문서