• 검색 결과가 없습니다.

DCMS 정보관리 표준화 지침

N/A
N/A
Protected

Academic year: 2021

Share "DCMS 정보관리 표준화 지침"

Copied!
133
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

정보관리 표준화 지침

DCMS

진두석 김광영 이민호 안설아 이원구 윤화묵 성원경 최희윤

(2)
(3)

정보관리 표준화 지침

DCMS

진두석 김광영 이민호 안설아 이원구 윤화묵 성원경 최희윤

(4)

진두석 김광영 이민호 안설아 이원구 윤화묵 성원경 최희윤

(5)

제 부 연구 배경

1

1

디지털 콘텐츠 통합관리 시스템

1

(DCMS)

1

정의

1.1 DCMS

1

배경 및 목적

1.2

1

구성도

1.3

2

주요 콘텐츠 현황

1.4

3

정보관리 표준화 관련 기술

2

4

메타데이터 표준

2.1

4

용어 표준

2.2

24

개발 표준

2.3

27

제 부

2

DCMS

데이터 표준화 체계

30

메타데이터 표준

1 DCMS

30

을 이용한 저널정보 메타데이터 표준

1.1 MARC XML

30

기반의 논문 표준 스키마

1.2 PMC XML

33

기반의 특허 표준 스키마

1.3 WIPO ST.36

71

용어 표준

2 DCMS

85

표준 단어

2.1

85

표준 용어

2.2

91

표준 도메인

2.3

94

관리번호 표준

3 DCMS

106

논문정보 관리번호

3.1

107

특허번호 관리번호

3.2

108

개발 표준

4 DCMS

109

개발 표준 지침

4.1

109

(6)

검증평가의견서

검증평가의견서

검증평가의견서

검증평가의견서

[

]

[

]

[

]

[

]

이동백

대표

이동백

대표

이동백

대표

이동백

(JNJ Consulting

(JNJ Consulting

(JNJ Consulting

(JNJ Consulting

대표

)

)

)

)

곽승진 충남대학교 교수

곽승진 충남대학교 교수

곽승진 충남대학교 교수

곽승진 충남대학교 교수

(

(

(

(

)

)

)

)

정회경 배재대학교 교수

정회경 배재대학교 교수

정회경 배재대학교 교수

정회경 배재대학교 교수

(

(

(

(

)

)

)

)

(7)



연구의 의의

연구의 의의

연구의 의의

연구의 의의

1.

1.

1.

1.

디지털 콘텐츠통합관리시스템의 필요성은 어제 오늘의 일이 아니다 다양한

-

.

콘텐츠의 목적하는 정보를 찾아서 새로운 연구 및 기타 산업자료로 활용을 위해

서는 통합관리시스템이 기반구조 시스템 형태 로 구성이 되어야만 원하는 정보

(

)

를 활용할 수 있다.

이러한 인프라를 구성하기 위해서는 기존에 구축되어진 자료를 표준화 하는

-작업이 선행-작업이고 또한 앞으로 구축 관리되는 시스템도 이러한 표준화에 맞

,

추어 시스템이 구성되어야 한다.

한국과학기술정보연구원 이하

에서는 여러 정보원으로부터 논문 특허

-

(

KISTI)

,

,

동향정보 등의 메타데이터 및 원문을 수집하여 이용자에게 검색 서비스를 제공

하고 있다 또한 정보원은 여러 국적의 출판사 도서관 학회 등 다양하기 때문에

.

,

,

이들 정보원으로부터 입수된 논문 메타데이터 또한

XML, SGML, Plain Text

파일 형태는 물론이고 내용의 구조 및 표현 형식까지 다양하다.

이에

를 이용하는 사용자를 위해서는 이러한 다양한 형태의 메타데이

-

, KISTI

터가 하나의 통일된 형태로 가공되어야지만 질 높은 서비스 제공이 가능하리라

생각한다 차세대 정보관리시스템인

.

DCMS

시스템 개발을 통해서 다양한 형태의

메타데이터의 형태 항목 표기방식 등의 통합형식을 정하고 변환 시스템을 새롭

,

,

게 설계하여 보다 나은 서비스 제공이 가능하리라 생각한다.

연구의 내용

연구의 내용

연구의 내용

연구의 내용

2.

2.

2.

2.

학술논문 특허 연구보고서 동향분석 산업표준 사실정보 등 다양한 디지털

-

,

,

,

,

,

콘텐츠를 통합하기 위해 메타데이타 표준 용어표준 관리번호 표준 개발표준의

,

,

,

(8)

형태로 분류하여 데이터 표준화 체계를 의미있게 구성이 되어있다.

특히

형태로 표준화를 구성하여 보다 다양하고 강력한 검색기능이 예상

-

XML

이 되며 향후 지속적인 디지털 데이터를 구축하기 위한 기반을 마련하였다고 볼

,

수 있다.

컨텐츠 표현 형식의 표준화

논문 서지

정보 표준화

기반

-

(bibliography)

(MARC XML

)

논문 기사

표준화

기반

-

(article)

(PMC-XML

)

특허 기사

표준화

기반

-

(article)

(WIPO ST.36

)

관리 표준화

단어 용어 표준화

-

/

컨텐츠 관리번호 표준화 자체 표준양식

- DCMS

(

)

개발 환경 표준 지침 자체 표준양식

-

(

).

연구의 첨언

연구의 첨언

연구의 첨언

연구의 첨언

3.

-(1)

3.

-(1)

3.

-(1)

3.

-(1)

본 연구의 표준화는 메타데이타 표준에 의해 구성이 되었는데 메타데이타를

-기술하는데 가장 효율적이고 명확한 방법을 제시한 표준이

ISO/IEC 11179

이다

.

본 연구의 내용이 이를 기반으로 구성이 되었는지를 고려할 필요가 있으며 향후

,

본 연구의 개선방향으로 삼을수 있는 좋은 기회가 되리라 생각한다.

(9)
(10)

연구의 첨언

연구의 첨언

연구의 첨언

연구의 첨언

3.

-(2)

3.

-(2)

3.

-(2)

3.

-(2)

본 연구의 표준화 지침은

정보서비스의 질적발전을 기대하는 평가자로

-

KISTI

써 매우 고무적인 일이다 이런한 표준화 지침이 개선 발전을 하기 위해서는 지

.

속적인 연구가 필요하다고 사료되며 개정작업이 활발하게 이루어져 살아있는 정

보관리 표준화 지침이 되기를 바라는 마음에 몇가지 첨언을 드리고자 한다.

는 계속적인 발전을 거듭하여 축척된 노하우로 인하여 로얄티

1) KISTI

DCMS

기술료 를 받을수 있는 기반을 지니고 있기에 이에 상응하는 시스템 설계 및

(

)

매뉴얼 운영방안 등이 문서화되어 보다 효울적으로 관리되기를 바라는 바이다

,

.

의 정보는 계속적으로 수집 관리 개발되어지기에

관련 개발사

2) KISTI

,

,

KISTI

업을 수행할 경우

DCMS

정보관리 표준화 지침 에 따라 시스템개발을 해야한다

고 사업제안요청서

(RFP)

에 항시 명시하여 앞으로 개발되어지는 신규시스템의

경우 표준화 지침에 따라 개발이 되어지도록 관리적인 지원이 필요하다고 볼수

있다.

(11)

결론

결론

결론

결론

4.

4.

4.

4.

정보관리 표준화 지침은 표준화 내용에 대한 정의서로서 향후

-

DCMS

에서 디지털 콘텐츠 관련 업무 및 개발시 필수적으로 활용 하도록 하

KISTI

여 궁극적으로 콘텐츠 관리시스템의 데이터 품질을 향상시키는 기반이 되기

를 바라는 바이다.

(12)



표준화

(

標準化

)

는 여러 가지 제품들의 종류와 규격을 표준에 따라 제한하고

통일하는 것을 말한다 표준화를 통하여 가장 능률적인 작업방법을 발견하고 대

.

량생산이나 대량구매를 가능하게 하며 소비자에 대한 품질보증을 목적으로 한다.

최근 창조적 발상과 혁신이 세계적인 화두이다 창조와 혁신은 새로운 방법의 발

.

견이며 그것은 곧 새로운 표준의 발견으로 볼 수 있다.

한국과학기술정보연구원

(KISTI)

은 우리나라 최고의 과학기술분야 정보유통기

관으로서 국내외 출판사 학회 도서관 연구소 등 여러 정보원으로부터 논문 특

,

,

,

,

허 연구보고서 동향정보 등 억건 이상의 메타데이터

,

,

1

(metadata)

및 원문을 수

집하여 이용자에게 제공하고 있다 그러나 다양한 국적과 정보원으로부터 입수된

.

논문의 경우 메타데이터 또한

XML, SGML, Plain Text

등 파일 형태는 물론이

고 내용의 구조 및 표현 형식까지 매우 다르기 때문에 이용자에게 빠르고 편리

한 정보서비스를 제공하기 위해서는 이러한 다양한 형태의 메타데이터가 하나의

통일된 형태로 가공되어 저장 및 색인과정을 거쳐야 통합된 서비스를 제공할 수

있다 기존의

.

KISTI

에서 관리하고 있는 과학기술정보 자료는 개별적으로 구축하

여 시스템 간 연계성이 떨어지고 개방과 공유를 위한 서비스 기반구축이 미흡한

부분이 많았다.

한국과학기술정보연구원에서는 차세대 정보관리시스템인

DCMS

시스템을 개

발하면서 다양한 형태의 메타데이터의 형태 항목 표기방식 등의 통합형식을 정

,

,

하고 변환 시스템을 새롭게 설계하였다 또한 개발 표준 지짐을 정의하여 향후

.

유지보수나 기능개선이 용이한 표준개발환경을 구축하였는데 이는 효율적인 정

보의 관리와 서비스를 위해 매우 중요하고 의미 있는 작업이라 하겠다.

정보관리 표준화 지침의 표준화 내용은 컨텐츠 표현 형식의 표준화와

DCMS

관리 표준화가 주된 내용이다 컨텐츠 표현 형식의 표준화는 첫째 논문 서지

.

,

(13)

정보 표준화

기반 둘째 논문 기사

표준화

(bibliography)

(MARC XML

)

,

(article)

기반 셋째 특허 기사

표준화

기반 이다 관

(PMC-XML

)

,

(article)

(WIPO ST.36

)

.

리 표준화에서는 첫째 단어 용어 표준화 한국데이터베이스진흥원 및 기타 표준

,

/

(

화 사례를 바탕으로 자체 표준화지침 정의 둘째

)

,

DCMS

컨텐츠 관리번호 표

준화 자체 표준양식 셋째 개발 환경 표준 지침 자체 표준양식 이 개발되었다

(

),

,

(

)

.

네트워크 환경에서 정보시스템 데이터베이스 등 다양한 어플리케이션들은 많

,

은 유형의 상호운용성

(interoperability)

과 관련을 갖게 된다 메타데이터와 관련

.

하여

상호운용성을

언급할

때는

일반적으로

탐색

상호운영상(search

또는 다양한 메타데이터 레코드 세트에 걸쳐 탐색을 수행하고

interoperability)

의미 있는 결과를 얻을 수 있는 능력을 말한다 탐색 상호운용성을 높이는 방법

.

으로 전통적인

MARC

기반 도서관의 종합목록

(union catalogs),

시스템 간 탐색

크로스워크

메타데이터 요소들

(cross-system search approach),

(crosswalk),

간의 권위 있는 매핑

(authoritative mapping),

메타데이터 레지스트리

(metadata

구축 등이 있다 동질적이지 않는 메타데이터 소스로부터 종합목록을

registry)

.

구축하는 것도 가능하겠지만 더 복잡하기 때문에 다양한 메타데이터 스킴들을

저장 및 색인 작성을 위한 공통 포맷으로 변한 것이 더 유익한 것으로 입증되고

있다 따라서

.

DCMS

시스템 개발을 통한 다양한 형태의 메타데이터의 형태 항

,

목 표기방식 등의 통합형식을 정하고 변환 시스템을 새롭게 설계한 컨텐츠 표현

,

형식의 표준화 작업은 매우 활용성이 높은 방법이다.

결론적으로 본

DCMS

정보관리 표준화 지침은 위의 표준화 내용에 대한 정의

서로서 향후 한국과학기술정보연구원에서 디지털 콘텐츠 관련 업무 및 개발시

필수적으로 활용 하도록 하여 궁극적으로 콘텐츠 관리시스템의 데이터 품질을

향상시키는데 필수적인 과정이다 또한

.

KISTI

가 수집 생산 서비스하는 중요한

,

,

과학기술 정보자원의 활용성을 극대화하는 노력의 일환으로 평가된다.

한국과학기술정보연구원의

DCMS

정보관리 표준화 지침은 다음과 같은 추가

적인 연구와 표준화 활동이 필요하다고 사료된다 첫째 현재 한국과학기술정보

.

,

연구원이 수집 생산 서비스하는 중요한 정보원인 연구보고서 동향정보 산업표

,

,

,

,

(14)

준 사실정보 등에 대한 표준화 작업이 추가적으로 필요하다 하겠다 또한 웹 정

,

.

보자원과 과학데이터 등 한국과학기술정보연구원이 국가적인 책임을 맡아 수집

하고 항구적인 보존을 위해서는 아카이빙과 관련된 메타데이터 요소에 대한 고

려가 요구된다 마지막으로

.

METS, MODS

등의 메타데이터와 관련된 국제적인

표준화 동향을 지속적으로 관찰하고 표준화 활동에 적극적으로 참여하는 노력이

경주되어야 할 것이다.

(15)



한국과학기술정보연구원에서 여러 정보원으로부터 논문 특허 동향정보

,

,

등의 메타데이터 및 원문을 수집하여 이용자에게 검색 서비스를 제공하고 있다.

그러나 정보원은 여러나라 국적의 출판사 도서관 학회 등 다양하기 때문에 이

,

,

,

들 정보원으로부터 입수된 논문 메타데이터 또한

XML, SGML, Plain Text

파일 형태는 물론이고 내용의 구조 및 표현 형식까지 다양하다 이들의 정보서비

.

스를 위해서는 이러한 다양한 형태의 메타데이터가 하나의 통일된 형태로 가공

된 후에 저장 및 색인 과정을 거쳐 서비스할 수가 있다 따라서 한국과학기술정

.

,

보연구원에서 차세대 정보관리시스템인

DCMS

시스템을 개발하여 다양한 형태

의 메타데이터의 형태 항목 표기방식 등의 통합형식을 정의하고 변환 시스템을

,

,

새롭게 설계하고 또한 개발 표준 지침을 정의함으로써 향후 유지보수나 기능개

,

선이 용이한 표준개발환경을 구축하여 향후 시스템간의 상호호환성 및 유지관리

를 일관되게 할 수 있게 한 점이 긍정적인 것으로 평가된다.

표준화 내용으로는 콘텐츠 표준 형식의 표준화와 관리 표준화로 구분할 수 있

는데 콘텐츠 표준 형식의 표준화는 논문 서지

,

(bibliography)

정보 표준화

기반

논문 기사

표준화

기반

특허 기사

(MARC XML

),

(article)

(PMC-XML

),

표준화

기반 이고 관리 표준화는 단어 용어 표준화 한국

(article)

(WIPO ST.36

)

,

/

(

(16)

데이터베이스진흥센터 및 기타 표준화사례 바탕으로 자체 표준화지침 정의),

콘텐츠 관리번호 표준화 자체 표준양식 개발 환경 표준 지침 자체 표준

DCMS

(

),

(

양식 을 정의하였다 이를 바탕으로 한국과학기술정보연구원에서 서비스를 위한

)

.

시스템을 구축함으로서 이에 대한 효용성에 대한 검증 및 평가도 가능하리라 사

료된다.

본 연구 결과의

DCMS

정보관리 표준화 지침은 콘텐츠 표준 형식의 표준화와

관리 표준화 내용에 대한 정의서로서 향후 한국과학기술정보연구원에서 디지털

콘텐츠 관련 업무 및 개발 시 필수적으로 활용하여 궁극적으로

DCMS

콘텐츠

관리시스템의 데이터 품질을 향상시킬 수 있으리라 사료된다 또한 표준을 이용

.

,

하여 실제 시스템 구축을 함으로서 향후 표준 내용의 검증과 평가가 지속적으로

이루어져 본 표준 지침을 더욱 발전시켜 나갈 수 있을 것이다.

(17)

제 부 연구 배경

제 부 연구 배경

제 부 연구 배경

제 부 연구 배경

1111

디지털 콘텐츠 관리 시스템

디지털 콘텐츠 관리 시스템

디지털 콘텐츠 관리 시스템

디지털 콘텐츠 관리 시스템

1

(DCMS)

1

(DCMS)

1

(DCMS)

1

(DCMS)

정의

정의

정의

정의

1.1 DCMS

1.1 DCMS

1.1 DCMS

1.1 DCMS

디지털 콘텐츠 통합관리 시스템은 한국과학기술정보연구원

(KISTI)

의 과학기술

정보자원의 체계적이고 효율적인 디지털 콘텐츠 관리 및 공동 활용성 제고를 통하

여 고부가가치 서비스를 제공하는 표준화된 개방형 플랫폼이다

,

.

배경 및 목적

배경 및 목적

배경 및 목적

배경 및 목적

1.2

1.2

1.2

1.2

현재

KISTI

에서 운영하고 있는 과학기술 정보관리시스템은 과거에 산발적으로

개발되어 최신의 표준화된 유통 프로세스와 선진화된 유통 인프라 환경에 적합하

지 않다 따라서 개별적으로 개발된 시스템 간 연계성이 떨어져 빈번한 재개발로

.

인력과 예산의 낭비요소가 발생하므로 디지털 콘텐츠를 통합적으로 관리하고

등 서비스 패러다임 변화에 대응하고 개방과 공유를 위한 서비스 기반구

Web 2.0

축에 활용할 수 있는 개방형 플랫폼 구현이 필요하다 또한 과학기술정보 표준 유

.

,

통체제를 구축하여 환경 변화에 민첩하게 대응하고 상호 운용성 제고 및 정보의

공동 활용을 도모하고 한다.

과학기술학회마

e-gate DB, u-gate DB, OCEAN, WISECAT, KESLI, KSCI,

을 등 개별 관리시스템을 디지털 콘텐츠 통합 관리시스템으로 대체하여 운영.

최적화된 디지털 콘텐츠 생성 관리를 반영한 시스템을 구현하여 과학기술 정

/

보자원의 체계적이고 효율적인 관리.

표준화된 개방형 플랫폼을 개발함으로써 과학기술정보의 공동 활용 및 접근성

을 제고.

(18)

구성도

구성도

구성도

구성도

1.3

1.3

1.3

1.3

디지털 콘텐츠 통합관리 체제

의 전체적인 구성은 아래 그림

KISTI

(DCMS)

1-1

과 같다 기존의

.

KISTI

에서 관리되고 있는 과학기술정보 자료는 개별적으로 구축

된 시스템에서 각각 다른 포맷과 형식으로 자료를 구축하여 시스템 간 연계성이

떨어지고 개방과 공유를 위한 서비스 기반구축이 미흡하였다 이러한 문제를 해결

,

.

하기 위해서

DCMS

에서는 디지털 콘텐츠의 표준 포맷을 정의하고 일원화된 관리

프로세스 입수

(

가공 관리 배포 를 적용한 표준 디지털 콘텐츠 관리 모델을 제시

)

한다.

그림

구조

[

1-1] DCMS

(19)

주요 콘텐츠 현황

주요 콘텐츠 현황

주요 콘텐츠 현황

주요 콘텐츠 현황

1.4

1.4

1.4

1.4

                              

주요 디지털 콘텐츠 현황

[

1-1]

(20)

2222 정보관리 표준화 관련 기술

정보관리 표준화 관련 기술

정보관리 표준화 관련 기술

정보관리 표준화 관련 기술

장에서는

에 가장 적합한 표준화 기술을 선정하기 위하여 메타데

2

KISTI DCMS

이터 표준과 용어표준에 관한 콘텐츠 관리 표준화 기술을 살펴보고 또한 향후 유

지보수나 기능개선이 용이한 개발 프레임워크와 통합개발환경에 대하여 살펴본다.

메타데이터 표준

메타데이터 표준

메타데이터 표준

메타데이터 표준

2.1

2.1

2.1

2.1

2.1.1 METS(Metadata Encoding and Transmission Standard)

2.1.1 METS(Metadata Encoding and Transmission Standard)

2.1.1 METS(Metadata Encoding and Transmission Standard)

2.1.1 METS(Metadata Encoding and Transmission Standard)

스키마 기반의 디지털도서관 또는 디지털 보존서고의 디지털객체

METS

XML

에 대한 각종 메타데이터를 인코딩하고 디지털객체를 교환하는 표준이다.

정의

1)

디지털도서관 또는 디지털 보존서고의 디지털객체에 대한 각종 메타데이터를

인코딩하고 디지털객체를 교환하는 표준.

스키마 기반의 범용의 메타데이터 프레임워크

XML

.

개발배경

2)

미국의

DLF(Digital Library Foundation)

지원하에

1997

년부터 진행된

프로젝트 결과물의 하나

MOA2(Making of America II)

.

프로젝트는 텍스트와 이미지 형태의 디지털 객체내에 주요 콘텐츠와

MOA2

함께 서술적

(descriptive),

관리적

(administrative),

구조적

(structural)

메타데

이터를 인코딩하기 위한 디지털 객체 표준의 생성을 그 목적으로 하여 XML

기반의 인코딩 표준을 개발

DTD

.

년 맥도노우

의 주도적인 역할로

버전 개발

2001

:

(Jerome McDonough)

1.0

년 현재

버전까지 발전

2010

: 1.9

.

관리 기관 : Library of Congress Network Development and MARC

Standards Office.

(21)

용도

3)

전달용 신택스

디지털객체의 전송 및 교환을 위한 표준으로 사용가능

-

.

의 제출용 정보패키지

배포용 정보패키지

를 인코딩하고

- OAIS

(SIP),

(DIP)

전달 가능.

서비스용 신택스

이용자에게 디지털콘텐츠와 관련된 메타데이터를 식별

하고 연계

-

(view)

하는 기능을 제공하는 기반역할이 가능

(navigate)

.

의 배포용 정보패키지

를 인코딩하고 전달 가능

- OAIS

(DIP)

.

저장용 신택스

디지털객체와 메타데이터를 저장하는 표준

-

.

의 저장용 정보패키지

를 인코딩 가능

- OAIS

(AIP)

.

기본구성

4) METS

헤더

(Header)

섹션 필수

[

]

서술 메타데이터 섹션(Descriptive Metadata Section)

관리 메타데이터 섹션(Administrative Metadata Section)

파일 섹션(File Section)

구조맵 섹션

(Structure Map Section) [

필수

]

구조연결 섹션(Structural Links)

행위 섹션(Behavior Section)

의 활용 및 기능

5) METS

참조모델에서 그 개념을 정의하

OAIS(Open Archival Information System)

고 있는 SIP(Submission Information Package), AIP(Archival Information

를 표현하는데 활용될

Package), DIP(Dissemination Information Package)

수 있음.

관점 시스템간의 디지털 객체를 전송 및 교환을 위한 정보 패키징 표준

SIP

:

.

관점 이용자에게 디지털 콘텐츠 및 관련 메타데이터에 대한 열람 및 네

DIP

:

비게이션을 제공하기 위한 정보패키징 표준.

(22)

관점 디지털 객체들을 아카이빙

하기 위한 정보 패키징 표준

AIP

:

(archiving)

.

그림

참조모델

[

1-2] OAIS

스키마

6) METS

그림

스키마

[

1-3] METS

(23)

METS Header

헤더 레코드는

문서가 인코딩하는 디지털 객체를 기술하는 메타데

-

METS

이터가 아닌

METS

문서 자체에 대한 메타데이터를 저장하는 곳으로 다

음과 같은 정보를 포함.

에이전트

(agnet) ,

명 이이전트 역할

(role).

문서에 대한 대체 레코드

METS

ID.

문서의 생성 갱신시간

METS

,

.

문서 상태

METS

(status).

서술 메타데이터 섹션 (Descriptive Metadata Section)

문서로 표현하려는 디지털 객체에 관련된 모든 서술 메타데이터를

- METS

포함.

스키마는 서술 메타데이터의 형식에 대해서는 정의하지 않음 대

- METS

.

신 다른 메타데이터 표준 형식의 서술 메타데이터를

METS

문서에 포함

할 수 있는 방법을 제공.

서술 메타데이터 섹션은

문서에서

요소로 표현됨

-

METS

<dmdSec>

.

요소는 서술 메타데이터를 포함하기 위하여 다음과 같은 콘

- <dmdSec>

텐트 모델을 취함.

내부 서술 메타데이터

(Internal Descriptive Metadata)

레코드가

XML

형태인 경우

<mdWrap>

요소의 하위 요소인

<xmlData>

요소의 값으

로 내부 서술 메타데이터 레코드를 포함시킴.

(24)

내부 서술 메타데이터 레코드가 이진데이터 형태인 경우

<mdWrap>

소의 하위 요소인

<binData>

요소의 값으로 내부 서술 메타데이터 레코

드를 포함시킴

. <binData>

요소값의

type

xsd:base64 .

(25)

술하면 다음과 같이 표현될 수 있음.

관리 메타데이터 섹션

관리 메타데이터 섹션에서는

문서로 표현하려는 디지털 객체에 관

-

METS

련된 관리 메타데이터를 포함.

스키마는 관리 메타데이터의 형식에 대해서는 정의하지 않음 대

- METS

.

NISOIMG, LC-AV

등 별도의 메타데이터 표준 형식의 관리 메타데이

터를

METS

문서에 포함할 수 있는 방법을 제공

.

관리 메타데이터 섹션은

문서에서

요소로 표현

-

METS

<admSec>

.

요소는

문서에서 단 번만 나타날 수 있음

- <amdSec>

METS

1

.

관리 메타데이터 섹션을 아래와 같은 가지 세부 영역으로 구분

-

4

기술 메타데이터 영역

(Technical Metadata) : METS

문서가 표현하고

자 하는 디지털 객체를 구성하는 파일이 어떻게 생성되었고 저장되었는

지에 대한 정보를 기술.

소스 메타데이터 영역

(Source Metadata) : METS

문서가 표현하고자

하는 디지털 객체가 디지털 형태로 생산

(born-digital)

된 것이 아닌 아

날로그

(analog)

형태의 원자원을 디지털 형태로 변환하여

(digitalized)

생산한 경우 디지털 자원의 원자원에 대한 서술 및 관리 메타데이터를

기술.

(26)

저작권 메타데이터 영역

(Rights Metadata) : METS

문서가 표현하는

디지털 객체에 대한 지적재산권정보

(Copyrights, license)

를 기술

.

변경정보 메타데이터 영역

(Ditgital Provenance Metadata) : METS

서가 표현하는 디지털 객체를 구성하는 파일 간의 출발지 목적지 관계

/

에 대한 정보를 기술

(source/destination relationship)

.

파일섹션

파일 섹션에서는

문서로 표현하려는 디지털 객체를 구성하는 디지

-

METS

털 파일 자체를 포함하거나 디지털 파일로의 연결정보를 포함.

파일 섹션은

문서에서

요소로 표현

-

METS

<fileSec>

.

요소는

문서에서 한번만 나타날 수 있음

- <fileSec>

METS

.

요소는 하나 이상의 관련된 파일을 하나로 묶어주는 역할을

- <fileSec>

하는

<fileGrp>

요소를 개 이상 포함 각

1

.

<fileGrp>

요소는 디지털 객

체에 대한 단일 버전을 구성하는 모든 파일을 포함 여기서 버전이란 미

.

,

리보기용

thumbnail

이미지와 저장용

master

이미지 또는

,

pdf

형태와

인코딩 텍스트 형태 등 용도 또는 형태의 구분을 의미 즉

TEI

,

.

,

요소는 용도 및 형태를 기준으로

문서에 포함되는 디지

<fileGrp>

METS

털 파일을 그룹핑하는 역할을 담당.

다음의 예에서

요소는 각각 디지털 객체의 버전을 구분하는

-

<fileSec>

3

개의

<fileGrp>

요소를 포함 첫 번째는

.

XML

로 인코딩된 문서파일이고

두 번째는

wav

형태인 저장용 마스터 오디오 파일이며 세 번째는

,

MP3

형태의 파일

.

두개의 오디오 파일정보를 포함하는

<file>

요소의

속성은 동일한 값을 가지고 있는데 이것은 이 두개의 파일이

GROUPID

각각 객체를 표현하는 다른 버전에 속하는 반면 동일한 내용의 정보를 담

고 있음을 의미.

(27)

문서에서는

문서가 표현하고자 하는 디지털 객체를 구성하

- METS

METS

는 디지털 파일 자체를 포함하거나 외부 파일을 연결할 수 있음.

디지털 파일에 대한 정보를 포함하는

요소는 서술 메타데이터를

-

<file>

표현하는

<dmdSec>

요소 또는 관리 메타데이터를 표현하는

<amdSec>

요소의

4

가지 하위 요소인

<techMD>, <sourceMD>, <rightsMD>,

요소들과 유사한 모델을 취함

<digiProvMD>

.

요소내에 포함되는 속성을 이용하여 디지털 파일에 대한 기본적

- <file>

인 관리 메타데이터 정보를 기술할 수 있음.

요소의 속성은 다음과 같다

- <file>

.

문서내에서 디지털 파일을 식별하는 로컬 식별자

ID : METS

.

파일형식을 기술 예

(28)

내에서의 파일간의

부여

SEQ :fileGrp

Sequence

.

파일의 크기 단위는

SIZE :

.

byte.

파일의 생성 일시

CREATED :

.

속성의 값을 생성하기 위하여 사용된

CHECKSUMTYPE : CHECKSUM

알고리즘 유형 예

checksum

.

) HVAL, MD5, SHA-1, SHA-256,

SHA-384, SHA-512, TIGER, WHIRLPOOL.

내부 파일에 대한

CHECKSUM :

checksum

.

디지털 파일의 소유자가 부여한 주식별값

OWNERID :

(primary

identifier).

디지털 파일의 용도

USE :

.

구조맵 섹션

구조맵

섹션은 이용자가 디지털 객체를 네비게이션

-

(structural map)

할 수 있도록 하는 계층적 구조

를 정

(navigation)

(hierarchical structure)

의.

요소는

요소들간의 포함관계를 통하여 계층구조를

- <structMap>

<div>

표현.

각각의

요소는 자신과 상응하는 콘텐츠를 식별하기 위하여

-

<div>

METS

문서에 대한 포인터인

<mptr>

요소 또는 디지털 파일에 대한 포인터인

요소를 포함

<fptr>

.

포인터는

요소가 지시하는 관련된 디지털 파일정보를 포함

- METS

<div>

하고 있는 별도의

METS

문서를 연결 이 기능은 각각의

.

METS

문서의

크기를 상대적으로 작게 유지하면서

METS

문서 세트가 구성하는 큰 컬

렉션 정보를 인코딩하는데 유용함.

(29)

파일 포인터는

요소가 지시하는 관련된 디지털 파일 정보를 포함

-

<div>

하는 동일한

METS

문서의 파일 섹션내의

<file>

요소를 연결

.

예로 제시한 구조맵은 개의 하위섹션

으로 구성

-

3

(div)

.

하위 섹션

들은 각각

형태와 오디오 파일인 개의 파일 또는

-

(div)

XML

2

외부

METS

문서로 연결

. <fptr>

요소의 하위 요소인

<area>

요소는

요소가 파일 전체가 아닌 일부분에만 대응한다는 것을 의미

<div>

.

요소는 연결대상 파일내의 정확한 범위를 식별

<area>

.

첫번째

파일

의 일부 범위로 연결되는데 연결대

-

<div>

XML

(FILE001)

XML

파일 내에서

ID

속성의 값으로

INTVWBG

INTVWND

을 가지

는 두개의 태그

(tag)

를 식별함으로써 구간 범위를 구분

.

두번째

는 다른 오디오 파일로 연결되는데 이 경우에는 연결대상

-

<div>

파일의

ID

속성의 값이 아닌

HH:MM:SS

형식의 간단한 시간코드 형태로

파일내의 시작

(begin)

과 끝

(end)

구간을 식별

.

세번째

는 내부 파일이 아닌 외부의

문서로 연결

-

<div>

METS

.

구조연결 섹션

구조연결

섹션은

섹션중에서 구조가 가장 단순

(30)

한 섹션.

단 하나의 요소

만을 포함

요소는 반복될 수 있음

-

<smLink>

. <smLink>

.

구조연결 섹션은 구조맵내의 구성단위

간의 하이퍼링크

-

(div)

(hyperlink)

를 표현 이 기능은

.

HTML

파일내에서 표현되는 하이퍼링크와 별도로 사

이트의 하이퍼링크 구조의 기록을 유지하면서 웹사이트 전체를 저장하기

위하여

METS

를 활용하는 경우 매우 유용할 수 있음

.

다른 페이지로의 하이퍼링크가 걸려 있는 이미지를 포함하는 웹페이지를

-저장하기 위해서

METS

문서를 활용하는 경우

, <structMap>

요소는 두

개의 웹 페이지에 대한

<div>

구조를 다음과 같이 표현 할 수 있음

.

첫번째 페이지

에 포함되어 있는 이미지파일

가 두번째 페

-

<div>

<div>

이지

<div>

로 하이퍼링크가 걸려 있다는 것을 표현하기 위해 다음과 같

이 구조연결 섹션을 포함할 수 있음.

(31)

요소는

구문구조를 약간 변경한 형태를 취함

- <smLink>

XLink

.

의 모든 속성을 사용하나 다만

속성과

속성은

명세

- XLiik

to

from

XLink

에서의

이 아닌

으로 선언

(specification)

NMTOKEN type

IDREF type

.

이러한 변경의 목적은 구조맵 내의 두 노드 간에 연결이 존재한다는 것을

-나타낼 수 있고 또한 연결대상 노드가 실제로 존재하는 지를

XML

프로세

싱 도구

(processing tool)

로 하여금 자동으로 검증하게 할 수 있기 때문

.

행위 섹션

행위

섹션은

문서내에 콘텐츠와 실행가능한 행위

-

(Behavior)

METS

를 연관시키기 위해서 사용될 수 있음

(executable behavior)

.

행위 섹션은 한 개 이상의

요소를 포함

-

<behavior>

.

각각의

요소는 특정 행위 섹션에서 표현하고자 하는 행위

-

<behavior>

세트에 대한 추상적 정의

(abstract definition)

를 표현하는 일종의 인터페

이스 정의

(interface definition)

를 위한

<interfaceDef>

요소를 포함

.

요소는 또한

요소에 의해서 추상적으로 정의

- <behavior>

<interfaceDef>

되는 행위를 구현하여 실행하는 프로그램 코드에 대한 포인터를 기술하기

위한

<mechanism>

요소를 포함

.

디지털 객체 행위는 아래의

프로젝트의 예와 같이 분산

-

Mellon Fedora

(32)

웹서비스

(distributed web service)

로의 링크로서 구현될 수 있음

.

문서 구성요소간의 연결구조

7) METS

문서는 하부 섹션간의 다소 복잡한 연결 구조를 가진다 이런 연결구조

METS

.

XML

문서인

METS

문서내의 연결대상 요소에

XML ID type

의 값을 취한

속성을 부여하고 연결대상 요소로 연결하고자 하는 요소내 링크속성 예

ID

( ,

등 의 값으로 연결대상 요소의

속성을 값을 기

DMDID, AMDID, STRUCTID

)

ID

술함으로써 이루어진다 이러한 링크속성들은 다음과 같은 유형이 있다

.

.

구조맵 섹션 파일 섹션에 대한 서술 메타데이터로의 연결을 위해

DMDID :

,

서 사용된다.

구조맵 섹션 서술메타데이터 섹션 파일섹션 구조연결 섹션 행위

AMDID :

,

,

,

,

섹션 그리고 서술메타데이터섹션 자체에 대한 관리 메타데이터로의 연결을

위해서 사용된다.

구조맵 섹션의 파일 포인터인

요소에서 파일섹션의

FILEID :

<fptr>

요소로의 연결을 위해서 사용된다

<file>

.

행위 섹션에서

또는

로의 연결에 사용된다

(33)

파일 섹션에서의 연결

파일

(fle)

또는 파일그룹

(gileGrp)

METS

문서내의 관련된 관리정보 메타

데이터로 연결될 수 있다.

그림

파일 섹션에서의 연결

[

1-4]

구조맵 섹션에서의 연결

구조맵 섹션은

METS

문서를 구성하는 필수 구성요소이다 이것은

.

METS

문서내의 연결 구조를 추적하여 처리하는데 있어 그 시작이 구조맵 섹션임을

의미한다 즉 구조맵 섹션이 없다면 다른 섹션은 존재의 의미가 없는 것이

.

,

다 구조맵과 구조맵의 단위

.

Division(div)

가 파일의 일부분으로 표현되는 복

합 콘텐츠 파일과 연결구조를 나타낼 수도 있고 구조맵의 단위가 하나 이상

의 파일일 수도 있다.

그림

구조맵 섹션에서의 연결

[

1-5]

(34)

하나 이상의 파일에 대한 순차적인 연결구조는 아래의 예와 같이 표현할 수 있다.

2.1.2 MODS(Metadata Object Description Schema)

2.1.2 MODS(Metadata Object Description Schema)

2.1.2 MODS(Metadata Object Description Schema)

2.1.2 MODS(Metadata Object Description Schema)

정의

1)

도서관 영역의 디지털객체의 서지정보 표준 메타데이터.

다양한 메타데이터

등 에 대한 교통정리

-

(ONIX, IMS, TEI

)

.

서지정보 메타데이터 표준을 지향한

의 문제점 해결

-

DC

.

디지털도서관의 메타데이터 표준환경 제공 범용 서지 메타데이터

-

(

).

MARC-compatible

필드의 일부분 포함 언어형식의 태그 사용

- MARC

,

.

의 축약형

버전

(35)

스키마 기반

XML

패키지와 독립적

- S/W

.

장기적 보유 가능

-

.

개발배경

2)

공식발표

년 현재

버전

2002/7

(2006

3.3

).

기반의 메타데이터 처리 요구 증가 도서관 및 문화기관

XML

(

).

상호운용성

(interoperability)

과 정밀성

(precision)

모두 만족

.

의 단순함과

의 복잡함의 절충

DC

MARC

.

디지털도서관 영역의 메타데이터 표준화 요구 증대.

는 표준 서지정보 메타데이터로서의 위상확보에 실패

DC

.

는 디지털객체에 부적합

MARC

.

관리 기관 : Library of Congress Network Development and MARC

Standards Office.

특징

3)

다른 유형의 메타데이터

(DC, MARC, ONIX

등 의 보완 역할

)

.

데이터 요소의 재귀적 반복 허용 아이템과 구성요소 모두 동일한

:

Title

용.

다양한 속성 제공.

외부의 데이터요소 연계 가능 예

( : xlink

로 외부의 초록정보 참조연계

).

라는 범용의 메타데이터 프레임워크와 함께 사용할 경우 잠재력 높음

METS

.

장점

4)

기반

XML

.

다양한 장르의 디지털자원에 대한 서지정보 기술 가능.

디지털 자원의 여러 측면

(facets)

에 대한 데이터 표현 가능

.

데이터요소가

DC

포맷보다는 풍부하고

MARC

포맷보다 간단

(19

상위요소

하위요소

64

).

(36)

한계

5)

현재로서 적용사례가 적음 경험부족

(

).

의 양방향 호환은 불가능 데이터손실 및 매핑 불일치

MODS

MARC

(

).

구체적인 활용지침 없음.

계층적 재귀적 특성은 이론적으로는 훌륭하나 현실적 적용에는 난제가 많음

/

.

적용사례

6)

대학의

Brown

CDI(Center for Digital Initiatives)

- http://dl.lib.brown.edu/documentation/MODS.pdf

프로젝트

LC

AudioVisual Prototype

- http://www.loc.gov/rr/mopic/avprot/avprhome.html

MINERVA(Mapping the INternet Electronic Resource Virtual Archive)

- http://www.loc.gov/minerva/

기반

Oxford University s Digital Library : DC

MODS

기반

출처

(

: http://www.loc.gov/standards/mods/mods-overview.html)

그림

메타데이터 표준들의 상호운용성 및 정밀도

[

1-7]

(37)

스키마 표준

7)

출처(http://www.loc.gov/standards/mods/v3/mods-3-3.xsd)

그림

스키마

[

1-9] MODS

그림

데이터 예

[

1-10] MODS

(38)

2.1.3 PMC(PubMed Central) XML

2.1.3 PMC(PubMed Central) XML

2.1.3 PMC(PubMed Central) XML

2.1.3 PMC(PubMed Central) XML

에서

을 가공하여 전 세계에 무료로 제공하고

PubMed

NLM

NCBI

MEDLINE

있는

MEDLINE

의 일종으로

1966

년 이후 의학저널에 대한 색인을 제공하고 있다

.

과 협찬 출판사들이 공동으로 참여하고 있으며 협찬 출판사들은

PubMed

NLM

,

저널 출판에 앞서 서지데이터 제목 저자 소스 초록 를

(

,

,

,

..)

NLM

에 제공한다 이

.

때문에

Update

가 다른 상업적인 데이터베이스보다 빨라 최신성을 유지하고 있다

.

또한

4,800

여종의 저널에 대해

PubMed

검색 결과에서 바로 원문이 링크되는

서비스를 제공하고 있으며 의학도서관 구독 저널 중

여종은 바로 원

LinkOut

3,300

문을 이용할 수 있는 장점을 가지고 있다.

그림

데이터 모델

[

1-11] PubMed

(39)

스키마

1) PMC XML

<!ELEMENT PubmedArticleSet (PubmedArticle)+>

<!ELEMENT PubmedArticle (MedlineCitation, PubmedData?)>

<!ELEMENT MedlineCitation (PMID, DateCreated, DateCompleted?, DateRevised?,

Article, MedlineJournalInfo, ChemicalList?, CitationSubset*, CommentsCorrectionsList?, GeneSymbolList?, MeshHeadingList?, NumberOfReferences?, PersonalNameSubjectList?, OtherID*, OtherAbstract*, KeywordList*, SpaceFlightMission*,

InvestigatorList?, GeneralNote*)>

<!ATTLIST MedlineCitation

Owner (NLM | NASA | PIP | KIE | HSR | HMD | NOTNLM)

"NLM"

Status (Completed | In-Process | PubMed-not-MEDLINE | In-Data-Review | Publisher | MEDLINE |

OLDMEDLINE) #REQUIRED>

<!ELEMENT Article (Journal,ArticleTitle,((Pagination, ELocationID*) |

ELocationID+),Abstract?, Affiliation?, AuthorList?,

Language+, DataBankList?, GrantList?,PublicationTypeList, VernacularTitle?, ArticleDate*)>

<!ATTLIST Article

PubModel (Print | Print-Electronic | Electronic | Electronic-Print) #REQUIRED>

(40)

용어 표준화

용어 표준화

용어 표준화

용어 표준화

2.2

2.2

2.2

2.2

용어 표준화 정의

용어 표준화 정의

용어 표준화 정의

용어 표준화 정의

2.2.1

2.2.1

2.2.1

2.2.1

용어 표준화는 여러 시스템에 산재해 있는 데이터에 대한 한글 논리 명 영문 물

(

) /

(

리 명의 명명규칙 데이터타입 데이터길이 등에 대한 기준을 마련하여 표준을 정

)

,

,

의함으로써 누구나 동일한 의미로 용어를 활용 할 수 있게 하며 궁극적으로 콘텐

츠 관리시스템의 데이터의 품질을 향상시키고자 하는 지침 및 활동을 말한다.

용어 표준화 목적

용어 표준화 목적

용어 표준화 목적

용어 표준화 목적

2.2.2

2.2.2

2.2.2

2.2.2

목적 설명 용어사용의 혼란방 지 표준화된 명칭을 유일하게 부여함으로서 데이터의 중복 정의와 불일치를 제거하여 사용자의 의사소통을 원활하게 한다. 전사 데이터 모델의 일관성 유지 전사적으로 표준화된 용어를 사용함으로써 데이터 모델을 구성 하는 논리 물리용어 오브젝트 명칭의 일관성을 유지한다/ ( ) . 데이터의 정확성 및 품질 확보 표준화를 통해 데이터의 구조와 흐름 등 정합성 검증이 용이하 여 데이터의 품질을 확보 한다. 공통의 표준화된 데 이터 이해 동일한 의미의 단어는 하나의 단어로만 표현 하고 단어간의 의, 미의 경계를 명확히 하여 공통의 이해를 기반으로 상호 의사소 통을 명확히 하게 한다. 시스템에 대한 이해도(Readability)가 향상되어 시스템의 상호 운용성을 향상 시킨다. 개발 생산성 향상 공통의 용어정의를 통해 재사용 기회를 높이고 항목명 작명 시 단어 선택에 대한 시간을 단축시킴으로써 개발 생산성을 향상 시킨다. 데이터 관리의 일관 성 및 정합성 향상 표준 데이터와 모델정보 데이터베이스 정보간의 일관된 관리, 와 정합성을 확보 한다.

용어 표준화 대상

용어 표준화 대상

용어 표준화 대상

용어 표준화 대상

2.2.3

2.2.3

2.2.3

2.2.3

표준화 대상은 원천 시스템에서 데이터가 작성되는 것으로부터 사용자의 데이터

활용 때까지 일련의 전 과정이 포함되며 논리 설계 단계 및 물리 설계단계에 해당

,

하는 표준화 원칙과 오브젝트의 명명규칙 등이 포함된다.

(41)

표준화 대상 설명 논리 데이 터 모델 오브 젝트 주제영역 데이터모델의 개념을 보다 관리하기 쉽도록 특정 주제를 가지고 분 류한 영역으로서 그 하위에 엔티티 집합을 가짐 예를 들어 통합방. 식 이라는 주제영역은 출원방식에 관련된 엔티티들의 집합으로 구성 됨 엔티티 데이터의 기본 단위로서 업무에서 관리하고자 하는 대상에 대한 종 합적인 정보를 가지고 있는 단위이다 예를 들어 발명자 라는 엔티. 티는 발명자의 신상에 대한 정보를 가짐 속성 속성은 엔티티들이 가지는 특징을 분류하는 가장 작은 단위의 데이 터 구성 요소이다 예를 들어 발명자 라는 엔티티 타입은 성명 주. , 민등록번호 주소 발명자코드 등과 같은 특징을 갖게 되는데 이러, , 한 특징이 속성에 해당 됨 물리 데이 터 모델 오브 젝트 테이블 논리설계 단계의 엔티티명에 대응하는 물리설계 오브젝트 칼럼 논리설계 단계의 속성명에 대응하는 물리설계 오브젝트 인덱스 테이블에서 특정조건의 데이터를 효율적으로 검색하기 위한 색인 데 이터로 대표적인 인덱스 대상으로는 대표키(Primary Key), 외부키 가 있음 (Foreign Key) 뷰 테이블에 대한 재정의로써 물리적으로 테이블의 특정 열(Column)과 특정 행(Row)를 뷰(view)로 정의하여 접근이 허용된 사용자만 사 용이 가능하도록 관리 함 데이터베 이스 논리적으로 연관된 하나 이상 테이블의 집합을 저장하는 오브젝트 테이블스 페이스 테이블을 저장하는 물리적 공간을 지칭하는 오브젝트 기타 기타 각 DBMS에서 사용하는 물리 오브젝트 (USER NAME, Control File, Cluster, Redo log File, Sequence, Synonym, Role, 등 Trigger, DB Link, Package, SQL Source, DataFile, Partition )

(42)

데이터 사전에 대한 용어 정의

데이터 사전에 대한 용어 정의

데이터 사전에 대한 용어 정의

데이터 사전에 대한 용어 정의

2.2.4

2.2.4

2.2.4

2.2.4

데이터 사전 정의 단 어 단어란 데이터모델링에서 논리 물리 오브젝트의 한글명 및 영문명/ 을 이루는 요소를 말하며 엔티티명 테이블명 속성명 칼럼명 생성, , , 조합 시 활용 테이블과 칼럼의 한글명 및 영문명을 구성하는 최 ( ) . 소 원소이며 단어는 동시에 용어 이거나 도메인이 될 수 있다. 용어 생성 분류 기본 용어를 구성하는 단어 주제어 수식어( , ) 분류 용어 생성시 최 우측에 정의 할 수 있는 도메인성 단어 이다. 도메인성 단어 실제 데이터 값에 대한 형식 이나 의미를 - : (type) 유추 할 수 있게 구성된 단어. 단어 사용 유형 분류 표준 현재 표준 단어로 사용이 허용된 단어 비 표 준 동 의 표준 단어와 유사한 의미로 정의되어 사용 중인 단어 이음동의어( ) 단 가급적 표준 단어를 사용하도록 권장 함, 금 칙 사용이 허락되지 않거나 일정 기간 사용하다가 특정 시점 이후 사 용이 중지된 단어 용 어 표준용어는 특히 논리 데이터 모델링 시 정의하는 속성(Attribute) 명에 사용하며 물리적으로 전환시 영문 칼럼명을 생성하기 위한 기 준이 된다 용어는 누구나 이해하기 쉽도록 간결하고 함축적이며. 명확한 표현을 사용 단어의 조합으로 이루어져 엔티티 속성 및 테. 이블 칼럼의 명칭으로 사용되는 용어. 도 메 인 도메인은 각 속성의 일반적인 특징을 나타내는 데이터의 성격을 분류한 것으로써 속성이 취할 수 있는 값의 집합이라 할 수 있다 일반적으로 엔티티에 존재하는. 속성들의 실제 값들이 나타내는 공통적인 특징을 그룹화 하고 특정 값을 제한 함 으로써 값에 대한 표준화와 명명에 대한 표준화를 준수 할 수 있다. 예 코드 금액 일자 수 내용 명 등) , , , , , 도메인분류 도메인을 관리를 위해 분류 체계를 구분함 예 도메인대분류 명 내용 주소 수 금액 율 날짜 번호 코드) ( / / , / / , , , ) 도메인소분류 명 금액 날짜 일련번호 여부( , , , , ) 도메인명 데이터 타입과 길이를 대표하기 위해 정의한 명칭 예 금액) N13, 내용V2000, 수N5 논리타입, 물리타입 정의된 도메인명을 물리화하기 위해 DBMS에 별로 물리TYPE 또는 를 정의 함 LENGTH . 예) [논리타입]VARCHAR() [물리타입]VARCHAR2()[오라클]

(43)

개발 표준

개발 표준

개발 표준

개발 표준

2.3

2.3

2.3

2.3

개발환경 프레임워크

개발환경 프레임워크

개발환경 프레임워크

개발환경 프레임워크

2.3.1

2.3.1

2.3.1

2.3.1

의 대표적인

기반의

개발 프레임워크는

Web Application Framework

Java

Struts

와 결합하면서

패턴을 구현한 내부 아키

WebWork

MVC(Model View Controller)

텍쳐가

WebWork

의 아키텍쳐로 변경되면서 기존

Servlet

기반에서

Filter

와 인터

셉터 기반으로 구조가 크게 변경되어 컴포넌트 기반의 시스템에 적합하며 향후 유

지보수나 기능개선에 대하여 확장 및 수정이 용이한 장점을 가지고 있다.

그림

아키텍쳐

(44)

그림

특징

[

1-12] Sturts2

(45)

통합개발환경 구축

통합개발환경 구축

통합개발환경 구축

통합개발환경 구축

2.3.2

2.3.2

2.3.2

2.3.2

컴포넌트 기반 개발이 가능한

Eclipse

기반의 통합 개발 환경은 프로그램의 개발

,

생산 운용유지 등과 관련된 시간과 비용을 단축하고 개발 환경변화에 대응한 기민

,

한 대응을 가능하게 한다.

그림

통합개발환경 구축

[

1-12]

(46)

제 부

데이터 표준화 체계

제 부

데이터 표준화 체계

제 부

데이터 표준화 체계

제 부

2

2

2

2

DCMS

DCMS

DCMS

DCMS

데이터 표준화 체계

메타데이터 표준

메타데이터 표준

메타데이터 표준

메타데이터 표준

1 DCMS

1 DCMS

1 DCMS

1 DCMS

을 이용한 저널정보 메타데이터 표준

을 이용한 저널정보 메타데이터 표준

을 이용한 저널정보 메타데이터 표준

을 이용한 저널정보 메타데이터 표준

1.1 MARC XML

1.1 MARC XML

1.1 MARC XML

1.1 MARC XML

저널정보 메타데이터를 저장하는 방식에서의 주요 고려사항은

DCMS

XML

반의 표현 방식과 기존

MARC

데이터를 손실 없는 수용하는지가 핵심이다 따라

.

서 저널정보 메타데이터를 저장하는 가지 방식에 대하여 아래와 같이 분석한

3

결과

MARC XML

DCMS

저널정보 메타데이터 저장방식으로 결정하였다

.

데이터를

별 원형 그대로

형식으로 저장하는 구

MARC XML

MARC

Tag

XML

조로서

XML

기반의 메타데이터 관리가 가능하며 기존

MARC

로 관리되던 저널

정보의 데이터 손실이 없는 구조이다.

저널데이터 저장방법

저널데이터 저장방법

저널데이터 저장방법

저널데이터 저장방법

1.1.1

1.1.1

1.1.1

1.1.1

데이터를 그대로 사용

1) MARC

을 활용하는 방안

2) MARC XML

내용 기존에 관리되던 원형의 MARC데이터를 그대로 저장 저널데이터는 으로 저장됨 - MARC 장점 기존에 관리되던 데이터의 손실이 없음 단점 DCMS시스템의 개발의 어려움 text 핸들링과 XML파싱 국내논문데이터를 MARC으로 변환 내용 기존에 관리되던 원형의 MARC데이터를 MARC XML로 변환 저널데이터는 로 저장됨 - MARC XML 장점 XML기반의 메타데이터 관리가 가능함 (text 핸들링이 아니라 XML 기반 시스템) - 기존에 관리되던 데이터의 손실이 없음 단점 MARC을 MARC XML로 변환해야 하는 과정이 있음 와 을 관리하는 기능을 동시에 지원 개발해야 함 MODS MARC XML /

(47)

를 활용하는 방안

3) MODS

구조

구조

구조

구조

1.1.2 MARC XML

1.1.2 MARC XML

1.1.2 MARC XML

1.1.2 MARC XML

그림

[

2-1] MARC XML Architecture

내용 기존에 관리되던 원형의 MARC데이터를 MODS로 변환 저널데이터는 로 저장됨 - MODS 세부방안 로 변환되지 않는 데이터의 중요성 판단 후 - 1 : MODS 무시하는 방법 세부방안 로 변환되지 않는 데이터를 위해 - 2 : MODS MODS 이용 extension 장점 MODS기반의 메타데이터 관리가 가능함 단점 MARC을 MODS로 변환해야 하는 과정이 있음 세부방안 데이터 손실 - 1 : 세부방안 에 사용되는 포맷을 지원하는 기능 추가개 - 2 : extension 발이 필요함

(48)

1.1.3 MARC XML

1.1.3 MARC XML

1.1.3 MARC XML

1.1.3 MARC XML

<?xml version="1.0" encoding="UTF-8" ?> <marc:collectionxmlns:marc="http://www.loc.gov/MARC21/slim"xmlns:xsi="http://www.w3.org/2001/X MLSchema-instance"xsi:schemaLocation="http://www.loc.gov/MARC21/slimhttp://www.loc.gov/standards/ marcxml/schema/MARC21slim.xsd"> <marc:record>

<marc:leader>00925njm22002777a4500</marc:leader> <marc:controlfield tag="001">5637241</marc:controlfield> <marc:controlfield tag="003">DLC</marc:controlfield>

<marc:datafield tag="010" ind1="" ind2="">

<marc:subfield code="a">91758335</marc:subfield> </marc:datafield>

<marc:datafield tag="028" ind1="0" ind2="0"> <marc:subfield code="a">1259</marc:subfield> <marc:subfield code="b">Atlantic</marc:subfield> </marc:datafield>

<marc:datafield tag="260" ind1="" ind2="">

<marc:subfield code="a">New York, N.Y. :</marc:subfield> <marc:subfield code="b">Atlantic,</marc:subfield>

<marc:subfield code="c">[1957?]</marc:subfield> </marc:datafield>

<marc:datafield tag="650" ind1="" ind2="0"> <marc:subfield code="a">Jazz</marc:subfield> <marc:subfield code="y">1951-1960.</marc:subfield> </marc:datafield>

<marc:datafield tag="650" ind1="" ind2="0">

<marc:subfield code="a">Piano with jazz ensemble.</marc:subfield> </marc:datafield>

<marc:datafield tag="700" ind1="1" ind2="">

<marc:subfield code="a">Charles, Ray,</marc:subfield> <marc:subfield code="d">1930-</marc:subfield> <marc:subfield code="4">prf</marc:subfield> </marc:datafield>

</marc:record> </marc:collection>

(49)

기반의 논문 표준 스키마

기반의 논문 표준 스키마

기반의 논문 표준 스키마

기반의 논문 표준 스키마

1.2 PMC XML

1.2 PMC XML

1.2 PMC XML

1.2 PMC XML

스키마를 기준으로

에서 필요한 엘리먼트를 확장하여

PMC XML

DMCS

DCMS

문 표준 스키마를 정의 하였다 다음은

.

DCMS

에 사용한 표준 스키마의 메타데이터

구조를 보여준다.

메타데이터 구조

메타데이터 구조

메타데이터 구조

메타데이터 구조

1.2.1

1.2.1

1.2.1

1.2.1

저널명 발행년 논문명이 없으면 저장하지 않는다

,

,

.

여러건의 데이터를 교환할 시에 필요에 의해 문서에 정의되지 않은 최상위 태

<articleSet>

을 사용할 수 있다

. <articleSet>

아래에 다수의

<article>

위치하는 형태로 다수의 데이터가 저장될 수 있다.

엘리먼트 엘리먼트 엘리먼트

엘리먼트 엘리먼트설명및엘리먼트설명및엘리먼트설명및엘리먼트설명및RuleRuleRuleRule 속성 속성 속성 속성 속성설명속성설명속성설명속성설명 내내내내 용 용용 용 추가상세정보 추가상세정보 추가상세정보 추가상세정보 적용 예 적용 예 적용 예 적용 예 DCMS XML DCMS XML DCMS XML DCMS XML 2 - 1 . article 최상위 태그 -없음

- (Value ) (front, body?, back?, floats-group?, (sub-article* | response*))

language #REQUIRED 언어코드가 불명확한 경우에 정보원의 특성을 보고 정보원별로 값 1. default 적용 위의 경우로도 파악이 불가능 하면 라는 2. und 값 입력 Unknown 코드체계를 준수 3. ISO 639-2 등 ="kor" ISO 639-2 언어코드 article-typ e #REQUIRED ="journal" 저널 ="proceedi ngs" 프로시딩 ="book" Book ="portal" Potal ="website" Web Site ="report" 연구보고서 ="trend" 동향분석 ="dissertati on" 학위논문 ="standard" 산업표준 <article language="eng"> 2 - 1 - 1 . front 메타데이터 기술 태그 -없음

- (Value ) (journal-meta, article-meta, (notes)?) <article language="eng">

메타데이터

(50)

본문 <body> </body> 참고문헌 <back> </back> </article> 2-1-1-1 .journal-meta 저널 메타데이터 기술 태그 -없음

- (Value ) (journal-id+, journal-title-group*, issn+, isbn*, publisher?, notes?) <article language="eng"> 저널정보 <front><journal-meta> </journal-meta> </front> </article> 2-1-1-1 -1.journal -title-gro up 여러종류의 저널명 기술 태그 -없음

- (Value ) (journal-title*, journal-subtitle*, trans-title-group*, abbrev-journal-title*) content-ty pe #IMPLIED <journal-meta> <journal-title-group content-type = "proceedings"> </journal-meta> ="journal" 저널 ="proceedi ngs" 프로시딩 ="book" Book ="potal" Potal ="website Web Site 2-1-1-1 -1-1.jour nal-title 저널명 기술 태그 본서명 대등서명 표현 - ( , ) - (#PCDATA) language #REQUIRED 저 널 본 서 명 저널명이 없으면 오류데이터로 처리 임시 서지 구축시 : 245 00 $a

Ex) 245 00 $aBiology and Fertility of Soils 등 ="kor" ISO 639-2 언어코드 content-ty pe #IMPLIED ="alt" 대등서명 <journal-meta> <journal-title-group content-type="proceedings"> <journal-title language="kor"> 저널본서명 <journal-title language="eng" content-type="alt"> 저널대등서명 </journal-meta> 2-1-1-1 - 저널명 기술 태그 기타서명 표현( )

(51)

-1-2.jour nal-subtit le - (#PCDATA) language #REQUIRED 저 널 기 타 서 명 임시서지구축시: 245 00 $b 다음에 블랭크콜론블랭크 를 앞세워 $a ( : ) 저장한다.

Ex) 245 00 $aBiology and Fertility of Soils : $bBiology 등 ="kor" ISO 639-2 언어코드 <journal-meta> <journal-title-group content-type="proceedings"> <journal-title language="kor"> 저널본서명 저널기타서명 <journal-subtitle> </journal-meta> 2-1-1-1 -1-3.abb rev-journ al-title 저널명 기술 태그 축약서명 표현 - ( ) - (#PCDATA) 저 널 축 약 서 명 임시서지구축시 : 210 00 $a Ex) 210 00 $aBiol Fertil Soils <journal-meta> <journal-title-group content-type="proceedings"> 저널본서명 <journal-title language="kor"> 저널축약서명 <abbrev-journal-title> </journal-meta> 2-1-1-1 -2.issn 기술 태그 - ISSN - (#PCDATA) pub-type #IMPLIED I S S N 이 없는 경우에 를 값으

pub-type paper default

로 적용 임시서지구축시 : 022 bb $a 의 경우 ( pub-type="paper" ) 임시서지구축시 : 022 b2 $a 의 경우 ( pub-type="electronic" ) Ex) 022 bb $a0178-2762 / 022 b2 $a1432-0789 ="paper" 인쇄 ="electroni c" 전자 ="cd" CD <journal-meta> <issn pub-type="paper"> 1111-2222</issn> <issn pub-type="electronic">

수치

그림 메타데이터 표준들의 상호운용성 및 정밀도[1-7]
그림 아키텍쳐
그림 특징[1-12] Sturts2

참조

관련 문서

끝난 후에 하는 경우가 있다 코발트에 의한 것과 제 산화철을 혼합하여 만든 철회 등이

z 에너지, 통신, 데이터 정보 영역으로 구분된 상호운용성 참조 모델 정의 z 주요 응용 애플리케이션에 대한 상호운용성 참조모델

반면에 화학적 에너지 저장 방법은 현재 널리 적용되고 있는 리튬이온 전지 와 더불어 나트륨 유황 전지, 슈퍼커패시터 전지 등이 있으며 물리적 에너지에 비해

공법에 따라 건물의 열손실 및 결로의 가능성 등이 달라지므로 실의 용도와 재료에 따른 적절한 선택이 필요하다.. 단열이 잘 되지 않는 경우 생길 수 있는

§ 초기에 DC는 DC 메타데이터 기술 셋을 장서 수준 기술로 구성하는 방법 을 구체화하기 위해 장서에 초점을 맞추고 메타데이터 속성을 제안하였 다. § 이후에 DC는 장서와

폐기허증 面色㿠白 폐기쇠절증 面色㿠白 신기허증 面色㿠白 신기불고증 面色㿠白.

○ 해당 엔터티가 수퍼-서브타입 관계에 있는 서브타입 엔터티인 경우에 한하여 상위에 존재하는 수퍼타입 엔터티의 이름을 기재. ※

국가공간정보체계 구축 범용통계조사시스쳄 구축 디지털행정협업체계 구축 외교정보통합관리체계 구축 온라인 국민소통시스템 구축 차세대 전자인사관리