• 검색 결과가 없습니다.

검색 방법이다. 이는 데이터간의 구조를 이용하여 종속적 관계 및 수평적 관 계를 계층 구조를 통해 해당 데이터를 유추할 수 있는 장점이 있다.

(3) ID 값에 의한 데이터 검색

해당 데이터의 엘리먼트 ID에 의한 검색방법이다. 이는 엘리먼트 단 위의 순차적인 ID 값을 이용하여, 해당 데이터의 엘리먼트 위치를 검색할 수 있다.

Fig. 12 Schema document

Fig. 13 Instance document in group A

(1) 기존 시스템

Table 8. Result storage in existing system

데이터 (A) 데이터 (B)

스키마 인스턴스 스키마 인스턴스

저장공간 21 Rec 20 Rec 24 Rec 800 Rec

저장시간 0.923 Sec 0.922 Sec 0.923 Sec 1.682 Sec

(2) 제안 시스템

Table 9. Result storage in proposed system

데이터 (A) 데이터 (B)

스키마 인스턴스 스키마 인스턴스

저장공간 14 Rec 20 Rec 15 Rec 781 Rec

저장시간 0.906 Sec 0.922 Sec 0.907 Sec 1.641 Sec

위에서 나타낸 바와 같이, 일정 데이터의 저장 공간과 저장에 따른 시간 을 비교해 보면, 저장 공간에서 특히 스키마에 효율적으로 동작함을 알 수 있다. 이는 중복 정의되는 스키마의 정의형식을 Eltype 필드를 이용해 데이터 를 축약시켜 저장하였기 때문이다. 실제 다양하고 복잡한 형태의 스키마 구 조를 가진 실 전자상거래의 문서들은 제안 시스템에 의해 저장 공간이 많이 줄어들 것이다. 인스턴스상의 저장 공간에 큰 차이가 없는 것은, 인스턴스의 모든 데이터가 정보로 활용되고 있기 때문이다. 그리고, 저장 시간은 XML 문서가 나뉘어진 상태로 DB Schema에 저장되는 시간을 측정한 것이므로, 저 장 시간의 차이는 나뉘어진 데이터양에 의한 차이에 따라 차이가 나타나는 것이며, 일반적으로 ODBC를 이용한 RDB 접근 시간이 저장 시간에 약 0.5 초 정도 유지되는 것으로 검증되었다. Fig. 14는 스키마와 인스턴스 데이터 에 따른 저장 공간의 차이를 그래프로 나타내고 있다.

Fig. 14 데이터에 따른 저장 공간

2) 검색에 따른 시간 측정

Table 10. Searching conditional

검 색 유 형 검 색 조 건

컨텐츠 값에 의한 검색 1) 김* or 홍*

2) 홍길동

계층 정보에 의한 검색 1) 2/0/4

ID에 의한 검색 1) 9*

2) 9

검색에 따른 시간 측정은 데이터 (A)와 데이터 (B)에 각각 Table 9와 같은 검색 유형과 검색 조건을 가지고 측정하였다. 검색 조건에 따른 측정을 10회 반복하여 나온 결과수치에 대한 평균을 기존 시스템과 제안 시스템에 따라 알아보았다.

(1) 기존 시스템

기존 시스템에서는 XML 스키마와 인스턴스간의 계층 구조가 서로 상이하 여 계층 정보에 의한 검색을 지원하지 않았다. 검색에 의한 산출 시간은 데

이터 컨텐츠에 의한 검색 시간보다 ID 검색에 따른 검색 시간이 상대적으로 빠른 결과를 나타내었으며, 이러한 결과는 이미 정렬 되어진 ID 값을 이용한 탐색시간의 차이에 따른 것이라 할 수 있다. Table 11은 기존 시스템에서의 검색 결과를 나타낸다.

Table 11. Result search in existing system

검색 유형 데이터 (A) 데이터 (B)

컨텐츠 검색 0.104 Sec 0.127 Sec

0.098 Sec 0.119 Sec

계층정보 검색 -

-ID 검색 0.084 Sec 0.085 Sec

0.092 Sec 0.098 Sec

(2) 제안 시스템

제안 시스템에서의 Table 10의 검색 유형을 참고로 질의를 처리한 결과 Table 12과 같은 결과를 얻을 수 있었다. 기존 시스템에서와 마찬가지로 컨 텐츠 검색 보다 ID검색의 유형에서 검색시간이 빠르게 나타남을 확인할 수 있으며, 기존 시스템보다 모든 검색유형에서 조금 향상된 결과를 나타내었 다. 이러한 결과는 인스턴스 저장 공간의 감소로 인한 레코드 대비 탐색시간 의 축소, 그리고 여러 테이블에 걸친 조인 연산이 아닌 하나의 독립 테이블 에서의 질의 처리로 인한 조인 연산의 감소에 의한 것이라 할 수 있다.

Table 12. Result search in proposed system

검색 유형 데이터 (A) 데이터 (B)

컨텐츠 검색 0.102 Sec 0.116 Sec

0.095 Sec 0.109 Sec

계층정보 검색 0.086 Sec 0.088 Sec

ID 검색 0.084 Sec 0.084 Sec

0.091 Sec 0.096 Sec

Fig. 15은 검색 유형에 따른 그래프를 나타내고 있다.

여기서 데이터 A, B 라고 하는 것은 검증 데이터 A와 B를 의미하며, 1, 2라고 하는 것은 Table 10에서 검색유형에 따른 검색 조건 1)과 2) 를 나타 낸다.

Fig. 15 검색 유형에 따른 검색 시간

3) 측정 결과에 따른 평가

데이터 (A)와 데이터 (B)에 따른 RDB 저장 공간 및 검색 시간에 대한 효율을 나타내면 Fig. 16와 Fig. 17와 같다.

Fig. 16 데이터에 따른 저장 공간 효율

Fig. 16에서 보듯이, 데이터 저장 공간에 대한 효율은 기존시스템을 100%의 효율이라고 가정했을 때, 스키마에 대한 데이터(A) 는 50 %, 데이 터 (B)는 60%에 가까운 감소를 나타내었다. 이는 스키마 구조가 복잡 할수 록 저장 효율이 좋아짐을 나타낸다. 그러나 인스턴스에 대해서는 기존시스템 과 제안시스템간의 차이가 거의 나타내지 않는다.

Fig. 17 검색 유형에 따른 검색 효율

Fig. 17에서 보듯이, 데이터 검색유형에 따른 검색 효율은 기존 시스 템을 100%의 효율로 가정했을 때, 모든 검색 유형에 대해, 기존 시스템 보다 나은 효율을 보였으며, 데이터 (A) 보다 데이터 (B)가 효율이 더 좋은 것은 데이터의 양이 증가 할수록 검색 시간 효율이 낫다는 것을 나 타낸다. 이것은 기존 시스템에 비해 데이터의 양이 줄고, 여러 테이블에 서의 조인 검색 시간 감소에 따른 제안 시스템의 효율 증가를 나타낸다.

또한, 데이터의 계층정보를 알고 있는 경우는, 일반적으로 데이터의 양에 관계없이 거의 비슷한 검색 속도를 가져옴으로써, 계층정보를 활용한 데이터 검색의 효율성도 기존 시스템의 검색방법들과는 대비되는 새로운 검색방법으 로 활용이 가능하다.

Ⅴ. 결론 및 향후 연구

XML 문서를 관계형 데이터베이스에 저장하기 위한 기존 모델링 방법은 XML 정의형식인 DTD와 인스턴스를 분리 저장하였고, 또한, 가상 또는 분할 저장방식 기반위에 데이터베이스 스키마는 여러 구조로 연구되어 왔다.

이러한 저장방법은 DTD를 따르는 인스턴스의 엘리먼트를 기준으로 ID를 부여하여 데이터베이스 스키마에 저장함으로써, 엘리먼트 정의형식에 따른 중복저장 비율의 증가로 인한 구조정보의 오버헤드가 높아지게 되었고, XML 정의형식과 인스턴스간의 계층정보가 불일치되어 검색 시 질의 처리를 어렵 게 했다.

그러나, 본 연구에서는 ETID 모델을 이용하여 XML 기반의 계층적 RDB 스키마 모델을 제안하여, 기존의 스키마 모델 적용에 따른 상이한 계층정보 를 동일화하고, 기존의 분리 저장방식을 통합할 수 있도록 관계형 데이터베 이스 스키마를 개선하고, XML 정의형식으로 DTD의 제한사항을 극복한 XML 스키마를 적용한 저장 시스템을 제안 및 구현하였다. 그 결과 제안 시 스템에서는 ETID 모델을 이용하여 해당 엘리먼트 정보의 위치를 계층적으로 표현하고, 기존 관계형 데이터베이스 스키마 구조의 개선을 통해 XML 스키 마와 인스턴스간 동일한 계층정보를 유지하게 되었으며, 저장 공간 활용 및 비율에 따른 효율성이 높아졌고, 계층구조 상이에 따른 손상을 최소한으로 유지하게 되어 별도의 연산시간 없이 문서간의 검색질의가 수월하게 되었다.

그러나, 관계형 데이터베이스 내에 저장되어 있는 XML 문서에 대한 데이터 에 대한 갱신이 발생하였을 때, 제안 시스템 내에서의 갱신처리가 불가능하 다.

향후 연구 과제로는 이미 저장되어 있는 관계형 데이터베이스 내의 데이터 갱신에 따른 처리에 대한 연구가 필요하다.

[참고문헌]

[1] Tim Bray, Jean Paoli et.al (ed.). Extensible Markup Language(XML) 1.0(Third Edition), World Wide Web Consortium(W3C), 2004.

(http://www.w3c.org/TR/2004/REC-xml-20040204)

[2] 연제원, 조정수, 이강찬, 이규철, “XML 문서 구조검색을 위한 저장 시스 템 설계”,『한국정보과학회 학술 발표논문집(B)』, 제26권 제1호, 1999, pp.3-5.

[3] D.W.Shin, “BUS:An Effective Indexing and Retrieval Schema in Structured Documents”, in Proc. Digitial Libraries, 1998.

[4] Brian Lowe, Justin Zobel, Ron Sacks-Davis, “A Formal model for Databases of Structured Text”, Proceedings of the Fourth International Conference on Database Systems for Advanced Applications(DASFAA

‘95), 1995, pp.449-456.

[5] Toung Dao, “An Indexing Model for Structured Document to Support Querues on Content, Structured and Attributes”, Proceedings of ADL

‘98, 1998, pp.88-97.

[6] 박종관 외, “XML 문서의 효율적인 구조 검색을 위한 색인 모델”, 『한국 정보과학회 논문지』, 제 8-D권, 2001, pp451-460.

[7] 홍석건 외 2명, “검색과 저장의 효율성을 위한 정적 테이블 기반의 XML 저장구조 설계”, 『 한국정보과학회 학술발표논문집(B)』, 제30권 2호, 2003, pp205-207.

[8] Daniela Florescu and Donald Kossmann, “Storing and Querying XML Data using an RDBMS”, IEEE Data Engineering Bulletin, 22(3), PP 27-34, 1999

[9] E. Damiani, S. Vimercati, S. Paraboachk and p.Samarati, “XML Access Control System: A Component-Based Approach”, In Proc. IFIP WG11.3 Working Conference on Database security, The Netherlands, 2000.8

[10] 정태선 외 3명 “XML 데이터를 위한 객체지향 데이터베이스 스키마 및 질의 처리”, 한국정보과학회 논문지 : 데이터베이스, 29(2), 2002

[11]

J. Shanmugasundaram, H. Gang, K. Tufte, C. Zhang, D. DeWitt and J. Naughton, “Relational databases for Querying XML Documents : Limitations and Opportunities” , 25th VLDB Conference, Edinburgh, Scotland, 1999

[12] S-Y. Chien, V.J Tsotras, and C. Zaniolo, “Version Management of XML Documents”, WebDB 2000 Workshop, Dallas. TX, 2000

[13]

Albrecht Schmidt, Florian Waas, Martin Kersten, Michael J.Carey, Ioana Manolescu and Ralph Busse, “Xmark : A Benchmark for XML Data Management”, Proc. VLDB, Hong Kong, China, 2002

[14] 민영수 외 5명, “XML 문서를 위한 구조정보 추출기의 설계 및 구현”, 한국정보과학회, ‘99 가을 학술발표논문집(Ⅰ), pp, 81-83, 1999

[15] A. Gabillon and E.Bruno, “Regulation Access to XML Documents”, In Proc. IFIP WG11.3 Working Conference on Database Security, 2001

감사의 글

정신없이 지내온 2년이라는 대학원 생활, 길지도 짧지도 않은 그 시간 이 었지만, 무엇보다도 제겐 소중한 시간들이었던 것 같습니다.

항상 부족한 것이 많은 저에게 보살핌과 가르침을 주셨던 지도교수님이신 곽호영 교수님이 계셨기에 무사히 졸업을 할 수 있게 되었습니다. 그래서, 지도교수님께 감사의 말씀을 다시 한번 올리지 않을 수 없었습니다.

교수님 감사드립니다.

그리고 이 논문을 위해 심사위원으로 많은 심사와 지도를 위한 열정을 아 끼지 않으셨던, 안기중 교수님, 김도현 교수님께도 감사의 말씀을 드립니다.

또한, 김장형 교수님, 변상용 교수님, 이상준 교수님, 송왕철 교수님 그리고 변영철 교수님께도 보다 학술적인 접근을 바라는 말씀과 충고를 아끼지 않아 주셨음에 감사드립니다.

이 논문을 완성하기까지 수많은 분들로부터 도움을 많이 받았습니다. 우 선, 같은 연구실에서 함께 공부하며, 생활한 이들이 있었기에 정말 소중한 열정을 쏟아낼 수 있었던 것 같습니다. 언제나 부족한 부분을 채워주고, 따 끔한 충고도 서슴치 않았던 정희 선배와 경복 선배, 또한 많은 시간을 같이 하며, 조언을 하여 줬던 인석 선배, 석건. 더 나은 미래를 위해 고민하던 봉 남. 그리고, 성철 형님과 혁준 선배에게도 이 지면을 빌어 감사의 마음을 전 하고자 합니다.

그리고, 연구실은 다르지만 옆에서 힘이 되어준, 송재경, 윤현주, 양동호, 변태보, 허지완 선배, 경진, 정윤, 그리고, 이정하, 정은경 조교 선생님, 제

관련 문서