• 검색 결과가 없습니다.

7.3 RDF 7.4 온톨로지 7.5 시맨틱 웹

N/A
N/A
Protected

Academic year: 2022

Share "7.3 RDF 7.4 온톨로지 7.5 시맨틱 웹 "

Copied!
97
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

2013. 08. 08

가천대학교 IT대학 컴퓨터 미디어 융합학과

Information Retrieval

제7장 시맨틱 웹

(2)

7.1 웹의 진화 7.2 XML

7.3 RDF 7.4 온톨로지 7.5 시맨틱 웹

익힘 문제

(3)

3

Why Semantic Web?

Semantic is power of knowledge.

의미를 아는 것이 진정한 힘이다.

세상은 넓고 웹 사이트는 많은데 자료의 의미를 알지 못하면,, 알고 싶은 것은 많으나 정보가 웹 사이트에 흩어져 있어서,,, 같은 자료도 사용할 때마다 다른 의미를 알아야,,,

지식검색이 목표

(4)

4

7.1 웹의 진화

초기의 웹

팀 버너스 리:

Client/Server 시스템에 HTML을 결합한 수준.

물리적 통신망 위에 논리적 HTTP를 설치하여 논리 공간 연 결.

 이질적 환경을 극복 Semantic Web

- 컴퓨터가 정보자원의 뜻을 이해하고, 논리적 추론까지 할 수 있는 차세대 지능형 웹.

- 분산 환경에서 자원에 대한 정보와 자원 사이의 관계-의미 정보를 기계가 온톨로지 형태로 표현하고 처리할 수 있는

(5)

5

7.1 개요

Web 의 비교

구 분 웹 1.0 웹 2.0 웹 3.0

시기(년) 1994-2004 2000-2010 2010-2020 상호작용 read only read & write read, write & execute 키워드 공유 공유, 참여, 개방 상황인식(context)

이용자 인간 인간 인간, 기계

이용형태 일방적 공급 이용자가 생산, 소비 웹이 원하는 콘텐츠 제공

검색 게시판 수준 여러 사이트에 개방 이용자 맞춤형 검색

기반 기술 서버관리 브로드 밴드, 서버관리 시맨틱 기술, 상황인식

대응 단말 PC PC와 모바일 일부 PC, 모바일, 시계 등

(6)

6

7.1 개요

World Wide Web

Client/Server + HTML + HTTP

: 단순성, 편리성  보급 by Tim Berbers-Lee

문제점

단어 빈도수와 어휘 정보로 검색  비관련 문서

이유: HTML은 보기용  내용과 의미 표현 곤란  에이전트 이용 곤란

Semantic Web

- 정보에 잘 정의된 의미를 부여  사람과 기계의 협동 가능 (Tim)

(7)

7

7.1.1 웰드 와이드 웹의 진화

(1) Web 1.0

웹 의 기원: 하이퍼 텍스트( 테드 넬슨이 1965년에 발표)

하이퍼텍스트 기능의 현실화: 더글러스 잉글버트의 마우스 1989년. 팀 버너스 리 WWW 발표.

특 징

- 온라인 게시판 - 텍스트와 링크 - 정적 웹 페이지

(8)

7.1.1 웰드 와이드 웹의 진화

(2) Web 2.0

2004년 O’Reilly Media사의 주장

자료의 소유자나 독점자 없이 쉽게 자료를 생산하고 공유하 기 위한 환경

특 징

- 프랫폼의 웹

플랫폼으로부터 독립: hw, sw로부터 구글: 서비스만 제공

- 집단지능의 웹

위키피디아, 유투브

(9)

9

7.1.1 웰드 와이드 웹의 진화

(3) Web 3.0

2006년 John Marfoff(Yew York Times 기자) 주창

지능화된 웹 - 시맨틱 기술, 맞춤형 컨텐츠와 서비스 시맨틱 웹: 기술이 정보를 이해하는 기술

웹 3.0: 기술적 관점 + 시장적 관점

특 징

- 연결된 자료의 웹:

생산자, 유통업자, 소비자들이 모두 연결되어야

- 시맨틱 웹

- 시맨틱 웹과 웹 2.0의 결합

(10)

7.1.1 웰드 와이드 웹의 진화

(3) Web 3.0

팀 버너스 리와 핸들러의 웹 3.0

웹 3.0

웹 2.0

시맨틱 웹 (RDFS, OWL)

연결된 자료

(RDF, SPARQL)

(11)

11

7.1 개요

World Wide Web

사람의 눈으로 이해하는 웹.

눈으로 수많은 사이트의 자료를 종합해야,,  불가 기계가 자료를 읽고 이해해야

Semantic Web

Def.

- 기계가 정보를 읽고 의미를 이해하고 새로운 정보를 만드 는 웹.

- 사용자 질의와 웹이 저장하고 있는 자원을 이해하고, 두 개를 연결하여 적합한 결과를 제공할 수 있는 웹 - 기계가 정보의 의미를 이해하는 웹

 생각하는 웹

이해: 웹에서 새 정보 발견 시 기존의 정보와 관련시킬 수 있

어야

(12)

7.1 개요

Semantic Web의 기능과 목표

기 능

- 조직과 어플리케이션에 걸친 데이터 상호 운영 – 지식 교환을 위한 상호 운영 표준 체계

– 공동체와 어휘의 상호 연결 아키텍처

목 표

1) 검색 시에 정확한 결과

2) 이질형 자료와 통합 및 비교

3) 모든 자료에 의미와 기술 정보 연관 4) 웹 서비스의 자동화

(13)

13

7.1 개요

실례 1

키워드기반 질의

키워드: 문서의 내용이나 제목을 요약한 핵심적인 단어.

차량 정비: 자동차 수리? 테이블: 가구? 자료?

재규어: 짐승? 자동차?

단어의 의미를 명확히 하기 위해 문서들을 분석하고, 개념을 정리 문맥에 따라 결정  개념기반 질의

개념기반 질의의 장점:

개념이 있으면, 다른 언어로도 질의 가능

계층 구조화: 내포와 외연으로 범위 축소 및 확장

(14)

7.1 개요

실례 2

외국 행사에 참여하려고 호텔을 예약하려 한다.

대 책

행사장: 행사 사이트에, 호텔: 호텔 사이트에 - 행사장에서 가까운 A급 호텔과의 거리는?

- 호텔에서의 교통 수단은? 시간과 가격은?

실례 4

환자의 진료 기록과 응급치료

(15)

15

7.1 개요

실례 3:

기존의 휴가 계획

관광지 선정 후 호텔 예약, 교통 예약

신 휴가 계획

(휴가 일정 + 개인 기호)를 입력하면, 자료의 의미를 파악하고,

웹 상의 정보를 해독하여 일정을 제시하고, 선정하면 예약

전제

관광 정보, 숙박 정보, 비행기 및 운송 정보  분산화

(16)

7.2 XML

기존 웹의 문제점

HTML의 스키마 부재 구조화된 자료 표현 곤란

 프로그램이 HTML 문서를 이해하기 곤란.

 문서 내부의 자료 구조 표현 곤란  일반 응용 곤란

ex. Display는 가능하나 저자의 이름과 성을 구분하기 곤란  복잡한 문서 교환에 부적합.

실례: 전자상거래 사이트. 주로 DB 작업  동적 페이지 대두

(17)

HTML

Semantic Web

XML

RDF

Ontology

구조 문제 해결

의미 문제 해결

개념 문제 해결

17

7.1 개요

문제점과 대책

HTML: 프로그램이 이해 곤란

자료구조 표현: 내부 구조 표현 곤란 복잡한 문서: 교환 곤란

(18)

7.2 XML

Def.

웹 상에서 구조화된 문서를 구현할 수 있는 표식 언어.

1996년 W3C: HTML의 한계 극복을 위해 제안.

특징

검색 용이, 체계적이고 일관적인 접근, 재가공 용이.

문서의 구조적인 정보만 기억  간단하게 조작하기 곤란.

용도

현재 B2B의 문서 양식으로 사용.

소규모 DB를 대체.

(19)

19

7.2 XML

정 의

- 웹에서 문서를 구조화하고 전송할 수 있는 표식 언어.

- HTML의 문서 표현과 DBMS의 스키마 기능을 통합한 도구.

기 능

어떤 문서도 태그를 이용하여 조직 가능.

HTML 문서와 DB 스키마 사이를 연결.

XML의 특징:

1) Tag로 자료에 대한 구조 제공: DB화 가능, self-documenting 2) 구조와 내용의 분리: 효율적 검색, 중첩 구조 허용

3) 정확한 내용 전달: 정보교환 및 자료공유 용이, 4) 문서 작성 간편

5) 사용자 Tag: 무제한 정의, 비 고정적 형식

(20)

7.2 XML

HTML과 XML 비교

구 분 HTML XML

태 그 고정식, 제한

적 사용자 정의  의미 부여 정보 표현 단순 표현 정보의 내부 구조 표현 Database 연계 속성 구분 곤

속성 별로 저장, 교환과 공유 가 능

검색 효율 비효율적 구조와 내용을 분리  효율적 장 점 쉽고 간결 복잡한 문서 작성 편리

(21)

21

7.2 XML

XML의 목표:

1) SGML과 호환,,

2) XML 프로세서를 작성하기 쉬워야,,

3) 설계가 용이해야: 형식적이고 정교해야,, XML의 구조:

1) HTML과 비슷하게 보여야

2) 엘리먼트라 불리는 사용자-정의 태그의 계층구조 3) 자료: 엘리먼트로 기술,

엘리먼트: 속성으로 기술

(22)

7.2 XML

HTML과 XML 문서

<HTML>

<HEAD></HEAD>

<BODY>

<font size=3> 과학

<p> 정보검색 </p>

<p> 도서출판 그린</p>

<p> 2009년 4월</p>

</font>

</BODY>

</HTML>

<?xml version="1.0" encoding="euc-kr" ?>

<과학>

<제목>정보검색</제목>

<출판사>도서출판 그린</출판사>

<출판일자>2009년 4월 9일</출판일자>

</과학>

(23)

23

7.2 XML 실례

<HTML>

<HEAD></HEAD>

<BODY>

<font size=3> 제품정보 <p> 배 </p>

<p>나주시 </p>

<p> 1 </p>

<p> 56000 </p>

</font>

</BODY>

</HTML>

<?xml version=“1.0” encoding=“utf-8 ? >

<제품정보>

<과일> 배 </과일>

<생산지역> 나주시 </생산지역>

<수량> 1 </수량>

<가격> 56000 </가격>

</제품정보>

HTML: 디스플레이용 언어 * XML: 표준화 작업과 자료보관용 언어

(24)

7.2 XML 문서 구조

XML 문서 = Prolog + Body

Prolog: XML 문서에 대한 정보를 기술 PI, DTD, XML 스키마 등으로 구성

Body: 문서 기술 부분. 여러 요소element들로 구성

XML 문서의 구성요소

- PI Processing Instruction - comment

- element - attribute

(25)

25

7.2 XML

XML 문서의 구성요소

<?xml verion=”1.0" encoding=”euc-kr” ?>

<!-- BODY (This is Comment) -- >

<제품정보>

<과일 종류=”배”>

<생산지역> 나주시 </생산지역>

<수량> 1 </수량>

<가격> 56000 </가격>

</과일>

</제품정보>

Prolog: PI

element

attribute comment Root element

(26)

7.2.2 XML 문서구조: DTD

DTD : Document Type Definition

SGML, XML 표식 언어에서 문서 형식을 정의하는 양식

<!ELEMENT 책(저자, TITLE)>

<!ELEMENT 저자(#PCDATA)>

<!ELEMENT 제목(#PCDATA)>

<!ATTLIST 책 GENERE (과학|소설) #Required>

(a) DTD 실례

<책 GENERE='소설'>

<저자>허균</저자>

<제목>홍길동</제목>

(b) DTD에 의한 XML 문서

(27)

27

7.2 XML 문서 구조: XML Schema

XML Schema DTD의 한계

- DTD는 구현이 어렵다.

- DTD는 제한된 자료형만 제공된다.

- DTD는 재사용성과 확장성이 불가능하다.

스키마 문서의 물리적 구성

schema, element, attribute와 주석문 기본 형식

<xs:schema xmlns:xs=“http://www.w3.org/2002/XMLSchema”>

</xs:schema>

(28)

7.2 XML 문서 구조: XML Schema

XML Schema

Def.

XML 문서가 표시되는 방식을 정의하는 도구.

DTD와 함께 XML 문서의 구조를 정의하는 표준

특징: 별도의 구문분석기가 필요 없고, 다양한 자료형을 제 공.

필요성: DTD는 구문분석기 필요, 다양한 자료형 요구

<xs:schema

xmlns:xs=“http://www.w3.org/2002/XMLSchema”>

targetnamespace=http://www.gachon.ac.kr elementFormDefault=“qualified”

attributreFormDefault=“unqualified”>

</xs:schema>

(29)

29

7.2 XML 문서 구조: XML Schema

XML Schema 실례

<complexType name="강사">

<sequence>

<element name="성"type="string" minOccurs="1"/>

<element name="이름"type="string" minOccurs="1"/>

</sequence>

<attribute name="제목“type="string use="optional"/>

</complexType>

(30)

30

7.2 XML NameSpace

동일한 이름 충돌방지 기술  접두사

기본 형식: <prefix:ElementName xmlns:prefix=URL>

<?xml version=“1.0” encoding=“euc-kr”?>

<Cus:User xmlns:Cus=“http://www.pop.com/buy/Cus”

xmlns:Order=“http://www.tech.net/2002”>

<Cus:ID> working-girl</Cus:ID>

<Cus:Name>소유춘</Cus:Name>

<Cus:Goods>

<Order:Good>

<Order:ID>2008-098</Order:ID>

<Order:Name>NoteBook</Order:Name>

</Order:Good>

</Cus:Goods>

</Cus:User>

(31)

31

7.2 XML : XSL

XML 문서: 자료를 저장하는 구조적인 문서.

XSL

XML 문서를 표현하기 위한 스타일을 정의하는 언어.

XML의 특징:

문서의 구조를 나타내는 부분과 표현하는 부분을 분리.

문서 구조를 변경하지 않고 표현만 달리할 수 있음.

(32)

7.2 XML : XSL

XML 문서의 표현

XML은 문서의 구조를 기술하는 방법과 표현하는 방법이 다 르다.

XML 문서는 HTML로 변환되어야 표현된다.

.

XML 문서

XSL 문서

HTML

문서 Display XSL

프로세서 (msxml)

(33)

33

7.2 XML : XSL

XML 문서: 자료를 저장하는 구조적인 문서.

XSL

XML 문서를 표현하기 위한 스타일을 정의하는 언어.

XSLT: Transformation. XML 문서를 다른 문서로 변환하는

방법을 정의

XSL-FO : Formatting Object. XSLT 결과로 나온 문서를 다양한

형식으로 바꾸는 처리(문서 표현을 정의)

XSL

XSLT XSL-FO

(34)

7.2 XML : XSL

XSL 문서의 문법

XML 문서를 표현하기 위한 스타일을 정의하는 언어.

xsl:stylesheet: xml 문서가 스타일시트임을 알려주는 XSL의 루트.

xsl:template: 변환 규칙 정의

xsl:apply-template: xsl:template에서 지정한 자식 노드 중에서 특정 노드가 선택되도록 하기 위해서 기술한다.

(35)

35

7.2 XML : XSL

XSL 문서

xsl:stylesheet: xml 문서가 스타일시트임을 알려주는 XSL의 루트.

xsl:template: 어느 부분을 어떻게 변환할 것인지를 결정.

xsl:apply-template: xsl:template에서 지정한 자식 노드 중에서 특

정 노드가 선택되도록 하기 위해서 기술.

<xsl:stylesheet xmlns:xsl=http://www.w3.org/1999/xsl/Transform version=“1.0”>

< xsl:template match=“패턴”> // 변환 규칙 정의 변환할 내용

< /xsl:template>

(36)

36

7.2 XML : XSL

XSL의 예제

c:\XML\test.xsl

---

<?xml version="1.0" encoding="euc-kr" ?>

<xsl:stylesheet xmlns:xsl=“http://www.w3.org/1999/XSL/Transform"

version="1.0">

<xsl:template match="/제품/자동차">

<h3> * 자동차 목록 * </h3>

<xsl: apply-templates select="모델명"/>

</xsl:template>

< xsl:template match="모델명">

<h5> 모델명 : <xsl:value-of select="."/> </h5>

</xsl:template>

</xsl:stylesheet>

(37)

37

7.2 XML : XSL

XSL의 예제

c:\XML\test.xml

---

<?xml version="1.0" encoding="euc-kr" ?>

<?xml:stylesheet type="text/xsl“ href="test.xsl”?> // XSL 문서 적용을 위함

<제품>

<자동차>

<모델명>그랜저 TG</모델명>

</자동차>

<자동차>

<모델명>NF 소나타</모델명>

</자동차>

</제품>

(38)

7.2 XML : XSL

XSL을 실행한 결과

---

* 자동차 목록

모델명 : 그랜저 TG

* 자동차 목록

모델명 : NF 소나타

(39)

39

7.2 XML

XML의 단점 for Semantic web

구조 표현, 그러나 의미 파악 곤란

- 태그 이름은 다르나 내용이 같을 경우 - 이름은 같으나 내용은 상이

상호 운영성: 두 태그 이름이 같은 의미를 가진다는 표현 <heading> , <subject>

- 같은 내용을 구조가 다르게 표현한 경우

ex. <date>12/11/2009</date>

<day>12</day>

<month>11</month>

<year>2009</year>

(40)

40

7.3 RDF resource description framework

RDF의 필요성

XML은 자료를 구조화할 수 있으나

자료의 의미를 전달하지 못함  의미 문제점 해결

RDF는 리소스, 특성, 서술문 구조로 구성되므로 같은 내용에 대해서 같은 해석이 가능하다.

단, 태그 이름의 중첩성과 모호성은 여전히 존재

대 책:

 온톨로지, RDF schema :

온톨로지가 보다 일반적이고 확장된 개념

(41)

41

7.3 RDF

Resource Description Framework XML의 문제점

<party name="활빈당“>

<chairman>홍길동</chairman>

</party>

(a) XML 1

<chairman>홍길동</chairman>

<party name="활빈당“>

</chairman>

(b) XML 2

XML의 두 가지 애매한 표현

둘 중에서 어느 것이 더 정확한 표현인가?

(42)

42

7.3 RDF resource description framework 정의:

-정보의 특성과 값을 명세하여 정보 간의 관계를 기술하는 도구.

-특정 자원의 메타데이터를 기술하는 XML 기반의 framework.

-웹 자원에 관한 메타 정보를 표현하기 위한 언어.

웹 문서에 관한 메타 자료를 XML을 기반으로 간단하게 표현.

선언적 문장 <S,P,O>들의 모음. <S,P,O> 은 정보의 기본 단위.

용도

- 정보 검색, - 문서 분류

(43)

43

7.3 RDF Data Model

Def.

- 메타자료의 일관적인 인코딩과 교환, 작성을 지원하는 표 현 모형.

- 자원을 (주체, 술어, 개체)의 3요소로 정의.

정보 자원 Resource

속성값 Value

속셩 유형 Property Type

저자

(a) RDF 자료 모형 a

값/객체

특성/술어 Http://www.google.co m/hanhwa/node.htm Http://www.kwu.ac.kr/c

omputer/database.xml

Http://www.naver.com/

chemical/main.htm (c) RDF 자료 모형의 실례 (b) RDF 자료 모형 b

구조/자원/주체

(44)

7.3 RDF 구조

RDF 자료 모델:

정보 자원의 특성과 값을 명세함으로써 자원 간의 상호 관계를 기술하는 모델.

구성 요소 내 역 실 례 1 일반 온톨로지

실 례 2 - 웹 온톨로지 - 자 원

Resource

주체

subject 데이터베이스 www.kwu.ac.kr/computer/database.xml 속 성

Property

술어

predicate 저자 dblab.kyungwon.ac.kr/1.2/author 속성 값

value

객체

object 홍길동 dblab.org/cs/professor/58603 * Hong, kil-dong

(45)

45

7.3 RDF Data Model

RDF: 자원을 (주체, 술어, 개체)의 3요소로 정의 - 아버지가 방에 들어가신다.

- 박태환의 나이는 21세다.

- 한국의 수도는 서울이다.

아버지

가방

들어가신다

박태환

나이

21

한국

수도

서울

(46)

7.3 RDF Data Model

RDF 문장의 실례

<rdf: RDF>

<rdf:Description about="http://www.ksii.or.kr/paper">

<s:Publisher> Korean Society of Internet Information</s:Publisher>

<s:Title> Internet Information thesis</s:Title>

<s:Date>2011-10-01</s:Date>

</rdf:Description>

</rdf:RDF>

(47)

47

7.3 RDF

RDF

웹 상의 자원을 XML 형식으로 메타데이터를 표현.

객체지향방식으로 지식을 표현

객체-속성-값의 구조를 갖지만 객체 중심이 아니라 속성 중 심.

RDF schema:

특정한 메타자료에서 정의하고 있는 어휘들을 선언하기 위 해 사용.

정보자원의 특성과 다른 자원과의 관계 정의.

* RDF는 기존 meta-data에 대한 정보만 표현하기 때문.

자원 성 정의 자원간 관계 정의 기능이 없다

(48)

48

7.3 RDF

Structure

– Resource (subject) : http://www.bookstore.org/id2009 – Property (predicate) : http://www.schema.org/#Author – Value (object) : "Taehee Kim”

<rdf:RDF>

<rdf:Description

about=“http://www.bookstore.org/id2009”>

<s:Author> Taehee Kim </s:Author>

</rdf:Description>

</rdf:RDF>

s:Author http://www.

bookstore.org/id2009 Taehee Kim

(49)

49

7.3 RDF

RDF 예제 1

<rdf: RDF>

<rdf:Description about=“http://www.w3c.org”>

<s:Publisher> World Wide Web Consortium</s:Publisher>

<s:Title> W3C Home Page</s:Title>

<s:Date>2009-10-01</s:Date>

</rdf:Description>

</rdf:RDF>

Serialization: RDF를 XML로 표현한 것.

(50)

7.3 RDF

RDF 예제 2

<?xml version=“1.0”?>

<rdf: RDF>

xmlns:rdf=“http://www.w3c.org/2009/10/01”>

xmlns:s=“http://description.org/schema/”>

<rdf:Description about=“http://www.w3c.org/Home/Lassila”>

<s:Creator> Ora Lassila</s:Creator>

</rdf:Description>

</rdf:RDF>

Ora Lassila is the Creator of the resource http://www.w3c.org/Home/Lassila

(51)

51

7.3.2 RDF Schema

사실 표현 : RDF Schema의 필요성

1) 홍길동이 인공지능을 강의한다.

2) 공학관이 안철수를 강의한다.

3) 인공지능이 안철수를 강의한다.

4) 공학관이 인공지능을 강의한다.

여러 가지 문장의 모순을 방지하는 방법은?

주어가 될 단어와 목적어가 될 단어의 구분

(52)

7.3.2 RDF Schema

RDF Schema

1) 자원의 클래스를 지정하는 도구(어휘 정의 능력 지원) 2) 새로운 용어를 정의하는 도구.

3) 정보 자원의 특성 선언과

다른 자원과의 관계를 정의하는 도구

객체 주체

치역

정의역 관계

술어

RDF RDFS

(53)

53

7.3.2 RDF Schema

계층적 Class 관계도

RDF와 RDFS의 계층 구조

교직원

정직원

전임 비전임 임시직

교원 직원

강사 교수

교직원

전임 교원

보안 이철수

과목 강의하다

관계하다

subClassOf subClassOf

subClassOf type

type

type

range

domain

range subPropertyOf

range

강의하다

RDF RDFS 교수

(54)

54

7.3.3 RDF의 장단점

RDF의 장점

- XML: 여러 가지 표현 방법  애매

- 객체의 의미를 하나로만 표현하므로 명확.

- URI를 이용하여 웹 자원 표현에 적합 RDF의 단점

- XML의 모호함이 적지만 여전히 존재 같은 tag가 여러 가지 용도로 사용

RDF 스키마의 문제점

- 동의 요소, 역관계, union, intersection 등 주요 관계 표현 곤란

(55)

55

7.3.3 RDF의 장단점

RDF의 대책

RDF schema: 특성에 대한 정의와 사용상의 제약사항 기술.

RDF 문의 단어 정의, 단어에 대한 세부적인 의미 기술 자원이 소속하는 class 정의 및 속성 정의

RDF의 용도 정보검색 문서 분류

지능형 에이전트

기타: 등급 표시, 선호도 표현

(56)

56

7.4 온톨로지

Ontology

Def.

- 담론에 의하여 합의된 정보를

기계가 다룰 수 있는 형태로 표현한 모델.

- 개념의 형태, 사용상의 제약조건을 명시적으로 정의한 기술.

- 특정한 영역에 속하는 개념과, 개념 사이의 관계를 기술하 는 정형화된 어휘 집합.

** 공유된 개념과 이들의 관계를 명확하게 정형화한 명세.

실례

: 생물과 생물 사이의 종의 관계. 단어들 사이의 관계

용도: 추론.

형태

: 정형 언어로 기술된 어휘의 집합

(57)

57

7.4 온톨로지

Ontology

온톨로지 개념의 3각 관계

개념, 용어, 존재물의 3각도

Stand for Symbolized

Refers to Ontology

Concept 기의(signifie)

Thesaurus Term 기표(Signifiant)

Object 개체 실물

실존하는 ‘나무’

‘나무’에 대한 생각

‘나무’라는 표현

(58)

7.4 온톨로지

Ontology

존재와 의미와 표현의 관계:

표현 정신 세계 실물 세계 비 고

시소러스 온톨로지 객체 시맨틱웹

용어 개념 개체 문자검색

기표 기의 실물 구조언어학

소리, 글 표상 시각, 청각, 촉각 현실

(59)

59

7.4 온톨로지

Ontology

형 태:

단어와 관계들로 구성된 사전.

특정 도메인에 관련된 단어들을 계층 구조로 표현.

확장 가능한 추론 규칙 포함.

구 조:

단어 계층: 계층분류( class, subclass, relationship) 추론 규칙: 계층 구조 확장 기능

사자? 호랑이?  고양이  포유류  동물 IS-A 관계, Instance-of 관계

(60)

7.4 온톨로지

Ontology

어원: 존재의 본질과 유형에 관한 이론 Def.

1) 공유된 개념화에 대한 정형화되고 명시적인 명세(Gruber) 2) 해당 영역의 개념들과 이들 개념들 간의 상호관계를 설정 3) 낱말에 대한 뜻과 각 낱말 사이의 관계를 잘 설명한 것(사

전, 체제)

4) 존재하는 현상에 대해 공유하고 있는 개념을 명확하고 명 시적으로 규정하는 것

5) 단어와 관계들로 구성된 사전.

6) 일종의 지식 표현.

(61)

61

7.4 온톨로지

Ontology

Def.

공유된 개념과 이들의 관계를 명확하게 정형화한 명세.

용어 내 역 비 고

공유 정보의 의미를 합의하여 공통적으로 사용 공용성 개념화 사물의 공통점을 집합으로 묶고 분류 분류 명확성 개념들의 종류, 관계, 제약조건을 정의 정확성 정형화 기계가 정보를 읽을 수 있는 형식 정의 형식화 명세화 개념 내용을 상세하게 기술 상세한 기술

(62)

7.4 온톨로지

Ontology 구성 요소

정보자원: 사물이나 개념

구성 요소 내 역 비 고

클래스 정보 자원에 부여하는 이름 ‘컴퓨터’, ‘사랑’

관계 클래스 간에 존재하는 연결성 is-A 관계, 인스턴스 관계

속성 클래스나 인스턴스의 특정한 성질(값) hasSize

TV의 크기는 42inch 인스턴스 정보 자원의 구체적인 사례 LG 3D 42 LCD TV

(63)

63

7.4 온톨로지

관계

1) 개념 관계: 분류 특성

IS-A 관계

: 일반화(개념화), 특수화

자손들의 공통적인 속성이 루트가 되고, 뿌리의 속성을 구체화한 것이 자손.

Instance-of 관계: 객체를 이루고 있는 여러 사례(실체) 중의

하나

자손들은 실체이므로 식별 가능하게 구체성이 있어야 한다.

2) 비개념 관계

“cause” 관계: 원인과 결과

“hasSize” 관계 : 특성 표현

(64)

7.4 온톨로지

클래스와 인스턴스들 사이의 관계

다리

한강교 양수교 잠수교

동물

사자 늑대

(c) Instance-OF 관계 (a) is-A 관계

자동차

엔진 차체 바퀴

(d) part-OF 건강

운동 식사 업무

(b) cause-OF

(65)

65

7.4 온톨로지

관계의 종류

관 계 내 역 비 고

is-A 요소들의 개념을 일반화(특수화)

Instance-OF 개념을 실체로 구체화 구체적인 실물 cause-OF 원인과 결과를 연결

part-OF 부분이 모여서 전체를 완성

(66)

7.4 온톨로지

Ontology의 구성 요소

1) Class or Concept: 영역 또는 일에 대한 개념 단위. – 사람, 대

* Axiom: 공리. - 모든 사람은 이름이 있다.

2) Relation: 클래스나 인스턴스들 사이의 연결 내용

* “isA” 관계: 포함 관계. 사람은 동물이다.

* “cause” 관계: 운동하면 건강하다.

- Function: 잘 정의된 관계. - 홍길동의 아버지 이름은

3) Instance: 사물이나 개념의 구체적인 사례.

ex. 경원전자 HappyCam 518W 모니터

4) Property:

클래스나 인스턴스의 특정한 성질, 성향

(67)

67

7.4 온톨로지

Ontology의 구성 요소 -

designer

employee

job 원자로

engineer consult

design

work support

SUV Class

Sportage Instance

isA

Class

4,440m m 자동차

Instance

-of hasSize

isA

(a) 공사 온톨로지 스키마 (b) 자동차 온톨로지 스키마

(68)

68

7.4 온톨로지

Ontology 구축 절차

순서 단계별 작업 내 역

1 범위와 목적 온톨로지 구축 범위와 목적을 명세 2 개념화 주제 영역의 핵심 개념 정리

3 범주화 주제 영역의 단어들을 분류

4 클래스 정의 계층에 있는 기본적인 단어들을 분류

5 속성 정의 클래스 간의 관계 정리 및 상세하게 속성을 정의

6 Facet 정의 제약조건과 같은 상세한 속성들을 정의 7 인스턴스 정의 온톨로지 언어로 인스턴스 생성

8 검증 기술적 측면에서 불일치 여부 검토

(69)

69

7.4 온톨로지 언어

OWL Ontology Web Language

Def. 온톨로지를 발간 및 공유하기 위한 시맨틱 웹 생성 언어.

웹 온톨로지와 그에 관련된 지식을 정의하는 언어.

-추론 시스템에 축적된 명제들을 정의 -클래스와 그 구성원 간의 관계를 기술

DAML+OIL: 웹 리소스에 대한 시맨틱 마크업 언어 W3C 표준안. RDF의 확장 언어로 시작.

웹 검색, SW agent 및 지식관리 기능 제공.

구문적으로 정의되지 않은 사실의 논리적 유추를 가능하게 하는 클래스 및 속성과 이에 적용할 수 있는 제약 사항의 집합으로 구성

(70)

7.4 온톨로지

Ontology 언어

온톨로지를 표현하기 위해 스키마와 구문구조 정의 DAML+OIL: 웹 자원에 대한 마크업 언어

Rdf의 단점을 보완해 온톨로지를 구축하기 위한 확장 언어 OIL: 정보를 추론하고 통합하기 위한 도구

OWL: DAML+OIL 기반으로 온톨로지의 공유와 출판 목적의 ML

적용분야

- 인공지능: 지식 표현과 활용

- 정보검색: 용어 모음, 동의어 사전

- 유비쿼터스: 작은 무선기기들의 네트워크 형성

(71)

71

7.4 온톨로지

기존 도구의 문제점과 OWL 기능

구분 종 류 내 역

기존 도구

HTML 사용자 태그의 한정과 문서 표현력 부족

XML 정의된 메타자료 요소와 다른 요소와의 관계 표현 곤란

RDF

클래스와 속성의 명확한 정의, 클래스와 클래스의 관계 그리 고 속성과 속성의 관계를 규정하지 못함

RDFS 동의 요소, 역관계, 합집합, 교집합 등의 주요 관계 표현 곤란 OWL 온톨로지 언어 구조 재정립

(72)

7.4 온톨로지

자동차 온톨로지 실례

SUV Car

Sportage

Puma Engine

Assembler Bus

(73)

73

7.4 온톨로지

온톨로지 클래스를 위한 OWL 코드

구분 내역 OWL 코드

1 클래스

정의

<owl: Class rdf:ID="Car"/>

<owl: Class rdf:ID="Bus"/>

<owl: Class rdf:ID="SUV"/>

2 부클래

스 정의

<owl: Class rdf:ID="Sportage"/>

<rdf:subclassOf rdf:resource="#SUV"/>

3

최하위 클래스

정의

<owl: Class rdf:ID="Puma"/>

<rdsf:subclassOf rdf:resource = "#Sportage"/>

<rdfs:label xml:lang='en'>Puma</rdfs:label>

<rdfs:label xml:lang='fr'>Cougouar</rdfs:label>

<owl:Class>

(74)

7.4 온톨로지

구성원 및 속성 정의

순서 구분 OWL 코드

1 구성원

정의

<Bus rdf:ID="Engine"/>

<owl:Thing rdf:ID="Bus"/>

<owl:Type rdf:resource="Bus"/>

2 속성

정의

<owl:ObjectProperty rdf:ID="madeByAssembler"/>

<rdfs:domain rdf:resource = "#Puma"/>

<rdfs:range rdf:resource = "#Assembler"/>

</owl:ObjectProperty>

(75)

75

7.4 온톨로지

Ontology와 추론

If Employee Park isAllowedToRead Sales Report B AND Employee Kim isSupervisorOf Employee Park

THEN Employee Kim isAllowedToRead Sales Report B

직원 문서

사업보고서 방재보고서

Kim

영업계획서 Park

B isSupervisorOf

isAllowedToRead

isAllowedToRead

isAllowedToRead hasTitle

Is-A Is-A

Instance -of

(a) 온톨로지의 클래스 관계

Is-A Is-A

(76)

7.4 온톨로지 언어

온톨로지 추론과정

IF 직원

직원

직원

영업계획서

직원 Park

Kim

Kim

isAllowedToRead B

Park

B

AND isSupervisorOf

THEN isAllowedToRead 영업계획서

전제 1

전제 2

결 론

(b) 3단 논법에 의한 추론

(77)

77

7.4 온톨로지 언어

SWRL: 온톨로지 추론언어

SWRL 실례: [그림 7.22]의 추론 절차

employee(?p) ∧ isAllowedToRead(?p, B) ∧ employee(?k)

∧ isSupervisorOf(?k, ?p) -> isAllowedToRead(?k, B)

(78)

7.4 온톨로지

Ontology와 추론

(79)

79

7.4 온톨로지

Ontology와 추론

(80)

80

7.5 시맨틱 웹

Def.

- 컴퓨터가 정보자원의 뜻을 이해하고, 논리적 추론까지 할 수 있는 차세대 지능형 웹.

- 분산 환경에서 자원에 대한 정보와 자원 사이의 관계-의 미 정보를 기계가 온톨로지 형태로 표현하고 처리할 수 있 는 기술(프레임워크)

- 컴퓨터가 정보의 의미를 이해하고 의미를 조작할 수 있는 웹.

정보의 의미를 명세화하여 자료의 의미 망을 기계가 처리할 수 있는 웹.

이해: 웹에서 새 정보 발견 시 기존의 정보와 관련시킬 수 있 어야

(81)

81

7.5 Semantic Web

Def:

- 자료의 개념, 유사성, 상관관계 등의 의미를 파악하여 결과물을 생성하여 제공하는 웹.

- 컴퓨터가 정보의 의미를 이해하고 논리적 추론까지 하는 웹.

- 기계가 정보를 읽고 이해하고 정보를 만드는 웹

- 기계가 질의와 저장 정보를 이해하고 두 개를 연결하여 적 합한 결과를 제공하는 웹

- 생각하는 웹 - 자료의 웹

(82)

82

7.5 시맨틱 웹

시맨틱 웹과 기존 웹의 비교

구 분 월드와이드웹 시맨틱웹

제안자 (제안 기관)

1989, Tim Berners-Lee

2004, Dale Dougherty(web 2.0) (ISO)

1999, Tim Berners-Lee (W3C)

검색 주체 인간 기계(프로그램)

자료 연결 비형식적 의미적, 형식적

검색 기능 단어 수준의 검색 의미적 연결 관계와 추론 검색

키워드 오류 시 검색 불가 의미적 추론으로 검색

연관 정보 키워드의 의미와 연관 정보 부재 관계에 의한 연관정보 브라우징

주요 기술 Folksonomy, Wiki, Ajax, RSS 온톨로지, RDF

(83)

83

7.5 Semantic Web

시맨틱 웹이 필요로 하는 기능:

1) 조직과 어플리케이션에 걸친 자료를 상호 운영할 수 있다 .

2) 지식 교환을 위하여 상호 운영 표준 체계를 지원한다.

3) 공동체와 어휘의 상호 연결 구조를 지원한다.

(84)

7.5 시맨틱 웹

Semantic Web의 목표

구 분 시맨틱 웹의 목표

1 검색 시 정확한 결과를 도출한다.

2 이질형 자료와 쉽게 통합하고 비교할 수 있다

3 모든 자료에 의미와 기술 정보를 연관시킬 수 있다

4 웹 서비스를 자동화할 수 있다

(85)

85

7.5 시맨틱 웹

정보관리에 대한 고민

- 인간의 지식을 어떻게 온전하게 표현하고 공유할 것인가?

> 추상적 개념, 경험, 지식을 어떻게 표현/전달/저장/공유하 나?

> 사람, 컴퓨터 간에 명확한 의사소통은 어떻게 가능한가?

논리 세계에서 표현하는 언어

- 논리 언어: woman = person ∩ female - 규칙 언어: if – then else

- 시각 언어: car – engine - tile

- 자연 언어:

(86)

7.5 시맨틱 웹

Semantic Web의 구조

주요 구성 요소

1) 자원 서술

XML, RDF: RDF는 메타언어 기능의 XML로 표현 가능

2) 지식 서술

온톨로지: 용어들 간의 관계를 표현하는 컴퓨터 판독 가능 규정

3) 통합 운용

agent:인간을 대신하여 정보자원을 수집, 검색, 추론하고 온 톨로지를 이용하여 다른 agent와 정보를 교환하는 지능형

(87)

87

7.5 시맨틱 웹

Semantic Web Layer Cake 1: 자원 서술 & 식별 체계 2: 정보 전달 & 표현 형식 3: 의미 연결, 의미 표현 4: 온톨로지 기술

5: 추론 6: 증명 7: 신뢰성 8: 보안

URI / IRI

XML RDFS

온톨로지:

OWL 통합 논리

신뢰 사용자 인터페이스와 응용

질의:

SPARQL

자료 교환: RDF

규칙:

RIF 출처: W3C, 2007

증 명

(88)

7.5 시맨틱 웹

Semantic 기술 적용분야

의미기반 전자상거래

시맨틱 커뮤니티

블로그

멀티미디어 정보처리 지식관리

시스템 지식 정보

검색

시맨틱 기술과 추론

유비쿼터스 컴퓨팅 시스템 통합

(89)

89

7.5 시맨틱 웹

Semantic Web Service의 진화

Semantic web과 Web2.0은 자연스럽게 차세대 웹 기술로 통합.

웹 서비스: 인터넷에서 XML자료를 주고 받는 인터페이스 SOAP, WSDL, UDDI를 이용.

Semantic Web

Web Service

Semantic Web Service KnowledgeWeb

Application 지식

서비스 정보자원

분산

서비스 SOA

(90)

7.5 시맨틱 웹

Semantic Web의 미래

Semantic web의 현재

발전 속도: slow

복잡도: too complex 표준화: not easy

해결할 문제점

1) 기반 기술: RDF, OIL, DAML,,, 부족 2) 언어 관계: not easy

3) 표준화: not easy

(91)

91

7.5 시맨틱 웹

Semantic Web의 방향

고급 웹: 다양한 도메인의 지식 처리  종합적 의사결정 지 원.

사회적 연결성

지식 연결과 추론 Web 4. 0

Ubiquitous Web (2015-2030) Semantic Wikis Web 3. 0

Semantic Web (2005-2020)

Ontologies

Web 2. 0 The Social Web

(2000-2010) Wikis Web 1. 0

The Web (1990-2000)

Databases

(92)

7.6 요점 정리

시맨틱 웹

컴퓨터가 정보를 이해하고 추론할 수 있는 웹.

웹1.0 사용자가 정보를 읽을 수만 있는 웹.

웹2.0 사용자가 정보를 읽고 쓸 수 있으므로 공유와 참여가 가 능.

웹3.0 컴퓨터가 정보의 의미를 이해하고 처리할 수 있는 웹.

HTML의 문제점과 대책

의미 파악 곤란. XML, RDF, ontology, semantic web

XML

(93)

93

7.6 요점 정리

XML의 특징

tag로 문서 구조화, 구조와 내용 분리, 무제한 사용자 tag,, XML의 문서구성

Processing Instruction, comment, element, attribute.

DTD

XML 표식 언어에서 문서 형식을 정의하는 양식

DTD의 한계

구현 난이, 제한된 자료형만 제공, 재사용과 확장 불가,, XML Schema : DTD 한계 극복

XML 문서가 표시되는 방식을 정의하는 도구.

(94)

94

7.6 요점 정리

XML schema의 특징

구문분석기가 필요 없고, 다양한 자료형 제공

XML Namespace 접두사로 동일한 이름 충돌방지 기술

XSL XML 문서를 표현하기 위한 스타일을 정의하는 언어.

XML의 단점 for Semantic web 구조 표현, 의미 파악 곤란

RDF

정보의 특성과 값을 명세하여 정보 간의 관계를 기술하는 도 구.

RDF Data Model

메타자료의 일관적인 인코딩과 교환, 작성을 지원하는 표현 모형.

(95)

95

7.6 요점 정리

RDF schema:

특정한 메타자료에서 정의하고 있는 어휘들을 선언하기 위해 사용.

RDF는 자원 특성 정의, 자원간 관계 정의 기능이 없기 때 Ontology

공유된 개념과 이들의 관계를 명확하게 정형화한 명세 (Gruber).

미리 합의된 정보를 기계가 다룰 수 있는 형태로 표현한 모델.

Ontology 구성 요소

클래스, 관계, 속성, 인스턴스 OWL Ontology Web Language

(96)

7.6 요점 정리

SWRL

온톨로지를 이용한 추론언어.

시맨틱 웹

컴퓨터가 정보자원의 뜻을 이해하고, 추론까지 할 수 있는 웹.

(97)

97

7.6 익힘 문제

세 문제를 선택하여 해법을 제시하시오.

참조

관련 문서

적절한 영양은 운동/훈련에 의한 상해를 줄이고, 상해로 부터의 회복 속도를 빠르게 해 훈련에 따른 최적의 신체 상태를 유지시킴.. 적절한 영양의 공급은 경기를

• Short-Term Memory: 짧은 시간 동안 정보를 가지고 있 을 수 있는 제한된 능력의 기억 저장고.. 짧은 지속시간 (seconds to minutes) 제한된

-난자의 세포막 표면에 접착된 정자는 미부의 운동이 정지되고, 정자두부의 적도 부(equatorial region)와 후모부(post cap region)가 난자의 세포막과 융합하여

액체섬광계수기(LSC: Liquid Scintillation Counter)..

④ 한쌍의 정준나사를 서로 반대방향으로 같은 양만큼 돌리면 반수준기의 기포는 좌 무지(left thumb)의 방향과 같은 방향으로 움직이므로 반수준기의 수포가 중앙에

정맥주입을 시행·보조 정맥주입상태 감시 DTPA 방사선 동위원소 스캔의 경우 도뇨가 필요.. 2-7) 신기능에 대한 기타 검사.

물론 작물이 다르기에 직접 비교는 어렵지만 중국 해수 벼의 대규 모 재배가 가능하려면 벼의 내염성을 높여 될수록 많은 해수로 관개하여 원가를 절약하고

연구를 위해 주변 사람들로부터 표본을 추출하는 경우가 있다는 내용의 주어 진 글 다음에, 이를 기회 표본 추출이라고 하며 이런 표본은 대표성이 없다는