2013. 08. 08
가천대학교 IT대학 컴퓨터 미디어 융합학과
Information Retrieval
제7장 시맨틱 웹
7.1 웹의 진화 7.2 XML
7.3 RDF 7.4 온톨로지 7.5 시맨틱 웹
익힘 문제
3
Why Semantic Web?
Semantic is power of knowledge.
의미를 아는 것이 진정한 힘이다.
세상은 넓고 웹 사이트는 많은데 자료의 의미를 알지 못하면,, 알고 싶은 것은 많으나 정보가 웹 사이트에 흩어져 있어서,,, 같은 자료도 사용할 때마다 다른 의미를 알아야,,,
지식검색이 목표
4
7.1 웹의 진화
초기의 웹
팀 버너스 리:
Client/Server 시스템에 HTML을 결합한 수준.
물리적 통신망 위에 논리적 HTTP를 설치하여 논리 공간 연 결.
이질적 환경을 극복 Semantic Web
- 컴퓨터가 정보자원의 뜻을 이해하고, 논리적 추론까지 할 수 있는 차세대 지능형 웹.
- 분산 환경에서 자원에 대한 정보와 자원 사이의 관계-의미 정보를 기계가 온톨로지 형태로 표현하고 처리할 수 있는
5
7.1 개요
Web 의 비교구 분 웹 1.0 웹 2.0 웹 3.0
시기(년) 1994-2004 2000-2010 2010-2020 상호작용 read only read & write read, write & execute 키워드 공유 공유, 참여, 개방 상황인식(context)
이용자 인간 인간 인간, 기계
이용형태 일방적 공급 이용자가 생산, 소비 웹이 원하는 콘텐츠 제공
검색 게시판 수준 여러 사이트에 개방 이용자 맞춤형 검색
기반 기술 서버관리 브로드 밴드, 서버관리 시맨틱 기술, 상황인식
대응 단말 PC PC와 모바일 일부 PC, 모바일, 시계 등
6
7.1 개요
World Wide Web
Client/Server + HTML + HTTP
: 단순성, 편리성 보급 by Tim Berbers-Lee
문제점
단어 빈도수와 어휘 정보로 검색 비관련 문서
이유: HTML은 보기용 내용과 의미 표현 곤란 에이전트 이용 곤란
Semantic Web
- 정보에 잘 정의된 의미를 부여 사람과 기계의 협동 가능 (Tim)
7
7.1.1 웰드 와이드 웹의 진화
(1) Web 1.0
웹 의 기원: 하이퍼 텍스트( 테드 넬슨이 1965년에 발표)
하이퍼텍스트 기능의 현실화: 더글러스 잉글버트의 마우스 1989년. 팀 버너스 리 WWW 발표.
특 징
- 온라인 게시판 - 텍스트와 링크 - 정적 웹 페이지
7.1.1 웰드 와이드 웹의 진화
(2) Web 2.0
2004년 O’Reilly Media사의 주장
자료의 소유자나 독점자 없이 쉽게 자료를 생산하고 공유하 기 위한 환경
특 징
- 프랫폼의 웹
플랫폼으로부터 독립: hw, sw로부터 구글: 서비스만 제공
- 집단지능의 웹
위키피디아, 유투브
9
7.1.1 웰드 와이드 웹의 진화
(3) Web 3.0
2006년 John Marfoff(Yew York Times 기자) 주창
지능화된 웹 - 시맨틱 기술, 맞춤형 컨텐츠와 서비스 시맨틱 웹: 기술이 정보를 이해하는 기술
웹 3.0: 기술적 관점 + 시장적 관점
특 징
- 연결된 자료의 웹:
생산자, 유통업자, 소비자들이 모두 연결되어야
- 시맨틱 웹
- 시맨틱 웹과 웹 2.0의 결합
7.1.1 웰드 와이드 웹의 진화
(3) Web 3.0
팀 버너스 리와 핸들러의 웹 3.0
웹 3.0
웹 2.0
시맨틱 웹 (RDFS, OWL)
연결된 자료
(RDF, SPARQL)
11
7.1 개요
World Wide Web
사람의 눈으로 이해하는 웹.
눈으로 수많은 사이트의 자료를 종합해야,, 불가 기계가 자료를 읽고 이해해야
Semantic Web
Def.
- 기계가 정보를 읽고 의미를 이해하고 새로운 정보를 만드 는 웹.
- 사용자 질의와 웹이 저장하고 있는 자원을 이해하고, 두 개를 연결하여 적합한 결과를 제공할 수 있는 웹 - 기계가 정보의 의미를 이해하는 웹
생각하는 웹
이해: 웹에서 새 정보 발견 시 기존의 정보와 관련시킬 수 있
어야7.1 개요
Semantic Web의 기능과 목표
기 능
- 조직과 어플리케이션에 걸친 데이터 상호 운영 – 지식 교환을 위한 상호 운영 표준 체계
– 공동체와 어휘의 상호 연결 아키텍처
목 표
1) 검색 시에 정확한 결과
2) 이질형 자료와 통합 및 비교
3) 모든 자료에 의미와 기술 정보 연관 4) 웹 서비스의 자동화
13
7.1 개요
실례 1
키워드기반 질의
키워드: 문서의 내용이나 제목을 요약한 핵심적인 단어.
차량 정비: 자동차 수리? 테이블: 가구? 자료?
재규어: 짐승? 자동차?
단어의 의미를 명확히 하기 위해 문서들을 분석하고, 개념을 정리 문맥에 따라 결정 개념기반 질의
개념기반 질의의 장점:
개념이 있으면, 다른 언어로도 질의 가능
계층 구조화: 내포와 외연으로 범위 축소 및 확장
7.1 개요
실례 2
외국 행사에 참여하려고 호텔을 예약하려 한다.
대 책
행사장: 행사 사이트에, 호텔: 호텔 사이트에 - 행사장에서 가까운 A급 호텔과의 거리는?
- 호텔에서의 교통 수단은? 시간과 가격은?
실례 4
환자의 진료 기록과 응급치료
15
7.1 개요
실례 3:
기존의 휴가 계획
관광지 선정 후 호텔 예약, 교통 예약
신 휴가 계획
(휴가 일정 + 개인 기호)를 입력하면, 자료의 의미를 파악하고,
웹 상의 정보를 해독하여 일정을 제시하고, 선정하면 예약
전제
관광 정보, 숙박 정보, 비행기 및 운송 정보 분산화
7.2 XML
기존 웹의 문제점
HTML의 스키마 부재 구조화된 자료 표현 곤란
프로그램이 HTML 문서를 이해하기 곤란.
문서 내부의 자료 구조 표현 곤란 일반 응용 곤란
ex. Display는 가능하나 저자의 이름과 성을 구분하기 곤란 복잡한 문서 교환에 부적합.
실례: 전자상거래 사이트. 주로 DB 작업 동적 페이지 대두
HTML
Semantic Web
XML
RDF
Ontology
구조 문제 해결
의미 문제 해결
개념 문제 해결
17
7.1 개요
문제점과 대책
HTML: 프로그램이 이해 곤란
자료구조 표현: 내부 구조 표현 곤란 복잡한 문서: 교환 곤란
7.2 XML
Def.
웹 상에서 구조화된 문서를 구현할 수 있는 표식 언어.
1996년 W3C: HTML의 한계 극복을 위해 제안.
특징
검색 용이, 체계적이고 일관적인 접근, 재가공 용이.
문서의 구조적인 정보만 기억 간단하게 조작하기 곤란.
용도
현재 B2B의 문서 양식으로 사용.
소규모 DB를 대체.
19
7.2 XML
정 의
- 웹에서 문서를 구조화하고 전송할 수 있는 표식 언어.
- HTML의 문서 표현과 DBMS의 스키마 기능을 통합한 도구.
기 능
어떤 문서도 태그를 이용하여 조직 가능.
HTML 문서와 DB 스키마 사이를 연결.
XML의 특징:
1) Tag로 자료에 대한 구조 제공: DB화 가능, self-documenting 2) 구조와 내용의 분리: 효율적 검색, 중첩 구조 허용
3) 정확한 내용 전달: 정보교환 및 자료공유 용이, 4) 문서 작성 간편
5) 사용자 Tag: 무제한 정의, 비 고정적 형식
7.2 XML
HTML과 XML 비교
구 분 HTML XML
태 그 고정식, 제한
적 사용자 정의 의미 부여 정보 표현 단순 표현 정보의 내부 구조 표현 Database 연계 속성 구분 곤
란
속성 별로 저장, 교환과 공유 가 능
검색 효율 비효율적 구조와 내용을 분리 효율적 장 점 쉽고 간결 복잡한 문서 작성 편리
21
7.2 XML
XML의 목표:
1) SGML과 호환,,
2) XML 프로세서를 작성하기 쉬워야,,
3) 설계가 용이해야: 형식적이고 정교해야,, XML의 구조:
1) HTML과 비슷하게 보여야
2) 엘리먼트라 불리는 사용자-정의 태그의 계층구조 3) 자료: 엘리먼트로 기술,
엘리먼트: 속성으로 기술
7.2 XML
HTML과 XML 문서
<HTML>
<HEAD></HEAD>
<BODY>
<font size=3> 과학
<p> 정보검색 </p>
<p> 도서출판 그린</p>
<p> 2009년 4월</p>
</font>
</BODY>
</HTML>
<?xml version="1.0" encoding="euc-kr" ?>
<과학>
<제목>정보검색</제목>
<출판사>도서출판 그린</출판사>
<출판일자>2009년 4월 9일</출판일자>
</과학>
23
7.2 XML 실례
<HTML>
<HEAD></HEAD>
<BODY>
<font size=3> 제품정보 <p> 배 </p>
<p>나주시 </p>
<p> 1 </p>
<p> 56000 </p>
</font>
</BODY>
</HTML>
<?xml version=“1.0” encoding=“utf-8 ? >
<제품정보>
<과일> 배 </과일>
<생산지역> 나주시 </생산지역>
<수량> 1 </수량>
<가격> 56000 </가격>
</제품정보>
HTML: 디스플레이용 언어 * XML: 표준화 작업과 자료보관용 언어
7.2 XML 문서 구조
XML 문서 = Prolog + Body
Prolog: XML 문서에 대한 정보를 기술 PI, DTD, XML 스키마 등으로 구성
Body: 문서 기술 부분. 여러 요소element들로 구성
XML 문서의 구성요소
- PI Processing Instruction - comment
- element - attribute
25
7.2 XML
XML 문서의 구성요소
<?xml verion=”1.0" encoding=”euc-kr” ?>
<!-- BODY (This is Comment) -- >
<제품정보>
<과일 종류=”배”>
<생산지역> 나주시 </생산지역>
<수량> 1 </수량>
<가격> 56000 </가격>
</과일>
</제품정보>
Prolog: PI
element
attribute comment Root element
7.2.2 XML 문서구조: DTD
DTD : Document Type Definition
SGML, XML 표식 언어에서 문서 형식을 정의하는 양식
<!ELEMENT 책(저자, TITLE)>
<!ELEMENT 저자(#PCDATA)>
<!ELEMENT 제목(#PCDATA)>
<!ATTLIST 책 GENERE (과학|소설) #Required>
(a) DTD 실례
<책 GENERE='소설'>
<저자>허균</저자>
<제목>홍길동</제목>
(b) DTD에 의한 XML 문서
27
7.2 XML 문서 구조: XML Schema
XML Schema DTD의 한계
- DTD는 구현이 어렵다.
- DTD는 제한된 자료형만 제공된다.
- DTD는 재사용성과 확장성이 불가능하다.
스키마 문서의 물리적 구성
schema, element, attribute와 주석문 기본 형식
<xs:schema xmlns:xs=“http://www.w3.org/2002/XMLSchema”>
</xs:schema>
7.2 XML 문서 구조: XML Schema
XML Schema
Def.
XML 문서가 표시되는 방식을 정의하는 도구.
DTD와 함께 XML 문서의 구조를 정의하는 표준
특징: 별도의 구문분석기가 필요 없고, 다양한 자료형을 제 공.
필요성: DTD는 구문분석기 필요, 다양한 자료형 요구
<xs:schema
xmlns:xs=“http://www.w3.org/2002/XMLSchema”>
targetnamespace=http://www.gachon.ac.kr elementFormDefault=“qualified”
attributreFormDefault=“unqualified”>
</xs:schema>
29
7.2 XML 문서 구조: XML Schema
XML Schema 실례
<complexType name="강사">
<sequence>
<element name="성"type="string" minOccurs="1"/>
<element name="이름"type="string" minOccurs="1"/>
</sequence>
<attribute name="제목“type="string use="optional"/>
</complexType>
30
7.2 XML NameSpace
동일한 이름 충돌방지 기술 접두사
기본 형식: <prefix:ElementName xmlns:prefix=URL>
<?xml version=“1.0” encoding=“euc-kr”?>
<Cus:User xmlns:Cus=“http://www.pop.com/buy/Cus”
xmlns:Order=“http://www.tech.net/2002”>
<Cus:ID> working-girl</Cus:ID>
<Cus:Name>소유춘</Cus:Name>
<Cus:Goods>
<Order:Good>
<Order:ID>2008-098</Order:ID>
<Order:Name>NoteBook</Order:Name>
</Order:Good>
</Cus:Goods>
</Cus:User>
31
7.2 XML : XSL
XML 문서: 자료를 저장하는 구조적인 문서.
XSL
XML 문서를 표현하기 위한 스타일을 정의하는 언어.
XML의 특징:
문서의 구조를 나타내는 부분과 표현하는 부분을 분리.
문서 구조를 변경하지 않고 표현만 달리할 수 있음.
7.2 XML : XSL
XML 문서의 표현
XML은 문서의 구조를 기술하는 방법과 표현하는 방법이 다 르다.
XML 문서는 HTML로 변환되어야 표현된다.
.
XML 문서
XSL 문서
HTML
문서 Display XSL
프로세서 (msxml)
33
7.2 XML : XSL
XML 문서: 자료를 저장하는 구조적인 문서.
XSL
XML 문서를 표현하기 위한 스타일을 정의하는 언어.
XSLT: Transformation. XML 문서를 다른 문서로 변환하는
방법을 정의
XSL-FO : Formatting Object. XSLT 결과로 나온 문서를 다양한
형식으로 바꾸는 처리(문서 표현을 정의)XSL
XSLT XSL-FO
7.2 XML : XSL
XSL 문서의 문법
XML 문서를 표현하기 위한 스타일을 정의하는 언어.
xsl:stylesheet: xml 문서가 스타일시트임을 알려주는 XSL의 루트.
xsl:template: 변환 규칙 정의
xsl:apply-template: xsl:template에서 지정한 자식 노드 중에서 특정 노드가 선택되도록 하기 위해서 기술한다.
35
7.2 XML : XSL
XSL 문서
xsl:stylesheet: xml 문서가 스타일시트임을 알려주는 XSL의 루트.
xsl:template: 어느 부분을 어떻게 변환할 것인지를 결정.
xsl:apply-template: xsl:template에서 지정한 자식 노드 중에서 특
정 노드가 선택되도록 하기 위해서 기술.<xsl:stylesheet xmlns:xsl=http://www.w3.org/1999/xsl/Transform version=“1.0”>
< xsl:template match=“패턴”> // 변환 규칙 정의 변환할 내용
< /xsl:template>
36
7.2 XML : XSL
XSL의 예제
c:\XML\test.xsl
---
<?xml version="1.0" encoding="euc-kr" ?>
<xsl:stylesheet xmlns:xsl=“http://www.w3.org/1999/XSL/Transform"
version="1.0">
<xsl:template match="/제품/자동차">
<h3> * 자동차 목록 * </h3>
<xsl: apply-templates select="모델명"/>
</xsl:template>
< xsl:template match="모델명">
<h5> 모델명 : <xsl:value-of select="."/> </h5>
</xsl:template>
</xsl:stylesheet>
37
7.2 XML : XSL
XSL의 예제
c:\XML\test.xml
---
<?xml version="1.0" encoding="euc-kr" ?>
<?xml:stylesheet type="text/xsl“ href="test.xsl”?> // XSL 문서 적용을 위함
<제품>
<자동차>
<모델명>그랜저 TG</모델명>
</자동차>
<자동차>
<모델명>NF 소나타</모델명>
</자동차>
</제품>
7.2 XML : XSL
XSL을 실행한 결과
---
* 자동차 목록
모델명 : 그랜저 TG
* 자동차 목록
모델명 : NF 소나타
39
7.2 XML
XML의 단점 for Semantic web
구조 표현, 그러나 의미 파악 곤란
- 태그 이름은 다르나 내용이 같을 경우 - 이름은 같으나 내용은 상이
상호 운영성: 두 태그 이름이 같은 의미를 가진다는 표현 <heading> , <subject>
- 같은 내용을 구조가 다르게 표현한 경우
ex. <date>12/11/2009</date>
<day>12</day>
<month>11</month>
<year>2009</year>
40
7.3 RDF resource description framework
RDF의 필요성XML은 자료를 구조화할 수 있으나
자료의 의미를 전달하지 못함 의미 문제점 해결
RDF는 리소스, 특성, 서술문 구조로 구성되므로 같은 내용에 대해서 같은 해석이 가능하다.
단, 태그 이름의 중첩성과 모호성은 여전히 존재
대 책:
온톨로지, RDF schema :
온톨로지가 보다 일반적이고 확장된 개념
41
7.3 RDF
Resource Description Framework XML의 문제점
<party name="활빈당“>
<chairman>홍길동</chairman>
</party>
(a) XML 1
<chairman>홍길동</chairman>
<party name="활빈당“>
</chairman>
(b) XML 2
XML의 두 가지 애매한 표현
둘 중에서 어느 것이 더 정확한 표현인가?
42
7.3 RDF resource description framework 정의:
-정보의 특성과 값을 명세하여 정보 간의 관계를 기술하는 도구.
-특정 자원의 메타데이터를 기술하는 XML 기반의 framework.
-웹 자원에 관한 메타 정보를 표현하기 위한 언어.
웹 문서에 관한 메타 자료를 XML을 기반으로 간단하게 표현.
선언적 문장 <S,P,O>들의 모음. <S,P,O> 은 정보의 기본 단위.
용도
- 정보 검색, - 문서 분류
43
7.3 RDF Data Model
Def.
- 메타자료의 일관적인 인코딩과 교환, 작성을 지원하는 표 현 모형.
- 자원을 (주체, 술어, 개체)의 3요소로 정의.
정보 자원 Resource
속성값 Value
속셩 유형 Property Type
저자
(a) RDF 자료 모형 a
값/객체
특성/술어 Http://www.google.co m/hanhwa/node.htm Http://www.kwu.ac.kr/c
omputer/database.xml
Http://www.naver.com/
chemical/main.htm (c) RDF 자료 모형의 실례 (b) RDF 자료 모형 b
구조/자원/주체
7.3 RDF 구조
RDF 자료 모델:
정보 자원의 특성과 값을 명세함으로써 자원 간의 상호 관계를 기술하는 모델.
구성 요소 내 역 실 례 1 일반 온톨로지
실 례 2 - 웹 온톨로지 - 자 원
Resource
주체
subject 데이터베이스 www.kwu.ac.kr/computer/database.xml 속 성
Property
술어
predicate 저자 dblab.kyungwon.ac.kr/1.2/author 속성 값
value
객체
object 홍길동 dblab.org/cs/professor/58603 * Hong, kil-dong
45
7.3 RDF Data Model
RDF: 자원을 (주체, 술어, 개체)의 3요소로 정의 - 아버지가 방에 들어가신다.
- 박태환의 나이는 21세다.
- 한국의 수도는 서울이다.
아버지
가방
들어가신다
박태환
나이
21
한국
수도
서울
7.3 RDF Data Model
RDF 문장의 실례
<rdf: RDF>
<rdf:Description about="http://www.ksii.or.kr/paper">
<s:Publisher> Korean Society of Internet Information</s:Publisher>
<s:Title> Internet Information thesis</s:Title>
<s:Date>2011-10-01</s:Date>
</rdf:Description>
</rdf:RDF>
47
7.3 RDF
RDF
웹 상의 자원을 XML 형식으로 메타데이터를 표현.
객체지향방식으로 지식을 표현
객체-속성-값의 구조를 갖지만 객체 중심이 아니라 속성 중 심.
RDF schema:
특정한 메타자료에서 정의하고 있는 어휘들을 선언하기 위 해 사용.
정보자원의 특성과 다른 자원과의 관계 정의.
* RDF는 기존 meta-data에 대한 정보만 표현하기 때문.
자원 성 정의 자원간 관계 정의 기능이 없다
48
7.3 RDF
Structure
– Resource (subject) : http://www.bookstore.org/id2009 – Property (predicate) : http://www.schema.org/#Author – Value (object) : "Taehee Kim”
<rdf:RDF>
<rdf:Description
about=“http://www.bookstore.org/id2009”>
<s:Author> Taehee Kim </s:Author>
</rdf:Description>
</rdf:RDF>
s:Author http://www.
bookstore.org/id2009 Taehee Kim
49
7.3 RDF
RDF 예제 1
<rdf: RDF>
<rdf:Description about=“http://www.w3c.org”>
<s:Publisher> World Wide Web Consortium</s:Publisher>
<s:Title> W3C Home Page</s:Title>
<s:Date>2009-10-01</s:Date>
</rdf:Description>
</rdf:RDF>
Serialization: RDF를 XML로 표현한 것.
7.3 RDF
RDF 예제 2
<?xml version=“1.0”?>
<rdf: RDF>
xmlns:rdf=“http://www.w3c.org/2009/10/01”>
xmlns:s=“http://description.org/schema/”>
<rdf:Description about=“http://www.w3c.org/Home/Lassila”>
<s:Creator> Ora Lassila</s:Creator>
</rdf:Description>
</rdf:RDF>
Ora Lassila is the Creator of the resource http://www.w3c.org/Home/Lassila
51
7.3.2 RDF Schema
사실 표현 : RDF Schema의 필요성
1) 홍길동이 인공지능을 강의한다.2) 공학관이 안철수를 강의한다.
3) 인공지능이 안철수를 강의한다.
4) 공학관이 인공지능을 강의한다.
여러 가지 문장의 모순을 방지하는 방법은?
주어가 될 단어와 목적어가 될 단어의 구분
7.3.2 RDF Schema
RDF Schema
1) 자원의 클래스를 지정하는 도구(어휘 정의 능력 지원) 2) 새로운 용어를 정의하는 도구.
3) 정보 자원의 특성 선언과
다른 자원과의 관계를 정의하는 도구
객체 주체
치역
정의역 관계
술어
RDF RDFS
53
7.3.2 RDF Schema
계층적 Class 관계도
RDF와 RDFS의 계층 구조
교직원
정직원
전임 비전임 임시직
교원 직원
강사 교수
교직원
전임 교원
보안 이철수
과목 강의하다
관계하다
subClassOf subClassOf
subClassOf type
type
type
range
domain
range subPropertyOf
range
강의하다
RDF RDFS 교수
54
7.3.3 RDF의 장단점
RDF의 장점
- XML: 여러 가지 표현 방법 애매
- 객체의 의미를 하나로만 표현하므로 명확.
- URI를 이용하여 웹 자원 표현에 적합 RDF의 단점
- XML의 모호함이 적지만 여전히 존재 같은 tag가 여러 가지 용도로 사용
RDF 스키마의 문제점
- 동의 요소, 역관계, union, intersection 등 주요 관계 표현 곤란
55
7.3.3 RDF의 장단점
RDF의 대책
RDF schema: 특성에 대한 정의와 사용상의 제약사항 기술.
RDF 문의 단어 정의, 단어에 대한 세부적인 의미 기술 자원이 소속하는 class 정의 및 속성 정의
RDF의 용도 정보검색 문서 분류
지능형 에이전트
기타: 등급 표시, 선호도 표현
56
7.4 온톨로지
OntologyDef.
- 담론에 의하여 합의된 정보를
기계가 다룰 수 있는 형태로 표현한 모델.
- 개념의 형태, 사용상의 제약조건을 명시적으로 정의한 기술.
- 특정한 영역에 속하는 개념과, 개념 사이의 관계를 기술하 는 정형화된 어휘 집합.
** 공유된 개념과 이들의 관계를 명확하게 정형화한 명세.
실례
: 생물과 생물 사이의 종의 관계. 단어들 사이의 관계용도: 추론.
형태
: 정형 언어로 기술된 어휘의 집합57
7.4 온톨로지
Ontology온톨로지 개념의 3각 관계
개념, 용어, 존재물의 3각도
Stand for Symbolized
Refers to Ontology
Concept 기의(signifie)
Thesaurus Term 기표(Signifiant)
Object 개체 실물
실존하는 ‘나무’
‘나무’에 대한 생각
‘나무’라는 표현
7.4 온톨로지
Ontology존재와 의미와 표현의 관계:
표현 정신 세계 실물 세계 비 고
시소러스 온톨로지 객체 시맨틱웹
용어 개념 개체 문자검색
기표 기의 실물 구조언어학
소리, 글 표상 시각, 청각, 촉각 현실
59
7.4 온톨로지
Ontology형 태:
단어와 관계들로 구성된 사전.
특정 도메인에 관련된 단어들을 계층 구조로 표현.
확장 가능한 추론 규칙 포함.
구 조:
단어 계층: 계층분류( class, subclass, relationship) 추론 규칙: 계층 구조 확장 기능
사자? 호랑이? 고양이 포유류 동물 IS-A 관계, Instance-of 관계
7.4 온톨로지
Ontology어원: 존재의 본질과 유형에 관한 이론 Def.
1) 공유된 개념화에 대한 정형화되고 명시적인 명세(Gruber) 2) 해당 영역의 개념들과 이들 개념들 간의 상호관계를 설정 3) 낱말에 대한 뜻과 각 낱말 사이의 관계를 잘 설명한 것(사
전, 체제)
4) 존재하는 현상에 대해 공유하고 있는 개념을 명확하고 명 시적으로 규정하는 것
5) 단어와 관계들로 구성된 사전.
6) 일종의 지식 표현.
61
7.4 온톨로지
OntologyDef.
공유된 개념과 이들의 관계를 명확하게 정형화한 명세.
용어 내 역 비 고
공유 정보의 의미를 합의하여 공통적으로 사용 공용성 개념화 사물의 공통점을 집합으로 묶고 분류 분류 명확성 개념들의 종류, 관계, 제약조건을 정의 정확성 정형화 기계가 정보를 읽을 수 있는 형식 정의 형식화 명세화 개념 내용을 상세하게 기술 상세한 기술
7.4 온톨로지
Ontology 구성 요소
정보자원: 사물이나 개념
구성 요소 내 역 비 고
클래스 정보 자원에 부여하는 이름 ‘컴퓨터’, ‘사랑’
관계 클래스 간에 존재하는 연결성 is-A 관계, 인스턴스 관계
속성 클래스나 인스턴스의 특정한 성질(값) hasSize
TV의 크기는 42inch 인스턴스 정보 자원의 구체적인 사례 LG 3D 42 LCD TV
63
7.4 온톨로지
관계
1) 개념 관계: 분류 특성
IS-A 관계
: 일반화(개념화), 특수화자손들의 공통적인 속성이 루트가 되고, 뿌리의 속성을 구체화한 것이 자손.
Instance-of 관계: 객체를 이루고 있는 여러 사례(실체) 중의
하나자손들은 실체이므로 식별 가능하게 구체성이 있어야 한다.
2) 비개념 관계
“cause” 관계: 원인과 결과
“hasSize” 관계 : 특성 표현
7.4 온톨로지
클래스와 인스턴스들 사이의 관계
다리
한강교 양수교 잠수교
동물
사자 늑대 곰
(c) Instance-OF 관계 (a) is-A 관계
자동차
엔진 차체 바퀴
(d) part-OF 건강
운동 식사 업무
(b) cause-OF
65
7.4 온톨로지
관계의 종류
관 계 내 역 비 고
is-A 요소들의 개념을 일반화(특수화)
Instance-OF 개념을 실체로 구체화 구체적인 실물 cause-OF 원인과 결과를 연결
part-OF 부분이 모여서 전체를 완성
7.4 온톨로지
Ontology의 구성 요소
1) Class or Concept: 영역 또는 일에 대한 개념 단위. – 사람, 대
학* Axiom: 공리. - 모든 사람은 이름이 있다.
2) Relation: 클래스나 인스턴스들 사이의 연결 내용
* “isA” 관계: 포함 관계. 사람은 동물이다.* “cause” 관계: 운동하면 건강하다.
- Function: 잘 정의된 관계. - 홍길동의 아버지 이름은
3) Instance: 사물이나 개념의 구체적인 사례.
ex. 경원전자 HappyCam 518W 모니터
4) Property:
클래스나 인스턴스의 특정한 성질, 성향67
7.4 온톨로지
Ontology의 구성 요소 -
designer
employee
job 원자로
engineer consult
design
work support
SUV Class
Sportage Instance
isA
Class
4,440m m 자동차
Instance
-of hasSize
isA
(a) 공사 온톨로지 스키마 (b) 자동차 온톨로지 스키마
68
7.4 온톨로지
Ontology 구축 절차
순서 단계별 작업 내 역
1 범위와 목적 온톨로지 구축 범위와 목적을 명세 2 개념화 주제 영역의 핵심 개념 정리
3 범주화 주제 영역의 단어들을 분류
4 클래스 정의 계층에 있는 기본적인 단어들을 분류
5 속성 정의 클래스 간의 관계 정리 및 상세하게 속성을 정의
6 Facet 정의 제약조건과 같은 상세한 속성들을 정의 7 인스턴스 정의 온톨로지 언어로 인스턴스 생성
8 검증 기술적 측면에서 불일치 여부 검토
69
7.4 온톨로지 언어
OWL Ontology Web Language
Def. 온톨로지를 발간 및 공유하기 위한 시맨틱 웹 생성 언어.
웹 온톨로지와 그에 관련된 지식을 정의하는 언어.
-추론 시스템에 축적된 명제들을 정의 -클래스와 그 구성원 간의 관계를 기술
DAML+OIL: 웹 리소스에 대한 시맨틱 마크업 언어 W3C 표준안. RDF의 확장 언어로 시작.
웹 검색, SW agent 및 지식관리 기능 제공.
구문적으로 정의되지 않은 사실의 논리적 유추를 가능하게 하는 클래스 및 속성과 이에 적용할 수 있는 제약 사항의 집합으로 구성
7.4 온톨로지
Ontology 언어
온톨로지를 표현하기 위해 스키마와 구문구조 정의 DAML+OIL: 웹 자원에 대한 마크업 언어
Rdf의 단점을 보완해 온톨로지를 구축하기 위한 확장 언어 OIL: 정보를 추론하고 통합하기 위한 도구
OWL: DAML+OIL 기반으로 온톨로지의 공유와 출판 목적의 ML
적용분야
- 인공지능: 지식 표현과 활용
- 정보검색: 용어 모음, 동의어 사전
- 유비쿼터스: 작은 무선기기들의 네트워크 형성
71
7.4 온톨로지
기존 도구의 문제점과 OWL 기능
구분 종 류 내 역
기존 도구
HTML 사용자 태그의 한정과 문서 표현력 부족
XML 정의된 메타자료 요소와 다른 요소와의 관계 표현 곤란
RDF
클래스와 속성의 명확한 정의, 클래스와 클래스의 관계 그리 고 속성과 속성의 관계를 규정하지 못함
RDFS 동의 요소, 역관계, 합집합, 교집합 등의 주요 관계 표현 곤란 OWL 온톨로지 언어 구조 재정립
7.4 온톨로지
자동차 온톨로지 실례
SUV Car
Sportage
Puma Engine
Assembler Bus
73
7.4 온톨로지
온톨로지 클래스를 위한 OWL 코드
구분 내역 OWL 코드
1 클래스
정의
<owl: Class rdf:ID="Car"/>
<owl: Class rdf:ID="Bus"/>
<owl: Class rdf:ID="SUV"/>
2 부클래
스 정의
<owl: Class rdf:ID="Sportage"/>
<rdf:subclassOf rdf:resource="#SUV"/>
3
최하위 클래스
정의
<owl: Class rdf:ID="Puma"/>
<rdsf:subclassOf rdf:resource = "#Sportage"/>
<rdfs:label xml:lang='en'>Puma</rdfs:label>
<rdfs:label xml:lang='fr'>Cougouar</rdfs:label>
<owl:Class>
7.4 온톨로지
구성원 및 속성 정의
순서 구분 OWL 코드
1 구성원
정의
<Bus rdf:ID="Engine"/>
<owl:Thing rdf:ID="Bus"/>
<owl:Type rdf:resource="Bus"/>
2 속성
정의
<owl:ObjectProperty rdf:ID="madeByAssembler"/>
<rdfs:domain rdf:resource = "#Puma"/>
<rdfs:range rdf:resource = "#Assembler"/>
</owl:ObjectProperty>
75
7.4 온톨로지
Ontology와 추론
If Employee Park isAllowedToRead Sales Report B AND Employee Kim isSupervisorOf Employee Park
THEN Employee Kim isAllowedToRead Sales Report B
직원 문서
사업보고서 방재보고서
Kim
영업계획서 Park
B isSupervisorOf
isAllowedToRead
isAllowedToRead
isAllowedToRead hasTitle
Is-A Is-A
Instance -of
(a) 온톨로지의 클래스 관계
Is-A Is-A
7.4 온톨로지 언어
온톨로지 추론과정
IF 직원
직원
직원
영업계획서
직원 Park
Kim
Kim
isAllowedToRead B
Park
B
AND isSupervisorOf
THEN isAllowedToRead 영업계획서
전제 1
전제 2
결 론
(b) 3단 논법에 의한 추론
77
7.4 온톨로지 언어
SWRL: 온톨로지 추론언어
SWRL 실례: [그림 7.22]의 추론 절차
employee(?p) ∧ isAllowedToRead(?p, B) ∧ employee(?k)
∧ isSupervisorOf(?k, ?p) -> isAllowedToRead(?k, B)
7.4 온톨로지
Ontology와 추론
79
7.4 온톨로지
Ontology와 추론
80
7.5 시맨틱 웹
Def.
- 컴퓨터가 정보자원의 뜻을 이해하고, 논리적 추론까지 할 수 있는 차세대 지능형 웹.
- 분산 환경에서 자원에 대한 정보와 자원 사이의 관계-의 미 정보를 기계가 온톨로지 형태로 표현하고 처리할 수 있 는 기술(프레임워크)
- 컴퓨터가 정보의 의미를 이해하고 의미를 조작할 수 있는 웹.
정보의 의미를 명세화하여 자료의 의미 망을 기계가 처리할 수 있는 웹.
이해: 웹에서 새 정보 발견 시 기존의 정보와 관련시킬 수 있 어야
81
7.5 Semantic Web
Def:
- 자료의 개념, 유사성, 상관관계 등의 의미를 파악하여 결과물을 생성하여 제공하는 웹.
- 컴퓨터가 정보의 의미를 이해하고 논리적 추론까지 하는 웹.
- 기계가 정보를 읽고 이해하고 정보를 만드는 웹
- 기계가 질의와 저장 정보를 이해하고 두 개를 연결하여 적 합한 결과를 제공하는 웹
- 생각하는 웹 - 자료의 웹
82
7.5 시맨틱 웹
시맨틱 웹과 기존 웹의 비교
구 분 월드와이드웹 시맨틱웹
제안자 (제안 기관)
1989, Tim Berners-Lee
2004, Dale Dougherty(web 2.0) (ISO)
1999, Tim Berners-Lee (W3C)
검색 주체 인간 기계(프로그램)
자료 연결 비형식적 의미적, 형식적
검색 기능 단어 수준의 검색 의미적 연결 관계와 추론 검색
키워드 오류 시 검색 불가 의미적 추론으로 검색
연관 정보 키워드의 의미와 연관 정보 부재 관계에 의한 연관정보 브라우징
주요 기술 Folksonomy, Wiki, Ajax, RSS 온톨로지, RDF
83
7.5 Semantic Web
시맨틱 웹이 필요로 하는 기능:
1) 조직과 어플리케이션에 걸친 자료를 상호 운영할 수 있다 .
2) 지식 교환을 위하여 상호 운영 표준 체계를 지원한다.
3) 공동체와 어휘의 상호 연결 구조를 지원한다.
7.5 시맨틱 웹
Semantic Web의 목표
구 분 시맨틱 웹의 목표
1 검색 시 정확한 결과를 도출한다.
2 이질형 자료와 쉽게 통합하고 비교할 수 있다
3 모든 자료에 의미와 기술 정보를 연관시킬 수 있다
4 웹 서비스를 자동화할 수 있다
85
7.5 시맨틱 웹
정보관리에 대한 고민
- 인간의 지식을 어떻게 온전하게 표현하고 공유할 것인가?
> 추상적 개념, 경험, 지식을 어떻게 표현/전달/저장/공유하 나?
> 사람, 컴퓨터 간에 명확한 의사소통은 어떻게 가능한가?
논리 세계에서 표현하는 언어
- 논리 언어: woman = person ∩ female - 규칙 언어: if – then else
- 시각 언어: car – engine - tile
- 자연 언어:
7.5 시맨틱 웹
Semantic Web의 구조
주요 구성 요소1) 자원 서술
XML, RDF: RDF는 메타언어 기능의 XML로 표현 가능
2) 지식 서술
온톨로지: 용어들 간의 관계를 표현하는 컴퓨터 판독 가능 규정
3) 통합 운용
agent:인간을 대신하여 정보자원을 수집, 검색, 추론하고 온 톨로지를 이용하여 다른 agent와 정보를 교환하는 지능형
87
7.5 시맨틱 웹
Semantic Web Layer Cake 1: 자원 서술 & 식별 체계 2: 정보 전달 & 표현 형식 3: 의미 연결, 의미 표현 4: 온톨로지 기술
5: 추론 6: 증명 7: 신뢰성 8: 보안
URI / IRI
XML RDFS
온톨로지:
OWL 통합 논리
신뢰 사용자 인터페이스와 응용
암 호 화 질의:
SPARQL
자료 교환: RDF
규칙:
RIF 출처: W3C, 2007
증 명
7.5 시맨틱 웹
Semantic 기술 적용분야
의미기반 전자상거래
시맨틱 커뮤니티
블로그
멀티미디어 정보처리 지식관리
시스템 지식 정보
검색
시맨틱 기술과 추론
유비쿼터스 컴퓨팅 시스템 통합
89
7.5 시맨틱 웹
Semantic Web Service의 진화
Semantic web과 Web2.0은 자연스럽게 차세대 웹 기술로 통합.
웹 서비스: 인터넷에서 XML자료를 주고 받는 인터페이스 SOAP, WSDL, UDDI를 이용.
Semantic Web
Web Service
Semantic Web Service KnowledgeWeb
Application 지식
서비스 정보자원
분산
서비스 SOA
7.5 시맨틱 웹
Semantic Web의 미래
Semantic web의 현재
발전 속도: slow복잡도: too complex 표준화: not easy
해결할 문제점
1) 기반 기술: RDF, OIL, DAML,,, 부족 2) 언어 관계: not easy
3) 표준화: not easy
91
7.5 시맨틱 웹
Semantic Web의 방향
고급 웹: 다양한 도메인의 지식 처리 종합적 의사결정 지 원.
사회적 연결성
지식 연결과 추론 Web 4. 0
Ubiquitous Web (2015-2030) Semantic Wikis Web 3. 0
Semantic Web (2005-2020)
Ontologies
Web 2. 0 The Social Web
(2000-2010) Wikis Web 1. 0
The Web (1990-2000)
Databases
7.6 요점 정리
시맨틱 웹
컴퓨터가 정보를 이해하고 추론할 수 있는 웹.
웹1.0 사용자가 정보를 읽을 수만 있는 웹.
웹2.0 사용자가 정보를 읽고 쓸 수 있으므로 공유와 참여가 가 능.
웹3.0 컴퓨터가 정보의 의미를 이해하고 처리할 수 있는 웹.
HTML의 문제점과 대책
의미 파악 곤란. XML, RDF, ontology, semantic web
XML
93
7.6 요점 정리
XML의 특징
tag로 문서 구조화, 구조와 내용 분리, 무제한 사용자 tag,, XML의 문서구성
Processing Instruction, comment, element, attribute.
DTD
XML 표식 언어에서 문서 형식을 정의하는 양식
DTD의 한계
구현 난이, 제한된 자료형만 제공, 재사용과 확장 불가,, XML Schema : DTD 한계 극복
XML 문서가 표시되는 방식을 정의하는 도구.
94
7.6 요점 정리
XML schema의 특징
구문분석기가 필요 없고, 다양한 자료형 제공
XML Namespace 접두사로 동일한 이름 충돌방지 기술
XSL XML 문서를 표현하기 위한 스타일을 정의하는 언어.
XML의 단점 for Semantic web 구조 표현, 의미 파악 곤란
RDF
정보의 특성과 값을 명세하여 정보 간의 관계를 기술하는 도 구.
RDF Data Model
메타자료의 일관적인 인코딩과 교환, 작성을 지원하는 표현 모형.
95
7.6 요점 정리
RDF schema:
특정한 메타자료에서 정의하고 있는 어휘들을 선언하기 위해 사용.
RDF는 자원 특성 정의, 자원간 관계 정의 기능이 없기 때 Ontology
공유된 개념과 이들의 관계를 명확하게 정형화한 명세 (Gruber).
미리 합의된 정보를 기계가 다룰 수 있는 형태로 표현한 모델.
Ontology 구성 요소
클래스, 관계, 속성, 인스턴스 OWL Ontology Web Language
7.6 요점 정리
SWRL
온톨로지를 이용한 추론언어.
시맨틱 웹
컴퓨터가 정보자원의 뜻을 이해하고, 추론까지 할 수 있는 웹.
97