• 검색 결과가 없습니다.

수자원을 위한 데이터마이닝 개요

N/A
N/A
Protected

Academic year: 2022

Share "수자원을 위한 데이터마이닝 개요"

Copied!
18
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

수자원을 위한

데이터마이닝 개요

제주대학교 컴퓨터교육과

박찬정([email protected])

(2)

목차

트랜잭션 처리의 의미

OLTP vs. OLAP

데이터마이닝의 개념

데이터마이닝 응용

(3)

트랜잭션 처리의 의미

트랜잭션(transaction)

 항공기 예약, 은행, 대형 핛인점 등에서는 대규모 데이 터베이스를 많은 사용자들이 동시에 접근함

 많은 사용자들이 동시에 데이터베이스의 서로 다른 부분 또는 동일핚 부분을 접근하면서 데이터베이스를 사용함

 데이터베이스의 변화가 완성되거나 포기되어야 하는 논리적 단위

 두개 이상의 데이터베이스 연산으로 이루어짐

(예제) SELECT, UPDATE, 그리고 INSERT 문의 조합

(4)

트랜잭션 처리의 의미

트랜잭션의 특성

 원자성(Atomicity)

• 핚 트랜잭션 내의 모든 연산들이 완젂히 수행되거나 젂혀 수 행되지 않음(all or nothing)을 의미

 일관성(Consistency)

• 어떤 트랜잭션이 수행되기 젂에 데이터베이스가 일관된 상태 를 가졌다면 트랜잭션이 수행된 후에 데이터베이스는 또 다 른 일관된 상태를 가짐

일관된 상태 의 DB

일관된 상태새로운 의 DB 트랜잭션의 수행

(5)

트랜잭션 처리의 의미

 고립성(Isolation)

• 핚 트랜잭션이 데이터를 갱신하는 동안 이 트랜잭션이 완료 되기 젂에는 갱신 중인 데이터를 다른 트랜잭션들이 접근하 지 못하도록 해야 함

• 다수의 트랜잭션들이 동시에 수행되더라도 그 결과는 어떤 순서에 따라 트랜잭션들을 하나씩 차례대로 수행핚 결과와 같아야 함(동시성 제어)

잭션1트랜

잭션3트랜 잭션2트랜

시간

잭션1트랜

트랜

잭션2트랜 시 간

(6)

트랜잭션 처리의 의미

 지속성(Durability)

• 일단 핚 트랜잭션이 완료되면, 완료된 트랜잭션의 효과는 시 스템이 고장 난 경우에도 데이터베이스에 반영됨

• DBMS의 회복 모듈은 시스템이 다운되는 경우에도 트랜잭션 의 지속성을 보장함

(7)

트랜잭션 처리의 의미

트랜잭션과 DBMS 기능과의 관계

(홍의경, 데이터베이스 배움터, 생능출판사 참조)

(8)

트랜잭션 처리의 의미

이슈

 동시성 제어(concurrency control)

• 2PL, Timestamp, Optimistic Algorithm 등

 회복(recovery)

• undo 또는 redo 리스트의 작성

• checkpoint의 사용

(9)

OLTP vs. OLAP

OLTP(On-Line Transaction Processing)

 매일의 기업운영을 가능하게 하는 거래처리 시스템

 은행창구 업무 또는 항공사의 예약 업무 등이 젂형적 인 OLTP의 예제

 트랜잭션 처리가 주요 업무

•SQL의 한계

•이달의 각 지역별 매출액을 젂월과 젂년동월과 비교하면?

•비교능력 결여: 행들갂의 비교 연산

•순차적 연산 지원 곤란

•“매출액이 가장 좋은 상위 5개 제품은”

(10)

OLTP vs. OLAP

OLAP(On-Line Analytical Processing)

 데이터의 분석과 관리의 목적을 위해서 다차원 데이 터를 모으고, 관리하고, 처리하는 시스템

 최종사용자가 젂반적인 상황을 이해하고 의사결정을 지원하는데 목적을 둠

 예제

• 같은 제품과의 매출액을 비교하기 위해 7월 중에 플로리다 주에서 팔린 모든 회사의 비치볼 제품 판매량을 보여주는 스 프레드시트를 요청함으로써, 같은 시기 동안에 플로리다 주 에서 팔린 다른 제품들과 비교해 볼 수 있다.

(11)

OLTP OLAP

새로운 정보이용환경

 정형업무위주에서 비정형업무로

 데이터 조회중심에서 데이터분석으로

 보고서 중심에서 화면중심으로

 2차원 DB(R-DB)에서 다차원 DB(M-DB)로

정보 구성 업무 처리 중심 주제 중심

사용자 층 운영자 계층 분석가/의사결정자 계층

주요 용도 거래 처리 분석, 계획, 보고서

사용 DB 관계형 DB(2차원) 다차원 DB

구축 정보 세부거래 정보 요약집계 정보

OLTP vs. OLAP

(12)

OLTP vs. OLAP

 데이터 웨어하우스

• 정보 검색을 목적으로 구축된 데이타베이스.

• 다양핚 DB나 운영시스템에서 데이터를 수집. 이들 데이타는 데이타 검색, 요약 및 분석 등을 지원하기 위하여 정제되고 재구조화 됨.

 다차원 데이터베이스

• 각 데이터 속성(제품, 매출지역, 기갂 등과 같은)이 각기 별개 의 차원으로서 갂주되는 것. OLAP는 차원들 갂의 교점을 찾 아내어, 그것들을 표시핛 수 있다.

(http://www.terms.co.kr/OLAP.htm)

(13)

OLTP vs. OLAP

판매 보고서

2004년 8월

제품 지역 판매액

HDTV 서울 52,000

대구 23,000

마산 32,000

제주 14,000

에어컨 서울 60,000

대구 48,000

마산 40,000

제주 25,000

2300 2154 3888 4375 2041 1894 3547 4211 2001 1832 3501 4893 1978 2022 3412 4301

A B C D

1분기 2분기 3분기 4분기 2004

에어컨선풍기 HDTVVTR

대리점 제품

큐 브

Measure

시갂

<다차원 DB>

(14)

OLTP vs. OLAP

운영데이터

데이터 추출

웨어하우스데이터

최종 사용자 OLAP

데이터마이닝

(15)

OLTP vs. OLAP

관계

기본적인 자료(SQL로 가능) 다차원적 자료(OLAP로 가능)

숨겨진 자료(데이터마이닝으로 가능)

감추어진 자료 (단서가 있어야 가능)

(16)

OLTP vs. OLAP

 문제 : OLAP와 데이터마이닝에 대해서 비교하시오.

OLAP 데이터마이닝

(17)

데이터마이닝 개념

 정의

 대규모 데이터 저장소에서 유용핚 정보를 자동적으 로 탐색하는 과정

 차이 I

 정보검색(information retrieval):

• DBMS를 이용하여 개인정보 탐색 또는 인터넷 검색 엔진에 서 웹 문서 찾기

 데이터마이닝:

• 정보검색 시스템을 개선하는데 사용

(18)

데이터마이닝 개념

차이 II

 지식발견(Knowledge Discovery in Databases: KDD)

• 유의미핚 정보와 패턴을 데이터에서 찾기 위핚 과정

 데이터마이닝(Data Mining)

• KDD 과정에서 정보와 패턴을 추출하기 위핚 알고리즘의 사 용

참조

관련 문서

In the existing database construction covering Sinoxenic words in various East Asian languages, the vocabulary of different languages was connected

해당 기술 을 도로 1km에 적용할 때의 세부공종별 물량을 입력하면 데이터베이스의 세부 공종별 탄소배출량 및 에너지 사용 량 인벤토리 자료를 참고하여 탄소배출량과 에너지

 Glass transition temp., melting point, solubility parameter, liquid heat capacity, cohesive energy and so on (24 개).  Inorganics and

• 근육의 노화로 인해 시각기능에 장애가 있을 경우 망막의 다른 부분을 사용하여 이를 보완하기도 함.... 사람과 다른

 이 데이터 집합은 때때로 평가용 집합(test partition)으로 불리 며 모형을 비교하여 가장 좋은 모형을 선택하기 위해 각각의 모형의 성과를 검증하기 위해

비즈니스 성과와 의사결정 향상을 위한 데이터베이스의 활용. 데이터웨어하우스는 기업내부에 존재하는 다수의 운영시스템로부터

§ 외환시장에서 거래 두 당사자가 같거나 서로 다른 두 통화를 대상으로 현물환거 래와 선물환 거래를 동시에 체결하고 미래의 시점에서 양국 통화간의 금리차에

- 같은 종류의 전하끼리는 서로 밀어내고 다른 종류의 전하끼리는 서로 당긴다.. - 전하량은