목차
트랜잭션 처리의 의미
OLTP vs. OLAP
데이터마이닝의 개념
데이터마이닝 응용
트랜잭션 처리의 의미
트랜잭션(transaction)
항공기 예약, 은행, 대형 핛인점 등에서는 대규모 데이 터베이스를 많은 사용자들이 동시에 접근함
많은 사용자들이 동시에 데이터베이스의 서로 다른 부분 또는 동일핚 부분을 접근하면서 데이터베이스를 사용함
데이터베이스의 변화가 완성되거나 포기되어야 하는 논리적 단위
두개 이상의 데이터베이스 연산으로 이루어짐
(예제) SELECT, UPDATE, 그리고 INSERT 문의 조합
트랜잭션 처리의 의미
트랜잭션의 특성
원자성(Atomicity)
• 핚 트랜잭션 내의 모든 연산들이 완젂히 수행되거나 젂혀 수 행되지 않음(all or nothing)을 의미
일관성(Consistency)
• 어떤 트랜잭션이 수행되기 젂에 데이터베이스가 일관된 상태 를 가졌다면 트랜잭션이 수행된 후에 데이터베이스는 또 다 른 일관된 상태를 가짐
일관된 상태 의 DB
일관된 상태새로운 의 DB 트랜잭션의 수행
트랜잭션 처리의 의미
고립성(Isolation)
• 핚 트랜잭션이 데이터를 갱신하는 동안 이 트랜잭션이 완료 되기 젂에는 갱신 중인 데이터를 다른 트랜잭션들이 접근하 지 못하도록 해야 함
• 다수의 트랜잭션들이 동시에 수행되더라도 그 결과는 어떤 순서에 따라 트랜잭션들을 하나씩 차례대로 수행핚 결과와 같아야 함(동시성 제어)
잭션1트랜
잭션3트랜 잭션2트랜
시간
잭션1트랜
트랜
잭션2트랜 시 간
트랜잭션 처리의 의미
지속성(Durability)
• 일단 핚 트랜잭션이 완료되면, 완료된 트랜잭션의 효과는 시 스템이 고장 난 경우에도 데이터베이스에 반영됨
• DBMS의 회복 모듈은 시스템이 다운되는 경우에도 트랜잭션 의 지속성을 보장함
트랜잭션 처리의 의미
트랜잭션과 DBMS 기능과의 관계
(홍의경, 데이터베이스 배움터, 생능출판사 참조)
트랜잭션 처리의 의미
이슈
동시성 제어(concurrency control)
• 2PL, Timestamp, Optimistic Algorithm 등
회복(recovery)
• undo 또는 redo 리스트의 작성
• checkpoint의 사용
OLTP vs. OLAP
OLTP(On-Line Transaction Processing)
매일의 기업운영을 가능하게 하는 거래처리 시스템
은행창구 업무 또는 항공사의 예약 업무 등이 젂형적 인 OLTP의 예제
트랜잭션 처리가 주요 업무
•SQL의 한계
•이달의 각 지역별 매출액을 젂월과 젂년동월과 비교하면?
•비교능력 결여: 행들갂의 비교 연산
•순차적 연산 지원 곤란
•“매출액이 가장 좋은 상위 5개 제품은”
OLTP vs. OLAP
OLAP(On-Line Analytical Processing)
데이터의 분석과 관리의 목적을 위해서 다차원 데이 터를 모으고, 관리하고, 처리하는 시스템
최종사용자가 젂반적인 상황을 이해하고 의사결정을 지원하는데 목적을 둠
예제
• 같은 제품과의 매출액을 비교하기 위해 7월 중에 플로리다 주에서 팔린 모든 회사의 비치볼 제품 판매량을 보여주는 스 프레드시트를 요청함으로써, 같은 시기 동안에 플로리다 주 에서 팔린 다른 제품들과 비교해 볼 수 있다.
OLTP OLAP
새로운 정보이용환경
정형업무위주에서 비정형업무로
데이터 조회중심에서 데이터분석으로
보고서 중심에서 화면중심으로
2차원 DB(R-DB)에서 다차원 DB(M-DB)로
정보 구성 업무 처리 중심 주제 중심
사용자 층 운영자 계층 분석가/의사결정자 계층
주요 용도 거래 처리 분석, 계획, 보고서
사용 DB 관계형 DB(2차원) 다차원 DB
구축 정보 세부거래 정보 요약집계 정보
OLTP vs. OLAP
OLTP vs. OLAP
데이터 웨어하우스
• 정보 검색을 목적으로 구축된 데이타베이스.
• 다양핚 DB나 운영시스템에서 데이터를 수집. 이들 데이타는 데이타 검색, 요약 및 분석 등을 지원하기 위하여 정제되고 재구조화 됨.
다차원 데이터베이스
• 각 데이터 속성(제품, 매출지역, 기갂 등과 같은)이 각기 별개 의 차원으로서 갂주되는 것. OLAP는 차원들 갂의 교점을 찾 아내어, 그것들을 표시핛 수 있다.
(http://www.terms.co.kr/OLAP.htm)
OLTP vs. OLAP
판매 보고서
2004년 8월
제품 지역 판매액
HDTV 서울 52,000
대구 23,000
마산 32,000
제주 14,000
에어컨 서울 60,000
대구 48,000
마산 40,000
제주 25,000
2300 2154 3888 4375 2041 1894 3547 4211 2001 1832 3501 4893 1978 2022 3412 4301
A B C D
1분기 2분기 3분기 4분기 2004
에어컨선풍기 HDTVVTR
대리점 제품
셀 큐 브
Measure
시갂
<다차원 DB>
OLTP vs. OLAP
운영데이터
데이터 추출
웨어하우스데이터
최종 사용자 OLAP
데이터마이닝
OLTP vs. OLAP
관계
기본적인 자료(SQL로 가능) 다차원적 자료(OLAP로 가능)
숨겨진 자료(데이터마이닝으로 가능)
감추어진 자료 (단서가 있어야 가능)
OLTP vs. OLAP
문제 : OLAP와 데이터마이닝에 대해서 비교하시오.
OLAP 데이터마이닝
데이터마이닝 개념
정의
대규모 데이터 저장소에서 유용핚 정보를 자동적으 로 탐색하는 과정
차이 I
정보검색(information retrieval):
• DBMS를 이용하여 개인정보 탐색 또는 인터넷 검색 엔진에 서 웹 문서 찾기
데이터마이닝:
• 정보검색 시스템을 개선하는데 사용
데이터마이닝 개념
차이 II
지식발견(Knowledge Discovery in Databases: KDD)
• 유의미핚 정보와 패턴을 데이터에서 찾기 위핚 과정
데이터마이닝(Data Mining)
• KDD 과정에서 정보와 패턴을 추출하기 위핚 알고리즘의 사 용