• 검색 결과가 없습니다.

비즈니스 인텔리전스

N/A
N/A
Protected

Academic year: 2022

Share "비즈니스 인텔리전스"

Copied!
63
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

비즈니스 인텔리전스

2016.06

충북대학교 조완섭 wscho@chungbuk.ac.kr

(2)

목차

• 정보시스템

• 분석처리 시스템

• 비즈니스 인텔리전스

• DW & OLAP

• BI 구축방안

2016-09-30 충북대학교 (wscho@cbnu.ac.kr) 2

(3)

정보시스템

• 정보시스템 History

2016-09-30 충북대학교 (wscho@cbnu.ac.kr) 3

Master files, reports

Lots of master files – complex and data redundancy

Databases – single sources of data

for all processing (data sharing/integrity)

Databases & High performance Transaction Systems & 4GL ERP System

Internet-based Integration

DB 서버 / Web 서버 / 응용 서버 분리 Business Intelligence

(Data Warehouse & OLAP) 인터넷

1960

1965

1970

1975~

1990~ Big

DataBig Data Advanced Databases

2010

(4)

정보시스템

거래처리 시스템(OLTP)과 분석처리 시스템(OLAP)으로 구분

최근들어 다양한 기업정보 시스템에 빅데이터를 수용하여 확장하는 문제 가 중요한 이슈로 부각 => 특히 분석처리를 담당하는 BI 부문 확장

2016-09-30 충북대학교 (wscho@cbnu.ac.kr) 4

충북대학교 기업정보화지원센터

(생산/회계/ 인

ERP

사/판매 등) (기업간 거래SCM

정보시스템)

(고객관계CRM

관리 시스템)

비즈니스 인텔리전스

고객 협력사

통합 DB 거래처리시스템

분석처리시스템

Big Data

Big Data Big Data

(5)

거래처리 시스템

• 거래처리 시스템의 발전 : 통합DB 기반의 ERP

2016-09-30 충북대학교 (wscho@cbnu.ac.kr) 5

통합 DB

(생산/회계/ 인ERP

사/판매 등) (기업간 거래SCM

자동화 시스템)

(고객관계관리CRM

시스템)

SEM (BI)

(지능형 전략정보시스템)

ERP기반 전사적 자원관리

생산재무 회계판매 인사…BI SC

M

CR M

협력사 고객

수많은 애플리케이션들이 개별적으로 개발운영

상호 연계처리가 어려움

IT가 비즈니스의 발목을 잡는 현상이 심화됨 DB 중복 문제 심각

동일한 데이터를 여러 시스템에 여러 번 입력

정확한 데이터를 실시간으로 활용하는 것이 불가능

기존 시스템을 고쳐서 해결하는 것은 불가능

Global ERP 도입으로 단번에 best practice 실현 검증된 시스템을 도입한 후 교육을 통해

임직원들의 일하는 방식을 upgrade 하자.

Point-Solution

(6)

거래처리 시스템 - ERP

2016-09-30 충북대학교 (wscho@cbnu.ac.kr) 6

(7)

분석처리 시스템 (Business Intelligence)

• 필요성

– 데이터는 넘치나 의사결정에 필요한 정보는 부재한 상태를 극복 하기 위해 분석시스템 구축이 필수

– 전사적 통합/요약된 정보를 찾거나 장기간 추세파악이 중요함

– 특히 외부데이터는 물론 빅데이터까지 수집, 저장, 분석해야 함

– 궁극적으로 데이터 분석 기반의 과학적인 의사결정 정착

• 분석처리 시스템 관련 기술의 발전

– Databases, ERP 시스템 급속한 확산

=> 이질적 데이터베이스의 통합관리 기술

– 통합된 데이터의 고도 분석을 통한 정보발견과 예측 요구증대

⇒Database Integration, ETL 기술

⇒DW & OLAP, Data mining, ... (Business Intelligence) 기술

2016-09-30 충북대학교 (wscho@cbnu.ac.kr) 7

(8)

분석처리 시스템 (BI)

Business Intelligence

– [가트너] 비즈니스 인텔리전스는 조직의 의사결정과 성능을 개 선하기 위한 정보를 수집하고, 이를 분석하기 위한 응용, 인프 라, 도구, 베스트 프랙티스를 모두 포함하는 개념이다

 (an umbrella term that includes the applications, infrastructure and tools, and best practices that enable access to and analysis of

information to improve and optimize decisions and performance.).

– [위키피디어] 비즈니스 인텔리전스는 조직 내부 혹은 외부의 원 시 정보를 수집하고 비즈니스 분석을 위해 유용한 정보로 변환 하는 기술과 도구들의 집합이다

 (a set of techniques and tools for the acquisition and transformation of raw data into meaningful and useful information for business analysis purposes).

– 비즈니스 인텔리전스는 조직의 운영에서 전략에 이르는 광범위 한 비즈니스 의사결정을 지원함

2016-09-30 충북대학교 (wscho@cbnu.ac.kr) 8

(9)

• BI의 필요성

– 현대의 조직들은 정보화로 인해 데이터는 넘치지만 최고경영자 의 의사결정을 지원하는 데는 부족함

– 최고 경영자의 의사결정에는 조직 내부와 외부에 산재해 있는 과거부터 현재까지의 데이터를 모두 수집하고, 통합하고, 분석 하는 경우가 많음

2016-09-30 충북대학교 (wscho@cbnu.ac.kr) 9

Databases거래처리 의사결정용

Databases

직원 임원

주문대출 의사결정

전략수립

Databases거래처리거래처리 Databases

비즈니스 인텔리전스

분석처리 시스템 (BI)

(10)

분석처리 시스템 (BI)

• Data Warehouse 란 ?

– Collection of diverse data

 aimed at executive, decision maker

 subject oriented

 often a copy of operational data

 with value-added data (e.g., summaries, history)

 Integrated, historical, and non-volatile data – Collection of tools

 gathering data

 cleansing, integrating, ...

 querying, reporting, analysis

 data mining

 monitoring, administering warehouse

2016-09-30 CBU / MIS 10

(11)

분석처리 시스템 (BI)

• Two approaches in the analysis

– Query-Driven (Lazy) ; Limitation !

– Data Warehouse (Eager)

2016-09-30 CBU / MIS 11

Source

….

Source SourceSource SourceSource

Query-driven ? or

Data warehouse ?

(12)

분석처리 시스템 (BI)

• Query-Driven Approache

2016-09-30 CBU / MIS 12

Limitation

- Historical data ?

- Overhead in the OLTP systems

Client Client

Wrapper

Wrapper

Wrapper

Mediator

Source

Source

Source

Query &

Results &

Analysis

OLTP

OLAP OLTP

(13)

분석처리 시스템 (BI)

• Adv. Of Query-Driven

– No need to copy data

– Less storage

– No need to purchase data

– More up-to-date data

– Query needs can be unknown (ad-hoc queries)

– Only query interface needed at sources

2016-09-30 CBU / MIS 13

(14)

분석처리 시스템 (BI)

• Data Warehouse Approach

2016-09-30 CBU / MIS 14

Client Client

Warehouse

Source Source Source

Query & Analysis

Integration

Metadata

Extraction

Transformation Cleansing

Loading OLAP & Data Mining

(15)

분석처리 시스템 (BI)

• Adv. Of DW Approach

– High query performance (specialized indexes)

– Queries not visible outside warehouse

– Local processing at sources (OLTP) unaffected

– Can operate when sources unavailable

– Can query data not stored in a DBMS (queries on the integra ted database)

– Extra information at warehouse

– Summarize (store aggregates)

– Add historical information

– Sufficient meta data

2016-09-30 CBU / MIS 15

(16)

• ERP와 BI의 비교

– ERP는 조직내 업무 정보화 측면에서 효과가 있으나 전략적 의 사결정이나 성과 향상 측면에서는 회의적임 => BI 동기

– ERP는 기업 내부 업무 효율성 증진을 위해 정보통합과 거래처 리 효율성 증대를 추구; BI는 분석을 통한 의사결정 지원이 목표

2012-11-00 16

항목 ERP BI

정의 전사적 프로세스 통합

프로세스 혁신

운영계 시스템으로 현업지원

전사적 데이터 통합

데이터 혁신 (정제, 통합, 분석) 의사결정 지원

사용자 지원측

업무 트랜잭션 처리 시스템 통합된 기능지원

일부 리포팅 기능 내재 (현황위주 단순정보제공) 현재 데이터 활용중심

트랜잭션의 결과분석 시스템 통합되고 정제된 데이터 활용 수많은 리포팅 기능 (다차원분석)

과거에서 현재까지 시계열성 데이터 분석

데이터 분석 측면

운영계 데이터 활용 중심

OLTP 에서 제한된 분석정보 제공 전사적 데이터 통합과 분석

내부 뿐 아니라 외부 데이터까지 활용 목적별로 마트 구축

기업환경 변화에 유연한 대처

분석처리 시스템 (BI)

(17)

• 본 강좌에서는 BI 용어를 BA까지 포함한 것으로 확대사용

2016-09-30 충북대학교 (wscho@cbnu.ac.kr) 17

기존 DW & OLAP 분석 (BI) 빅데이터 분석 (BA)

분석대상 주로 과거데이터를 분석하여 현

황을 분석하는 정적 보고서 작성 과거와 현재 데이터를 실시간 수집하여 새로운 정보를 발견하고, 가까운 미래를 예측함

데이터특성 정형 데이터 위주의 적은 데이터

를 기존 컴퓨터에서 저장, 처리 다양한 유형의 데이터 (문서, SNS, IoT, 오 디오, 동영상 등)를 클라우드 등에 분산저 장, 분산처리함

분석특성 온라인, 다차원 분석위주 데이터마이닝, 통계기법, 기계학습 등 심 화분석과 가시화 중요

분석의 예 과거 수년간 매출정보를 분석하 여 지역, 시간, 제품, 고객별로 매 출을 집계함 (다차원 분석)

현재 실시간으로 발생하는 데이터를 바로 수집, 연계통합, 분석함으로써 미래 예측

- 대형사고가 터지기 전에 30개의 작은 사고 가 있고, 그전에 300개 징후가 있음 (빅데이 터로 예측하자 !)

- SNS, 블로그 등에 올라오는 고객불만을 실 시간으로 분석하면 적절한 대처가 가능함

분석처리 시스템 (BI)

Business Intelligence

(18)

비즈니스 인텔리전스

• 비즈니스 인텔리전스를 구성하는 요소 기술들

Data warehouse & Online analytical processing (OLAP)

– Analytics : data mining, text mining, process mining, predictive analytics and prescriptive analytics.

– Complex event processing,

– Business performance management, benchmarking

– Big data technology

– Reporting

• 비즈니스 인텔리전스 솔루션

– IBM사의 Cognos

– SAP 사의 Business Objects

– MS사의 Analysis Service

– SAS사의 BI 툴

2016-09-30 충북대학교 (wscho@cbnu.ac.kr) 18

수많은빅데이터용

오픈소스 BI Tools

Talend, Spark, R, Tableau, …

(19)

비즈니스 인텔리전스

• Architecture - 비즈니스 인텔리전스를 구현하는 시스템 구조

2016-09-30 충북대학교 (wscho@cbnu.ac.kr) 19

Data Sources Data Storage

EngineOLAP

Front-end Tools 시스템ERP

BI

BI

BI BI

BI BI

Tier 1 :

DataWarehousing

Tier 2 : OLAP분석처리

OLAP Server

Tier 3 : Client

일상업무처리 (OLTP)

지능적 업무처리

(20)

비즈니스 인텔리전스 - 사례

사례 : A 기업 구매담당 임원은 아침에 출근하여 구매 팀장 을 불러서 다음 지시함. 점심시간에 B사의 구매담당 임원을 만나 중요한 의사결정을 하기로 되어 있는데 오전 중으로 다 음 자료를 정리하여 보고 요망.

2012-11-00 20

A 고객사에 대한 매출분석 보고서

. 지난 3년간 년도별/분기별/월별 판매량과 매출액 . 지난 3년간 매출이익

. 지난 3년간 A 고객사의 부서별 서비스 지원 요청 회수

(21)

비즈니스 인텔리전스 - 사례

• 작업량 – 추정

2012-11-00 21

담당 팀장은 지시를 들으면서 “오늘 점심시간까지 될 수 있을지?” 라고 걱정하면서 자리로 돌아와서 팀원들을 불러 매출분석 보고서와 관련된 회의를 하였다.

한시간 후에 임원이 지시한 업무의 규모와 처리 절차가 분석되었는데 요약하면 다음과 같다.

- 공동 작업해야 할 팀의 수 : 3개 팀

- 공동 작업을 해야 할 자회사 : 1개 (전산외주회사) - 소요기간 (예측) : 6일

- 소요인원 (예측) : 현업 6명, 전산요원 4명 (5개 팀)

(22)

2012-11-00 22

소요기간 : 6일 (33 단계)

소요인원 : 현업 5명, 전산요원 4명 (4개팀)

1. 비즈니스 인텔리전스를 도입하지 않은 경우

(23)

2. 비즈니스 인텔리전스를 도입한 경우

2012-11-00 23

데이터 웨어하우스

(과거 data, 외부d ata)

OLAP 분석

비즈니스 인텔리전스

DBDB

DBDB OLTP 일상

업무 ERP

업무처리 단계 : 없음 소요시간 : 10분

소요인원 : 0명

(24)

비즈니스 인텔리전스 - 배경

• 비즈니스 인텔리전스를 도입하지 않은 기업

– 결국 임원은 점심시간에 A고객사 임원과의 회의에서 필요한 정 보를 보고받지 못한 채 회의장으로 가거나 혹은 미팅을 연기해 야 할 것임

– 이러한 문제는 기업과 공공기관 등 대부분의 조직에서 발생하 는 흔한 문제이며, CEO나 CIO가 BI의 필요성을 절실하게 느끼 는 이유도 여기에 있음

• 비즈니스 인텔리전스가 구축된 기업

– 이러한 분석은 실시간(온라인)으로 이루어짐

– 그것도 전산부서나 현업의 도움 없이 임원이 자신의 방에서 버튼 클릭 몇 번으로 원하는 자료를 그래픽 형태로 출력할 수 있게 됨

– 소요시간은 10분 이내이고, 소요인원은 0 명

2012-11-00 24

(25)

DW & OLAP

Data Warehouse (DW)

– 관리자의 의사결정을 지원하기 위하여 수집한 조직 내부 혹은 외부의 데이터로써 과거정보까지 포함할 수 있음

– 일반직원들의 거래처리를 위한 데이터의 집합으로 정의되는 데이터베이스와는 용도가 다름

– 비즈니스 인텔리전스를 구현하기 위한 데이터의 모음

특징

– 데이터 웨어하우스는 다음 네가지 특징을 가짐

주제 지향적(subjectoriented) 데이터

통합적(integrated) 데이터

시계열적(timevarient) 데이터

비휘발적(nonvolatile) 데이터

2016-09-30 충북대학교 (wscho@cbnu.ac.kr) 25

(26)

DW & OLAP

주제 지향성(subject-orientation)은 데이터를 주제별로 구성함

으로써 최종 사용자(end user)와 전산에 약한 분석자라도 이해 하기 쉬운 형태로 구성하는 것임

예: 매출액을 고객별로, 제품별로, 판매시간대별로, 지역별로 구성

통합성(integration)은 DW에 입력될 때 일관적인 형태(항목이

름, 측정값 단위, 일관된 코드 등)로 변환되어 연계, 통합됨

시계열성은 현재 데이터 뿐 아니라 과거 일정 기간 동안 발생

한 데이터를 포함하여 기간별 분석이 가능하게 함

비휘발성(nonvolatilization)로 DW에 일단 데이터가 적재되면

일괄 처리(batch) 작업에 의한 추가 및 삭제 외에는 변경 연산 이 수행되지 않음

매달(혹은 매주) 말에 한달㈜치 거래 내역이 추가되는 형태

2016-09-30 충북대학교 (wscho@cbnu.ac.kr) 26

(27)

DW & OLAP

OLAP (Online Analytical Processing) 정의

– 최종 사용자(분석가, 임원)가

– 다차원 정보인 DW에 직접 접근하여

– 대화식으로 정보를 분석하고

– 분석결과를 다양한 보고서 형식 (GUI)으로 출력하여

– 의사결정에 활용하는 과정

2012-11-00 27

DW

DB4 DB3

DB2

DB1

OLAP DM

ETL

files Data Mining

OLTP 영역 BI 영역

(28)

DW & OLAP

다차원 정보

– 다양한 각도에서 분석될 수 있는 정보 (매출액 등)를 의미함

2012-11-00 28

제품별로 매출액은 ?

기간별로 매출액은 ?

매출액의목표대비 실적은 ? 매출액은 ?권역별

매출액 데이타

제품별 매출액은 ?

제품별/권역별 매출액은 ?

제품별/권역별/분기별 매출액은 ? 세부제품별/도시별/월별 매출액은 ?

… (수많은 분석 질의) …

(29)

DW & OLAP

직접 접근 (온라인/실시간 분석)

– 전산부서와 같은 매개자를 거치지 않고 임원이나 사용자가 원하는 정보에 직접 접근하여 분석함을 의미함

2012-11-00 29

정보원 정보원

사용자

전산부서 사용자

< 기존의 분석방식 >

< OLAP 분석방식 >

(30)

DW & OLAP

대화식 분석

– 이전 분석질문 결과를 이용하여 다음 분석질문을 작성하는 방 식으로 다양한 분석을 수행함

2012-11-00 30

권역별 매출액의 전 년 동월 비교

결과는 ?

호남권의 매출액

전년 동월에 비해 감소

호남권에 속 각 도시

매출액 ?

목포시의 제품별 매출액 변화는 ?

…. (PC가 문제) 온라인/대화식 분석 처리가 중요함

(31)

DW & OLAP - 예제

2012-11-00 충북대-경영정보학과 31

권역 전체 변수 매출액 유형 실적 권역별 당월(3월) 전월 전년동월 전년동월대비증감 (%) 수도권 67,500 43,600 61,500 10 충청권 45,500 32,000 56,000 (19) 영남권 55,300 46,500 66,700 (17) 호남권 43,200 33,900 56,000 (23) 권역 호남권 변수 매출액 유형 실적

도시별 당월(3월) 전월 전년동월 전년동월대비증감 (%) 광주 8,900 9,000 8,500 5 전주 7,800 7,200 7,200 8 군산 5,500 6,100 6,800 (19) 목포 4,500 5,800 7,100 (37) 권역 목포 변수 매출액 유형 실적

제품별 당월(3월) 전월 전년동월 전년동월대비증감 (%) 냉장고 7,500 3,600 6,500 15

TV 5,500 2,000 6,000 (8) 스마트폰 5,300 6,500 5,700 (7) PC 3,200 3,900 6,000 (47)

지역별/제품별/월 별 매출정보

데이터 웨어하우스

다양한 분석

OLTP DB

다양한 분석 다양한 분석

판매 데이타

목포지역의 C 판매량 ?

실시간/대화식 분석

(32)

DW & OLAP - 예제

• GUI를 활용한 시각화

– 현황이나 추세를 수치보다는 그래프 형태로 보여줌

2012-11-00 2016-09-30 충북대-경영정보학과 32

(33)

DW & OLAP과 OLTP 비교

2012-11-00 33

OLTP OLAP

Mostly updates

Many small transactions Mb-Tb of data

Raw data

Clerical users Up-to-date data

Consistency, recoverability critical

Mostly reads

Queries long, complex Gb-Tb of data

Summarized, consolidated data Decision-makers, analysts

Historical data

Integration critical

ERP 업무처리의 대부분

예: 은행거래 (입출금, 이체), 주문처리 등

최근 3년간 강남지역의 매출액 추세 ? 지역별/상품별 매출액은 ?

지역별/상품별/년도별 매출액은 ?

지역별/상품별/특정년도의 월별 매출액?

(34)

BI 구축 방안

전사적 공감대의 형성

데이터가 전사적으로 다양한 부서에서 추출되고 통합 분석되어야 하며, 분석 결과가 해당 부서에서 활용되어 지능 높은 비즈니스로 연결되어야 함

현업 요구 사항에 대한 단계별 수용

DW가 한꺼번에 모든 문제를 해결할 것이라는 지나친 기대는 금물

단계별로 Pilot 시스템 구축 =>사용 => 평가 및 feedback 과정을 반복하여 점진적으로 최적화됨

Business-Oriented

기술적 문제보다 business 전략에 초점을 맞추는 것이 중요하며, 기존 시스 템에서 불가능한 비즈니스 전략을 보여주어야 함

DW 구축 안이 business 부서에서 나와야 하며, 주관부서를 명확히 해야 함

“분석을 위한 분석”으로 전락하는 것을 경계해야 하며, 구축 대상이 되는 업 무 영역이 명확해야 함

2012-11-00 34

(35)

BI 구축 방안

시스템 측면의 유의사항

– 데이터의 quality 보장방안 수립

– 데이터 (과거 데이터와 외부 데이터까지 포함)와 사용자 증가로 인한 성능 고려

– 사용자의 정보조회 유형의 변경과 확대를 고려 (유연성 => 구 축보다는 도구 활용)

– 부하가 큰 ETL 부분 (운영시스템 성능저하) 최적 자동화 방안

– 시스템 구축 이후에도 전담 팀의 유지

개발된 시스템의 평가와 지속적인 개선

IT팀/Business팀 사이의 communication 채널

2012-11-00 35

(36)

BI 구축 방안

BI 구축의 접근방법

– EXCEL 기반 (구식)

– Relational Database 기반

 의사결정용 데이타베이스 구축과 분석 프로그램 작성 – BI tool 기반

 부서별로 Data marts 구축 => Enterprise DW 통합구축

 EDW 설계 및 구축 => Data marts 구축

– 기간, 초기 비용, 위험요소, 분석의 난이도 등을 고려하여 결정함

2012-11-00 36

(37)

BI 구축 방안

Excel-based approach

– 담당자만이 이해 가능한 모델 (예: 수십 개의 엑셀 sheet가 복잡 한 수식으로 연결되어 있음)

– BI 업무의 특성상 프로세스 단계별 조정 사항이 매우 빈번하며, 수작업 프로세스로 인한 처리비용 증가 (시간, 정확도, 인력 등)

– 데이터 공유가 어려우며, 타 시스템과의 인터페이스도 어려움

– 구조 변경의 요구사항에 대처하기 어려움 (예: 조직의 변경, 제 품의 추가)

– 깊이 있는(상세 레벨) 분석모델을 운영하기 어려움(예: 지점별, 상품별,월별 매출액 등 다차원 분석)

2012-11-00 37

(38)

Multidimensional Data Model

2016.06

충북대학교 조 완섭

비즈니스 인텔리전스

(39)

목차

• 다차원모델

• Cube Operators

• Star Schema

• 실무사례

2012-11-00 39

(40)

다차원 모델

• 다차원 배열 구조(cube)로 DW 데이터 저장, 관리

2012-11-00 40

Time (quarter)

Item (types)

TV …..

Computer Phone Car

Vancouver

ALL

Sales amount of Sales amount of

Computer in Vancouver during Q1

Q1

Q2

Q3

Q4

Chicago New York Toronto

실세계정보

Cube

(41)

다차원 모델

• Tables vs. Cubes

2012-11-00 41

sale prodId storeId amt

p1 c1 12

p2 c1 11

p1 c3 50

p2 c2 8

c1 c2 c3

p1 12 50

p2 11 8

Table view: 2-D cube:

dimensions = 2

(42)

다차원 모델

• Tables vs. Cubes

2012-11-00 Customer (custId) 42

Store

P1

p50 P2

1 53 111

C100

….C3

C2

C1

60 50

40 150

Store

(storeId)

<1,12>

<5,50>

<2,11>

<qty, price>

sale oderId date custId prodId storeId qty amt

100 1/7/97 53 p1 c1 1 12

102 2/7/97 53 p2 c100 2 11

105 3/8/97 111 p1 c3 5 50

price

3-D cube

(43)

2012-11-00 43

MOLAP - CUBE Operators

• Han’s book 그림

2016-09-30 CBU / MIS 43

OLAP 연산자

Cube Operators

Dice

Roll-up

Slice

Drill-down

Pivot Combination of cube operators

=> 복잡한 분석

(44)

CUBE Operators

Pivot

행과 열의 위치를 바꾸는 연산자

Roll-up

차원 계층을 따라서 상위 레벨에 대한 집계치를 계산하는 연산

예를들어, 날짜별 판매량에서 주별, 혹은 월별 판매량을 구할 때 사용됨

Drill-down

차원 계층을 따라서 하위 레벨에 대한 집계치를 계산하는 연산

예를들어, 월별 판매량에서 주별, 혹은 날짜별 판매량을 구하는데 사용됨

Slice

한 차원에 대하여 주어진 값으로 selection한 결과 (subcube)를 산출하는 연산

예를들어 slice for time = "Q1"은 time 차원에서 하나의 값 (Q1)으로 셀렉션하여 생성됨

Dice

두 차원 이상에 대하여 주어진 값들로 selection한 결과 (subcube)

location, time, item 세 차원에서 selection 된 결과 subcube를 만들 때 사용됨

Drill-across

두 개 이상의 사실 테이블을 포함한 질의를 수행할 때 사용되는 연산자

Drill-through

큐브에서 해당 소스 데이터베이스 (관계형 데이터베이스 테이블)까지 접근하여 관련 raw data를 검색하는 연산

2012-11-00 44

(45)

CUBE Operators

Ranking (Sorting) the top/bottom N items

최고치 (혹은 최소치)로부터 차례로 N개를 선택하는 연산

매출량이 가장 높은 (낮은) 10개 상점은 ?

이 밖에도 큐브에 대한 다양한 연산자들이 제안되고 있음

Moving average

Growth rate

Interests

Internal rate of return

Depreciation

Currency conversion

Statistical functions

2012-11-00 45

(46)

CUBE Operators - 예제

분석의 예제

분기별 sales amount ? (slice)

1분기 도시별, 제품별 sales amount ? (dice)

월별 (혹은 날짜별) sales amount ? (drill down)

도시별 sales amount ? (slice)

제품별 sales amount ? (slice)

분기별, 도시별 sales amount ?

분기별, 도시별, 제품별 sales amount ?

월별, 도시별 sales amount ?

월별, 도시별, 제품별 sales amount ?

1분기 New York에서 제품별 sales amount ?

Computer 제품의 도시별 sales amount ?

Computer 제품의 도시별, 분기별 sales amount ?

휴일 동안에 Vancouver 에서 판매된 자동차의 sales amount ?

(조건에 따라서 무수히 많은 질문이 가능하며, OLAP은 이러한 질의를 효과적으로 작성하고, 빠르게 분석할 수 있어야 함)

2012-11-00 46

Time(quarter)

Item (types)

TV …..

Computer Phone Car

Vancouver Q1 Q2 Q3 Q4

Chicago New York Toronto

(47)

CUBE Operators vs. SQL

2012-11-00 47

Multi-dimensional cube Relational Table

day 2 p1 c144 c24 c3

p2 c1 c2 c3

p1 12 50

p2 11 8

day 1

c1 c2 c3

p1 56 4 50

p2 11 8

p1 p2 c1 56 11 c2 4 8 c3 50

Select ProdId, StoreId, sum(amount) From Sales

Group by ProdId, StoreId

c1 c2 c3 sum 67 12 50

sum p1 110 p2 19

subcube

Dice

Pivot

summary

sale prodId storeId date amt

p1 c1 1 12

p2 c1 1 11

p1 c3 1 50

p2 c2 1 8

p1 c1 2 44

p1 c2 2 4

p1 c1 56 p1 c2 4 p1 c3 50 P2 c1 11 P2 c2 8

(48)

Star Schema

• Relational Implementation of Cubes

2012-11-00 48

Time(quarter)

Item (types)

TV …..

Computer Phone Car

Vancouver Q1 Q2 Q3 Q4

Chicago New York Toronto

TimeTid DayWeek Month Quarter Year

Location SidCity

Province Country

ItemPid Model Pname Category SaleTid

PidSid

QtyUnit_Price

(49)

Star Schema

• Q1 : 년도별, 월별 판매금액 합계

2012-11-00 49

SELECT year, month, SUM(Qty*Unit_Price) FROM Sales S, Time T

WHERE S.time_key = T.time_key GROUP BY year, month;

year month SUM

2005 1 200

2005 2 250

2005 3 530

... ... ...

2006 1 330

2006 2 420

... ... ...

TimeTid DayWeek Month Quarter Year Location SidCity Province Country

ItemPid Model Pname Category SaleTid

PidSid

QtyUnit_Price

(50)

Star Schema

• Q2 : Q1에 대한 roll-up / drill-down 연산

2012-11-00 50

SELECT year, SUM(dollars_sold) => year, month, SUM(dollars_sold) FROM Sales S, time T

WHERE S.time_key = T.time_key

GROUP BY year => year, month

year SUM 2005 2200 2006 3250 2007 6530 ... ...

year month SUM 2005 1 200 2005 2 250 2005 3 530 ... ... ...

2006 1 330 2006 2 420 ... ... ...

Rollup Drill down

TimeTid DayWeek Month Quarter Year Location SidCity Province Country

ItemPid Model Pname Category SaleTid

PidSid

QtyUnit_Price

(51)

Star Schema

Q3) Slice for time = "Q1"

SELECT S.*

FROM sales S, time T

WHERE S.time_key = T.time_key AND T.quarter = "Q1";

Q4) Dice for

(location.city = "Toronto" or "Vancouver") AND (time.quarter = "Q1" or "Q2") AND

(item.item_name = "entertainment" or "PC")

SELECT S.*

FROM sales S, time T, item I, location L

WHERE S.time_key = T.time_key AND

S.lication_key = L.location_key AND S.item_key = I.item_key AND

(T.quarter = "Q1" or T.quarter = "Q2") AND (L.city = "Toronto" or L.city = "Vancouver") AND

(I.item_name = "entertainment" or I.item_name = "PC");

2012-11-00 51

(52)

실무사례

실무사례 구축

2016-09-30 CBU / MIS 52

1. DW 요구사항 분석

Sales 전략을 수립하고 실행을 담당하는 Sales Manager는 다양한 분석을 기반으로 의사 결정을

수행하기 위하여 회사의 자재 (materials), 고객(customers), 판매 조직(sales organizations)에 대한 정보와 판매기록에 관한 정보를 (1)~(4)의 sample data와 같이 관리한다.

(1) Material Tables

(53)

실무사례

2016-09-30 CBU / MIS 53

(2) Sale Organization data

(54)

실무사례

2016-09-30 CBU / MIS 54

(3) Customer Tables

(55)

실무사례

2016-09-30 CBU / MIS 55

(4) Sales Data

- 2010년 1월부터 2012년 12월까지 월별 5개씩의 레코드를 추가하여 총 36 * 5 = 180개 정도의 레코드를 입력하시오 (각 필드의 값은 랜덤하게).

- 각 material 별로 unit of measure 값이 선택될 수 있도록 Sales data에 대한 입력폼을 만들어 보시오 (form 만드는 방법 숙지).

(56)

실무사례

2016-09-30 CBU / MIS 56

(57)

실무사례

2016-09-30 CBU / MIS 57

이상의 데이터를 사용하여 다음과 같은 스타 스키마로

구축한다.

(58)

실무사례

2016-09-30 CBU / MIS 58

그림 1-1의 스타 스키마에 대하여 다음과 같은 분석을 실행한다 : SQL로 작성

Customer Name별로 판매금액의 합계는 ?

• 고객이 거주하는 도시별로 판매금액의 합계는 ?

제품 카테고리별로 판매금액의 합계는 ?

제품 이름별로 판매금액의 합계는 ? \

매장이 위치한 도시별로 판매금액의 합계는 ?

매장별로 판매금액의 합계는 ?

• 년도별 Sales Revenue의 합계는 ?

• 년도별, 월별 Sales Revenue의 합계는 ?

• 년도별, 월별, 주별 Sales Revenue의 합계는 ? (주 : 1주 ~ 53주)

• 제품별, 년도별 Sales Revenue의 합계는 ?

비오는 날에 Sales Revenue의 합계는 ?

환율이 높은 시기/중간/낮은 시기에 제품별로 Sales Revenue의 합계는 ?

(59)

실무사례

2016-09-30 CBU / MIS 59

그림 1-1에서 다음과 같은 분석이 불가능하다. 이러한 분석이 가능하도록 1-1의 스타 스키마를 확 장하고, 적절한 데이터베이스를 로딩한 다음에 분석을 하시오.

고객이 거주하는 도시별로 Sales Revenue의 합계는 ?

고객이 거주하는 도시를 EAST, MIDWEST, WEST로 구분한 지역으로 묶는다고 가정할 때 각 지역별로 Sales Revenue의 합계는 ?

고객의 성별로 Sales Revenue의 합계는 ?

고객의 연령대별 Sales Revenue의 합계는 ? (10대, 20대, ..., 60대)

Material 테이블에서 각 항목을 4개의 categories인 Food, Furniture, Electronics, Others 으로 묶은 다음에 각 category별로 Sales Revenue의 합계는 ?

앞에서 각 category별로 년도별 Sales Revenue의 합계는 ?

(60)

Access DB

• Database – star schema

2016-09-30 CBU / MIS 60

(61)

분석 예제

• Customer Name별로 Sales Revenue의 합계는 ?

2016-09-30 CBU / MIS 61

SELECT cust.이름, count(*) as 구매회수, sum(단가*판매량) as 구매금액 FROM cust INNER JOIN sales ON cust.고객번호 = sales.Cust

Group By cust.이름;

(62)

분석 예제

• Customer의 고객거주 도시별로 Sales Revenue의 합계는 ?

2016-09-30 CBU / MIS 62

SELECT cust.주소시, count(*) as 구매회수, sum(단가*판매량) as 구매금액 FROM cust INNER JOIN sales ON cust.고객번호 = sales.Cust

Group By cust.주소시;

(63)

BI 구축 방안

RDB-based approach

– DB 설계와 분석용 DB 구축 및 응용 프로그램 개발에 시간 소요

– 변화에 대한 유연성 부족(예: 대부분의 프로세스를 프로그램 로직으로 구현하므로 환경 변화를 반영하는데 노력이 필요)

– 분석과 리포팅을 위한 별도의 작업을 필요로 함

Packaged (BI) solution

– 상기 방식의 단점은 대부분 해결되나 도구 자체의 내부적인 체 계로 인해 그 방법론과 처리 절차에 맞추어야 함 (교육 필요)

– 초기 가격적인 부담 (SW, 컨설팅 비용)

– Tool에서 제공하지 않는 기능을 추가하는 것이 어려움

– Multi-dimensional data model (vs. Star Schema) 활용

2012-11-00 63

참조

관련 문서

소피아

비즈니스 성과와 의사결정 향상을 위한 데이터베이스의 활용. 데이터웨어하우스는 기업내부에 존재하는 다수의 운영시스템로부터

u-커머스에서는 생활, 경제, 산업, 교통공간과 그 곳의 사물, 기계, 상품 등 필요한 모든 것에 센서, 칩, 마이크로 머신, 무선인식 태그 등이

정보기술과 정보시스템은 기업이 새로운 제품, 서비스, 비즈니스 모델 등의 개발이 가능하도록 함.. 새로운 제품, 서비스, 비즈니스

인간 운동을 분석하기 위한 운동학적 개념.. Kinematics Concepts for Analyzing

• 젂자적읶 네트워크를 통하여 비즈니스 프로세스를 완성함으로써 젂자적으로 비즈니스를 하여, 물리적읶 비즈니스 프로세스를 위핚 정보를 대체하는 홗동 (Weill and

– 데이터 마이닝 기법은 통계학에서 발전한 탐색적자료분석, 가설 검정, 다변량 분석, 시계열 분석, 일반선형모형 등의 방법론과 데이터베이스 측면에서 발전한

제1절 서비스 비즈니스 기획1. 서비스 비즈니스 기획의