제5장 데이터베이스
데이터 관리
데이터베이스 접근법
관계형 데이터베이스 모델
데이터베이스 관리 시스템
데이터베이스 유형과 추세
데이터 계층
데이터베이스
파일
레코드
필드 홍길동 (고객이름)
고객번호, 고객이름, 고객전화번호 (고객레코드) 1 김갑돌 011-123-9876 (고객파일) 2 나울자 016-660-4989
3 홍길동 010-333-3535
고객파일 (판매 데이터베이스) 상품파일
판매원파일
데이터 개체, 속성과 기본 키
개체(entity)란 데이터가 수집되고 저장되 는 대상으로서 사람, 장소, 사물 혹은 사건 을 가리킨다.
속성(attribute)이란 개체의 특성이다.
기본 키(primary key)는 레코드를 독특하 게 식별해줄 수 있는 하나의 필드 혹은 필 드의 집합이다.
기본 키
속성(필드) 개체 = 고객
경동무역 레코드
파일의 종류 124
프로그램 파일(program file): 소프트웨어 명령문들을 포함하는 파일
데이터 파일(data file): 데이터를 포함한 파일
마스터 파일(master file): 일반적으로 주 기적으로 갱신되는 상대적으로 영구적인 레코드들을 포함하는 데이터 파일
거래파일(transaction file): 마스터 파일에 가해질 변경 내용을 일시적으로 저장하는 파일 e.g., 주소변경내역
전통적인 데이터관리 125
급여
응용프로그램
송장처리 응용프로그램 급여파일
송장파일
보고서
보고서
재고파일 재고관리 보고서 응용프로그램
데이터 응용프로그램 사용자
데이터베이스 접근법 127-128
급여
응용프로그램
송장처리 응용프로그램 급여데이터
송장데이터 재고데이터
보고서
보고서
재고관리 보고서 응용프로그램 DBMS
응용프로그램 사용자
데이터베이스
관계형 데이터베이스 모델 (relational database model)
관계형 데이터베이스 모델은 데이터베이 스에 데이터를 저장하기 위해 논리적으로 관련된 2차원 테이블 혹은 파일을 이용한 다.
관계(relation)란 관계형 데이터베이스 모 델에 있어서 2차원 테이블을 의미한다.
종업원번호가 기본 키이다.
옆에 키 아이콘이 나타나 있다.
Microsoft Access를 이용하여 어떻게 종업원 파일에 대한 자료사전을 만들 수 있는지 보여준다.
자료사전은 필드이름, 데이터 형식, 필드크기 등에 대한 데이터를 가지고 있다.
외래 키
기본 키
종업원 테이블에 나타난 부서명은 외래 키(foreign key)이다.
무결성 제약
(integrity constraint)
관계형 데이터베이스에서는 외래 키에 의 해 두 파일이 서로 논리적으로 연결되어 있다.
부서 테이블에서 어느 두 부서도 같은 이 름을 가져서는 안되고, 어느 종업원에게도 부서 테이블에 없는 부서명이 할당되어서 는 안된다.
데이터베이스 관리 시스템 132
질의
고객거래처리
DBMS 저축예금처리
응용프로그램
신용카드처리 응용프로그램
대출처리 응용프로그램
고객 데이터베이스
DBMS는 아래와 같은 5가지 소프트웨어 요소를 가진다.
DBMS 엔진
데이터정의 하위시스템
데이터조작 하위시스템
어플리케이션 생성 하위시스템
데이터 관리 하위시스템
데이터 정의 하위시스템 133
데이터 정의 하위시스템은 자료사전을 만 들고 관리하는 것과 데이터베이스 파일의 구조를 정의하는 것을 도와준다.
데이터베이스 개발자는 Oracle 8이나 IBM 의 DB2와 같은 데이터베이스 관리 시스템 에서 데이터 내용, 관계, 그리고 구조를 명 시하고 수정하기 위해서 데이터 정의어
(data definition language, DDL)를 이용 한다.
자료사전을 만든다는 것은 데이터베이스가 포함할 정보 의 논리적 속성(logical property)을 정의하는 것이다.
논리적 속성 예
필드 이름 유형
형식
디폴트 값
종업원 번호, 종업원 이름, 입사날짜 텍스트, 날짜/시간
전화번호에 대한 지역코드가 필요한가?
데이터가 입력되지 않을 경우 주어지는 값은?
데이터 조작 하위시스템 134
DBMS의 데이터 조작 하위시스템은 데이 터베이스에서 데이터를 추가, 갱신, 삭제 할 수 있도록 해준다.
데이터 조작 도구에는 뷰(view), 보고서 생성기, QBE(query-by-example) 도구, 그리고 SQL(structured query language) 이 있다.
View
뷰는 데이테베이스 파일의 내용을 보고, 원하는 변경을 하고, 정렬(sorting)을 하도 록 한다.
정렬하기
찾기
Microsoft Access에 있어서 뷰
종업원 테이블에서 선택된 4개의 필드
보고서 생성기
서울 종업원 QBE
서울 종업원: 쿼리 실행결과
SQL(Structured Query Language)
SQL 질의의 기본적인 포맷은 아래와 같다.
SELECT ________
FROM ________
WHERE ________
관계형 데이터베이스 사례:
비디오 대여점 139
개체:
개체간 관계
1:1
1:N
M:N
관계(relation):
고객(고객전화번호, 고객이름, 고객주소) 영화(영화이름, 대여요금, 대여여부)
대여(고객전화번호, 영화이름, 대여날짜, 반납 예정날짜, 회수날짜, 요금수납액)
데이터베이스 유형 141
운영적 데이터베이스
(operational database)
분산 데이터베이스
외부 데이터베이스
하이퍼미디어 데이터베이스
텍스트
텍스트 비디오 오디오
이미지
오디오
하이퍼미디어 데이터베이스
실제
예상
A B C D 상품
지역
서울 부산 대구
다차원 데이터 분석 143
온라인 분석처리 144
(online analytical processing, OLAP)
다차원 데이터 분석에 대한 다른 용어는 온라인 분석처리
OLAP은 대량의 데이터를 다양한 관점으 로 조작하고 분석할 수 있는 능력
데이터 웨어하우스(data warehouse)
데이터 웨어하우스는 쉽게 보고서를 만들 수 있도록 흩어져 있는 주요 운영 데이터 를 통합하여 문제를 해결한다.
데이터 웨어하우스(data warehouse)는 회사 전체 관리자에게 관심이 있는 현재 및 역사적 데이터를 저장하는 데이터베이 스로서 보고서 작성과 질의 도구를 갖추고 있다.
데이터 웨어하우스는 의사결정을 지원한 다.
내부 데이터베이스
외부 데이터베이스
추출, 변환
데이터 웨어하우스
데이터 접근과
분석
- 질의와 보고서 - OLAP
- 데이터 마이닝
데이터 웨어하우스
조직 전체 데이터 웨어하우스
생산 회계
광고
판매 유통
마케팅
데이터 마트: 데이터 마트:
데이터 마트(data mart)는 데이터 웨어하우스의
부분 집합으로서 특정 기능이나 그룹의 사용자를 위해 별도로 만든 데이터베이스이다. 145
패턴
데이터베이스 선택된 데이터 데이터 웨어하우스 선택
데이터 전환
데이터
마이닝 비즈니스
지식 해석
데이터 마이닝은 의사결정을 지원하고 미래 행동을
예측하기 위해 사용될 수 있는 패턴과 규칙을 찾기 위해 데이터를 분석하는 것이다.
데이터 마이닝의 응용
응용 설명
고객이탈 경쟁자에게 가버릴 가능성이 있는 고객을 예측한다.
직접마케팅 전화 권유나 직접 우편과 같은 직접 마케팅 캠페인에 가 장 잘 반응할 가능성이 있는 고객을 식별한다.
사기 탐지 사기이거나 비합법적일 가능성이 있는 거래를 찾는다.
시장-바스켓 분석 동시에 구매할 제품과 서비스를 식별한다.
시장 세분화 고객이 누구인지 혹은 무엇을 선호하는지에 기초하여 고 객을 그룹화 한다.
추세분석 어떻게 매출액과 같은 주요 변수가 시간이 흐름에 따라 서 변화하는지 분석한다.