• 검색 결과가 없습니다.

정보자원관리와 데이터자원관리

N/A
N/A
Protected

Academic year: 2022

Share "정보자원관리와 데이터자원관리"

Copied!
64
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

학습목표

제11장

정보자원관리와 데이터자원관리

 정보자원관리의 다섯 가지 요소를 배운다.

 정보자원관리 측면에서의 데이터자원관리를 살펴본다.

 전통적인 데이터자원관리의 개념과 기술을 배운다.

 빅데이터 시대의 개념과 기술을 배운다.

(2)

목 차 _ 제 11장

11-1 정보자원 관리의 다섯가지 요소 11-2 데이터자원관리

11-3 빅데이터

(3)

11-1 정보자원관리의 다섯 가지 요소

 정보와 같은 자원을 획득하기 위해서는 비용이 발생하게 되고, 정보 자원을 이용함으로써 부가 가치를 창출할 수가 있음

 이러한 자원을 효과적인 관리를 수행하기 위해서 정보자원관리(IRM:

Information Resource Management)의 개념이 등장하기 시작함

 정보자원관리는 효율성보다는 효과성을 강조하는 개념이며 정보만의 관리를 의미하는 것이 아니고, 정보 기술의 모든 요소의 관리를 의미 함

정보자원관리

<그림 11-1> 정보자원관리의 분류

(4)

11-1 정보자원관리의 다섯 가지 요소

 1950년대에 정보는 제품 또는 서비스를 설계, 생산, 유통과 관련되어 어쩔 수 없이 만들어지는 서류상에 표현되는 것을 의미했음

 1960년대에 정보는 조직의 활동을 위한 일반적 지원을 수행하는 역할로써 그 인식이 변화

 1970년대에 정보는 시스템에 의해 수집되고 가공되어 조직에 대한 통제를 줄 수 있는 도구로 인식되었음

 1980년대 중반부터 정보는 기업의 전략 자원으로 간주되기 시작되었음

 궁극적으로 기업의 정보 관리는 지식 관리(knowledge management)로 확대 되어야 함

정보관리 및 지식관리

종이호랑이 로서의 정보

일반적 지원을 수행하는 정보

경영을 위한 정보

전략차원으로서의 정보

1950년대 1960년대 1970년대 1980년대

중반

<일반적인 정보 개념의 시대적 변화 (Laudon and Laudon, 1990)>

(5)

데이터 고객구매자료

정보

고객별 구매패턴

지식

고급맥주와 기저기를 함께 두면 이익이 증가

$$

품목 함께

구매하는 % 기저귀 - 맥주 85%

빵 - 버터 60%

초콜릿- 피넛 버터

40%

데이터-정보-지식의 비교

(6)

구분 자료 정보 지식

구조화 쉬움 단위 필요 어려움

객관성 객관적, 단순관찰 중간, 가공 필요 주관적

기계화/계량화 쉬움 합의 필요 어려움

전파 쉬움 손실 발생 어려움

부가가치창출 적음 중간 많음

학습 관련 없음 관련 없음 학습의 결과물

의사결정 관련 적음 객관적 사용 주관적 사용

신념 관련 없음 관련 없음 관련됨, 특정

관점/입장

행동 관련 없음 관련 없음 많음

의미 적음 있음 많음

자료, 정보, 지식의 차이

(7)

지식의 속성

지식의 고유 속성 지식 경영에 주는 시사점

• 암묵지를 형식지로 표현하는 것은 한계가 있음

• 선점의 효과가 표준화 및 가격 경쟁력에 영향을 줌

• 운전 매뉴얼을 읽었다고 운전할 수 있는 것이 아님

• 산수를 알아야 수학을 논할 수 있음 (성숙의 개념이 중요함)

• 사용하면 할수록 새로운 부가 지식이 생산됨

• 사용할 수록 다음 단계의 지식 습득 능력이 가속됨

• 지식과 지식이 합쳐질 때 더욱 가치 있는 지식이 생성

• 지식을 나누어도 원소유자의 지식이 없어지지 않음

긍정적 측면

부정적 측면

• 생산성과 품질에 직결될 수 있음

• 모방이 어려운 핵심 역량의 구축이 가능

• 다른 자원에 비해 투자 대비 효과가 매우 커질 수 있음

무한한 부가가치 창출이 가능함

상식적 접근으로는 성과를 내기 어려움

• 사람의 수준과 능력을 바꾸는 작업임

• 인간의 행동 양식, 욕구를 반드시 고려 해야만 함

• 단기간에 성공할 수 없음

• 개념이 혼동되어 정보만 축적하기 쉬움

생성,이전이 쉽지 않다

사용해도 줄지 않는다

나눌수록 효과가 크다

사람과 연관 있음

지식은 규모의 경제 뿐만 아니라 범위의 경제를 가지는 것으로써 잘 선정하고 활용하면 무한한 부가가치가 확보할 수 있으며 지속적인 경쟁 우위 요소로 작용할 수 있음

(8)

정보의 정성적 가치

관련성(Relevancy) ***

– 정보는 현안의 문제 또는 수혜자의 요구 에 적합한 것이어야 하는데, 이를 정보의 관련성이라고 한다.

정확성(Accuracy) ****

– 이상적으로 모든 정보는 내용상 오류가 없이 정확해야 하지만, 현실적으로는 정 확성의 수준을 향상시키는 일은 비용을 수반한다. 예) WTC건물 높이(상대적 정 확성), 누가 WTC 테러를 사주했을까?

적시성(Timeliness) ****

– 필요시점에 정보가 제공되는가의 적시성 이 보장되어야 한다. 의사결정에 치명적 일 수 있음 예)테러계획을 미리 알았다 면…

완전성(Completeness) **

– 경영자는 문제 또는 해결책에 필요한 모 든 정보를 제공받을 수 있어야 한다.

(9)

11-1 정보자원관리의 다섯 가지 요소

 정보기술 자체가 기업의 자원으로서 그 가치를 인식하는 것임.

 오류관리: 잘못된 정보의 오류 관리(데이터의 입력 오류), 시스템의 오 류(시스템의 다운 현상 등)

 재난관리: 기업 정보의 무결성 유지, 정상적인 시스템 운용 – 하드웨어 백업, 소프트웨어 백업, 인력 백업

 시스템관리: 고의적인 데이터의 수정이나 해킹에 의한 자료나 데이터를 보호하기 위함

– 입력관리, 전산처리 관리, 출력관리, 데이터베이스관리, 통신 관리, 접근관리

 정보시스템 감사: 정보시스템 관리자와 정보시스템 활동에 책임을 지는 최종사용자들은 사용 중 프로그램과 절차를 관리하고 정확하게 작동하 도록 관리하는 책임

– 내부감사, 외부감사, 컴퓨터 주변에 대한 감사, 컴퓨터를 통한 감사 기술관리 (Technology Management)

(10)

IT 기본 구성 요소

Data

Data는 의사결정의 필수사항

기업 경영을 지원하는 빠르고 정확한 정보 Data Warehousing Data Mining을 통한 진화

H/W

최상의 성능과 안정적인 서비스가 필수 사항

CPU, Memory, DISK 발전을 통한 Computer System 진화

Application

효율적인 Application은 Business Process의 필수 사항 정확한 정보를 빠르게 전달 할 수 있는 효율적인 시스템

Application Warehousing Application Mining 을 통한 진화

(11)

11-1 정보자원관리의 다섯 가지 요소

 정보시스템이 물리적으로 어디에 위치되어 있는가? 사용자들은 어디 에서 정보 시스템에 접근하는가? 정보시스템을 어디에서 개발해야 하 는가?

 분산관리 개념의 중요한 이유

– 기술의 발달과 고속 컴퓨터 네트워크의 급속한 확산

– 최종사용자의 컴퓨팅(End-User Computing) 수준이 높아짐

– 기업의 의사결정과 운영통제의 분산화에 따른 조직의 이해관계가 향상됨

 분산관리에 대한 고려사항 – 네트워크 관리

– 데이터베이스 관리 – 시스템 통합

– 설비관리 분산관리

(12)

11-1 정보자원관리의 다섯 가지 요소

 기능관리와 정보자원 관리 조직

– 대부분의 기업들은 정보자원을 정보시스템시스템 부서에 의해 관리 – 정보시스템 부서는 시스템 개발, 시스템 운영, 기술지원의 세 가지

중요한 업무를 수행함

 사용자 요구와 시스템 관리

– 정보자원 관리의 주요 목적은 사용자 요구를 만족시키는 것이며, 관 리자와 종업원의 요구를 만족시키는 방법은 점점 복잡해 지고 있음 – 관리자들은 의사결정지원 시스템과 전문가시스템 접근방법에 의해

다양한 형태로 자료 요구함

– 정보시스템의 사용자 범위는 점차적으로 고객, 거래처, 공급업체 등 도 시스템 사용자에 포함되고 있음

기능관리

(13)

11-1 정보자원관리의 다섯 가지 요소

 최신동향 파악 및 추세 유지

– 정보시스템 부서에 있어 최근의 추세를 유지하는 것은 매우 어려움 – 노후된 소프트웨어의 문제

– 하드웨어 딜레마

• 기술상의 진부화

• 용량 제약

• 재정상의 고려사항

 인력 관리

– 정보시스템부서의 직원이 최신 추세와 동향을 유지하도록 하는 것은 많 은 조직들 사이에 존재하는 문제임

기능관리

완전히 새로운 응용프로그램의 개발

응용 프로그램의 일부를 새로 개발

기존 응용 프로그램의 수정

새로 개발하는 부분의 비율 0%

100%

(14)

11-1 정보자원관리의 다섯 가지 요소

 재무관리

– 정보시스템 자원에 대한 기능관리는 정보자원들이 기술적 관점뿐만 아니 라 재무적인 관점에서도 관리됨

– 사용자에 대한 비용부과

• 무료제공방법

• 부분비용청구방법

• 전체비용청구방법 – 예산수립

• 일반적으로 조직 전체예산의 5-10% 차지

• 전산실 예산의 25-50%는 인건비와 훈련비용에 충당

• Bottom-Up budgeting Approach

• Top-Down Budgeting Approach

기능관리

(15)

11-1 정보자원관리의 다섯 가지 요소

 전략관리는 정보자원 관리 중 가장 중요한 관리부분으로 부상하고 있음

 예를 들어, 경쟁업체에서 선도적으로 소비자들이 구매하 려고 하는 차별화된 제품이나 서비스를 전략적으로 개발 하거나, 특별한 혜택을 내부조직이나 협력업체에 내부시 스템을 통해서 제공하는 사례가 나타날 수 있음  “자사 의 경쟁우위 상실”

 기업의 정보시스템 응용 프로그램들은 급료나 원장과 같 은 회계 및 재무업무의 비용절감과 효율적인 처리를 위해 개발되었음  그러나 새로운 기술과 응용분야의 성장과 함께 정보시스템을 이용해서 경쟁우위를 확보하려는 쪽으 로 방향으로 전환되고 있음

전략관리

(16)

• "데이터베이스는 어느 한 조직의 여러 응용 시스 템들이 공용할 수 있도록 통합, 저장된 운영 데 이터의 집합"

• 통합된 자료(Integrated Data)-

최소의 중복 (Minimal redundancy)

• 저장된 자료(Stored Data)

• 자료공유(Shared Data)

• 운영자료(Operational Data)

데이터베이스

11-2 데이터자원관리

(17)

데이터  DB화

Levels of Data within a Database

– An entity is a person, place, thing, or eve nt.

– A field is a single value, such as a name, address, or dollar amount. A field generall y has three attributes.

Data type: usually numeric or text

Name: assigned by the person developing th e database

Size: the number of characters that can be en tered

(18)

데이터베이스 계층구조

논리적 데이터요소

물리적 데이터요소 데이터

베이스

파일

레코드

바이트 비트 필드

데이터 구성의 기초

(19)

계층구조 요소 예시

데이터베이스 판매 DB/파일 주문 DB/파일

품목 DB/파일 부품 데이터베이스

파일 100 브레이크패드 Sonata DY 10,000 5

105 스파크플러그 Avante DY 3,000 10 110 헤드라이트 Avante JS 65,000 3

품목 파일 No. Description Model Vendor Unit Pr. Qty

필드 브레이크 패드 Description’ 필드

레코드 100 브레이크패드 Sonata DY 10,000 5 No. Description Model Vendor Unit Pr. Qty

‘브레이크 패드’

부품의 레코드

바이트 10101000 ‘브레이크 패드’의

‘ㅂ’ 자음

비트 0 ‘ㅂ’ 자음 바이트의

최하위 비트

 데이터베이스 계층 구조

(20)

11-2 데이터자원관리

 캐릭터(Character): 사용자의 관점에서 가장 기본적인 논리데이터 구성요소로 문자나 숫자로 구성됨

 필드(Field): 데이터의 상위그룹은 필드나 데이터 아이템. 캐릭터의 그룹으로 구성. 특히 필드는 엔티티(Entity)의 특성을 나타냄

 레코드(Record): 필드 데이터의 그룹

 파일(File): 레코드의 그룹은 데이터 파일이나 테이블로 설명. 파일들은 영구성 기준에 따라 마스터 파일(Master File), 거래 파일(Transaction File)로 분류

 데이터베이스(Database): 논리적인 파일들의 통합된 모음. 논리적인 파일들 을 관리하기 위하여 보조기억장치에 물리적으로 저장됨

데이터 구성의 기초

<그림 11-3> 인사 데이터베이스의 예

(21)

Page 14-7

급여를 계산하는데 필요한 연관된 레코드 타입들

중복으로 관리: 주소, 생일, 1주 작업시간

(22)

• 응용시스템들간의 서로 다른 파일사용

(23)

11-2 데이터자원관리

 데이터베이스 안에서 기업의 모든 파일을 통합하며, 데이터베이스관리 시스 템에 의해 관리, 많은 응용프로그램에 의하여 접속

– 통합된 차원에서의 데이터베이스 갱신과 유지  비즈니스 거래를 반영 하여 레코드에 반영

– 통합된 데이터베이스 안의 실제 물리적인 데이터 데이터베이스 관리 시스템에 의해서 관리

– 최종사용자들이 쉽게 질의하고 편리하게 보고서를 만들 수 있도록 데이 터베이스 관리 시스템 소프트웨어 보고서 작성 소프트웨어 또는 웹브 라우저 형태의 질의 소프트웨어를 이용하여 활용

데이터베이스 접근방식

(24)

11-2 데이터자원관리

 데이터베이스 개발

– 데이터베이스관리시스템 패키지는 MS Access나 Oracle DB, 한 국의 Tibero 등 상용화

– 데이터베이스 전문가(Database Administrator)를 통해서 데이터 베이스의 무결성과 신뢰성을 높여주고, 유지보수를 향상 시킴

 데이터사전

– 데이터베이스를 운용하는 또 다른 도구이며, 컴퓨터에 기반을 둔 데이터에 대한 데이터, 즉 메타데이터를 의미함

 데이터베이스 질의

– 최종사용자는 DBMS를 사용하여 질의 언어나 보고서 생성 프로그 램을 사용하여 데이터베이스로부터 정의에 관하여 질의함

– 데이터베이스 관리 시스템의 대표적인 질의 언어는 SQL임 데이터베이스 접근방식

(25)

11-2 데이터자원관리

 애플리케이션 개발

– DBMS 패키지는 애플리케이션 개발의 중요한 도구임.

– 최종사용자, 시스템, 분석가들, 그리고 다른 애플리케이션 개발자들은

DBMS 패키지에 내장된 4GL 프로그램 언어나 개발도구에 의하여 애플리케 이션 프로그램을 만듬

– SQL의 예

• 데이터 입력 화면과 전자문서 보고서를 개발

• 전통적인 프로그래밍 언어를 사용가능

• 간단히 데이터베이스를 갱신하기 위하여 DBMS의 질의 언어인 Data Manipulation Language(DML)를 사용할 수 있음

데이터베이스 접근방식

<표 11-1> SQL의 예

(26)

11-2 데이터자원관리

 데이터베이스 관리 시스템(DBMS)은 데이터를 창조하고 유지하고 그리고 최 종 사용자와 조직의 데이터베이스를 조정할 수 있도록 컴퓨터 프로그램으로 세팅되어 있음

 DBMS는 데이터베이스를 구축하는 틀을 제공하고 저장된 데이터를 보조기억 장치에 효율적으로 저장하며 필요한 데이터를 신속히 검색하는 기능을 제공

 DB접근 인터페이스 제공, 복구, 여러 사용자(Multi-User)의 여러 프로그램 (Multi-Program)을 지원, 동시성 제어(Concurrency Control) 등의 기능 제공

데이터베이스 관리 시스템

<그림 11-7> 데이터베이스 관리 시스템

(27)

프로그램 1

프로그램 2

프로그램 3

조직 데이터베이스 애플리케이션 DBMS

데이터정의어 (DDL)

데이터조작어 (DML)

데이터 사전

DB

데이터베이스 관리시스템(DBMS)

(28)

• 데이터 사전의 예

(29)

DBMS 질의어(Query)

• 데이터 정의어 (Data Definition Language: DDL)

– 데이터베이스를 구조적으로 정의하는데 이용되며, 테이블 생성, 변형, 삭제, 제한설정 등을 할 수 있다.

– 예: CREATE TABLE, ALTER TABLE, DROP TABLE

• 데이터 조작어 (Data Manipulation Language: DML)

– 사용자 데이터를 저장, 변경, 질의하는데 사용되는 명령어 이다.

– 예: INSERT, DELETE, UPDATE, SELECT

• 데이터 통제어 (Data Control Language: DCL)

– 데이터베이스를 통제하는데 이용되며, 주로 데이터 베이스 관리자의 사용자에 대한 권한 설정을 위한 명령어이다.

– 예: GRANT/PROVOKE PRIVILEGE

(30)

• 테이블 정의

(31)

• 데이터의 삽입, 삭제, 수정

– 삽입

– 삭제

– 수정

(32)
(33)

데이터베이스 관리 시스템

한번에 하나이상의 파일에 존재하는 데이터를 다루기 위하 여 상용 SW를 구매해야 하는가 ?

대다수 사용자들은

MS Access, Oracle, Tibero 등과 같은 상용 DBMS 패키지를 구매

한다.

(34)

11-2 데이터자원관리

데이터베이스 관리 시스템

데이터베이스 관리 시스템

<그림 11-5> 혼란한 창고

<그림 11-6> 정돈된 창고

(35)

11-2 데이터자원관리

 데이터베이스는 애플리케이션 개발과 함께 지속적으로 진화되고 확 장 됨

 많은 기업들은 여러가지 형태의 데이터베이스를 구축하게 됨 데이터베이스 종류

<그림 11-8> 데이터베이스 종류

(36)

DB 1 지역부서 1

DB 2 지역부서 2

DB 3 지역부서 3 통신 네트워크

지역적으로 분산되어 있는 데이터베이스들은 각각 해당 지역부서에서 관리하지만

지역부서 간에 상호 데이터 공유가 가능하다.

분산처리 데이터베이스

11-2 데이터자원관리

(37)

 데이터의 저장소인 데이터웨어하우스(Datawarehouse)는 여러가지 의 실행과 외부와 다른 조직의 데이터베이스를 뽑아냄

 데이터마이닝을 위하여 비즈니스 전문가들과 주요 자원 데이터를 관 리하고 주요자원의 데이터를 변형시키고 목록화하여 의사결정을 지 원함

데이터 웨어하우스와 데이터마이닝

11-2 데이터자원관리

(38)

데이터 웨어하우스 DB

외부 DB (상용) 운영 시스템

DB 운영 시스템

DB 운영 시스템

DB

추출, 통합, 변환

의사결정을 위한 정보

데이터마이닝, OLAP등의

분석도구 데이터 탐색/분석

데이터 웨어하우징 기술은 기존에 의미없이 버려지던 데이터 더미들을 한 데 모아 의미있는 정보로 변환함으로써 전략적인 기회를 탐색할 수 있는 중요한 기술이다.

데이터 웨어하우징

11-2 데이터자원관리

(39)

배치 운영 데이터

트랜잭션 운영 데이터

외부 데이터

데이터 웨어하우스

관리

소프트웨어 데이터 웨어하우스

데이터베이스 메타 데이터

소스 데이터 데이터 웨어하우스

추출/변화/통합 기존 시스템

데이터 마트/ 데이터 웨어하우스

데이터 억세스 도구

질의와 보고서 작성 애플리케이션 개발

OLAP 도구

11-2 데이터자원관리

데이터 웨어하우징

(40)

11-2 데이터자원관리

데이터웨어하우스: OLTP

(41)

11-2 데이터자원관리

데이터웨어하우스: 의사결정 지원

(42)

데이터웨어하우스: ETL도구

(43)

11-2 데이터자원관리

데이터웨어하우스: 활용 효과

(44)

발전 단계 비즈니스 문제 관련 기술 특성

데이터 수집 (1960년대)

지난 5년간의 나의 총 수익은 얼마인가?

컴퓨터, 테이프, 디스크 회고적, 정적인 데이터 전달

데이터 접근 (1980년대)

3월의 광주지역에서의 상품판매는 얼마나 되나?

RDBMS, SQL 회고적, 레코드수준에서의 동적인 데이터 전달

데이터 웨어하우징과 의사결정

(1990년대 초반)

대전지역에서 구체적 판매는?

OLAP, 다차원 데이터베이스, 데이터웨어하우스

회고적, 다양한 수준에서의 동적인 데이터 전달

지능적 데이터마이닝 (1990년대 후반)

다음달에 서초구 지역의 상품판매는 어떻게 될까?

그이유는?

개선된 알고리즘, 멀티프로세서 컴퓨터, 대용량 데이터베이스

미래의, 순향적인 정보 전달

데이터웨어하우스와 데이터마이닝: 지식발견의 단계

(45)

데이터마이닝(Data Mining)

• 정의

– 대용량 데이터베이스에서 가치 있는 비즈 니스 정보를 찾아내는 것

• 기능

– 행동과 동향의 자동화된 예측

– 알려지지 않은 패턴의 자동화된 발견

(46)

Data Mining - 구매패턴의 발견

Association Rules Mining: 장바구니 분석

(47)

데이타마이닝

분석시스템

Data Mining의 사용

DBMS 데이타베이스

(검색) 시스템

홍길동이 금년에 구입한

상품은 무엇인가?

(검색)

홍길동이 내년에 구입할

상품은 무엇인가?

(예측, 추천)

(48)

Data Mining - 의사결정에 활용

패턴발견

빵과 과자를 사는 사람의 80%는 우유를 같이 산다

분유와 기저귀를 사는 사람의 74%는 맥주를 같이 산다

의사결정

맥주 소비는 분유와 기저귀 소비에 영향을 미침 빵과 과자 가격 인상은 우유 소비에 영향을 미침

상품 진열대에 (빵, 과자, 우유), (분유, 기저귀, 맥주)를 같이 진열 우유 소비를 조절하기 위해 빵,과자 가격을 조정

업무적용

(49)

데이터마이닝 절차

• 데이터마이닝 절차

(50)

Data Mining - 학습의 원리

Pattern, Model (Intelligence)

Least loyal common

profitable

학습 데이터

未知 데이터

과거 데이타 미래 예측

(51)

• 데이터 웨어하우스와 데이터 마트 비교

데이터 마트 데이터 웨어하우스

- 저렴한 비용으로 단기간 내 구축

- 전사 데이터에 대한 단일 데이터 뷰 제

- 원활한 데이터 공급 및 분석 정보의 정 확성 보장

- 전사적 정보의 통일성 유지

- 중복된 ETL 작업 필요

- 추출 주기, 시간에 따라 상이한 정보 발생 - 운영계 시스템의 부하 발생 우려

- 기업경영 변화에 따른 즉각적인 대응 곤란

- 전사 데이터 모델링에 의한 장시간 소요

(52)

데이터마이닝 응용분야

Retail/Marketing

구매자의 성향, 구매패턴, 성향들사이의 관계 등을 판독

shelf planning, supermarket inventory planning 등에 활용

Banking

위조 신용카드사용의 패턴을 추적

"loyal" 고객을 identify

신용카드 가입을 변경시킬 것으로 판단되는 고객을 미리 에측

여러 가지 재정 지표들간의 숨겨진 상관관계 판독

Insurance

Claim Analysis

새로운 상품에 대한 고객 수요 예측

risky customer의 행동 패턴을 identify

위조행위를 identify

Medicine

환자 history 데이타의 분석

성공적인 의료 요법을 identify하는데 이용

특정 환자에 대한 수술 여부 판단

(53)

IT 업계의 새로운 화두 Big Data란??

단순히 많은 양의 데이터

너무 방대해 일반적으로 사용하는 방법이나 도구로 수집, 저장, 검색, 분석, 시각화 등을 하기 어려운 데이터 집합

그러한 데이터 집합을 활용하는 영역이나 기술까지 데이터 베이스의 규모에 초점을 맞춘 정의 (McKinsey, 2011)

- 일반적인 데이터베이스 SW가 저장, 관리, 분석할 수 있는 범위를 초과하는 규모의 데이터

데이터 베이스가 아닌 업무수행에 초점을 맞춘 정의 (IDC, 2011)

-다양한 종류의 대규모 데이터로부터 저렴한 비용으로 가치를 추출하고

데이터의 초고속 수집, 발굴, 분석을 지원하도록 고안된 차세대 기술 및 아키텍처

11-3 빅데이터

(54)

11-3 빅데이터

 맥킨지(Mckinsey)에 따르면 매달 300억 개 이상의 콘텐츠가 페이스 북을 통해서 공유

 전세계적으로 매년 40%씩 데이터가 증가하고 있는 추세 새로운 데이터의 등장 및 특성

(55)

11-3 빅데이터

 가트너 그룹(Gartner Group)은 ‘빅데이터’라고 불리는 데이터들은 다 음과 같은 세 가지 특징을 가진다고 정의함

빅데이터의 3가지특성

데이터 종류의 증가 비정형,

구조화 되지 않은 데이터 데이터의 기하급수적인 증가 방대한 데이터의 집합

대 용 량

다 양 성

실시간 데이터 생성, 활용 빠른 데이터 분석, 처리

속 도

(56)

비정형 데이터의 증가 SNS의 대중화

데이터 분석 기술의 발전 Big Data

빅데이터의 등장배경

(57)

빅데이터(Big Data)

기존 데이터에 비해 너무 방대해 이전 방법이나 도구로 수집, 저장, 검 색, 분석, 시각화 등이 어려운 정형 또는 비정형 데이터 세트를 의미

(58)

11-3 빅데이터

 구조적 데이터(Structured Data)

– 현재 기업에서 일반적으로 사용하고 있는 구조화된 형태의 틀에 맞춰진 데이터

 비구조적 데이터(Unstructured Data)와 반구조적 데이터(Semi- Structured Data)

– 이미지, 웹로그, 게시판에 사용자의 의견 및 질의 등과 같이 일정 한 형태와 패턴을 지니지 않은 데이터

 기업은 빅데이터를 통해 보다 풍부하고 진보된 분석을 신속하고 정확 하게 수행할 수 있게 되었음

 어떤 시각을 가지고 데이터를 바라보는 자와 수많은 데이터 속에서 필요한 정보를 찾아내고자 하는 반복적인 과정 속에서 발견

 예로서, 로그 분석을 통한 수요예측 및 오류 방지, 시계열성 웹로그 분석을 통한 전자결제 사기 탐지 및 예방 등

빅데이터의 유형에 따른 분류

(59)

데이터의 증가 더욱 고사양 고가의 장비로 교체?

전 서비스 영역에서 개인화 서비스와 소셜 서비스를 제 공해야 하는 환경으로 변화

기존의 시스템, 소프트웨어 아키텍처의 Scale-Up만으 로는 한계

빅데이터와 기업의 대응

(60)

분산 처리 시스템

-효과적인 분산처리 시스템을 통한 유연한 서버 운용이 핵심 경쟁력

-서버 사양과 단일 스토리지 용량보다는 이를 효율적으로 운용하는 소프트웨어가 중요해 짐 -기술이 발전하고 있는 과정, 대부분 오픈소스 형태

(61)

빅 데이터는 클라우드 기반의 대용량 데이터 처리 기술인 하둡(Hadoop)을 비롯해, 전통적인 RDBMS를 보완하기 위한 NoSQL(Notonly SQL), 그리고 각종 데이터 시각화 (Data Visualization) 기법에 이르기까지 방대한 기술 세트를 사용한다.

따라서 데이터를 저장하고 분석하는 부분에서 경쟁사보다 우수한 기술을 보유한 신생 기업 이 나타나면 이를 경쟁적으로 인수하고 있는 상황이다.

위키본(Wikibon)에 따르면, 2011년 빅 데이터 시장 규모는 52억 달러였으며 하드웨어, 소 프트웨어, 서비스 분야 중 서비스 매출이 44%로서 가장 큰 비중을 차지했다.

빅 데이터 시장에서 앞서가기 위해서는 서비스 역량이 가장 중요할 것으로 판단.

빅 데이터의 궁극적인 목적은 기술의 도입이 아니라 이를 통해 비즈니스 통찰력을 도출하고

(62)

T-mobile 고객 이탈 방지

• 매일 170억 건 이상의 통화 및 송수신 내역을 담은 데이터 발생, 이를 분석해 다른 통신사로 옮긴 고객이 사전에 보였던 특유의 패턴 발견

• 고객간 소셜 네트워크를 분석, 영향력이 큰 고객을 따라 지인들이 동 반 이탈하는 현상 발견. 이탈 징후 보이는 고객에게 맞춤형 추가혜택 제 공하여 Lock-in 유도

• 시스템 구축 직후인 2011년 2/4분기 이탈 고객 수 5만 명으로 1/4분 기 9만 9,000명 절반 수준으로 감소

포드 스마트 자동차

• 시시각각으로 운전데이터를 수집, 유저가 어디로 향하려 하는가 등을 실시간으로 예측하는 등의 미래 스마트자동차 개발 목표

• 구글과 '하이브리드 자동차스마트 서비스' 공동 개발 중. 실시간으로 수집되는 교통정보 데이터를 분석하여 교통혼잡지역을 피함과 동시에 운전자의 운전습관에 기초하여 가장 에너지를 절약하는 방식으로 운전 자의 목적지 경로를 추천

(63)

국가위험 국토보안 관리

정부 비용 절감

(64)

11-3 빅데이터

빅데이터가 가져올 새로운 기회

<표 11-3> 국외 주요국 정부 및 기업의 빅데이터 활용 현황

참조

관련 문서

기숙사 업무를 관리 및 처리하는 임원 또는 관리자는 모바일 기 기를 이용하여 사생들의 점호 현황을 직접 입력하게 되며 이는 서 버의 데이터베이스에 저장 관리

그리고 정보시스템 측 면에서의 보안성 평가를 통하여 정보시스템을 안전하게 보호 할 수 있도록 하는 종합적인 정보시스템 위험관리 방안과 기 술, 관리, 운영

효과적인 백신 개발 전염병 발생 감시체계 운영 사례 조사 유행 조사 대상 전염병의 관리, 퇴치, 박멸 예방 접종 기록의 체계적인 보관과 관리, 활용

현재로서는 페기 기능만 도 선도적이고 고무적인 시도이나 데이터세트 생산 시스템에서는 기록관리 기능의 필요성이 더욱 큰 만큼 시스템 개발 과정에서부터 기록

따라서 사용자에 대한 충분한 사 전 교육과 시스템 이용에 대한 사용자의 의견을 적극적으로 수용하려는 시스템 운영요 원의 태도와 같은 서비스

출입국절차 간소화 관련 정보 통합관리연구개발 공항안전시설 통합관리 기술 연구 개발 유비쿼터스기술기반 항공화물 통합관리 시스템 개발 지속가능 항공환경

둘째, 시스템 사용을 통해 지각되는 사용자의 학습기대는 사용자 만족에 긍정적인 영향을 미치는 것으로 나타났다.. 사용 자들이 정보시스템 사용을 통하여 업무수행에

2011년 - 2017년 –인천국제물류센터IILC IT 시설 구축 –인천항공화물 터미널 IT 시설 구축 –여객터미널PTC 면세관리 서버 및 CCTV 구축 –자유무역지역 롯데면세점 IT시설 구축 –한국 면세점 협회 인도장 관리 시스템 개발 –한국 면세점 협회 교육 관리 시스템 개발 –한국 면세점 협회 홈페이지 기능개선 및