• 검색 결과가 없습니다.

<표 목차> Ⅰ <목 차> <그림 목차> <별첨>

N/A
N/A
Protected

Academic year: 2022

Share "<표 목차> Ⅰ <목 차> <그림 목차> <별첨>"

Copied!
31
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)
(2)

<목 차>

Ⅰ. 개요 · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · 1

Ⅱ. 공공 빅데이터 분석 사업비 산정 방법 · · · · · · · · · · · · ·6

Ⅲ. 관련 참고자료 및 유의사항 · · · · · · · · · · · · · · · · · · · · · · · · · · · · · ·21

<별첨>

사업비 자동산정 툴 활용법 · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · 22

(3)

[표 3] 작업 난이도 별 작성 기준 ············································································9

[표 4] 주요 분석 사업 분석 모델링/모델 구현 단계의 세부 태스크 (예시) ··9 [표 5] 보정계수의 종류 및 적용 단계 ··································································11

[표 6] 데이터 규모에 따른 보정계수 (예시) ·······················································12

[표 7] 데이터 처리기술 적용에 따른 보정계수 (예시) ·····································12

[표 8] 업무 분야별 특성에 따른 보정계수 (예시) ···········································14

[표 9] 사용 데이터 종류에 따른 보정계수 (예시) ·············································15

[표 10] 빅데이터 분석기술 적용에 따른 보정계수 (예시) ······························16

[표 11] 단계별 수행률 설정 (예시) ······································································17

[표 12] 분석 단계별 보정 후 소요 공수 산식 ···················································18

[표 13] 직접경비 산정 ···························································································19

<그림 목차>

[그림 1] 공공 빅데이터 분석 사업비 산정 체계 ··················································3

[그림 2] 공공 빅데이터 분석 사업의 7개 추진 단계 ··········································4

[그림 3] 세부 태스크별 난이도, 작업자수, 작업일수 산정 (예시) ···················8

[그림 4] 공공 빅데이터 분석 사업비 산정 구조 ················································20

(4)

. 개요

1. 추진 배경 및 필요성

❍ 공공 빅데이터 추진의 중요성 부각

- 국정 핵심과제인 정부3.0 주요과제에 공공 빅데이터 업무가 포함 되어 정부 내에서의 데이터 기반 과학적 정책 수립에 대한 중요성이 부각됨

- 데이터 기반의 과학적 경영 및 행정 지원과 주요이슈 해결을 위해 각 기관에서 다양한 분야의 빅데이터 분석을 추진 중임

❍ 공공 빅데이터 분석 사업비 산정 방안 부재

- 그간의 공공 빅데이터 분석 사업이 ‘단일부처, 1회성 분석’에서 ‘다 부처, 연속성 분석’으로 전환하여 업무에 지속적으로 가능한 형태 로 변화, 발전하여 왔으나 빅데이터 분석을 위한 적정한 사업 대 가를 산정하기 위한 체계와 방안 부재

❍ 적정하고 합리적인 공공 빅데이터 분석 사업비 산정 방안 마련 - 공공 빅데이터 분석을 위해 일관성 있고, 효율적인 대가 기준을

제시함으로써 업무 담당자가 쉽게 활용할 수 있는 사업비 산정 가이드를 제시

(5)

2. 추진 경과

❍ (‘15. 7) 공공 빅데이터 협의회 회의

- 빅데이터 분석 사업 추진을 위한 대가기준 마련 필요성 제기

❍ (‘16. 4 ~ 5) 기 추진 빅데이터 분석 사업의 산출내역서 취합 및 분석

❍ (‘16. 6) 빅데이터 분석 사업비 산정 가이드(초안) 마련

❍ (‘16. 6 ~ 7) 단계별 보정계수 적정성 검토를 위한 전문가 의견수렴 실시

❍ (‘16. 7) 분야별 보정계수 결정 및 빅데이터 분석 사업비 산정 가이드(안) 마련 - 데이터 규모, 데이터 처리기술, 업무분야, 사용데이터 종류, 빅데이터

분석기술 등 단계별 보정계수 산정

- 공공 빅데이터 분석 개발원가(직접인건비, 제경비, 기술료)와 직접 경비 합계를 통한 분석 사업비 산정

❍ (‘16. 7) 공공 빅데이터 분석 사업비 산정 가이드(안) 기관 및 사업자 대상 설명회

❍ (‘16. 8) 빅데이터 분석사업비 자동 산정툴(엑셀) 개발

❍ (‘16. 10) 공공 빅데이터 협의회에 가이드 공유 및 의견 수렴

(6)

3. 가이드의 구성

□ 본 가이드에서는 공공 빅데이터 분석 사업비의 구성 요소를 크게 개발원가와 직접경비로 구분하였음

❍ 개발원가는 분석 사업에 소요되는 인력과 공수를 산정하여 보정 계수를 적용한 직접인건비에 제경비와 기술료를 합하여 계산

❍ 직접경비는 데이터 구매료 등 분석 사업에 소요되는 직접적인 경비를 산정함

[그림 1] 공공 빅데이터 분석 사업비 산정 체계

□ 사업비를 산정하기 위해서는 총 7가지 절차를 거치며, Ⅱ장에서는 산정 절차별 상세 설명을 예시와 함께 제시함

❍ 분석 사업비 산정을 위한 7개 절차 및 절차별 주요 내용은 다음과 같음

절차 주요 내용

 사전 준비 ○ 분석대상 업무와 요구사항을 명확히 정의하고, 7개 분석 사업 추진 단계별 주요활동과 태스크를 도출

 단계별 투입공수 산정 ○ 요구사항에 근거하여 분석대상 업무의 세부 태스크 별로 난이도, 작업자수, 작업일수를 산출

[표 1] 사업비 산정 절차별 주요 내용

(7)

□ 사업비를 산정하기 위해서는 공공 빅데이터 분석 사업의 추진 단계를 표준화하고 단계별 복잡도에 따른 보정계수를 적용하여 정확한 규모 산정이 가능해야 하며, 이를 위해 ‘요건 정의’부터

‘검증 및 안정화’에 이르는 7개의 사업추진 단계를 표준화 하였음

❍ 공공부문에서 기 추진된 빅데이터 분석 사업의 산출내역서 및 작업명세서(WBS : Work Breakdown Structure)를 분석하여 표준화한 공공 빅데이터 분석 사업의 추진 단계는 다음과 같음

[그림 2] 공공 빅데이터 분석 사업의 7개 추진 단계

□ ‘사업비 자동산정툴’(이하 ‘산정툴’이라 함)을 통한 분석 사업비 산정 단계별 작성 방법과 주의 사항을 상세히 설명하였으며, 별첨에서는 산정툴의 활용법을 화면과 함께 제시하였음

절차 주요 내용

 단계별 수행률 설정

○ 사업 단계별 수행률을 설정

○ 예를 들어, 데이터 수집, 전처리를 기관의

IT담당자가 수행하는 경우, 해당 단계별 수행률을 0%로 설정할 수 있음

 보정 후 소요비용 산정

○ 식별된 보정계수에 따라 소요공수를 보정 – 소요공수 = 보정 전 분석규모 × 보정계수

○ 소요 공수에서 도출된 기술등급별 투입공수로 등급별 소요비용을 산정

○ 등급별 소요비용에 제경비와 기술료를 더해 소요비용 합계를 산정

 직접경비 산정 ○ 해당 분석 사업에 관련된 직접경비를 계산

 분석 사업비 산정 ○ 분석 사업비를 산정

– 분석 사업비 = 개발원가 + 직접경비

(8)

□ 본 가이드에서 사용한 주요 용어는 다음과 같음

○ 난이도 : 분석 사업의 세부 태스크를 수행하는 작업자의 기술 등급을 ‘전문’,

‘복잡’, ‘보통’, ‘단순’으로 구분

○ 작업자수 : 세부 태스크에서 난이도에 해당하는 작업을 수행하는 사람의 수

○ 작업일수 : 세부 태스크에서 난이도에 해당하는 작업자의 총 작업일 수

○ 복잡도 : 빅데이터 분석 사업에서 사용되는 데이터, 기술, 업무 유형 등을 다양성과 복잡성에 따라 점수화한 것으로 1 ~ 2 사이의 값으로 표현하며, 보정계수를 산출 하는데 사용됨

○ 보정계수 : 분석 사업의 규모만으로는 사업의 정확한 소요비용을 산정하기 어렵기에 복잡성 요소들 중 예산 수립 또는 제안단계에서 파악 가능하고 정량화 가능한 요소들을 중심으로 도출 하는 보정치

※ 빅데이터 분석 사업비에서 적용되는 보정계수는 데이터 규모, 데이터 처리 기술, 분석모델 수립 난이도, 분석 기술 적용에 따른 보정계수가 있음

○ 직접경비 : 분석 사업에 소요되는 직접적인 비용을 의미하며, 데이터 구매료 등 이 이에 해당됨

○ 제경비 : 직접비(직접인건비와 직접경비)에 포함되지 아니하고 분석사업자의 행정운영을 위한 기획, 경영, 총무 분야 등에서 발생하는 간접 경비로서 임원·

서무·경리직원 등의 급여, 사무실비, 사무용 소모품비, 비품비, 기계기구의 수선 및 상각비, 통신운반비, 회의비, 공과금, 운영활동 비용 등을 포함

○ 기술료 : 사업자가 개발·보유한 기술의 사용 및 기술축적을 위한 대가로서 조사 연구비, 기술개발비, 기술훈련비 및 이윤 등을 포함

(9)

Ⅱ . 공공 빅데이터 분석 사업비 산정 방법

 사전 준비

❍ 요구사항 정의 및 태스크 도출

- 분석대상 업무에 대한 요구사항을 정의하고, 요구사항을 달성하기 위해 필요한 단계별 태스크를 도출하며, 태스크 별로 세부(하위) 태스크를 정의함 - 분석 업무를 수행하기 위한 단계 구분, 프로세스, 주요 활동, 태스크,

세부 태스크를 식별하여 [표 2]의 양식에 맞게 작성함

○ 단계 구분 : 빅데이터 분석 공정 단계인 요건 정의, 데이터 수집, 데이터 전처 리, 분석 모델링, 모델 구현, 시각화, 검증 및 안정화의 7개 단계로 구성

○ 프로세스 : 단계를 세분화한 모든 활동 요소들의 집합으로 특정한 목적을 달성 하기 위해 Input을 받아 작업을 수행하고 산출물(Output)을 제시하는 일련의 활동

○ 주요 활동 : 분석 사업에서 프로세스의 목적을 달성하기 위해 세분화한 활동 (Activity)단위

○ 태스크 : 주요 활동을 작업 단위로 세분화한 것. 하나의 태스크는 하나 이상의 작업자가 배정되어 작업이 수행됨

○ 세부 태스크 : 작업의 최하단위임. 일정계획수립, 데이터 현황분석, 분석 알고 리즘 모델 설계, 통합 테스트 등 프로젝트 관리를 위해 활용되며, 세부 태스크별 투입공수가 더해져 단계별 비용이 산정됨

- 모든 태스크는 7개 ‘단계 구분’에 포함되어야 하며, 7개 이외의 단계를 별도로 추가하여 작성할 수는 없음(단계를 별도로 추가하는 경우 ‘산정툴’

에서 산식이 적용되지 않아 사업비 산정이 안됨)

- 분석 대상 업무의 특성과 해당 빅데이터 분석을 위해 사용될 주요 빅데이터 분석 기술(텍스트 마이닝, 통계 분석, 데이터 마이닝 등)에 따라 단계별 태스크와 세부 태스크가 달라지므로 이를 고려하여 작성 - ‘공공 빅데이터 업무적용 가이드’(2016, 행정자치부)의 부록1. ‘사업

(10)

추진 단계별 점검항목’ 내용을 참조하여 분석 사업에 필요한 태스크와 세부 태스크를 도출할 수 있음

[표 2] 분석 사업 단계별 프로세스 및 주요 활동 (예시)

(11)

 단계별 투입공수 산정

❍ 단계별 투입공수 산정 단계에서는 보정 전 단계별 투입공수를 산정하며 총 MD (Man-Day)를 21일*로 나눠 총 MM (Man-Month)을 산출

* 한 달간 작업 일수로서 2015년의 월평균 근무일수는 21.0일로 조사됨 (근거 : 소프트 웨어산업진흥법 제22조 소프트웨어사업의 대가지급 4항 ‘소프트웨어기술자의 노임단가’)

총 MM = 총 MD ÷ 21.0

❍ 투입공수를 산정하기 위해 세부 태스크별 난이도와 작업자수, 작업일수를 산정하여 [그림 3]과 같이 작성

- 데이터 규모, 기술, 난이도 등 분석 사업에서 고려되어야 할 보정요소는

‘ 단계별 보정계수 산정’에서 고려

- 작업자수와 작업일수를 입력하면 MD(일 투입 공수)는 자동 산정됨

❍ 하나의 태스크가 상세 업무 분할, 다른 투입인력 등급, 상이한 분석기술 적용 등의 사유로 2개 이상으로 구분되어 수행되어야 할 경우 세부 태스크를 추가하여 작성할 수 있음([그림 3] 빨간색 박스 참조)

[그림 3] 세부 태스크별 난이도, 작업자수, 작업일수 산정 (예시)

(12)

❍ 태스크 별 작업 난이도 정의

- 태스크 또는 세부 태스크 별로 작업 난이도를 ‘전문’, ‘복잡’, ‘보통’,

‘단순’으로 구분하여 작성하며, 작업 난이도의 작성 기준은 다음과 같음

작업 난이도 작성 기준 대상

기술등급 전문 특급 이상의 기술등급 자격을 갖춘 자가 태스크를

수행해야 하는 경우 특급

복잡 고급 이상의 기술등급 자격을 갖춘 자가 태스크를

수행해야 하는 경우 고급

보통 중급 이상의 기술등급 자격을 갖춘 자가 태스크를

수행해야 하는 경우 중급

단순 초급 이상의 기술등급 자격을 갖춘 자가 태스크를

수행해야 하는 경우 초급

[표 3] 작업 난이도 별 작성 기준

- 작업 난이도는 소요공수 산정 시 투입인력의 기술등급을 결정하는데 사용 - 분석 사업의 특성, 적용기술에 대한 투입인력의 숙련도, 기관 담당자의 사업이해도 및 역량 등에 따라 세부 태스크별 난이도에 대한 인식 정도가 상이하여 기준이 되는 ‘권고 난이도’를 제시(별첨 ‘사업비 자동산정툴 활용법’ 부분 참조)

- 분석 사업 단계별 프로세스 중 분석모델 설계, 모델 구현 시 분석 업무 내용, 사용 데이터의 종류, 활용방안 등에 따라 태스크 및 세부 태스크의 세분화가 필요함. 아래 예시는 분석 사업에 따른 모델링 단계와 모델 구현 단계의 세부 태스크 정의의 예시임

사업명 분석 업무내용 사용 데이터 분석 모델링 단계의 세부 태스크 모델 구현 단계의 세부 태스크

공동주택 관리비 투명성

공동주택 관리비 47개 항목에 대한

- 공동주택 관리정보시스템 (단지정보, 입찰공고문,

- 분석 시나리오 작성 - 탐색적 데이터 분석 - 분석모델 설계(초안) - 업무담당자 및 전문가 검토 - 확증적 데이터 분석 - 분석모델 설계(수정안) [표 4] 분석 모델링/모델구현 단계의 세부 태스크 (예시)

(13)

❍ 태스크 별 작업자수, 작업일수 정의

- 분석 사업 단계별 투입공수 입력 양식에 세부 태스크 별로 투입 되어야 할 적정 작업자수와 작업일수를 1 이상의 숫자로 작성

- 산정툴에서 세부 태스크가 필요하지 않은 경우, 작업자수에 ‘0’을 입력하면 해당 세부 태스크는 전체 투입공수에 반영되지 않음

 단계별 보정계수 산정

❍ 단계별 보정계수 산정 단계에서는 이전 단계에서 도출된 단계별 투입 공수에 보정계수를 적용하여 보정후 단계별 소요 공수를 산정하기 위해 해당 분석 사업에 활용되는 데이터 종류와 양, 데이터 처리기술, 분석 기술 등을 고려한 보정계수를 산출함

- 단계별 보정계수 산정 방법의 적정성 검토를 위해 학계 전문가, 현장 경력 분석가를 대상으로 설문조사를 실시, 설문 결과를 반영하여 단계별 보정계수 산정 방식을 확정함

- 분석 사업의 특성, 기간 등 단계별 투입 공수에 영향을 미칠 수 있는 4개의 보정계수를 정의하고 보정계수를 결정하는 요소별 복잡도를 정의

사업명 분석 업무내용 사용 데이터 분석 모델링 단계의 세부 태스크 모델 구현 단계의 세부 태스크 지자체

갈등 이슈 파악을

통한 선제적

대응 (행자부)

주요언론, SNS의 핵심

키워드를 변화량을 분석하여 지자체별 주요 갈등 사전 인지

- 언론사 신문 기사

- SNS(트위터)

- 분석 시나리오 작성

- 지자체내, 지자체간 갈등인지 모델 - 화제어 도출 및 분석 모델(빈도 분석) - 연관어 도출 및 분석 모델(연관 분석) - 지자체 범위 확장 모델(시계열 분석) - 위험지수 스코어링 모델(선제적 대응

체계)

- 향후 사전인지 모델 보급 및 확산 방안

(14)

❍ 보정계수의 종류 및 적용 단계는 다음과 같음

보정계수의 종류 설명 적용 단계

(1) 데이터 규모에 따른 보정계수

분석에 사용되는 원천 데이터의 종수와 양,

보유기관 수 데이터 수집

(2) 데이터 처리기술 적용에 따른 보정계수

데이터 전처리 단계의 요소 기술로 축소, 여과,

변환, 정제, 통합, 개인정보 비식별화 등 데이터 전처리

(3) 분석모델 수립의 난이도 보정계수

업무 분야 특성

분석모델 수립 시 일반 분야, 전문 분야, 현안의 다양성이 큰 분야 등 업무 분야의 특성에 따라 측정

분석 모델링 사용

데이터 종류

사용하는 데이터가 공공분야인지 민간분야인지, 정형인지

비정형인지에 따라 복잡도 측정 (4) 분석기술

적용에 따른 보정계수

분석 목적을 달성하기 위해 적용할 빅데이터

분석 기술에 따른 복잡도 측정 모델 구현 [표 5] 보정계수의 종류 및 적용 단계

(1) 데이터 규모에 따른 보정계수

- 일반적으로 빅데이터 분석 사업에서 처리해야 할 데이터의 규모가 커지면 투입인력이 증가하고 커뮤니케이션 채널이 복잡해져서 데이터 수집 단계의 소요 공수에 영향을 주게됨

- 따라서 사업규모의 증가에 따른 보정이 필요하며, 이를 감안하는 것이 규모 보정계수임

- 데이터의 종수와 크기는 수집 단계의 복잡도에 영향을 미치며, 사용할 수집 환경을 분석하거나 수집을 위한 환경을 구성할 때, 기관 내·외부 데이터를 수집할 때, 데이터의 종수와 양이 많을 수록 소요 공수는 증가하게 됨

- 원천 데이터의 제공 기관의 수는 데이터 수집 단계의 투입 공수에 영향을 미치며, 데이터를 제공하는 기관의 수가 많을수록 소요 공수는 증가됨

- 데이터의 종수와 데이터 크기, 데이터 보유기관의 수에 따른 보정

(15)

데이터 규모 보정계수 = 

∑데이터규모별복잡도

데이터 규모 설명 개수/크기 복잡도 보정

계수 데이터의 종수

[단위:종수(개)]

- 사용하는 테이블, 문서 등의 종수 - 16개 이하는 1.0, 17 ~ 41개는 1.5,

42개 이상은 2 ( 10 ) 개 ( 1.0 )

( 1.2 ) 데이터 크기

[단위:용량(TB)]

- 분석 대상 데이터의 건수, 용량 등 - 전체 소스 데이터 용량이 3TB

미만은 1, 3 ~ 16TB 는 1.5, 16TB를 초과하는 경우 2

※ SNS를 분석하는 경우는 분석 대상이 되는 텍스트의 데이터 크기만을 고려함

( 2 ) TB ( 1.0 )

원천 데이터 보유기관의 수 [단위:기관수(개)]

- 원천 데이터의 제공 기관의 수 - 4개 이하는 1.0, 5 ~ 9개는 1.5,

10개 이상은 2 ( 5 ) 개 ( 1.5 ) [표 6] 데이터 규모에 따른 보정계수 (예시)

(2) 데이터 처리기술 적용에 따른 보정계수

- 수집된 데이터를 전처리 하는 과정은 빅데이터 분석 사업에서 많은 공수가 투입되는 공정이며, 각 처리 기술이 전체 전처리 공정에 서 어느 정도 가중치를 차지하는지를 산정하여 보정계수를 산출 - 데이터 처리기술 적용에 따른 보정계수는 다음의 양식으로 작성

데이터 처리기술 보정계수

= ∑(처리기술별 복잡도 × 처리기술 적용 가중치)

처리기술 설명 복잡도 가중치(%) 보정

계수 데이터 여과

(Filtering)

- 오류 발견, 보정, 삭제 및 중복성 확인 등의 과정을 통해 데이터 품질을 향상 시키는 기술

1.6 ( 20% )

( 1.63 ) 데이터 변환

(Transformation) - 데이터 유형 변환 등 데이터

분석이 용이한 형태로 1.6 ( 20% ) [표 7] 데이터 처리기술 적용에 따른 보정계수 (예시)

(16)

(3) 분석모델 수립의 난이도 보정계수

- 분석모델 수립의 난이도 보정계수는 ‘① 업무 분야별 보정계수’와

‘② 사용 데이터 종류별 보정계수’를 도출하여 두 보정계수의 평균값을 적용함

처리기술 설명 복잡도 가중치(%) 보정

계수 변환하는 기술

- 정규화(normalization), 집합화(Aggregation), 요약(summarization), 계층생성 등의 방법 활용 - ETL(extraction/transformation

/loading) 도구 활용

데이터 정제 (Cleansing)

- 결측치 들을 채워 넣고, 이상치를 식별 또는 제거하고, 잡음 섞인 데이터를

평활화하여 데이터의 불일치성을 교정하는 기술

※일반적으로 데이터는 불완전하고, 잡음이 섞여있고, 일관성이 없기 때문에 데이터 정제가 필요

1.8 ( 30% )

데이터 통합 (Integration)

- 데이터 분석이 용이하도록 유사 데이터 및 연계가 필요한 데이터(또는 DB)들을 통합하는 기술

※데이터를 보유하고 있는 다수 기관의 내·외부 데이터 간 연계를 고려한 통합 필요

1.5 ( 20% )

데이터 축소 (Reduction)

- 분석 컴퓨팅 시간을 단축할 수 있도록 데이터 분석에 활용되지 않는 항목 등을 제거하는 기술

1 ( 0% )

개인정보 비식별화

- 수집된 데이터에 포함된 개인정보의 일부 또는 전부를 삭제, 다른 정보로 대체 또는 다른 정보와

결합(Mash-up)하여도 특정 개인을 식별하기 어렵도록 하는 일련의 조치

1.5 ( 10% )

(17)

① 업무 분야별 보정계수

- 같은 규모의 분석 사업 일지라도 업무의 가변성이나 복잡성에 따라 분석모델 수립 시 생산성은 달라짐. 즉, 데이터나 정보처리 위주의 측면이 강조되는 일반업무 분야보다 현안의 다양성이 큰 민원, 범죄, 재난, 교통 등의 분야는 분석모델을 수립하기 위한 노력이 더 많이 소요됨

- R&D, 의료, 금융 등 전문 지식이 필요한 분야의 분석모델 수립 은 해당 분야의 전문가가 참여해야만 가능한 경우가 있으므로, 이를 감안하기 위한 것이 분석모델 수립의 난이도 보정계수임 - 하나의 사업에 여러 개의 업무 분야가 혼재하는 경우에는, 각 분야

별로 보정계수를 도출하고 해당 유형이 전체 사업규모에서 차지 하는 비율을 곱하여 합산한 값을 보정계수로 함

- 전체 사업에서 각 분야별 분석모델이 차지하는 비율(가중치)을 모두 더하면 100%가 되며 계산식은 다음과 같음

업무 분야 보정계수

= ∑(업무 분야별 복잡도 × 업무분야별 적용 가중치)

업무분야 설명 복잡도 가중치(%) 보정

계수 일반 분야 - 가변성, 복잡성이 높지 않은 업무

- 일반 행정, 교육, 복지 등 1 ( 20% )

( 1.32) 현안의

다양성이 큰

분야 - 민원, 범죄, 재난, 환경, 교통 등 1.4 ( 80% ) 전문 분야 - 전문 지식이 필요한 분야의

분석모델을 개발하는 경우

- 의료, 금융, 국방, 안보 등 1.7 ( 0% ) [표 8] 업무 분야별 특성에 따른 보정계수 (예시)

② 사용 데이터 종류별 보정계수

- 같은 규모의 분석 사업 일지라도 사용하는 데이터의 성격(정형 또는 비정형)에 따라 생산성은 달라짐. 즉, 정형 데이터 처리 위

(18)

주의 분석 모델보다 다양성이 큰 비정형 데이터를 처리해야 하는 분석모델의 경우 모델 수립을 위한 노력이 더 많이 소요됨 - 또한, 민간이나 기관 외부의 데이터를 활용하여 분석모델을 수립

해야 하는 경우는 해당 데이터의 전문가가 참여해야만 가능한 경우가 있으며, 이때 전문가 참여에 따른 규모의 증가를 소요 공수에 감안하기 위한 것이 분석모델 수립의 난이도 보정계수임 - 하나의 사업에 여러 성격의 데이터가 혼재하는 경우에는, 각

데이터 별로 해당 데이터가 전체 사업에서 차지하는 비율을 가중치로 하여 보정계수를 도출함

- 전체 사업에서 각 데이터 유형별 가중치를 모두 더하면 100%가 되며 계산식은 다음과 같음

사용 데이터 종류 보정계수

= ∑(데이터 종류별 복잡도 × 데이터 종류별 적용 가중치)

데이터 종류 설명 복잡도 가중치(%) 보정

계수

공공 데이터

정형 데이터

- 즉시 통계적 분석에 사용될 수 있을만한 형태로 정리되고 가공된 데이터 (공간데이터 포함)

- RDB에 저장된 테이블, CSV 형태

1 ( 100% )

( 1.00 ) 비정형

데이터

- 정형화 되지 않고 가공되지 않은 raw data

- 텍스트(민원), 동영상, 사진 등 1.8 ( 0% )

민간 데이터

정형 데이터

- 신용카드사의 카드 결제 내역, 이동통신사 통화 이력 데이터 등 민간에서 생성되고 유통되는 데이터 - 카드결제내역, 통화이력,

1.5 ( 0% ) [표 9] 사용 데이터 종류에 따른 보정계수 (예시)

(19)

(4) 빅데이터 분석기술 적용에 따른 보정계수

- 빅데이터 분석모델 구현의 생산성은 분석에 사용된 기술에 영향을 받게 되므로 분석기술에 따른 보정계수를 적용하여야 함

- 빅데이터 분석에 사용되는 주요 적용 기술은 총 4가지로 구분 하였으며 각각의 난이도에 따라 복잡도를 정의하였음

- 하나의 분석모델을 구현하기 위해서 여러 종류의 분석기술을 사용하는 경우는 각 분석기술별로 해당 기술이 차지하는 규모의 비중(가중치)을 곱하여 합산한 값을 보정계수로 함

- 전체 사업에서 분석기술별 가중치를 모두 더하면 100%가 되며 계산식은 다음과 같음

분석기술 보정계수

= ∑(분석기술별 복잡도 × 분석기술별 적용 가중치)

구분 설명 복잡도 가중치(%) 보정

계수 데이터

마이닝

- 대용량의 데이터로부터 패턴인식, 인공지능 기 법 등 을 이 용 하 여 숨 겨 져 있 는 데이 터 간 의 상호 관련성 및 유용한 정보를 추출하는 기술

1 ( 80% )

( 1.02 ) 통계적 분석

- 전통적인 분석 방법으로 주로 수치형 데이터에 대하여 확률을 기반으로 어떤 현상의 추정, 예측을 검정하는 기법

1.1 ( 20% )

텍스트 마이닝

- 텍스트 기반의 데이터로부터 새로운 정보를 발견할 수 있도록 정보 검색, 추출, 체계화, 분석을 모두 포함하는 Text-processing 기술 및 처리 과정

1.3 ( 0% )

소셜 네트워크

분석

- 대용량 소셜 미디어를 언어분석 기반 정보추출을 통해 이슈를 탐지하고, 시간의 경과에 따라 유통되는 이슈의 전체과정을 모니터링하고 향후 추이를 분석하는 기술

1.3 ( 0% ) [표 10] 빅데이터 분석기술 적용에 따른 보정계수 (예시)

(20)

 단계별 수행률 설정

❍ 분석 사업의 7개 추진 단계를 100% 모두 수행하는 경우 단계별 수행률은 모두 ‘100%’ 로 입력

❍ 분석 사업이 7개 추진 단계 중 전체가 아닌, 일부 단계만을 수행 하는 경우도 있음

- 분석 사업이 분할 발주되어 분석 모델링·모델 구현·시각화가 별도의 사업으로 수행되는 경우가 이러한 예에 해당됨

- 또한, 데이터 수집과 전처리는 기관 내부의 인력이 수행하는 경우도 이에 해당됨

❍ 각 단계별 가중치는 다음과 같이 입력함

단계 요건 정의

데이터 수집

데이터 전처리

분석 모델링

모델

구현 시각화 검증 및 안정화 수행률(%) ( 100% ) ( 100% ) ( 100% ) ( 100% ) ( 100% ) ( 100% ) ( 100% )

[표 11] 단계별 수행률 설정 (예시)

 보정 후 소요비용 산정

❍ 데이터 규모, 데이터 처리 기술, 분석모델 수립의 난이도, 빅데이터 분석기술의

(21)

단계 구분 분석 단계 기술등급별 보정 후 소요 공수 산식 요건 정의 요건정의 단계 보정 전 투입 공수 × 요건정의 단계 수행률 데이터 수집 데이터 수집 단계 보정 전 투입 공수 × 데이터 수집 보정계수 ×

데이터 수집 단계 수행률 데이터

전처리

데이터 전처리 단계 보정 전 투입 공수 × 데이터 전처리 보정계수 × 데이터 전처리 단계 수행률

분석 모델링 분석 모델링 단계 보정 전 투입 공수 × 분석 모델링 보정계수 × 분석 모델링 단계 수행률

모델 구현 모델 구현 단계 보정 전 투입 공수 × 모델 구현 보정계수 × 모델 구현 단계 수행률

시각화 시각화 단계 보정 전 투입 공수 × 시각화 단계 수행률 검증 및

안정화

검증 및 안정화단계 보정 전 투입 공수 × 검증 및 안정화 단계 수행률

❍ 위 산식을 적용하여 기술등급별 소요 공수(MM) 산출

※ 기술등급별 소요 공수는 ‘사업비 자동산정툴’에서 자동 계산

❍ 기술등급별 소요 공수에 기술등급별 월노임단가를 곱하여 직접인건비를 산출

직접인건비 = 기술등급별 소요 공수(MM) × 월노임단가

※ 월노임단가는 한국소프트웨어산업협회가 공표하는 소프트웨어 기술자 평균 임금을 사용

❍ 직접인건비로 제경비와 기술료를 산출

- 제경비 = 직접인건비 × 110%

- 기술료 = (직접인건비 + 제경비) × 20%

※ 제경비는 직접인건비의 110 ∼ 120%, 기술료는 직접인건비와 제경비의 합에 20 ∼ 40%를 산정함

(22)

 직접경비 산정

❍ 직접경비는 해당 빅데이터 분석 사업에 소요되는 직접적인 경비를 의미하며, 직접경비에 포함되는 항목들은 아래 표를 참조하여 도출

❍ 직접경비의 계산시에는 정확한 내역을 제시하여야 하며, 다음 산정 양식을 활용하여 직접경비를 산정함

❍ 직접경비가 발생하는 경우는 다음과 같음

- 데이터의 구매료 : 카드사, 통신사, 신용사, 포털 등 데이터 구매 - 소프트웨어 도구 사용료 : SAS, QlikView, ArcGIS 등

- 특정기술 도입 관련 전문가 비용 : MapReduce, Hadoop 등

- 홍보비용 : 인포·모션 그래픽스 등 홍보물 제작 및 배포, 컨퍼런스 개최 등

직접 경비 항목 산출 내용 금액

① 당해 빅데이터 분석 사업에

필요한 데이터의 구매료 -

② 당해 분석 사업에 특별히 필요로 하는 소프트웨어 도구

사용료   -

③ 발주자의 요구에 의한 특정기술

도입과 관련된 전문가 비용   -

④ 사업 결과를 대내외에 홍보하기 위한 홍보물의 제작 및 배포, 컨퍼런스 개최 등

홍보물 제작  3,000,000

⑤ 그 밖에 당해 분석 사업에

특별히 소요되는 직접비용   -

[표 13] 직접경비 산정 예시

(23)

 분석 사업비 산정

❍ 아래의 산식에 따라 빅데이터 분석 사업비를 산정함. 단, 비용 산정과정의

‘5단계) 소요비용 산정’의 기술료 계상에 이윤이 포함되므로 최종 분석 사업비에는 이윤을 추가로 계상하지 않음

빅데이터 분석 사업비

= 직접인건비 + 제경비 + 기술료 + 직접경비

❍ 공공 빅데이터 분석 사업비 산정 구조를 요약하면 다음과 같음

[그림 4] 공공 빅데이터 분석 사업비 산정 구조

(24)

Ⅲ. 관련 참고자료 및 유의사항

□ 참고자료

❍ 엔지니어링산업 진흥법 제31조의 규정에 의한 엔지니어링사업의 대가 기준

❍ 평균 임금 적용을 위한 소프트웨어 기술자 분류기준

❍ 통계법 제27조(통계의 공표) 에 따라 한국소프트웨어산업협회가 공표하는 소프트웨어 기술자 평균임금(기존 ‘기술자 노임단가’)

(대가산정 시점에서 가장 최근 평균임금을 적용함. 예컨대, ‘16년 9월의 경우 ’15년의 평균임금을 적용)

□ 유의사항

❍ 대가 산정에 사용된 투입공수는 사업의 예산 및 예정가격 산정을 위한 용도로만 활용되어야 하며, 이것이 사업 진행과정에서의 실제 투입 인원을 관리하는 기준으로 활용될 수는 없음에 유의

❍ 본 공공 빅데이터 분석 사업비 산정 가이드는 빅데이터 분석 사업에 국한하여 적용이 가능하며, 분석 시스템 구축 및 인프라 도입 등의 시스템 개발이 포함된 경우 SW사업 대가 산정을 준용한 기능점수 (Function Point) 방식을 병행하여 사업비를 산정해야 함

(25)

별첨 사업비 자동산정툴 활용법

 사전준비

➀ 프로세스, 태스크 및 세부 태스크의 추가

- ‘공공 빅데이터 분석 사업비 산정 양식.xlsx’의 ‘단계별 투입 공수(양식)’ 시트에 작성함

- 산정툴은 모든 빅데이터 분석에 적용되는 범용적인 프로세스, 태스크 및 세부 테스크로 구성되어 있으며, 추가적인 프로세스, 태스크 및 세부 테스크가 필요한 과제의 경우 산정툴에 행(行)을 추가할 수 있음(예시: 요건정의 단계에 ‘업무현황 분석’이라는 태스크를 추가함)

(26)

 단계별 투입공수 산정

➀ 사업의 난이도 설정

- 실제 활동에 투입되는 인원의 수준으로 작성하되 사업 수행시 각 활동별 권고 난이도에 맞춰 인원을 투입하는 것을 권장함

※ ‘권고 난이도’는 ‘15년 행자부가 추진한 빅데이터 분석과제의 테스크별 난이도 평균 값임

➁ 작업자수 설정

- 난이도에 맞는 인원을 배정하되 다른 수준의 인원을 추가 투입시 바로 밑에 동일

(27)

 단계별 보정계수 산정(1/2)

➀ 데이터 규모에 따른 보정계수 산정

- ‘공공 빅데이터 분석 사업비 산정 양식.xlsx’의 ‘사업비 산정(양식)’ 시트에 작성함 - 데이터의 종수, 데이터의 크기 및 원천데이터 보유기관의 수를 설명에 따라 각

단위에 맞추어 기재하면 자동으로 보정계수가 산정됨

➁ 데이터 처리기술 적용에 따른 보정계수 산정

- 데이터 여과, 데이터 변환, 데이터 정제 등 분석의 전 단계에서 소요될 방식별 처리 비중을 가중치에 작성함(합계 100% 기준으로 작성)

(28)

 단계별 보정계수 산정(2/2)

(29)

➁ 사용 데이터 종류별 보정계수 산정

- 분석에 사용될 대상 데이터의 유형을 기재하며 여러 유형이 혼재하는 경우 비중을 나누어 기재(합계 100% 기준으로 작성)

➂ 빅데이터 분석기술 적용에 따른 보정계수 산정

- 분석에 사용될 빅데이터 적용기술을 기재하며 여러 유형이 혼재하는 경우 비중을 나누어 기재(합계 100% 기준으로 작성)

 단계별 수행률 설정

➀ 요건 정의, 데이터 수집 등 각 단계별 작업 수행률을 기재함(각 단계별로 최고 100%까지 작성 가능)

 보정 후 소요비용(개발원가) 산정

※ 까지 작성된 내용을 토대로 단계별 소요 공수 및 기술 등급별 소요비용까지 자동으로 산출되므로 임의로 작성하지 말 것

(30)

 직접 경비 산정

➀ 산출 내역 작성

- 직접 경비 항목에 해당되는 직접경비의 주요내용을 예시와 같이 간략하게 작성함

➁ 금액 작성

- ➀에 작성된 직접 경비 내역의 비용을 작성함

※ ➀,➁ 작성시 직접 경비 합계는 자동 산출됨

 공공 빅데이터 분석 사업비 산정 종합 및 총계

※ 지금 까지 작성된 내용을 토대로 개발월가, 직접경비, 부가세의 총 합계가 자동으로 산출되니 임의로 작성하지 말 것

(31)

참조

관련 문서