• 검색 결과가 없습니다.

과학기술 오픈데이터 평가 지표

N/A
N/A
Protected

Academic year: 2021

Share "과학기술 오픈데이터 평가 지표"

Copied!
67
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

본원 305-806 대전광역시 유성구 대학로 245 Tel 042) 869-1004 Fax 042) 869-0969

Contact us

nos.ndsl.kr

과학기술 오픈데이터 평가 지표 Science and Technology Open Data Index

과학기술 오픈데이터 평가 지표

Science and Technology Open Data Index

과학기술 오픈데이터 평가 지표

Science and Technology Open Data Index

저 자

현미환 KISTI 정보서비스실 선임연구원

mhhyun@kisti.re.kr

이수경 KISTI 정보서비스실 연구원

skl@kisti.re.kr

김혜선 KISTI 정보서비스실 실장

hskim@kisti.re.kr

박진호 ㈜리스트

현미환 · 이수경 · 김혜선 · 박진호

(2)

과학기술 오픈데이터 평가 지표

Science and Technology Open Data Index

현미환 / 이수경 / 김혜선 / 박진호

(3)

●●

과학기술 오픈데이터(Open Data) 평가 지표

●●

목 차

제 1 장 서론 1

1. 연구의 배경 1

2. 연구의 목적 및 필요성 3

3. 오픈데이터(Open Data)의 정의 4

3.1. 오픈(Open)의 정의 4

3.2. 오픈데이터(Open Data)의 정의 7

제 2 장 선진사례 분석 1 1

1. Global Open Data Index 11

2. Web Index 20

3. Open Data Barometer 28

4. Open Data Readiness Assessment 34

5. Five Star Open Data 43

제 3 장 과학기술 오픈데이터 평가 지표 7 4

1. 과학기술 오픈데이터 평가지표 모형 7 4

2. 과학기술 오픈데이터 평가지표 항목 9 4

2.1. 접근성(Accessible) 49

2.2. 활용성(Availability) 50

2.3. 재활용성(Reusability) 53

2.4. 완전성(Completeness) 54

2.5. 관리체계(Management System) 55

2.6. 커뮤니티(Community) 56

3. 과학기술 오픈데이터 평가지표 측정방식 7 5

제 4 장 결 론 59

부 록

1. 선진사례별 주요 지표 및 채택 3 6

2. 과학기술 오픈데이터 성과측정 지표별 질의문 7 9

(4)

<표 목차>

표 1. 열린지식재단 Open Definition v2.1의 조건 및 정의 5

표 2. 열린지식재단 Open Data Handbook의 Open Data 정의 8

표 3. 오바마 행정부의 Open Data 정의 8

표 4. Global Open Data Index 2013 vs. 2014년 순위 비교 12

표 5. Global Open Data Index 한국 평가 지적사항 13

표 6. Global Open Data Index 평가 데이터셋 15

표 7. 데이터셋 별 질의문과 가중치 1 6

표 8. Web Index 국가별 평가 결과(2012~2014) 2 2

표 9. Web Index 한국의 평가 결과 비교(2012~2014) 3 2

표 10. 하위 지표별 측정 범위와 정의 4 2

표 11. 평가지표의 구성과 비중 24

표 12. 평가 데이터 목록과 관련 지표 5 2

표 13. ODB 평가 데이터 목록과 관련 지표 30

표 14. ODB 지표별 세부 연구방법 31

표 15. ODB 데이터 획득 방법 32

표 16. 지표별 세부 조사내용 32

표 17. 주요 지표별 핵심 데이터셋 3 4

표 18. 데이터의 공급과 품질 관련 표준 지침 목록 8 3

표 19. ORDA 핵심 지표와 증명자료의 요건 3 9

표 20. 핵심 데이터셋과 설명 42

표 21. Five Star Open Data의 단계별 의미 44

표 22. Five Star Open Data의 단계별 의미 44

<그림 목차>

그림 1. Global Open Data Index 홈페이지(http://index.okfn.org/) 11

그림 2. 2014년 Global Open Data Index 국가별 현황 12

그림 3. Global Open Data Index 한국 평가 결과 상세 13

그림 4. Global Open Data Index 온라인 설문조사 화면 19

그림 5. Global Open Data Index 데이터세별 평가 화면 20

그림 6. Web Index 홈페이지 21

그림 7. Web Index 2014년 한국의 평가 결과 2 2

그림 8. Web Index 평가모형 구조 23

그림 9. Open Data Barometer 홈페이지 28

그림 10. Open Data Barometer 2013, 3014 결과 29

그림 11. Open Data Barometer 한국 순위 변화 29

그림 12. Open Data Barometer 한국 평가결과 상세 29

그림 13. World Bank - Open Government Data Toolkit 35

그림 14. 5 Star Open Data 43

그림 15. 과학기술 오픈데이터 성과측정 모형 설계(1안) 7 4

그림 16. 과학기술 오픈데이터 성과측정 모형 설계(2안) 8 4

그림 17. 과학기술 오픈데이터 성과측정 모형(최종안) 8 4

(5)

제 1 장

서 론

1. 연구의 배경

최근 ‘데이터’가 새로운 경제, 지식정보사회의 핵심 요소로 부각하고 있다. Linked

Data, Open Data, Big Data, Gov2.0 등이 새로운 데이터 사회를 대표하는 새로운 용

어들로 이 용어는 공통적으로 가공된 정보(information)가 아닌 이전 단계의 데이터

(data) 활용에 대한 가능성에 중점을 두고 있다.

정보화 사회에서 데이터는 흔히 ‘새로운 오일(data is the new oil)’로 지칭하며, 경

제적 파급효과 분석을 위한 노력이 계속되고 있다. 데이터 경제(Data Economy)적 관

점은 이러한 노력을 뒷받침할 수 있는 중요한 접근점으로 볼 수 있다.

특히, 데이터가 중심이 되는 새로운 정보화 사회를 만들기 위해서는 기반이 될 수

있는 가용성 데이터의 양적, 질적 기반이 필요하다. Linked Data는 데이터를 개방하는

방식 중 이미 거대한 정보생태계를 갖추고 있는 웹(web)을 플랫폼으로 기계(machine)

가 자동적으로 처리할 수 있는 데이터 형식을 만드는 개념이다. Linked Open Data는

Linked Data와 Open Data의 합성어로 기계가 자동으로 처리할 수 있는 형식의 데이

터를 개방형 데이터로 개방하여 누구나 자유롭게 활용할 수 있게 함으로써 새로운 데이

터 생태계를 웹에 구현하고자 하는 것이다.

Linked Data가 데이터 중심 생태계의 기술적인 완성도를 가능하게 하는 요소라면

Open Data는 실질적이고 가시적인 다양한 생산물들이 만들어질 수 있게 한다. 특히

Open Data 중 정부, 공공 데이터는 초기 데이터 생태계의 다양성과 양적 풍부성 확보

가 가능한 중요한 개념이다.

Open Data는 주요국의 열린 정부 선언(Open Gov.) 및 정책 추진과 맞물려 세계적

인 확산 추세를 맞게 되었고, 대표적인 것이 미국과 영국 정부의 열린 정부 선언이며

최근에는 열린 정부가 새로운 정부 운영 패러다임으로 자리매김하고 있다.

미국, 호주, 유럽연합 등의 개방형 정부 선언은 정부, 공공데이터 개방을 통해 정부

투명성 강화와 차세대 성장 동력인 데이터(data is the new oil)를 기반으로 하는 경제

체제(Data Economy)를 마련해가고 있다.

한국은 세계 최고 수준의 정보통신기술기반의 정부운영, 정보공유 체계를 구성하여

2010, 2012년 UN 전자정부평가에서 연속 1위를 달성하였지만 미국(2009, data.gov),

영국(2010, data.gov.uk) 등과 비교했을 때 데이터 개방, 열린 정부정책 추진에 있어서

는 후발 주자로 볼 수 있다.

세계적으로는 이미 개별국가의 데이터 개방을 넘어 국가 간 공동 데이터 개방 협력

추진이 이루어지고 있는 단계로 대표적인 것이 EU의 Open Data Strategy 발표

(2011), OECD의 Open Government Partnership(2011), G8 정상 개방형데이터협정

(Open Data Charter, 2013) 등이다.

우리나라는 열린 정부 대신 ‘정부 3.0’이라는 용어로 데이터 개방을 추진하고 있는

반면 해외의 경우는 열린 정부 혹은 정부 2.0 등의 용어를 혼용하여 사용하고 있다. 세

계적인 컨설팅 그룹 가트너(Gartner)는 정부 2.0과 정부 3.0의 개념을 구분하고 있는

데 정부 3.0(Gov 3.0)은 LOD(Linked Open Data)의 결과물인 RDF 형태로 데이터를

개방하는 단계로 정의하고 있다.

- Gov 2.0: 정보기술을 활용하여 정부의 서비스, 데이터, 운영을 최적화함

- Gov 3.0: 시맨틱 웹 표준(RDF)를 활용해서 개방형 데이터를 발행

이렇듯 개방형 데이터 생태계에서 정부 데이터, 공공 데이터의 개발과 보급의 중요

성이 강조되고 각 국 정부의 데이터 개방 선언이 이어지면서 정부가 제대로 Open

Data 정책을 추진하고 있는지에 대한 평가가 이루어지기 시작했다.

(6)

대표적이 것인 Web Index, Global Open Data Index, Open Data Barometer 등

이다. 이런 평가 지표와 결과들이 발표되고 각 국의 개방형 데이터 정책과 성과 평과가

가시화되고 순위화 되면서 Open Data에 대한 중요성과 확산 속도에 긍정적인 영향을

미치고 있다.

그러나 현재의 Open Data 평가 지표는 국가를 대상으로 한 평가지표와 결과이다.

기억기관(memory institution)은 전통적으로 정보를 관리, 서비스, 보존하고 있는 기

관으로 대상 개체를 관리, 서비스, 보존하기 위해 다양한 메타데이터를 개발하고 실제

데이터 개방 활동을 수행해왔다.

데이터 개방은 기억기관에게 새로운 업무, 서비스 영역이라기보다는 지속적으로 수

행해왔던 서비스의 연장선이라고 볼 수 있다. 하지만 현재의 ‘개방(Open)’, ‘개방형 데

이터(Open Data)’의 개념 정의에 맞게 개방을 하고 있는지에 대한 점검은 이루어지지

않고 있고, 개방된 데이터에 대한 성과측정, 과정의 타당성에 대한 평가는 체계적으로

이루어지고 있지 않다.

2. 연구의 목적 및 필요성

본 보고서의 목적은 정부를 대상으로 이루어지고 있는 Open Data에 평가를 한국과

학기술정보연구원에 적용 가능한 새로운 평가모델과 지표로 재구성하는 것이다.

‘Open Data’ 서비스가 본격화되고 평가가 이루어지고 있는 것이 비교적 최근의 일

로 ‘Open Data’ 개념에 대한 정의도 지속적으로 변화 발전하고 있으며, 평가모델과 지

표 역시 지속적으로 변화하는 양상을 보이고 있다.

본 보고서에서는 이런 점을 감안하여 현재 대표적인 평가모델, 지표 분석뿐만 아니

라 ‘Open Data’에 대한 정의에서부터 검토하여 한국과학기술정보연구원에 실제적인

적용과 결과를 도출할 수 있는 지표를 도출하고자 한다.

최종 결과는 한국과학기술정보연구원뿐만 아니라 전통적인 지식정보자원 관리의

주체인 기억기관의 Open Data 서비스 평가에 직접적으로 활용되거나 참고할 수 있

다.

3. 오픈데이터(Open Data)의 정의

3.1 오픈(Open)의 정의

‘Open Data’에 대한 정의와 이해를 위해서는 우선 ‘open’에 대한 정의가 필요하다.

정보통신 분야에서 ‘open’에 대한 정의는 ‘open source’에서 유래하고 재정의되는 경

향이 강하다.

현재 ‘open’, ‘open data’와 관련해서 가장 활발한 활동을 수행하고 있는 기관이

열린지식재단(Open Knowledge Foundation)으로 열린지식재단은 지속적으로 ‘open

data’에 대한 개념 정의를 수행하고 알리는 역할을 하고 있다. 열린지식재단은

‘http://opendefinition.org’를 통해서 지속적인 개정 작업을 하고 있는데 현재(2015

년 10월)는 버전 2.1의 정의가 이루어져 있다.

열린지식재단의 ‘open’ 역시 ‘open source’라는 용어에서 많은 부분을 참고하고

있으며 핵심적인 영향은 데비안 자유 소프트 가이드라인(Debian Free Software

Guidelines)과 Bruce에 의해 후에 정의된 ‘open source definition’에서 채용하고 있

다.

열린지식재단이 ‘open’에 대한 정의를 시도하고 발전시키는 이유는 용어에 대한 의

미를 명확히 함으로서 공유하고 상호운용성이 극대화될 수 있는 이해 형성에 있다. 열

린지식재단은 ‘open’은 기본적으로 지식을 대상으로 하며, 이를 설명하기 위해서 크게

열린 저작물(open works), 오픈 라이선스(open licenses)

1)

로 구분하고 세분화하여 설

명하고 있다.

저작물(works)은 전달되는 지식의 항목 또는 일부를 나타내기 위해 사용하는 용어

리며, 라이선스는 이런 저작물이 제공되는 법적인 조건을 의미한다. 퍼블릭 도메인은

저작권 혹은 유사 조건이 존재하지 않음을 내포하고 있다.

1) 본 용어 설명은 ‘opendefinition.org/od/2.1/ko’에서 한국어로 번영된 내용을 그대로 활용하고 있다. 본 문건에서는 국립국어원에서 출간된 국어순화용어자료집(1997)에 의하여 외래어 “Open”은 순화어 “열린”으로 번역해야 하지만 문맥에 따라 ‘오픈’과 병행하여 표기하고 있음을 밝히고 있다.

(7)

구 분 조 건 정 의

열린 저작물 (Open Works)

오픈 라이선스 혹은 열린 상태(Open License or Status)

저작물은 반드시 퍼블릭 도메인에 존재하거나 오픈 라이선스(2절에서 정의됨)로 제공되어야 한다. 저작 물에 수반된 어떤 추가적인 조건(이용 약관 또는 저 작자가 보유한 특허 등)도 저작물의 퍼블릭 도메인 상태나 사용된 라이선스의 조항과 모순되면 절대 안 된다.

접근(Access)

저작물은 반드시 완전한 형태로 제공되어야 하고, 복제를 위한 합리적 수준의 일회성 비용 이상을 요 구할 수 없으며, 비용 부담 없이 인터넷을 통해 내려 받을 수 있도록 해야 한다. 라이선스를 따르기 위해 요구되는 추가적인 정보(저작자 표시 요구사항을 따 르기 위한 기여자의 이름 등)는 반드시 저작물과 함 께 제공되어야 한다.

기계가독성(Machine Readability)

저작물은 반드시 컴퓨터로 쉽게 처리될 수 있고 저 작물의 개별 요소에 쉽사리 접근 및 수정을 할 수 있 는 형태로 제공되어야 한다.

오픈 포맷(Open Format)

저작물은 반드시 오픈 포맷으로 제공되어야 한다.

오픈 포맷은 금전적 또는 그 밖의 사용상 제약을 두 지 않고 적어도 하나 이상의 자유 또는 오픈 소스 소 프트웨어 도구로 완전히 처리될 수 있다.

오픈 라이선스 (Open Licenses)

요구되는 권한 (Required Permissions)

사용(use) 라이선스는 반드시 라이선스가 적용된 저작물에 대 해 자유로운 사용을 허락해야 한다.

재배포 (redistribution)

라이선스는 반드시 라이선스가 적용된 저작물에 대 한 재배포를 허용해야 하며, 이는 저작물 자체 또는 다른 출처의 저작물들로 구성된 집합 일부로 판매되 는 것을 포함한다.

변경(modification)

라이선스는 반드시 라이선스가 적용된 저작물로부 터 파생된 이차적 저작물의 창작을 허용해야 하고, 이차적 저작물이 원저작물과 같은 조건으로 배포될 수 있도록 허락해야 한다.

분리(separation) 라이선스는 반드시 저작물 일부가 다른 부분 또는 해당 부분을 처음 배포한 어떤 집합으로부터 분리되 표 1. 열린지식재단 Open Definition v2.1의 조건 및 정의

열린 저작물은 이런 3가지 핵심 용어의 정의를 기본적으로 내포하고 있는 의미로

열린 저작물로 배포되기 위해서는 [표 1]과 같은 조건을 갖추어야 한다.

구 분 조 건 정 의

어 자유롭게 사용, 배포, 변경될 수 있도록 허락해야 한다. 어떤 형태로든 저작물 일부를 원라이선스의 조건에 따라 받은 모든 사람은 원저작물에 대해 인 가된 것과 같은 권리를 소유해야 한다.

편집(compilation)

라이선스는 반드시 라이선스가 적용된 저작물이 별 개의 다른 저작물에 제약을 가하지 않으며 함께 배 포될 수 있도록 허락해야 한다.

차별

금지(non-discrimin ation)

라이선스는 어떤 사람이나 단체도 차별해서는 절대 안 된다.

전파 (propagation)

저작물에 결부된 권리는 반드시 추가적인 법적 조건 에 동의할 필요 없이 재배포된 모두에게 적용되어야 한다.

모든 분야에 활용 (application to any purpose)

라이선스는 반드시 목적에 상관없이 사용, 재배포, 변경, 편집을 허락해야 한다. 라이선스는 누구에게 도 특정 분야의 저작물 사용을 제한하면 절대 안 된 다.

무료 (no charge)

라이선스는 그 조건의 일부로 요금 체계, 사용료, 다 른 보상이나 금전적 보수 등 무엇도 요구하면 절대 안 된다.

허용 가능 조건 (Acceptable Conditions)

저작자 표시 (attribution)

라이선스는 대가성을 갖지 않는 한 저작물의 배포에 기여자, 저작권자, 후원자, 창작자 등 저작자를 표시 하도록 요구할 수 있다.

무결성 (integrity)

라이선스는 라이선스가 적용된 저작물의 변경된 판 이 원저작물과 다른 이름 또는 판 번호를 갖거나 변 경된 내용을 명시하도록 요구할 수 있다.

동일 조건 변경 허락 (share-alike)

라이선스는 저작물의 배포가 같거나 유사한 라이선 스를 따르도록 요구할 수 있다.

고지 (notice)

라이선스는 저작권 고지 및 라이선스 표시의 보존을 요구할 수 있다.

원시 코드 (source)

라이선스는 저작물을 배포하는 누구나 받는 사람이 쉽게 수정을 가할 수 있는 형식에 대한 접근을 제공 하도록 요구할 수 있다.

기술적 제한 금지(technical restriction

라이선스는 저작물의 배포가 허용된 권리의 행사에 제약을 가하게 될 모든 기술적 조치로부터 자유로울 것을 요구할 수 있다.

(8)

구 분 조 건 정 의 prohibition)

불가침(non-aggres sion)

라이선스는 변경자에게 라이선스에 의해 허락된 권 리를 행사하는 데 필요한 추가적 공개 권한(예, 특허 권)의 부여를 요구할 수 있다. 라이선스는 또한 허락 된 권리의 행사에 있어 라이선스를 공격(예, 특허 소 송)하지 않겠다는 동의를 조건으로 붙일 수 있다.

[출처: http://opendefinition.org/od/2.1/ko/]

열린지식재단의 Open Definition은 범용적, 추상적으로 사용되는 열린, 개방

(open)으로 정의되는 부분을 구체적인 요건과 세부적인 기술로 체계화하고 있다.

Open Data의 평가 시 정성적인 요소로 라이선스의 부여여부, 접근성, 활용성 등은 중

요한 평가 지표로 ‘opendefinition.org’의 정의는 중요한 시사점을 제시하고 있다고 할

수 있다.

3.2 오픈데이터(Open Data)의 정의

열린지식재단은 ‘opendefinition.org’외에 Open Data를 정책적으로 추진하고 데

이터를 개방하고자하는 경우 반드시 알아야하는 기본적이고 중요한 사항을 Open Data

Handbook

2)

으로 제시하고 있다. ‘Open Data Handbook’은 open data가 왜 필요하

고, 무엇이며, 어떻게 데이터를 공개할지 데이터 공개 후에 해야 할 일들에 대해서 구체

적으로 제시하고 있다.

본 보고서에서는 이 중 오픈 데이터가 무엇인지에 정의된 개념을 [표 2]와 같이

정리하고 향후 오픈 데이터 평가 모델 수립 시 주 척도로 활용한다.

2) http://opendatahandbook.org/

특 징 정 의

공공성(Public) Ÿ 정부기관과 관련 단체 등이 구축한 정보와 데이터 중 개인정보, 비밀성, 보안과 같은 최소한의 규제를 제외한 모든 정보와 데이터는 공공성을 가짐.

접근가능성 (Accessible)

Ÿ 개방형 데이터는 검색, 다운로드, 지표화가 가능하도록 편리하고 수정가능하고 개방된 형태(open format)와 기계가독형 형태(machine readable format)를 가져야 함.

Ÿ 개방형 데이터는 특정한 개인이나 단체를 차별하지 않고 가능한 모든 이용자와 사용목적을 고려해 만들어져야하고 이에 따라 다양한 형태로 배포될 수 있으 며, 이 형태(format)는 공공적으로 접근 가능하고 규제가 없는 것이어야 함.

상세설명 Ÿ 개방형 데이터는 이용자가 데이터를 처리하기 위한 정보뿐만 아니라 데이터의 표 3. 오바마 행정부의 Open Data 정의

특 징 정 의

가용성과 접근성 (Availability and

Access)

데이터는 인터넷을 통해서 다운로드 받을 수 있어야 하고, 원천데이터를 변 환하거나 새로운 저작물 생산에 합리적인 비용 소모가 가능해야함. 또한 데 이터는 편리하게 수정 가능한 형태로 제공해야 함.

재사용과 재배포 (Reuse and Redistribution)

데이터는 다른 데이터셋과 조합하여 사용하는 것을 포함한 재사용, 재배포 가 가능한 형태(가능하면 관련 라이센스나 법제도적 조항)여야 함.

범용적인 참여 (Universal Participation)

모든 사람이 사용, 재사용, 재배포할 수 있어야 함. 예를 들어, “상업적”, “비 상업적” 사용에 대한 제한 혹은 특정목적(교육용 등)을 위한 사용의 제한 등 이 없어야 함.

표 2. 열린지식재단 Open Data Handbook의 Open Data 정의

앞서 언급한 것처럼 열린 데이터 생태계에서 중요한 역할을 담당하고 있는 것이 정

부 데이터이다. 특히, 미국, 영국 등 주요국이 열린 정보(Open Gov.)를 새로운 정부운

영원칙으로 규정하면서부터 열린 데이터에 대한 관심과 보급이 가속화되고 있다. 특히

오바마 행정부가 가장 적극적인 행보를 보이고 있다. 미국의 오바마 행정부는 Open

Data를 다음과 같이 정의하고 있다

3)

.

3) Burwell, S. M., VanRoekel, S., Park, T., & Mancini, D. J. (2013). Open Data Policy—Managing Information as an Asset. Memorandum for the Heads of Executive Departments and Agencies.

(9)

특 징 정 의

(Described)

강점, 약점, 한계, 보안 요구사항 등 상세하고 충분한 설명을 갖추고 있어야 함.

Ÿ 이를 위해 개방형 데이터는 메타데이터에 대한 상세한 문서, 데이터 사전뿐만 아니라 샘플 데이터 등 다양한 정보를 제공해야 함.

재사용성 (Reusable)

Ÿ 개방형 데이터는 개방형 라이선스(Open Licence)로 배포되어야 하며, 이용에 규제가 있어서는 안 됨.

완전성 (Complete)

Ÿ 개방형 데이터는 처음 수집한 원천 형태 그대로를 실행 가능하도록 제공해야 함.

Ÿ 2차 저작물인 경우는 항상 원 데이터도 개방되어야 함.

적시성 (Timely)

Ÿ 개방형 데이터는 데이터의 가치 유지를 위해 가능한 빠르게 배포되어야하고 빈 도는 주요 이용자와 최종사용자의 필요에 따라 결정되어야 함.

사후관리 (Managed Post-Release)

Ÿ 개방된 데이터의 이용과 사후 이용자의 요구에 응대할 수 있도록 담당자의 연 락처가 명시되어야 함.

열린지식재단, 미국 오바마 행정부의 Open Data에 대한 정의가 중요한 이유는 이

들 정의의 경우 Open Data가 갖추어야할 특징에 대해 명확하게 기술하고 있기 때문이

다. 또한 명확하게 구분된 특징들은 Open Data Barometer 등의 모델 및 지표에도 직

접적으로 적용 가능하다.

(10)

제 2 장

선진사례 분석

1. Global Open Data Index

Global Open Data Index는 열린지식재단(OKF, Open Knowledge Foundation)

에서 수행하는 프로젝트로 전 세계 정부의 데이터 개방 정책, 실행을 평가하고 순위화

하고 있다. 2013년과 2014년 두 차례의 평가가 진행되어 결과가 공개되었다.

Global Open Data Index는 매년 정부가 개방 형태(open format)로 만들고 있는

데이터들이 실제로 시민, 언론, 시민사회단체 등에서 접근가능하고 잘 활용되고 있는지

를 개방형 데이터 전문가들에 의한 평가를 기반으로 순위화한다.

그림 1. Global Open Data Index 홈페이지(http://index.okfn.org/)

순위 2013년 2014년

국가 점수 국가 점수

1 영국 94% 영국 97%

2 덴마크 87% 덴마크 83%

3 미국 87% 프랑스 80%

4 노르웨이 76% 핀란드 73%

5 네더란드 74% 호주 72%

6 슬로베니아 73% 뉴질랜드 72%

7 핀란드 72% 노르웨이 71%

8 스웨덴 67% 미국 70%

9 호주 66% 독일 69%

10 뉴질랜드 66% 인도 68%

표 4. Global Open Data Index 2013 vs. 2014년 순위 비교

2013년 평가 시 70개국에서 2014년에는 97개국으로 확대되었는데 이는 남반구

국가들이 포함되었기 때문이다. Global Open Data Index는 현재(2015년 10월)

2015년 평가가 진행 중이다.

그림 2. 2014년 Global Open Data Index 국가별 현황

Global Open Data Index의 핵심은 개방되어야 할 핵심 데이터셋을 중심으로 개방

되어 있는 형태를 평가한다.

(11)

그림 3. Global Open Data Index 한국 평가 결과 상세

순위 데이터셋 주요 지적사항 2013년 순위

6 오염물질 배출량

(Pollutant Emissions)

Ÿ 벌크 형태의 다운로드를 제공하고 있지 않

아 감점됨. 33

11

교통시간표 (Transport Timetables)

Ÿ 벌크 형태의 다운로드를 제공하고 있지 않

아 감점됨. 16

표 5. Global Open Data Index 한국 평가 지적사항

한국의 경우 2013년 평가 시 33위를 기록하였으나 2014년에는 28위로 5단계 상승

한 결과를 보여준다.

한국의 핵심 데이터셋의 개방에 대한 평가결과와 2013년 대비 상세 결과는 다음과

같이 정리할 수 있다.

순위 데이터셋 주요 지적사항 2013년 순위

14 기업 등기부

(Company Register)

Ÿ 벌크 형태의 다운로드를 제공하고 있지 않 아 감점됨.

Ÿ 개방형 라이선스를 적용하고 있는지 여부 확인이 불가능하여 감점됨.

16

16

정부 지출 (Government

Spending)

Ÿ 정부지출을 확인할 수 있는 웹사이트 확인 이 불가능함.

Ÿ 공개적 활용, 무료 활용, 온라인 활용, 기계 가독형 형태 데이터 제공, 벌크 다운로드, 개방형 라이선스 적용, 적시에 데이터 제공 항목에서 모두 감점됨.

38

23 정부 예산

(Government Budget)

Ÿ 개방형 라이선스를 적용하고 있는지 여부

확인이 불가능하여 감점됨. 18

26 입법

(Legislation)

Ÿ 공개적 활용, 벌크 다운로드, 개방형 라이선

스 적용 항목에서 모두 감점됨. 46

41 국가통계

(National Statistics)

Ÿ 벌크 다운로드 불가능과 개방형 라이선스

미적용으로 감점됨. 43

42

우편번호 (Postcodes /

Zipcodes)

Ÿ 공개적 활용, 무료 활용, 온라인 활용, 기계 가독형 형태 데이터 제공, 벌크 다운로드, 개방형 라이선스 적용, 적시에 데이터 제공 항목에서 모두 감점.

11

46 국가지도

(National Map)

Ÿ 공개적 활용, 무료 활용, 벌크 다운로드, 개 방형 라이선스 항목에서 모두 감점. 34

53 선거결과

(Election Results)

Ÿ 기계가독형 형태 데이터 제공, 벌크 다운로 드, 개방형 라이선스 제공 부분에서 모두 감 점됨.

33

한국의 경우 대부분의 항목에서 2013년에 비해 상승된 순위를 보이고 있지만, 정부

예산, 우편번호, 국가지도, 선거결과에 대해서 하향된 결과를 보이고 있다.

평가 절차는 크게 두 단계로 볼 수 있다. 첫 번째는 핵심 데이터셋 10종에 대한 확보

이며, 두 번째는 확보된 정보가 정확한지를 지역전문가와 데이터 전문가에 의해 검증을

받는 것이다. 핵심 데이터셋은 총 10개로 열린지식재단의 열린 정부 커뮤니티와 G8 국

가의 핵심 데이터셋에 기반하여 다음과 같이 선정하였다.

(12)

특 징 정 의

오염물질 배출량 (Pollutant Emissions)

Ÿ 인간의 건강과 관련하여 (온실가스 배출량 등을 요구하지는 않음) 특히, 대기 오염 물질 방출에 대한 총 데이터 정보로 국가 수준 혹은 더 상세한 수준까지의 연간 기준 이상 데이터 제공을 확인함(예, 탄소, 질소 배출 등).

교통시간표 (Transport Timetables)

Ÿ 정부 차원에서 운영되고 있는 공공 교통 서비스가 대상으로 특히 버스와 기차가 주임.

기업 등기부 (Company Register)

Ÿ 기업의 등기부 정보로 회사명, 고유식별자, 주소, 활동 정보 등을 제공하 고 있는지 확인함.

Ÿ 단, 대차 대조표 , 재무데이터 등을 포함할 필요는 없음.

정부 지출 (Government

Spending)

Ÿ 실제로 과거에 정부에서 지출한 상세내역을 제공해야함.

정부 예산 (Government Budget)

Ÿ 정부 예산 관련 데이터로 부처 별 등 높은 수준의 정보를 제공해야하는 데 실제 과거에 일어난 지출 정보가 아니라 예산 관련 계획 데이터를 의 미함.

입법 (Legislation)

Ÿ 국가의 법령 정보를 온라인 상으로 확인할 수 있어야하는데 법률 제정 과정의 투표 결과 등은 필수적이지 않음.

국가통계

(National Statistics) Ÿ 핵심 통계는 인구학적, 경제적 지표로 GDP, 실업률, 인구 등임.

우편번호 (Postcodes /

Zipcodes)

Ÿ 우편번호 정보로 우편번호와 대응하는 지리적 좌표 정보(위, 경도)를 포 함하고 있어야함.

국가지도

(National Map) Ÿ 1:250,000(1Cm=2.5Km) 수준의 국가지도를 제공해야함.

선거결과

(Election Results) Ÿ 국가의 주요한 모든 선거 관련 데이터(선거구, 지역별 결과 등) 제공.

표 6. Global Open Data Index 평가 데이터셋

데이터 수집은 두 단계로 이루어지는데 첫 단계는 자원봉사자 등을 통해 데이터셋

에 대한 데이터를 수집하는 단계이고 두 번째는 전문가(자원자)를 통해서 결과를 검증

하는 단계이다. 각각의 데이터셋은 9개의 서로 다른 질문을 통해 평가된다. 9개의 각

질의문과 간략한 구성 내용 가중치는 다음과 같다.

질 의 간략 내용 가중치

데이터가 존재하는가? 데이터가 존재하고 아날로그, 디지털 형태로 활용가능한?

오프라인, 온라인 형태로 활용가능한가를 평가함 5

데이터가 디지털형태인가? 이 질의를 통해서 데이터가 컴퓨터 혹은 디지털 저장소에 저장되어 있는지 종이형태로만 활용가능한지를 평가함 5

공개적으로 활용가능한가?

이 질의는 데이터의 ‘공공성’을 평가하는 것으로 데이터에 대한 접근이 자유로운가를 평가함. 데이터를 얻기 위해 요청하거나 접근하는데 제약이 있을 경우 ‘공공성’을 갖추지 않은 것으로 간주함.

5

데이터를 무료로 활용가능한가?

이 질의는 데이터가 무료인지 혹은 과금이 되는지를 평가함.(과금이 되는 경우에 관련 사항에 대한 별도의 설명을 추가한 후 평가함)

15

데이터를 온라인 상에서 활용할 수 있는가?

이 질의는 공식적인 출처로부터 해당 데이터를 온라인상에서 활용할 수 있는가를 평가하기 위한 것으로 이를 증명할 수 있는 URL정보의 기술이 필요함

5

데이터는 기계가독형인가?

이 질의는 데이터가 기계가독형 형태인지를 평가하기 위한 것임. 데이터는 디지털형태이지만 PDF 문서처럼 기계 가독형이 아닌 것들이 존재함(특히, PDF의 표 데이터).

스프레드쉬트형 문서는 기계가독형 데이터로 인정함.

15

데이터는 벌크형태로 활용가능한가?

이 질의는 데이터 전체를 쉽게 다운로드 받거나 접근할 수 있도록 하고 있는지를 평가함. 비 벌크 형태이지만 거대 데이터베이스의 정보를 시민이 직접 질의하고 원하는 필요한 정보를 다운로드 받을 수 있는 경우는 고려 대상임.

10

개방형 라이선스를 적용하고 있는가?

이 질의는 데이셋이 개방형 라이선스 조항을 기술하여 사람들이 자유롭게 사용, 재사용, 재배포할 수 있는지를 기술하고 있는지 평가하기 위한 것임. 라이선스 정보가 없을 경우 이 데이터는 개방된 형태로 보기 어려움.

30

데이터는 적시, 최신성에 기반하여 제공되고 있는가?

이 질의는 데이터가 적시에, 최신성을 유지한 상태로 제공되고 있는지를 평가하기 위한 것임(예를들어 선거결과를 즉시제공하는가 일정 시간 경과 후(몇 년 후) 제공하고 있는가? 등)

10 표 7. 데이터셋 별 질의문과 가중치

각 데이터셋을 평가하기 위한 상세 질의문과 평가를 위한 상세 기준 정보는 다음과

같다.

(13)

① 데이터가 존재하는가? 존재한다면 어느 사이트에서 확인할 수 있고 어떤 포맷(

Excel, XML, HTML)으로 제공하고 있는가?

- 정부 혹은 정부를 대표할 수 있는 기구를 통해서 직접 공식적인 정부데이터를

제공해야함.

- 기업, 시민단체, 비정부기구 등을 통해서 확인되는 정부 데이터는 인정되지

않음(단, 정부에서 공식적으로 승인, 동의를 받았을 경우는 가능함).

② 데이터는 디지털형태로 제공되는가?

- 컴퓨터를 통해서 데이터에 접근이 가능한지를 확인.

- 온라인을 통해서 데이터를 찾을 수 있다면 그 형태가 스캔을 통한 디지털 자료

라도 가능함.

- 만약 데이터가 디지털화 되어있지만 접근이 불가능한 경우일 경우에도 만약

데이터 개방 신청 등을 통해서 자료를 받을 수 있다면 이 항목은 ‘Yes’로 확인

가능함.

③ 공개적인 접근이 가능한가?

- 데이터에 제한 없이 자유롭게 공개적으로 접근이 가능할 경우 다음 중 어떤

경우인지 확인

∙ 비밀번호나 승인 과정 없이 온라인으로 접근이 가능한지 확인

∙ 데이터가 종이형태이지만 공개적으로 접근가능하고 복사 등에 제한이 없음

- 데이터가 제한 없이 자유롭게 접근, 활용이 불가능한 경우 다음 중 어떤 경우

인지 확인

∙ 정보자유법신청서(FOIA, Freedom Of Information Request)를 제출한

후에 활용 가능

∙ 정부관리(공무원)만 접근이 가능함

④ 데이터는 무료로 활용가능한가?

- 어떤 비용지불도 있어서는 안 됨

⑤ 데이터를 온라인에서 활용 가능한가?

- 만약 이메일을 통해서 정부 데이터를 입수할 수 있지만 온라인 상에서 활용이

가능하지 않다면 이 항목에는 ‘예’로 확인할 수 없음

⑥ 데이터는 기계 가독형인가(Machine Readable)?

- 데이터는 컴퓨터를 통해서 쉽게 처리 가능해야함.

∙ 기계가독형 파일 형태: XLS, CSV, JSON, XML

∙ 비기계가독형 파일 형태: HTML, PDF, DOC, JIF, JPEG, PPT

※ 파일 포맷에 대한 판단이 어려울 경우 Open Data Census에 연락하여 확인

필요함

⑦ 벌크(bulk) 형태로 활용이 가능한가?

- 모든 데이터셋은 쉽게 다운로드 받을 수 있어야 함.

- 온라인 인터페이스를 통해서 데이터의 일부분만을 얻을 수 있는 경우는 벌크

형태가 아닌 것으로 간주함(웹 폼을 통해서 질의문을 통해서 대규모 데이터베

이스를 대상으로 일부 결과만을 탐색하도록 제한이 되는 경우).

⑧ 개방형 라이센스를 사용하고 있는가?

- 모든 데이터 용어와 제공되는 데이터셋은 사용, 재사용, 재배포에 제한이 없어

야 함.

- 서비스 사이트에는 개방의 정의가 명확하게 정의되어 있어야 하고 오픈 라이

센스를 확인할 수 있어야 함(웹 사이트 하단 혹은 별도 메뉴 등에 표기하여

함).

⑨ 데이터가 즉시성 있게 제공되고 있는가?

- 데이터가 시간과 관련되어 있을 경우 즉시성 있게 정보를 제공하고 있는지 확인.

(14)

- 국가 예산의 경우 가장 최근 연도의 데이터가 존재하는지 확인해야하고 과거

데이터와 일정한 주기로 업데이트되고 있는 지 확인할 수 있어야 함(국가예산,

교통, 우편번호 등은 서로 다른 주기(정기, 비정기)를 가질 수 있으며 가장 최

적화된 주기를 설정할 필요가 있음).

데이터셋에 대한 평가 지표 항목이 수집되고 제출될 때마다 다음 단계별로 확인 작

업이 수행된다. 먼저 기여자(contributor)가 해당 국가의 핵심 데이터셋의 가용성에 대

한 정보를 제출하면 해당 결과는 열린지식재단에서 지명된 해당 지역의 전문가가 추천

한 검토자에게 발송되고 검토자는 제출 결과가 정확한지를 검증한다. 제출 정보에 문제

가 있을 경우 검토자는 전문가(expert)에게 도움을 요청할 수 있고 이 단계까지가 완료

되면 온라인상으로 결과가 반영된다.

평가는 온라인으로 진행되는데 실제 입력 화면은 아래의 그림과 같다.

그림 4. Global Open Data Index 온라인 설문조사 화면

그림 5. Global Open Data Index 데이터세별 평가 화면

Global Open Data Index의 가장 큰 특징은 해당 지표에 대한 평가내용 등도 상이

하나 개방형 데이터 평가를 위해 데이터제출자, 검토자, 전문가 등 체계적인 검토체계

를 갖추고 있는 것이다. Global Open Data Index에서 가장 중요한 가중치를 갖는 지

표는 라이선스 관련 항목으로 개방된 데이터가 구체적으로 어떤 조건하에 사용가능한

지를 명확하게 전달하는 것이 활용성에 가장 큰 영향을 주는 요소로 고려하고 있다.

2. Web Index

Web Index는 월드와이드웹 재단에 의해서 만들어진 최초의 다차원 척도로 전 세계

적으로 인터넷의 정치, 경제, 사회적 영향도를 측정하고 각 국별로 순위를 공개하고 있

다. 2012년에 처음 발간되었으며, 2013년 발간자료부터 평가대상에 20개국이 추가되

고 개방형 데이터(Open Data), 개인정보보호, 검열 등의 지수가 신규로 추가되었다.

현재(2015년 6월) 2014년 까지 결과가 공개되었다.

(15)

Web Index 측정을 위한 하위 지표는 범용적 접근(Universal Access), 관련

콘텐츠(Relevant content), 자유와 개방성(Freedom and Access), 기여도

(Empowerment)이다. 4개 하위 지표 중 개방형 데이터와 관련된 지표는 자유

와 개방성이다.

그림 6. Web Index 홈페이지

2012년에서 2014년까지 3개년간의 상위 10개국 현황을 비교해보면 다음과

같다.

그림 7. Web Index 2014년 한국의 평가 결과 순위

2012년 2013년 2014년

국가 점수 국가 점수 국가 점수

1 100 스웨덴 100 덴마크 100

2 미국 97.31 노르웨이 97.5 핀란드 98.81152793

3 영국 93.83 영국 95.6 노르웨이 97.31680173

4 캐나다 93.42 미국 95.2 영국 95.67142342

5 핀란드 91.88 뉴질랜드 92.4 스웨덴 94.96911846

6 스위스 90.49 덴마크 92.4 미국 94.51597129

7 뉴질랜드 89.15 핀란드 91.9 아이슬란드 93.7222288

8 호주 88.44 아이슬란드 91.9 한국 92.80714227

9 노르웨이 87.76 프랑스 90.9 네덜란드 91.83557987

10 아일랜드 87.42 한국 87.4 벨기에 89.61122621

표 8. Web Index 국가별 평가 결과(2012 ~ 2014)

2012년에서 2014년까지 한국의 전체 순위와 하위 지표별 점수는 다음과 같

다.

(16)

순위 전체순위 universal access

relevant content

freedom and openness

impact and empowerment

2012 13(81.06 )

2013 10(87.40점) 91.9 90.0 66.8 73.1

2014 8(92.81점) 95.92 96.58 74.90 82.14

표 9. Web Index 한국의 평가 결과 비교(2012 ~ 2014)

2012년의 경우 하위 지표 구성이 현재와 달라 단순비교가 어려워 세부 점수

를 기입하지 않았다.

전체 Web Index의 평가 모형은 <그림 8>과 같다.

그림 8. Web Index 평가모형 구조

하위지표 측정범위와 정의

범용접근(Universal Access)

국가가 고품질의 인터넷 접근이 가능한 기반시설에 대한 투자와 시민들이 웹을 잘 사용할 수 있도록 교육에 대한 투자가 이루어지고

있는지를 평가함 자유와 개방성(Freedom and

Openness)

시민들이 온라인에서 안전하고 자유롭게 의견을 게재하고 표현하할 수 있는지와 개인정보보호에 대한 권리를 누리고 있는지를 평가함

관련 콘텐츠(Relevant Content)

시민들이 그들의 언어로 다양한 정보들을 쉽고 편안하게 사용할 수 있어야 하고, 다양한 채널과 플랫폼을 통해서 관련된 콘텐츠에

편안하게 접근할 수 있어야 함

기여도(Empowerment) 웹이 사회, 경제, 정치, 환경 분야에서 긍정적인 변화를 야기하고 있는지를 평가함

표 10. 하위 지표별 측정 범위와 정의

지표 하위지표 비중

1. Web Index

1.1. 범용 접근(Universal Access) 0.25

1.1.1. 통신기반 0.333333

1.1.2. 접근 및 재정 0.333333

1.1.3. 교육 및 의식 0.333333

1.2. 자유와 개방성(Freedom and Openness) 0.25

1.2.1. 웹의 개방성 1

1.3. 관련 콘텐츠(Relevant Content) 0.25

1.3.1. 웹 활용 0.5

1.3.2. 콘텐츠 창작 0.5

1.4. 기여도(Empowerment) 0.25

1.4.1. 경제적 영향 0.333333

1.4.2. 정치적 영향 0.333333

1.4.3. 사회적 환경적 영향 0.333333 표 11. 평가지표의 구성과 비중

전체 하위 지표가 측정하는 범위와 정의는 <표 10>과 같다.

전체 하위 지표의 구성과 비중은 <표 11>과 같다.

(17)

코드명 공식명칭(간략설명) 링 크 관련지표

CIA

Central Intelligence Agency [ , 중앙정보국]

https://www.cia.gov/index.html -

EIU

Economist Intelligence Unit

[영국, 시가경제주간지 The Economist의 계열사]

http://www.eiu.com/ 자유와 개방성

EM Euromonitor

[글로벌 시장조사 리서치사] http://www.euromonitor.com/ 권한(기능)분산

FH

Freedom House [미국, 비정부기구, 민주주 의, 정치자유, 인권활동]

http://www.freedomhouse.org/ 자유와 개방성

Facebook Facebook

[소셜미디어] https://www.facebook.com/ -

IEA

International Energy Agency [국제에너지기구]

http://www.iea.org/ 범용접근

INSEAD INSEAD Business School

[유럽경영대학원] http://www.insead.edu/ 권한(기능)분산

ITU

International Telecommunication Union [국제전기통신연합]

http://www.itu.int 범용접근

ODB Open Data Barometer http://www.opendataresearch.org/baro meter

자유와 개방성 관련콘텐츠 권한(기능)분산 표 12. 평가 데이터 목록과 관련 지표

각 하위지표의 평가에는 세계적으로 신뢰받을 수 있는 기관의 데이터를 근거

자료로 활용한다. Web Index에서 활용하고 있는 평가용 데이터 목록과 출처

현황은 <표 12>와 같다.

코드명 공식명칭(간략설명) 링 크 관련지표

RSF Reporter Sans Frontieres http://www.rsf.org 자유와 개방성

SN

Social networks:

Facebook and others [소셜미디어]

관련콘텐츠

UN United Nations

[국제연합] http://www.un.org

범용접근 관련콘텐츠 권한(기능)분산

UNESCO UNESCO

[유네스코] http://www.unesco.org -

WB World Bank

[세계은행] http://www.worldbank.org/ 범용접근

WEF World Economic Forum

[세계경제포럼] http://www.weforum.org/ 자유와 개방성 권한(기능)분산

WF Web Foundation

[월드 와이드 웹 재단] http://www.webfoundation.org -

WI

Wireless Intelligence(GSMA) [세계이동통신사업자협회]

https://gsmaintelligence.com/ 범용접근

Wikipedia Wikipedia http://wikipedia.org 관련 콘텐츠

자유와 개방성과 관련된 평가 요소는 언론 자유지수(Press Freedom

Index), 출판·보도의 자유(Press Freedom), 국정참여권(Political Rights), 시민

자유(Civil Liberities)이다.

자유와 개방성 관련 지표의 결과 확인을 위한 주요한 질문은 다음과 같다.

① 최근 12개월 내에 정치적, 사회적으로 민감한 웹 콘텐츠가 정부에 의한 차단되거

나 혹은 정보통신기업에게 콘텐츠를 차단, 필터 혹은 내리도록 요구된 경우는 어

느 정도인가?

② 해당 국가의 개인 정보 보호를 위한 강력한 법적 규제는 어느 정도인가?

③ 해당 국가는 어느 정도까지 정보권(Right to Information), 정보자유권(Freedom

(18)

of Information) 관련 법률이 기능하고 있는가?

④ 인터넷 서비스 제공자들이 특정 유형 혹은 상업적 이익을 위해 웹 콘텐츠 제공,

서비스를 차별하지 않도록 네트워크 트래픽 관리를 하도록하는 법, 규정은 어느

정도 수준인가?

⑤ 인터넷 중개자들은 (유통자, 인터넷 서비스 제공자, 웹 호스팅회사, 사이버 카페,

검색엔진 혹은 인터넷 접속 제공자) 이용자들이 생산, 저장, 배포한 불법 콘텐츠

에 대한 법적 책임으로부터 명확하게 보호되고 있는가?

⑥ 전자적 통신에 있어서 개인 정보를 보호하기 위한 실질적이고 적법한 절차를 제

공하는 국가의 법률과 규정은 어느 정도 수준인가?

⑦ 법 집행기관과 법원은 정보통신 기술 도구가 성차별적 폭력을 저전자적

통신에 있어서 개인 정보를 보호하기 위한 실질적이고 적법한 절차를 제

공하는 국가의 법률과 규정은 어느 정도 수준인가?

Web Index는 최초의 다차원척도로 이후 Open Data Barometer 등의 중요한 선행

연구 및 주요 핵심 지표로 활용되고 있다. 열린 데이터는 개인정보보호, 검열 등과 함께

2013년부터 새롭게 추가된 지표로 웹 생태계의 변화에 따라 향후에도 기존 평가지표의

변화와 새로운 평가지표의 생성이 지속될 것으로 예상할 수 있다.

Web Index의 모든 지표 확인을 위해서는 전문가의 의견 혹은 이를 평가할 수 있는

신뢰도 있는 기관의 데이터가 필수적이다. 또한 전문가의 주관적인 판단과 능력에 따라

신뢰도가 달라질 수도 있고, 평가를 위해 활용되는 원천 데이터 제공기관의 특성, 데이

터의 신뢰도에 따라 결과가 달라질 수 있다. 때문에 실제 평가에 있어서 평가지표의 적

절성 외에도 평가자, 원 데이터 소스의 신뢰성 확보 문제가 중요한 요소이다. Web

Index의 지표들은 기술적인 평가지표보다는 자유, 개방성관련 개념적 평가지표와 상세

평가 내용 등에 참고할 수 있다.

3. Open Data Barometer

Open Data Barometer는 월드와이드웹 재단(WWW, World Wide Web

Foundation)과 오프데이터 연구소(Open Data Institute)가 세계 각 국 정보의 오픈

데이터 현황을 분석하여 순위화하고 있는 보고서이다. Web Index가 인터넷의 정치,

경제, 사회적 영향도를 광범위하게 측정하고 있는 반면, Open Data Barometer는 각

국 정부의 개방형 데이터 측정에 집중하고 있다.

그림 9. Open Data Barometer 홈페이지

ODB는 2013년, 2014년 두 차례 분석을 수행한 바 있으며 결과는 <그림 10>과 같

다.

(19)

그림 10. Open Data Barometer 2013, 3014 결과

한국의 경우 2014년 조사결과에서 17위를 기록했는데 이는 13년과 비교했을 때 5

단계 하락한 순위이다.

그림 11. Open Data Barometer 한국 순위 변화

그림 12. Open Data Barometer 한국 평가결과 상세

핵심 데이터셋 설 명

(Mapping data)

국가 지도를 유지 관리하는 기관에서 상세한 공식, 행정적 경계, 도로 등 인프라 시설에 대한 정보를 1:250,000 이상의 척도로 제공하고 있는 데이터.

토지소유데이터(Land ownership data)

토지 소유권에 대한 국가 차원에서 제공하는 데이터 셋으로 일반적으로 국가의 토지를 등록 관리하는 기관의 데이터베이스에 의존함.

국가 통계(National statistics) 통계기관에서 제공하는 인구 및 경제관련 지표 데이터로 GDP, 실업율, 인구 등에 대한 정보를 분기 혹은 연단위로 제공하는 것.

세부 국가예산 데이터(Detailed budget data)

높은 수준의 국가 정부 예산으로 부서의 부문별 세부 지출 계획 데이터를 의미함.

정부 지출 데이터(Government

spend data) 실제 과거의 정부 지출에 대한 상세한 데이터셋.

기업 등기부(Company registration data)

국가에 등록된 회사의 등기 정보로 회사명, 식별자, 주소, 활동 분야 등의 정보를 담고 있는 데이터셋.

법률 데이터(Legislation data) 국가 재정 법률 정보 데이터셋.

대중 교통 시간 데이터(Public

transport timetable data) 버스, 지하철과 같은 대중 교통 서비스의 시간, 장소 정보 데이터셋.

국제 무역 데이터(International

trade data) 특정 상품 혹은 국가와의 수입, 수출 데이터셋.

보건 부문 성과 데이터(Health sector performance data)

전체적인 의료시스템 현황을 파악할 수 있는 데이터로 예방접종, 수준, 의료서비스 접근 수준, 특정 그룹에 대한 건강관리 결과, 의료서비스와 환자의 만족도 등에 대한 데이터셋.

초등, 중등 교육 성과 데이터(Primary and secondary education performance data)

국가 교육 서비스의 성과와 시민의 복지에 대한 영향력을 확인할 수 있는 데이터로 국가 수준 시험의 점수, 학교 출석률, 교사 출석률 등을 가지고 있어야하며, 단순한 학교 정보 리스트는 의미있는 데이터셋으로 취급하지 않음.

범죄 통계 데이터(Crime statistics data)

범죄 통계 데이터로 온라인 상으로 범죄의 위치, 실시간 범죄 보고서, 연간 수준에서 세분화된 범조 데이터, 범죄 지도 등의 데이터셋.

국가 환경 통계 데이터(National 탄소 배출, 오염 물질 배출에 대한 데이터셋.

표 13. ODB 평가 데이터 목록과 관련 지표

Open Data Barometer의 경우 핵심 데이터 셋에 대한 개방 여유를 평가하는 것이

중요하다. Open Data Barometer에서 평가하는 중요한 데이터셋의 상세 현황은 <표

13>과 같다.

(20)

핵심 데이터셋 설 명 environmental statistics data)

선거 결과 데이터(National

election results data) 과거 10년 이상의 모든 국가 선거 결과에 대한 데이터셋.

공공 계약 데이터(Public

contracting data) 정부에 의해 입찰된 중요 계약 정보 데이터셋.

지표 평가대상 세부 요소 연구방법

준비성

국가(정부)가 개방형 데이터 구현을 위해 정치적, 사회적, 경제적 토대를 얼마나 견고하 게 구축했는지를 평가함

Ÿ 정부의 의지와 기술적 역량

Ÿ 기업의 역할과 역량 Ÿ 시민의 정치적 자유와

권리

Ÿ 전문가(동료평가) 평가 후 실 데이터 조사

실행력

정부가 혁신, 신뢰성, 사회정책 개선을 위해 얼마나 다양한 데 이터를 공개하고 있는지를 평 가함

Ÿ 데이터셋의 신뢰성 Ÿ 데이터 셋의 혁신성 Ÿ 데이터셋의 사회정책

Ÿ 데이터셋 평가

영향력

개방형 데이터가 정치, 사회, 환경, 경제적으로 긍정적인 변 화를 일으키는지를 평가함

Ÿ 정치: 투명성, 신뢰성, 효율성

Ÿ 경제 : 기업에 대한 지 원(기존 기업 및 신생 기업)

Ÿ 사회 : 환경 영향력, 사 회소외계층 수용도

Ÿ 전문가(동료평가) 평가 표 14. ODB 지표별 세부 연구방법

Open Data Barometer가 적용하고 있는 개방형 데이터 지표는 준비성

(Readiness), 실행전략(Implementation), 영향력(Emerging impact)이다. 각 지표의

평가 대상과 세부 구성요소, 하위지표 및 체크리스트 작성을 위한 방법은 아래와 같다.

ODB 대상 국가는 The Web Index 2013에 포함된 국가를 표본으로 하고 있으

며, 평가를 위한 데이터는 다음과 같은 방법론에 근거하여 획득한다.

지표 구 분 연 구 방 법

준비성 정부

전문가조사

Ÿ 해당 국가는 충분한 자원지원을 받는 개방형 데이터 이니셔티브가 수행되고 있는가?

Ÿ 지방 정부 등이 자체적으로 개방형 데이터 이니셔티브를 어느 정도 활발히 운영하고 있는가?

2차 데이터 Ÿ 2013년 World Economic Forum Global Information Technology 보고서

기업 전문가조사

Ÿ 개방형 데이터를 활용하기 위해 개인이나 기업에 제공되고 있는 교육은 어느정도인가?

Ÿ 정부가 개방형 데이터를 활용한 새로운 문화를 위해 직접 자원하는(공모전 개최, 보조금 지원 등) 수준은 어느정도인가?

표 16. 지표별 세부 조사내용 데이터 획득 방법 상 세 내 용

전문가(동료평가)

Ÿ 2013. 7 – 10까지 수행

Ÿ 전문가를 대상으로 개방 데이터 관련 다양한 질문을 제시하고 10점 척도로 평가

Ÿ 모든 점수는 Z-Score로 정규화

데이터셋평가

Ÿ 전문가 평가, double-blind review, 기술전문가 검증

Ÿ 15개 데이터에 대한 10개 체크리스트로 주로 데이터 활용가능성, 형태, 라 이선스, 적시성 등을 평가함(10점 척도 평가)

Ÿ 각 질문에 대해서 이를 증명할 수 있는 출처를 링크할 수 있도록 함

2차 데이터

Ÿ 전문가 평가의 문제점을 보완하기 위해서 신뢰성 높은 기관의 데이터를 보 조적으로 활용함

Ÿ Web Index가 활용하고 있는 주요 데이터 출처를 활용함(UN, Freedom House 등)

표 15. ODB 데이터 획득 방법

상위 지표에 해당하는 하위지표의 구체적인 세부지표, 조사내용은 다음과 같다.

(21)

지표 구 분 연 구 방 법

2차데이터

Ÿ 2012년 World Economic Forum Global Competitiveness Index 참조

Ÿ 인구 100명당 인터넷 사용자(World Bank 지표)

시민

전문가조사

Ÿ 국가의 정보권리법이 얼마나 제 기능을 하고 있는가?

Ÿ 국가의 데이터 보호법이 얼마나 제 기능을 하고 있는가?

Ÿ 시민(사회단체)과 정보전문가들의 개방형 데이터와 관련한 정부 참여는 어느정도인가?

2차데이터 Ÿ 2013년 Freedom House Political Freedoms and Civil Liberties Index(정치적 자유와 시민 자유 지표) 참조

실행력

전문가 설문(답변을 뒷받침할 수 있는

증빙자료 첨부)

Ÿ 데이터셋 평가를 위한 질문 1. 데이터셋이 존재하는가?

2. 형태에 상관없이 정부 데이터를 온라인상에 이용가능한가?

3. 기계가독형 데이터셋을 제공하는가?

4. 기계가독형 데이터셋을 벌크형태로 다운로드 가능한가?

5. 제공 데이터셋은 무료로 이용가능한가?

6. 데이터셋은 개방형 라이선스를 갖고 있는가?

7. 데이터셋은 최신성을 유지하고 있는가?

8. 개방된 데이터셋은 지속가능성을 보장하는가?

9. 데이터셋 탐색은 용이한가?

10. 데이터셋의 중요 요소(개체)에 URI를 부여하고 있는가?

실행력 하위요소 평가를 해 활용한 데이터 범주

Ÿ 혁신성 : 기업의 부가가치 창출이 가능한 데이터 ü 지도, 대중교통 시간표, 범죄통계, 국제무역 Ÿ 신뢰성 : 정부, 기업에 책임 부여

ü 법률, 선거결과, 상세 국가예산, 상세 정부 지출, 기업 등기부

Ÿ 사회정책성 : 사회 정책 비판 및 권리강화 ü 보건, 초중등교육, 국가환경통계, 인구, 토지소유

영향력

전문가 설문(답변을 뒷받침할 수 있는

증빙자료 첨부)

Ÿ 데이터셋 평가를 위한 질문

1. 개방형 데이터가 정부의 효과성, 효율성 증대에 현저한 영향을 주었는가?

2. 개방형 데이터는 국가의 투명성, 신뢰성 강화에 현저한 영향을 주었는가?

3. 개방형 데이터가 국가의 환경 지속가능성에 현저한 영향을 주었는가?

4. 개방형 데이터는 정책 입안, 정부 서비스 접근에 있어서 소외계층을 포용력 증대에 현저한 영향을 주었는가?

5. 개방형 데이터는 국가 경제에 현저하게 긍정적인 영향을 주었는가?

지표 구 분 연 구 방 법

6. 사업가들은 개방형 데이터를 활용하여 성공적으로 신규 사업 창출을 하였는가?

혁신(Innovation) 사회정책(Social Policy) 책임(Accountability)

일반적으로 기업에 의해서 사용 되거나 혹은 명확하게 기업에 큰 가치를 가져다 줄 수 있는 개 방형 데이터

사회 정책을 계획, 실행, 비판하 는데 도움을 줄 수 있는 데이터

정부와 기업의 책임을 요구하는 데이터

지도 데이터, 공공 교통 시간표, 범죄 통계, 국제 무역 데이터, 공공 계약

보건 부문 성과, 초등/중등 교육 성과 데이터, 국가 환경 통계, 상세 인구 데이터

토지 소유 데이터, 법률, 국가 선거 결과, 상세 정부 예산, 상 세 정부 지출, 기업 등기 데이터 표 17. 주요 지표별 핵심 데이터셋

실제 평가에서는 핵심 데이터셋에 개방 여부가 가장 기본적인 기초 데이터로 각 지

표별 해당 데이터셋은 다음과 같다.

Open Data Barometer는 선행 사례인 Web Index, 5 Star Open Data의 내용을

배경으로 하고 있으며, 실제 평가에 적용하고 있다. 특히 정부, 기업, 시민 등 데이터와

관련된 모든 이해관계자별 지표 수립과 평가를 수행하고 있어 가장 최근의 결과이자

가장 신뢰도 높은 결과로 활용 가능하다. Open Data Barometer의 결과를 참조하여

상위권 국가의 현황을 참조하여 국내의 부족한 부분을 보충할 수 있는 자료로 활용 가

능하며, 동일한 지표 연구방법을 적용하고 범위를 축소하여 국내 연구 진행이 가능하

다.

4. Open Data Readiness Assessment

개방형 데이터 준비 평가 도구(ODRA)는 세계은행(World Bank)의 열린 정

(22)

부 데이터 작업반에서 정부의 열린 정부를 지향하는 각 국 정부의 현황과 상태

를 평가하기 위한 방법론이다.

준비평가도구는 열린 정부 데이터 툴킷(Open Government Data Toolkit)

의 하나의 구성요소로 전체 구성은 <그림 13>과 같다.

그림 13. World Bank - Open Government Data Toolkit

툴킷의 전체 구성은 Open Data Essentials, Technology Options, Demand and

Engagement, Supply and Quality of Data, Readiness Assessemtn Tool로 구성되

며 각 항목별 상세 내용은 다음과 같다.

① Open Data Essentials에서는 개방형 데이터의 개념정의부터 실제 사례, 응용서

비스, 정책 등을 설명하며 세부적 내용은 다음과 같다.

∙ 데이터 개린을 준비하는 열린 정부에 준비하는 출발점에서 확인해야하는 정

보들을 체계적으로 제공함

∙ 기술적인 측면에서의 개방의 정의와 법적인 측면에서의 개방의 정의 명확히

하고 각 국의 개방형 데이터 포털, 서비스, 실제 정부 부처의 데이터 개방 사

례를 제공함

∙ 개방형 데이터의 혜택을 설명하고 이와 관련된 외부의 보고자료 등에 대한

연결(하이퍼링크)을 제공함

∙ 개방형 데이터를 준비하면서 도움을 받을 수 있는 교육자료 등에 대한 연결

(하이퍼링크)을 제공함

② Technology Options(기술적 선택사항)에서는 실제 개방할 데이터셋의 규모와

갱신 주기 등을 고려하야 3단계의 기술적 방법론을 제시한다.

∙ 1단계는 전체 서비스 대상 데이터 셋 규모가 100이하이고 매주 최소 10개의

데이터셋이 갱신되는 경우로 웹서버 구축, 웹 서버내 데이터 파일 서비스를

위한 공간을 제공하거나 공공 클라우드 공간의 제공, HTML 페이지에 메타데

이터 정보 표현, 구글 검새과 같은 사이트 검색 툴로 검색 제공, 정보기술 팀

에 의한 메타데이터, 데이터 업데이트 수행을 제시하였으면 이용자와의 피드

백 구현을 권고함

∙ 2단계는 전체 서비스 대상 데이터 셋 규모가 100이상 1,000이하이고 매주 최

소 10개 이상 100개 이하의 데이터셋이 갱신되는 경우로 CMS기반의 웹 서버

구축, 웹 서버 저장소, 공공 클라우드 저장소 혹은 개별 정부부처 웹 사이트에

서 체계적으로 데이터 파일을 관리, SQL 데이터베이스에서 메타데이터를 관

리하여 동적인 질의 페이지 구현, 자동화된 오류 점검, CMS검색이나 구글 사

이트 검색 등으로 데이터베이스에 대한 텍스트 기반 검색 서비스 제공 등을

권고함

∙ 3단계는 전체 서비스 대상 데이터 셋 규모가 1,000이상이고 매주 100개 이상

의 데이터셋이 갱신되는 경우로 서로 다른 웹서비스를 통합할 수 있는 이용자

서비스 환경 구성, 공공 클라우드 스토리지체 저장된 데이터파일의 자동화된

관리체계 구축 혹은 개방형 데이터베이스관리시스템을 활용한 데이터 저장과

수치

표  2.  열린지식재단  Open  Data  Handbook의  Open  Data  정의
그림  1.  Global  Open  Data  Index  홈페이지(http://index.okfn.org/)
그림  3.  Global  Open  Data  Index  한국  평가  결과  상세 순위 데이터셋 주요  지적사항 2013년  순위 6 오염물질  배출량 (Pollutant  Emissions) Ÿ 벌크  형태의  다운로드를  제공하고  있지  않아  감점됨
표  6.  Global  Open  Data  Index  평가  데이터셋
+7

참조

관련 문서

유아가 현재 가지고 있는 지식과 경험에 기초하여 새로운 개념과 기술을 획득하고 다양한 경험을 통합할 수 있도 록 내용을 선정한다.. 교육내용은 탐구할 가치가

완전경쟁 하에서는 시장에서의 수요와 공급에 의해 가격 이 자동적으로 결정되므로 기업이 가격을 결정할 수 없고 독점시장에서만 완전한 가격결정권을

− 농업 과학기술 인재에 대한 지속적 지원과 장기적 시스템을 구축해야 하며, 우수 연구와 기술을 선도 인재를 중심으로 창조 부대에 대한 지원을 확대해야 함.. −

융합인재교육(STEAM)은‘과학기술에 대한 흥미와 이해를 높이고, 과학기술 기반의 융합적 사고와 문제해결력을 배양하는 교육’으로서 자칫 흥미를 잃을 수 있는 과학기술

융합인재교육(STEAM)은‘과학기술에 대한 흥미와 이해를 높이고, 과학기술 기반의 융합적 사고와 문제해결력을 배양하는 교육’으로서 자칫 흥미를 잃을 수 있는 과학기술

또한 공공 데이터포털에서 제공하는 다양한 오픈 API 데이터를 이용하여 우리 생활에서 활용할 수 있는 방법을, 디자인 씽킹 과정을 통해 창의적인 설계를 할

데이터 탐색가는 수많은 데이터를 걸러내 실제로 필요한 데이터를 발견하는 능력을 가진 사람이다.. - 분석한 자료를 가지고 찾아낸 우리가 적용할

무등산에 대한 다양한 어원적 해석을 포함하는 작품으로서,상상력을 동원하여 그 의미를 추정할 수 있는 다양한 음성적 표기들을 열거하면서 주변 민중들의 넋을