• 검색 결과가 없습니다.

제2절 소셜 빅데이터 분석 및 활용방안 4)

2. 빅데이터 개요

가. 빅데이터 정의

빅데이터(Big Data)는 Wikipedia(2015. 8. 5.)에서 ‘기존 데이터베 이스 관리도구로 데이터를 수집·저장·관리·분석의 역량을 넘어서는 대량 의 정형 또는 비정형 데이터 세트 및 이러한 데이터로부터 가치를 추출하 고 결과를 분석하는 기술’로 정의하고 있다. Gartner(2012)는 더 나은 의사결정, 시사점 발견 및 프로세스 최적화를 위해 사용되는 새로운 형태 의 정보처리가 필요한 대용량, 초고속 및 다양성의 특성을 가진 정보자산 으로 정의하고 있으며, McKinsey(2011) 는 일반적인 데이터베이스 소 프트웨어 도구가 수집, 저장, 관리, 분석하기 어려운 대규모의 데이터로 정의하고 있다. 이와 같은 정의를 살펴볼 때 빅데이터란 엄청나게 많은 데이터로 양적인 의미를 벗어나 데이터 분석과 활용을 포괄하는 개념으 로 사용되고 있다(송태민, 2012).

우리나라는 정부3.0의 효과적인 추진과 생애주기별 맞춤형 서비스 및 국민 행복 실현을 위하여 정부 차원의 빅데이터 추진방안이 마련되었다.

빅데이터의 주요 특성은 일반적으로 3V(Volume, Variety, Velocity)를 기본으로 2V(Value, Veracity)나 1C(Complexity)의 특성을 추가하여

설명하고 있다(그림 2-6 참조). 특히, 보건복지 분야에서는 국민의 생명 과 직결되는 정보를 다루고 있어 빅데이터에 있어 가치(Value)와 신뢰성 (Veracity)은 매우 중요하다고 할 수 있다.

〔그림 2-6〕 빅데이터의 특성과 정부 3.0 추진 전략

나. 공공 빅데이터 현황

‘공급자 위주’에서 ‘국민 중심’ 정보공개로 패러다임이 전환됨에 따라 공공정보가 민간의 창의성 및 혁신적인 아이디어와 결합하여 새로운 비 즈니스를 창출할 수 있는 생태계 조성을 위해 많은 나라에서 공공 정보의 공개를 추진하고 있다. 우리나라는 2011년 8월부터 정부와 공공기관이 보유한 데이터를 대대적으로 개방하여, 기관 간 공유는 물론 국민과 기업 이 상업적으로 자유롭게 활용할 수 있도록 공공데이터 개방을 추진하고 있다. 공공데이터는 각 기관이 전자적으로 생성·취득하여 관리하고 있는

모든 데이터베이스 또는 전자화된 파일로 범정부 차원에서 영리·비영리 목적에 관계없이 개발·활용을 촉진하고 있다. 공공데이터 개방과 관련하 여 2013년 10월 ‘공공데이터의 제공 및 이용 활성화에 관한 법률’이 제 정·시행됨에 따라 각 부처별로 분야별 공공데이터의 공개와 효율적 활용 방안을 모색하고 있다(송태민, 2014). OECD는 올해 처음 공공데이터 개 방 전략 수립, 이행을 돕기 위해 처음 발표한 공공데이터 개방지수는 가 용성(Availability), 접근성(Accessibility), 정부지원(Government Support) 의 3개 분야 19개 지표로 구성하여 2015 정부백서(Government at a Glance 2015)를 발표했다. OECD 대상국의 공공데이터 개방지수 평균 은 0.58이었으며, 1위를 한 한국은 0.98, 2위 프랑스(0.92), 3위 영국 (0.83), 4위 호주(0.81), 5위 캐나다(0.79) 순으로 선정 되었으며, 한국을 제외한 유일한 아시아 국가 조사대상국인 일본은 14위를 기록했다.

〔그림 2-7〕 OECD 공공데이터 개방지수 순위

자료: OECD(2015). Government at a Glance 2015

우리나라의 공공데이터는 공공데이터 포털(data.go.kr)에서 공개하고 있으며, 2015년 7월 24일 현재 18,014건의 데이터셋을 제공하고 있다.

전체 데이터셋 중 보건복지 분야 데이터는 10.57%로 보건분야 909건,

복지분야 995건의 총 1,904건이 제공되고 있다(표 2-12 참조).

<표 2-13> 보건복지 분야 연도별 상위 빈출 키워드

〔그림 2-8〕 연도별 보건분야 제공데이터의 키워드 워드클라우드(Word Cloud)

〔그림 2-9〕 연도별 복지분야 제공데이터의 키워드 워드클라우드(Word Cloud)

2013년 2014년 2015년

2013년 2014년 2015년

구분 보건 복지

2013년 2014년 2015년 2013년 2014년 2015년

1 병원 병원 미용 노인 시설 노인

2 의료기관 업소 병원 현황 장애인 마을회관

3 현황 의료기관 의료기관 장애인 현황 아동

4 약국 약국 공중위생 복지시설 노인 현황

5 의원 의료 피부 복지 복지 노인복지

6 업소 현황 의원 시설 어린이 무료급식

7 예방접종 국가시험 이미용 약국 아동 복지

8 용인시 보건의료 미용실 경로당 청소년 복지시설

9 공중위생 공중위생 세탁 아동 센터 장례

10 정보 광주광역시 위생소 센터 복지시설 회관

다. 빅데이터 개인정보보호 방안

현재 어느 나라를 막론하고 빅데이터의 활용에 있어 가장 큰 과제는 개 인의 사생활 비밀보호 및 개인정보보호이다(송태민 외, 2014). 개인정보 보호에 중점을 두면 빅데이터의 활용을 저해하게 될 우려가 있다. 개인정 보보호법의 목적이 ‘개인정보의 수집·유출·오용·남용으로부터 사생활의 비밀 등을 보호함으로써 국민의 권리와 이익을 증진하고’로 되어있지만 개인정보와 비개인정보를 명확히 구분하기가 어렵고 비즈니스에 있어 자 동적으로 수집되는 데이터가 비개인정보라고 할지라도 프라이버시를 침 해할 가능성이 있다. 특히 소셜 미디어에 공개된 개인정보는 위변조와 오 남용이 쉽고 상업적 이용을 위한 정보수집 등에 노출이 될 수 있기 때문 에 프라이버시 침해 등의 문제가 발생할 가능성이 매우 높다. 방송통신위 원회는 2013년 12월 18일 ‘빅데이터 개인정보보호 토론회’와 2014년 3 월 19일 ‘온라인 개인정보보호 세미나’를 통해 의견을 수렴하고 2014년 12월 23일 ‘빅데이터 개인정보보호 가이드라인’을 발표하였다. 가이드라 인의 주요 내용은 <표 2-14>과 같이 빅데이터 수집 시부터 개인식별 정 보에 대한 철저한 비식별화 조치와 개인의 사상·신념, 정치적 견해 등 민 감 정보에 대한 조합·분석 등 처리 금지 등에 관한 것이다. 빅데이터로부 터 개인을 보호하기 위해 가장 중요한 것은 특정 개인을 식별하지 못하도 록 하는 익명화와 정보접근 및 정보처리에 대한 통제다. 그러나 정보접근 및 정보처리에 대한 통제를 강하게 하면 정보 활용을 활성화 할 수 없기 때문에 빅데이터의 ‘활용과 보호의 균형’에 대한 효과적인 정책이 우선적 으로 마련되어져야 할 것 이다(송태민, 2013).

<표 2-14> ‘빅데이터 개인정보보호 가이드라인’의 주요내용

관련 문서