이 보고서에서 다루는 플로우 빅데이터라는 개념이 다소 생소할 수도 있다. 하지만 조금만 생각해 보면 플로우 빅 데이터는 생각보다 훨씬 더 일상생활과 밀접한 관련이 있고 활용방안도 다양하다는 점에 동의하게 될 것이다.
우선 ‘플로우(Flow)’는 흐름, 유동이라고도 사용되고 있 다는 점을 상기하면, 플로우 데이터는 사회경제 현상 중 본질적으로 정적이지 않는 현상, 즉 시간이 지남에 따라 변화하는 동적인 현상을 나타내기에 적합하다. 예를 들 어 도로 위를 지나다니는 자동차 통행량, 이사를 다니는 인구의 크기, 전화선을 통해 이동하는 전화통화량 등을 나타낼 때 플로우 데이터가 이용될 수 있다. 또한 플로우 를 시각화하면 다양한 굵기의 여러 선분으로 표현될 수 있는데, 위 사례의 경우 자동차 통행량도, 인구이동 유선 도, 지역 간 상호 통화량 지도를 상상하면 될 것이다. 이 러한 플로우 맵(유선도)을 좀 더 자세히 살펴보면 각 선
분은 플로우가 지나가는 기반, 즉 도로망 및 전화선과 같 은 물리적 기반이 있거나, 인구이동의 시작 및 도착지역 을 잇는 가상의 기반이 있다. 이러한 물리적 또는 가상 의 기반은 보통 네트워크(network)라고 일컬어지며, 시 각적으로 점과 선분의 집합으로 개념화할 수 있기 때문 에 노드(node)와 연결(link)로 구성된 그래프(graph)로 표현할 수 있다. 이렇게 사회경제 현상을 그래프로 추상 화하여 표현하게 되면 그래프를 처리, 저장, 관리, 분석, 시각화하는 다양한 이론과 방법론을 적용할 수 있다. 예 를 들어 통행량을 유선도로 표현하여 통행패턴을 시각적 으로 한눈에 파악할 수 있고, 노드 또는 링크를 통과하는 통행량을 측정하여 통행량이 많은 곳과 적은 곳을 쉽게 파악할 수 있다. 또한 최단경로 분석과 같은 다양한 네트 워크 분석방법을 적용할 수 있는데, 네트워크상에서 이 론적인 최단경로 통행을 가정했을 때의 플로우 패턴과
플로우 빅데이터를 활용한 과학적 정책지원 확대를 기대하며
김종근 | 한국감정원 연구개발실 정책연구부 부연구위원([email protected])
지역경제 정책지원을 위한 플로우(Flow) 빅데이터 활용방안 연구
A Study on Applications of Flow Big Data to Regional Econmic Policies
황명화, 차미숙, 김종학, 이영주, 성혜정, 윤은정 지음 KRIHS 보고서
114 국토 제436호(2018. 2)
실제 플로우 패턴을 비교하여 그 차이점과 원인을 분석 하고 개선책을 제시할 수 있을 것이다. 이처럼 간략하게 나마 플로우 데이터의 특성에 대해 살펴보았음에도 우리 일상에는 네트워크 및 플로우로 표현할 수 있는 다양한 현상이 있다는 점과 플로우데이터 분석을 통해 실생활에 도움이 되는 정보를 획득하고 합리적 의사결정을 내릴 수 있다는 것을 확인하였다.
이 보고서는 위에서 제시한 전통적인 플로우 데이터 분 석에서 나아가 더욱 과감한 시도를 하고 있다는 점에서 매우 고무적이고 그 진행과정과 결과가 흥미롭다. 구체 적으로 저자는 플로우로 표현되는 현상 중 복잡하고 용량 이 커서 일반적인 처리와 관리 및 분석방법의 적용이 매 우 어려운 플로우 빅데이터를 구축하고 지역경제 정책에 활용할 수 있는 방안을 제시하고 있다. 보고서는 총 6장 으로 구성되어 있는데, 제1장은 연구에 대한 소개로 기존 지역경제 지표와 분석방법은 고정밀 정보를 적시에 제공 하는 데 한계가 있으며, 이를 보완하고 해결할 수 있는 미 시적 흐름과 동적 변화를 보여줄 수 있는 데이터의 필요 성을 제시한다. 또한 현재 이러한 플로우 데이터의 하부 구조는 갖추어져 가고 있으나 다양한 데이터의 발굴 및 활용에 관한 연구가 미흡하다는 점을 지적하고 있다.
제2장은 플로우 빅데이터의 개념을 정립하고 그 역할 과 한계점을 제시한다. 플로우 빅데이터는 자동화된 수 집체계를 통해 생산되어 다양한 시공간 단위에서 정보를 추출할 수 있는 장점이 있다. 다만 통계적 표본 추출 방 식을 따르지 않으므로 대표성에 제약이 있으며 분석결과 의 해석이 쉽지 않고, 처리 비용이 높고, 개인정보보호 등으로 인해 공개 수준이 낮은 점을 단점으로 지적한다.
제3장은 국내외 공공부문 선행 활용사례를 원천데이 터 발굴방법, 분석기법, 응용모델, 법제도 기반에 초점을 두어 검토한 뒤 그 시사점을 도출한다. 국내 플로우 빅데 이터 구축현황을 조사하여 총 49종의 데이터를 확인하였 다. 그리고 국내외 활용사례를 검토하여 크게 지역경제
발전 분야, 지역관광 활성화 측면, 도시 및 지역 모니터 링 분야, 교통관리 분야로 나누어 정리하고 있다.
제4장은 지역경제 정책 지원을 위해 플로우 빅데이터 시범활용 사례를 두 가지 제시한다. 먼저 지역경제 구조 와 동적 특성을 파악하기 위해 기업 간 거래패턴을 분석 하였다. 기업의 판매와 거래 데이터를 활용하여 네트워 크를 구성한 후, 군집분석을 통해 기업 커뮤니티를 탐지 하고 커뮤니티의 공간분포 및 연계관계를 분석하였다.
분석을 통해 업종별 거래 네트워크의 공간분포가 큰 차 이점을 보이기 때문에 지역산업 지원정책 수립 시 지역 특성을 고려해야 한다는 정책적 함의를 제시하고 있으 며, 유사업종 기업 간 연계관계 분석을 통해 특정 업종 위기에 따른 영향 범위를 예측하고 그 대응책을 세울 수 있는 기초자료로 활용 가능함을 보였다. 두 번째 사례로 서울시 강남구 지역의 신용카드 매출자료와 택시운행 데 이터를 활용하여 상권활성화 정책지원을 위한 소비 및 통행 패턴을 분석하였다. 분석 결과 지방소비자의 강남 지역 의료서비스 지출액이 1년 사이 약 9억 원이 상승했 다는 흥미로운 사실을 제시하였으며, 심야시간 택시 목 적지는 서울 인근 도시가 많다는 점을 자료로 확인하였 다. 이러한 결과는 상업 활성화를 위해 외부지역 주민의 소비패턴을 고려할 필요가 있다는 점과 심야 광역버스 도입 시 수요추정에 활용 가능함을 보였다.
제5장은 플로우 빅데이터의 정책활용 방안 및 활용촉진 을 위한 법제도 방안 등을 제시하고 있으며, 제6장은 결론 과 향후 연구방향을 제시하며 보고서를 마무리하였다.
향후 플로우 빅데이터는 자동화된 수집체계를 갖춘 구 축기반이 확대되고, 재현할 수 있는 사회경제 현상의 폭 과 깊이가 커짐에 따라 정책수립 지원을 위한 유용한 도 구로서의 활용성은 증가할 것이다. 따라서 앞으로 플로 우 빅데이터 연구가 활발히 진행되어야 하며, 이 보고서 가 해당 분야 연구발전에 중요한 밑거름이 될 것으로 기 대한다.
115