• 검색 결과가 없습니다.

개방형 지리인구통계 분석도구 개발 및 활용방안

N/A
N/A
Protected

Academic year: 2022

Share "개방형 지리인구통계 분석도구 개발 및 활용방안"

Copied!
251
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

국민활동 데이터를 이용한 개방형 지리인구통계 분석도구 개발 및 활용방안

기본 | 20-23

국민활동 데이터를 이용한 개방형 지리인구통계 분석도구 개발 및 활용방안

Developing Open Geodemographics Analysis Tools Using Behavioral Big Data

제1장 서론

제2장 국민활동 데이터와 개방형 지리인구통계 분석도구 개발 의의 제3장 국내외 사례 분석

제4장 국민활동 데이터를 이용한 개방형 지리인구통계 분석도구 개발 제5장 개방형 지리인구통계 분석도구 활용방안

이영주, 이보경, 오창화

이영주(연구책임)

국토연구원 공간정보사회연구본부 국토시뮬레이션센터장

이보경

국토연구원 공간정보사회연구본부 부연구위원

오창화

국토연구원 공간정보사회연구본부 전문연구원

국토연구원 (Korea Research Institute for Human Settlements) 국토연구원은 국토자원의 효율적인 이용·개발·보전에 관한 정책을 종합적 으로 연구함으로써 국토의 균형발전과 국민생활의 질 향상에 기여하기 위하여 1978년 설립되었다. 설립 이래 지속가능한 국토발전, 개발과 보전의 조화, 주택과 인프라시설 공급을 위한 연구를 수행함으로써 아름다운 국토를 창조하여 국민의 행복을 향상하기 위해 노력해왔다. 국토연구원은

국민활동 데이터를 이용한 개방형 지리인구통계 분석도구 개발 및 활용방안

Developing Open Geodemographics Analysis Tools Using Behavioral Big Data 기본 |

20-23

2020년도 연구보고서 목록

•가상국토 구현을 위한 디지털트윈 정책방향

•감염병 대응을 위한 공간정책 과제

•건물 분야 온실가스 감축을 위한 건물·토지공간 활용 전략

•경기북부 접경지역의 균형개발을 위한 종합 발전구상과 실천방안 연구(Ⅲ)

•국가위기지역 설정을 통한 균형발전 지원체계 개편 연구

•국민활동 데이터를 이용한 개방형 지리인구통계 분석도구 개발 및 활용방안

•국토균형발전을 위한 교통시설의 국민체감 효과분석 연구

•국토균형발전을 위한 초광역 연계 발전 방향

•금융·공간 빅데이터를 활용한 지역경제 분석 및 예측

•남북교류협력 대비 북한 국토정보 활용성 제고방안

•남북협력시대 북한특구 개발 비즈니스 모델 및 협력방안 연구

•농촌지역의 마이크로공간데이터 조사방법론 개발 및 활용 방안 연구

•데이터 기반 국토정책 소통도구 개발 및 활용

•도시개발밀도 관리를 위한 현황분석 및 공간관리제도 개선방안

•도시계획 변경에 따른 공공기여 기준 정립 및 기금 설치방안 연구

•도시의 영향권과 기능 연계권 분석을 통한 도시권 획정 연구

•도시재생뉴딜 정책평가와 지속가능한 추진 방향 연구

•도시재생사업 선순환 구조 실현을 위한 정책방안 연구

•도시취약지역 공동체 기반의 거점공간 운영방안

•미래 여건 변화에 대응한 도로 건설 유지 비용 조달방안

•미세먼지 대책을 위한 국토공간 유형구분 연구

•미세먼지 저감을 위한 빅데이터 기반의 공간과 교통체계 간 협력방안

•미집행 도시공원 내 국공유지의 계획적 관리방안 연구

•민간임대주택등록 활성화 제도의 성과 점검과 개선방안

•베트남의 국토개발사례 분석을 통한 남북한 협력방안 연구

•보상투기 방지를 위한 손실보상 기준시점 개선연구

•부동산 가격공시 제도의 개선방향 연구(I)

•분권형 지역개발정책을 위한 제도 개선방안 연구

•비도시지역 개별입지공장의 계획적 관리를 위한 정책연구

•비적정주거의 사회·공간적 특성과 주거지원 강화방안

•빈집 발생원인과 근린영향분석을 통한 빈집 관리체계 개선방안 연구

•사회통합을 위한 부동산자산의 불평등 완화방안 연구

•산업위기지역의 실태분석 및 활성화방안

•쇠퇴지역 생활교통비용 파악을 통한 교통서비스 개선방안 연구

•수도권 신도시 정책의 평가 및 향후 발전 방향

•수소경제시대의 도로환경 개선효과 평가 연구

•아세안국가의 국토균형발전에 관한 개발협력전략 연구

•인구·가구구조 및 주거특성의 변화 전망과 주거정책 패러다임 재정립 방향

•인구감소·지방분권시대에 대응한 지방상수도 정책 개선방안 연구

•임대주택 DB 체계 구축방안 기초연구

•주거취약계층을 위한 정책연계 강화방안 연구

•주택구매소비자의 의사결정구조를 반영한 주택시장 분석 체계 구축

•주택시장 규제지역 지정효과 제고방안 연구

•주택시장 영향요인과 향후 정책방향

•주택임대차계약제도의 개선방향에 관한 연구

•중소·중견기업의 해외건설 활성화를 위한 해외 전용펀드 도입 방안 연구

•중장기 건설시장 전망 및 상시 모니터링체계 구축 연구

•지방 중소도시 재생모델 구축방안

•지방도시 주거환경 개선을 위한 계획 및 제도 연계 방안

•지역 간 인구이동 특성 분석 및 정책방안 연구

•지역 관광지 쇠퇴원인 진단 및 활성화 방안 연구

•지역 상생발전을 위한 혁신도시 연계형 원도심 재생 방안 연구

•지역노동시장의 공간적 미스매치 분석과 정책방안 연구

•지역산업 클러스터의 경쟁력 진단과 발전방안 연구

•지역자산화를 위한 사회적 부동산 활성화 방안 연구

•지역주도형 도시재생을 위한 재정·금융 지원체계 구축방안

•축소도시의 유휴 국·공유재산 실태와 관리·활용방안 연구

•친환경·에너지 전환도시를 위한 그린 뉴딜 추진 방안 연구

•친환경차 활성화 추이에 따른 이용자 중심 충전인프라 구축 방안

•플랫폼 운송사업과 택시산업 간 갈등완화를 위한 정책방향 연구

(2)

기본 20-23

국민활동 데이터를 이용한

개방형 지리인구통계 분석도구 개발 및 활용방안

Developing Open Geodemographics Analysis Tools Using Behavioral Big Data

이영주, 이보경, 오창화

(3)

■ 저자

이영주, 이보경, 오창화

■ 연구진

이영주 국토연구원 국토시뮬레이션센터장(연구책임) 이보경 국토연구원 부연구위원

오창화 국토연구원 전문연구원

■ 외부연구진

강계화 ㈜ 빅데이터와 미래연구소 소장 김형석 ㈜ 아태인구연구원 원장

■ 연구심의위원

문정호 국토연구원 부원장

임은선 국토연구원 공간정보사회연구본부장 박정은 국토연구원 도시재생연구센터장 하수정 국토연구원 연구위원

김익회 국토연구원 부연구위원 이경주 한국교통대학교 교수

(4)

본 연구보고서의 주요 내용

󰋎 현실감 있는 정책 발굴 및 추진을 위해 국민의 생활패턴 및 경제활동을 파악할 수 있는 공공 및 민간 빅데이터를 발굴하여, 공간정보와 융합한 소지역 단위의 정책 기초자료를 개발하고, 누구나 쉽게 지역의 사회경제적 특성을 종합적으로 파악할 수 있는 개방형 지리인구통계 분석도구 구축

󰋏 지리인구통계(Geodemographics) 방법론을 적용하여 사회경제적 특징을 나타내는 지역 유형화·

세분화 통계자료를 개발하고, 탐색적 데이터 분석(EDA, Exploratoty Data Analysis)을 위해 관 심 지역의 특성을 직관적으로 파악할 수 있는 지역유형화 결과 및 관련 정보서비스 기능 설계 - 국민의 이동 및 경제활동을 파악할 수 있는 민간 빅데이터를 활용하여 지역의 사회경제적 특성 분석 - 특정 시점에 측정된 정적 데이터뿐만 아니라 시간적 개념과 흐름이 반영된 동적 데이터 구축 - 빅데이터를 잘 다룰 수 없어도 정보를 쉽게 활용할 수 있는 기술적 환경 제공

- 데이터 활용역량(Data Literacy) 격차를 줄이고 디지털 접근성을 높여 포용적 디지털 경제를 지향

󰋐 방대한 양의 정보에서 지역 특성을 종합적으로 파악하는 가이드 역할 수행, 분석결과 및 관련 지표 탐색이 가능한 도구로 누구나 쉽고 직관적으로 소지역 단위의 사회경제적 특성 파악

본 연구보고서의 정책제안

󰋎 (공공부문) 국토모니터링, 지역개발 모니터링 등 다양한 정책 발굴 및 모니터링 지표로 활용, 지역맞춤 형 정책 컨설팅 도구로서 도시재생사업지구 검증 및 선제적 대상지구 선정, 성과 모니터링 등에 활용

󰋏 (민간부문) 소상공인 및 중소기업이 다양한 목적의 상권분석 및 마케팅 도구로 활용, 일반 국민은 사회적 참여 기회 확대 및 협력적 지역문제 진단 등 데이터에 근거한 소통도구로 활용

󰋐 (추진과제) 공공과 민간데이터 융합 활용 확대를 위한 협력적 거버넌스 체계 구축, 새로운 데이터 발굴 및 콘텐츠 개발, 정보를 기반으로 새로운 정보와 가치를 창출할 수 있는 선순환 생태계 조성

주요 내용 및 정책제안

FINDINGS & SUGGESTIONS

(5)
(6)

1. 서론

□ 연구의 배경 및 필요성

∙ [정책환경의 변화] 정책 패러다임이 증거기반(evidence-based policy)으로 전환 되고, 데이터 경제의 부상, 디지털 뉴딜의 등장 등으로 정책의 효과성과 실효성 을 높이기 위한 수단으로서 데이터 활용수요는 더욱 증가할 전망

∙ [기술환경의 변화] 기술의 개방성은 높아지고, 보편화되고 있으며, 누구나 쉽 게 다양한 데이터에 접근하여 활용할 수 있는 환경이 조성되면서 ‘데이터 활용

역량(Data Literacy)’에 대한 관심과 중요성이 높아짐

∙ [사회환경의 변화] 투명하고 합리적인 의사결정을 지향하고, 국민소통과 사회 적 참여 확대 등 상향식 문제해결 방식이 대두되며, 지역의 문제를 협력적으로 진단하고 해결방안을 모색하는 방향으로 사회혁신이 추진

∙ 시대가 급변함에 따라 기술 및 데이터 활용환경도 변화하고 있으며, 이에 대응 가능한 새로운 정책 기초자료의 개발 및 다양화 필요

□ 연구목적

∙ 이 연구는 현실감 있는 정책 발굴 및 추진을 위해 국민의 일상생활을 파악할 수 있는 공공 및 민간 빅데이터(국민활동 데이터)를 활용하여, 소지역 단위의 사회 경제적 특징을 세분화·유형화 한 새로운 지역통계 구축

∙ 국민의 생활패턴 및 경제활동을 파악할 수 있는 데이터를 발굴하여, 공간정보 와 융합한 소지역 단위의 정책 기초자료를 개발하고, 누구나 쉽게 지역의 특성 을 종합적으로 파악할 수 있는 개방형 지리인구통계 분석도구 개발

∙ 국민의 거주·이동 특성과 경제적 특성을 소지역 단위로 분석·유형화하는 방법 론을 정립하고, 대전광역시를 대상으로 시범 적용한 결과를 바탕으로, 향후 개 방형 지리인구통계 분석도구의 활용 확대방안 모색

요 약

SUMMARY

(7)

2. 국민활동 데이터와 개방형 지리인구통계 분석도구 개발 의의

□ 개방형 지리인구통계 분석도구는 지역의 사회경제적 특성을 소지역 단위로 쉽고 간단하게 파악하기 위해, 공공과 민간의 빅데이터를 위치 기반으로 융합 활용하여 생산한 통계 데이터(지표) 및 해당 정보 탐색을 위한 기술서비스를 통칭

∙ ‘지리인구통계’ 방법론1)을 적용하여 지역의 사회경제적 특징을 나타내는 지역 유형화·세분화 통계자료 개발

∙ 탐색적 데이터 분석(EDA, Exploratoty Data Analysis)을 위해 관심 지역의 특성 을 직관적으로 파악할 수 있는 지역통계 자료 관련 정보서비스 기능 설계

□ 국민활동 데이터 기반의 개방형 지리인구통계 분석도구 개발 의의

∙ (데이터 생산 관점) 국민의 이동 및 경제활동을 파악할 수 있는 민간 빅데이터 를 활용하여 지역의 사회경제적 특성을 추정할 수 있는 콘텐츠 개발

∙ (데이터 구축방법 관점) 특정 시점에 측정된 정적 데이터뿐만 아니라 시간적 개 념과 흐름(flow)이 포함된 동적 데이터로 구축

∙ (데이터 활용방법 관점) 탐색적 데이터 분석(EDA)이 가능하며, 빅데이터를 잘 다룰 수 없어도 정보를 쉽게 활용할 수 있는 기술적 환경 제공

∙ (정책적 효과 측면) 데이터 활용역량(Data Literacy)의 격차를 줄이고 디지털 접근성을 높여 포용적 디지털 경제를 지향

3. 국내외 사례 분석

□ 영국 CDRC의 오픈 지오데모그래픽(Open Geodemographics)

∙ 영국의 소지역 단위 인구·사회·경제적 특성을 반영하여 인구 총조사에서 집계 된 60개 변수를 활용한 OAC(Output Area Classification) 구축·공개

1) 지리인구통계(Geodemographics)는 ‘사람들이 사는 장소를 중심으로 사람들을 분석하는 것’으로, 사람이 사는 장소에 대한 많은 변수(데이터)를 활용하여 사회공간적 구조를 분석하는 방법론

(8)

∙ 전국을 8개의 Supergroup, 26개의 Group, 76개의 Subgroup으로 유형화·세 분화한 통계자료를 웹 기반 인터랙티브 지도로 시각화하여 제공

자료: CDRC Maps: 2011 OAC. https://maps.cdrc.ac.uk/#/geodemographics/oac11/default/ (2020년 3월 3일 검색) 그림 1 | 영국 CDRC에서 제공하는 OAC 인터랙티브 지도

□ 일본 ‘다이내믹 지오데모그래픽(Dynamic Geodemographics)’ 개발

∙ 공간정보와 인구 활동에 관련된 민간 빅데이터를 활용하여 시계열의 새로운 다 이내믹 지오데모그래픽 개발 추진

∙ 휴대전화의 이동 이력을 바탕으로 인구분포에 대한 빅데이터와 다양한 공간정 보를 융합하여 인구의 사회경제적 특성을 추정하고, 변화하는 지역의 인구 속 성을 파악

□ 소비자 타겟팅 활용 목적으로 다양한 기업에서 상용 지리인구통계 생산

∙ 민간에서는 ACORN, MOSAIC, PSYTE-HD, Patchwork nation 등 다양한 지리인구통계자료를 생산하고 있으며, 공공 센서스자료와 오픈 데이터, 민간 빅데이터 등을 다양하게 융합 활용하여 지속적인 유형화 방법 개선을 도모

(9)

□ 공공, 민간 등 다양한 데이터를 활용하여 지역을 유형화·세분화 하여 공개함으로써 국민의 생활공간을 새로운 방식으로 탐색할 수 있는 도구 제공

∙ 민·관 데이터 공유와 활용 저변 확대 등으로 공공 분야에서의 지리인구통계 구 축 및 활용 확대가 이루어지고 있으며, 인터랙티브 지도 등 개방형 플랫폼을 통 해 분석 결과를 공개하여 국민의 정책적 관심과 참여를 유도

∙ 인구·사회·경제적 지표를 반영하여 목적에 맞게 지역을 유형화할 수 있는 지리 인구통계 자료의 구축이 필요하며, 구축된 자료에 누구나 쉽게 접근하여 탐색 할 수 있는 정책 기초자료 및 도구개발 필요

4. 국민활동 데이터를 이용한 개방형 지리인구통계 분석도구 개발

□ 국민활동을 나타내는 데이터로서 사람의 거주와 이동에 대한 데이터와 경제활동 관 련 데이터를 활용하여 250m 격자단위로 지역을 유형화하고 특성을 세분화

∙ 사람의 거주·이동 특성을 파악하기 위해 SKT의 유동인구 데이터를, 경제적 특 성 파악을 위해 KCB 데이터 등 민간 빅데이터를 융합 활용(<표 1> 참고)

∙ 지역의 거주 환경 및 상업 시설 현황 등의 특성을 반영하기 위해 건축물의 주용도 와 노후도 등을 분석에 활용

∙ 그 밖에 1인가구 현황, 사업체 종사자 수, 카드지출 행태 등 지역의 사회경제적 특성 파악에 필요한 정보이지만, 표준화된 격자단위 데이터로 구축이 불가능한 데이터는 해당 지역을 이해하는 보조 변수로 활용

□ 지역유형화를 위해 지리인구통계 모형 중 하나인 K-means 군집분석을 적용하여, 대전광역시를 대상으로 시범분석하고, 해당 결과를 인터랙티브 리포트와 같이 정보탐색 이 가능한 기술적 환경으로 구축

∙ 1차 분석에서는 사람의 이동 특성을 나타내는 데이터셋과 경제활동을 나타내 는 데이터셋으로 구분하여 지역 군집화를 수행하고 결과를 해석

∙ 2차 분석에서는 1차 분석 결과를 토대로 두 데이터셋을 위치기반으로 융합하여 군집분석을 수행하고 지역을 유형화

(10)

구분 데이터 유형 및 출처 데이터

시점 항목명 항목 정의

민간 데이터

유동인구/

서비스인구 (SKT)

2018년 6월

~ 2019년 5월

성별 유동인구 일단위 Snapshot으로 집계된 성별 유동인구 의 월 평균

연령대별 유동인구

일단위 Snapshot으로 집계된 연령대별(유소년인 구, 생산가능인구, 고령인구) 유동인구의 월 평균 평일-공휴일별

유동인구

일단위 Snapshot으로 집계된 평일/공휴일 유 동인구의 월 평균

근로형태·소득정보 (Korea Credit Bureau, KCB)

2019년 9월

월평균 소득(추정) 은행 및 카드사 등록 고객의 월 평균(추정) 소득 급여소득자 은행 및 카드사 등록 고객 중 급여소득자 현황 자영업자 은행 및 카드사 등록 고객 중 자영업자 현황 소비 정보

(BC카드)

2018년 6월 ~

2020년 5월 업종별 지출현황 자택 주소지 기준의 BC카드 회원의 업종별 카 드 지출 현황(2018년 6월 ~ 2020년 5월)

공공 데이터

사업체 종사자 (통계청, 전국사업체

조사 2018)

2018년 산업분류별

종사자 1인 이상의 모든 사업체의 종사자 수 가구 수 및 1인가구 수

(통계청, 인구주택총 조사 2018)

2018년 1인가구 비율 집계구 단위 총 가구 수 대비 1인가구 수 비중 인구통계

(2019 국토조사, 행정안전부)

2019년 10월

주민등록인구 통계

연령별(유소년인구, 생산가능인구. 고령인구) 주민등록인구 및 고령인구비율 통계 건축물 통계

(2019 국토조사, 국토지리정보원)

2019년 10월

노후건축물 통계 지역 내 노후건축물(25년 이상) 통계 용도별

건축물 통계

지역 내 공동주택(아파트, 연립 등), 단독주택, 상업시설, 공업시설 통계

자료: 저자 작성

표 1 | 지리인구통계 분석에 활용한 데이터 항목

□ 사람의 이동특성을 고려한 지역유형화 분석

∙ 주민등록인구와 이동통신사의 유동인구 데이터, 그리고 건물 용도를 구분할 수 있는 건축물 데이터 등을 활용하여 K-means 군집분석 수행

∙ 대전광역시를 대상으로 분석한 결과, 6개의 주요 그룹으로 구분되었으며, 정주 지역 특성과 그렇지 않은 지역의 구분이 뚜렷하게 나타났으나, 지역 유형화에 유동인구 변수보다 건물용도 비율의 영향력이 크게 나타남

□ 경제활동 특성을 고려한 지역유형화 분석

∙ 생산자원(인구밀도, 연령별 인구구조), 생산활동의 유형(급여소득자/자영업자 비 율), 경제활동 분배 결과(월 추정소득)을 융합하여 K-means 군집분석 수행

(11)

∙ 대전광역시를 대상으로 분석한 결과, 4개의 주요 그룹으로 구분되었으며, 중심 부의 활력지역과 외곽의 은퇴자 지역, 변두리의 관심지역 등의 특성이 나타남

이동특성을 고려한 지역유형화 분석 경제활동 특성을 고려한 지역유형화 분석

자료: 저자 작성

그림 2 | 이동특성과 경제활동 특성을 고려한 지역유형화 분석결과

□ 국민의 이동과 경제활동 특성을 융합한 지역유형화 분석

∙ 사람의 이동과 경제활동 특성을 고려한 지역유형화 분석에 사용된 변수를 결합 하여 대전광역시를 대상으로 군집분석을 수행한 결과, 5개의 군집이 관찰되었 으며, 제 1군집과 제 5군집은 각각 2개와 3개의 세부 군집으로 재분류

- 군집 1은 대체로 거주인구(주민등록인구)와 인구의 흐름(유동인구) 모두 낮은 지 역이며, 세부 군집 1-1의 경우 자영업자 비율과 고령인구 비율이 높은 지역, 세부 군집 1-2는 근로소득자 비율이 높고 노후건축물 비율이 가장 낮은 지역 - 군집 2는 모든 연령대의 거주인구가 가장 많고 아파트 비율이 높고 추정소득도

높은 지역

- 군집 3은 유동인구가 많고, 상업용 건물의 수가 가장 많은 지역

- 군집 4는 고령인구 비율이 가장 높으나 유동인구와 건물은 매우 적은 지역

(12)

- 군집 5는 대체로 건물 수가 많은 단독주택 밀집 지역으로, 세부 군집 5-1은 그 룹내 추정소득이 상대적으로 높고 근로소득자 비율이 높고, 세부 군집 5-2는 고령인구 비율이 다소 높고 단독주택과 노후 건축물 비율이 전체 군집 중 가장 높으며, 군집 5-3은 그룹내 상대적으로 유동인구는 많고 거주인구수는 적고 상 업시설 수가 상대적으로 많은 지역

자료: 저자 작성

그림 3 | K-Means 군집분석에 따른 지리인구통계 그룹 분류

(13)

∙ 1인가구 비율을 함께 살펴보면, 군집 3(도시의 삶이 모이는 곳)에 해당하는 격자 와 겹치는 집계구의 평균 일인가구 비율이 약 54.18%로 가장 높은 반며, 군집

2(안정적 삶을 영위하는 가구) 지역은 1인가구 비율이 가장 낮음

∙ 대전광역시에 도매 및 소매업을 비롯한 금융 및 보험업 등 다수의 산업 분류가 군집 3에 집중되어 있으며, 유동인구가 많고 상업용 건물이 많은 도심에 분포

∙ 업종별 카드매출 분석결과, 대부분 군집에서 생활업종의 비율이 가장 높으나, 군집 3의 경우 음식 업종 지출비율이 가장 높게 나타났으며 이는 유동인구가 많은 상업지역 및 1인가구 비율이 높은 지역의 특성이 드러나는 것으로 추정

□ 개방형 지리인구통계 자료는 방대한 양의 정보에서 지역의 특성을 종합적으로 파악 하는 가이드 역할을 수행할 수 있으며, 해당 결과 및 관련 지표를 데이터 탐색이 가 능한 도구로 제공하여 누구나 쉽고 직관적으로 소지역 단위의 지역특성 파악

∙ 정책실무자와 국민에게 원본 데이터를 제공하여도 데이터 분석전문가 외에는 누구나 목적에 맞게 데이터를 활용하고 의미 있는 정보(insight) 도출에는 한계

∙ 정책실무자와 국민이 데이터에 근거한 정책적 소통과 데이터 활용 확대를 위해 방대한 양의 데이터에서 필요한 정보를 쉽게 도출하는 보편적 데이터 활용기술

(정보서비스) 제공이 필요하며, 본 연구에서는 이를 인터랙티브 리포트로 설계

자료: 저자 작성

그림 4 | 개방형 지리인구통계 분석도구 인터랙티브 리포트(시범 구축)

(14)

5. 개방형 지리인구통계 분석도구 활용방안

□ 공공부문에서의 활용방안

∙ (중앙정부 차원) 다양한 정책 발굴 및 모니터링 도구로서, 상시적인 지역의 경 제활력 및 민생경제 현황 모니터링을 위한 기초자료, 지역의 변화 및 정책(혹은 사업) 추진으로 인한 영향 분석 등에 활용

∙ (지자체 차원) 지역맞춤형 정책 컨설팅 도구로서, 개별 지역정보를 바탕으로 정책 목적에 따른 대상 지역·시장을 명확하게 분석하고, 특성을 고려한 정책 상 품 발굴 및 전달 채널 전략 수립에 활용하여 지역경쟁력 제고

∙ (도시재생사업/지역개발사업 발굴 및 성과 모니터링) 개방형 지리인구통계 분 석도구는 체감도 높은 사업을 발굴하고, 주민참여를 통한 계획 수립을 위한 기 초자료 및 소통지원, 사업의 성과를 모니터링하는 도구 등으로 활용 가능

□ 민간부문에서의 활용방안

∙ (상권분석) 유동인구 및 소득/소비 데이터 등 지역분석 및 상권분석의 기초가 되는 자료를 바탕으로, 다양한 목적의 상권분석 및 마케팅 도구로 활용 가능

∙ (소통도구) 일반 국민들의 사회적 참여 기회 확대 및 협력적 지역문제 진단 및 해결방안 모색을 위해 데이터에 기반한 소통도구로 활용 가능

□ 개방형 지리인구통계 분석도구 활용 확대를 위한 추진과제

∙ (거버넌스 구축) 공공과 민간의 빅데이터 융합 활용을 통해 창출되는 시너지 효 과 등을 고려하여 데이터의 표준화, 지속적 유지관리 및 안정적 운영을 위한 민 간과 공공의 협력적 거버넌스 체계 구축 필요

∙ (콘텐츠 개발) 기존의 통계자료에서 도출하지 못한 국민활동의 다양한 특성을 파악하기 위해서는 공공뿐만 아니라 민간부문에서 생산되는 여러 가지 자료를 검토하여 지역의 특성을 파악할 수 있는 새로운 데이터 발굴·콘텐츠 개발 필요

∙ (정보활용 생태계) 정보로 새로운 정보와 가치를 창출할 수 있는 정보활용 선순 환 생태계 조성이 필요하며, 다양한 스토리와 융합 콘텐츠가 생산될 수 있는 생 태계 활성화가 필요

(15)

차 례

CONTENTS

주요 내용 및 정책제안···ⅲ 요 약···ⅴ

제1장 서론

1. 연구의 배경 및 목적 ···3

2. 연구의 범위 및 방법 ···9

3. 선행연구 검토 및 차별성 ···11

4. 연구의 기대효과 ···14

제2장 국민활동 데이터와 개방형 지리인구통계 분석도구 개발 의의 1. 국토정책 환경 변화와 기존 통계자료의 한계 ···17

2. 지리인구통계(Geodemographic) 관련 이론 및 선행연구 ···22

3. 개방형 지리인구통계 분석도구 개념 및 필요성 ···41

4. 국민활동 데이터 기반의 개방형 지리인구통계 분석도구 개발 의의 ···44

제3장 국내외 사례 분석 1. 영국의 오픈 지오데모그래픽(Open Geodemographic) 프로젝트 ···49

2. 일본의 다이내믹 지오데모그래픽 개발 연구 ···66

3. 상용 지리인구통계 구축 및 활용 사례 ···69

4. 소지역 단위의 지역통계 생산 사례 ···76

5. 소결 및 시사점 ···95

(16)

제4장 국민활동 데이터를 이용한 개방형 지리인구통계 분석도구 개발

1. 개방형 지리인구통계 분석도구 개발방향 ···99

2. 개발방법 및 기능 ···101

3. 시범적용 ···115

4. 대시보드 개발 ···169

5. 소결 및 시사점 ···176

제5장 개방형 지리인구통계 분석도구 활용방안 1. 공공부문에서의 활용방안 ···181

2. 민간부문에서의 활용방안 ···190

3. 개방형 지리인구통계 분석도구 활용 확대를 위한 추진과제 ···192

제6장 결론 및 향후 과제 1. 결론 및 정책제언 ···197

2. 연구의 한계와 향후 과제 ···199

참고문헌···201

SUMMARY···209

부 록···213

기본 20-23

국민활동 데이터를 이용한 개방형 지리인구통계 분석도구 개발 및 활용방안

(17)

차 례

CONTENTS

<표 1-1> 선행연구 요약 및 차별성 ···13

<표 2-1> 미국과 영국의 지리인구통계 모델 ···27

<표 2-2> 민간데이터와 공공데이터 종류 및 포함된 데이터의 변수 ···30

<표 2-3> 연구자 별 활용한 데이터 분포 변환 및 표준화 방법 ···33

<표 3-1> 2011 Output Area Classification(OAC)의 입력변수 ···51

<표 3-2> 2014 Internet User Classification의 입력변수 ···56

<표 3-3> 2015 Classification of Workplace Zones(COWZ)의 입력변수 ···62

<표 3-4> 2011 Classification of Workplace Zones for England and Wales (COWZ-EW)의 군집분석 결과 ···63

<표 3-5> 기초단위구 구획 방식 및 순서 ···81

<표 3-6> 지오코딩 예시 ···85

<표 3-7> 기초단위구의 구획 구분 기준 ···86

<표 3-8> 소지역통계 제공 항목 ···89

<표 3-9> 집계구별 통계 제공 현황 ···89

<표 3-10> 통계 경계 제공 자료 현황 ···93

<표 4-1> 지리인구통계 분석에 활용한 데이터 항목 ···102

<표 4-2> 경제활동 변수 ···107

<표 4-3> 유동인구 활용 분석 변수 및 기초 통계량 ···117

<표 4-4> 유동인구 활용 분석 클러스터별 변수 평균값 ···119

<표 4-5> 유동인구를 활용한 지리인구통계 그룹별 주요 특징 ···122

<표 4-6> 경제활동 데이터 활용 분석 변수 및 기초 통계량 ···123

<표 4-7> 경제활동 데이터 활용 분석 클러스터별 변수 평균값 ···125

<표 4-8> 경제활동 데이터를 활용한 지리인구통계 그룹별 주요 특징 ···127

<표 4-9> 융합분석 데이터 항목 및 기초 통계량 ···129

<표 4-10> 클러스터별 변수 평균값 ···132

<표 4-11> 군집 1의 세분류 클러스터별 변수 평균값 ···139

표차례

LIST OF TABLES

(18)

<표 4-12> 군집 5의 세분류 클러스터별 변수 평균값 ···142

<표 4-13> 클러스터별 주요 변수의 경향성 ···144

<표 4-14> 지리인구통계 그룹별 주요 특징 종합 ···145

<표 4-15> 대전광역시 군집별 산업분류별 종사자 수 평균(명) ···163

<표 4-16> 대전광역시 군집별 업종별 카드 지출 비율 평균(%) ···166

(19)

차 례

CONTENTS

<그림 1-1> 연구 흐름도 ···7

<그림 2-1> 데이터·AI 경제 활성화 계획 ···18

<그림 2-2> 시군구 단위 인구감소 지역 유형과 격자(500m) 단위 3년 연속 인구 감소지역 현황 비교 ···20

<그림 2-3> 지리인구통계의 활용 분야 ···23

<그림 2-4> Booth의 Descriptive Map of London Poverty ···24

<그림 2-5> 다양한 지리인구통계 구축 사례 ···26

<그림 2-6> 일반적인 지리인구통계 분석 프로세스 ···28

<그림 2-7> 접근성 기반 건강데이터 점수 분포 시각화 ···31

<그림 2-8> K-means 클러스터링 수행 과정 ···35

<그림 2-9> SOM 수행 과정 ···36

<그림 2-10> SOM을 활용한 지역 유형화 ···37

<그림 2-11> Heatmap을 활용한 군집별 특징 해석 ···39

<그림 2-12> DataShine에서 제공하는 인터랙티브 맵 ···40

<그림 2-13> 지리인구통계 분류 대시보드 구성 사례 ···40

<그림 3-1> 영국 Open Geodemographic 사례 ···50

<그림 3-2> OAC 2011의 Supergroup 및 Group 유형화 지도 ···52

<그림 3-3> OAC 인터랙티브 맵 ···53

<그림 3-4> LOAC 및 TOAC 데이터 구성 ···54

<그림 3-5> 2014년 IUC Group의 유형화 지도 (런던지역) ···57

<그림 3-6> 2018년 IUC Group의 유형화 지도 (런던지역) ···58

<그림 3-7> 2014 IUC Group 기반의 지역별 온라인 쇼핑 회복력 ···60

<그림 3-8> 2011 COWZ의 도시별 결과 ···64

<그림 3-9> COWZ-EW의 유형화 지도 (런던지역) ···65

<그림 3-10> 다이내믹 지오데모그래픽 개발방향 ···66

<그림 3-11> 다이내믹 지리인구통계의 인구 센서스 및 경제 센서스 비교 ···67

그림차례

LIST OF FIGURES

(20)

<그림 3-12> 다이내믹 지리인구통계의 방문자 분석 및 이벤트 발생 분석 ···68

<그림 3-13> ACORN의 유형화 분석 프로세스 ···70

<그림 3-14> MOSAIC 군집 특징 예시(MOSAIC UK) ···71

<그림 3-15> 사회경제적 특성에 따른 MOSAIC USA의 분류체계 ···72

<그림 3-16> MOSAIC Japan 예시 ···73

<그림 3-17> PSYTE-HD 군집 특징 예시 ···74

<그림 3-18> Patchwork nation 분류 결과 ···75

<그림 3-19> 미국 센서스 소지역 구분의 예시 ···79

<그림 3-20> 기초단위구 획정 결과(예시) ···82

<그림 3-21> 집계구 획정 결과(예시) ···84

<그림 3-22> 거처 포인트 및 사업체 포인트(예시) ···85

<그림 3-23> 집계구 자동 통합 과정(AZP) ···88

<그림 3-24> 통계청 SGIS에서 제공하는 집계구 통계 서비스 ···93

<그림 4-1> Thinking with Data ···100

<그림 4-2> 월별 유동인구의 분포(연령대별 구분) ···104

<그림 4-3> 유동인구 데이터의 공간적 분포 ···104

<그림 4-4> 경제활동 관련 데이터의 공간적·통계적 분포(급여소득자, 자영업자) ···109

<그림 4-5> 제조업 종사자수와 전문, 과학 및 기술 서비스업 종사자수의 공간적 분포 ····110

<그림 4-6> 경제활동 데이터의 공간적 분포(월 평균 추정 소득) ···110

<그림 4-7> 경제활동 데이터의 공간적 분포(카드 지출 현황) ···111

<그림 4-8> 보조변수로 활용한 데이터 ···113

<그림 4-9> 국민활동 데이터를 활용한 개방형 지리인구통계 분석도구 개발을 위한 분석 과정 ···114

<그림 4-10> 유동인구 군집분석의 최적 클러스터 사이즈 결정 ···118

<그림 4-11> 유동인구 데이터를 활용한 대전광역시 클러스터 군집 분포 ···121

<그림 4-12> 경제활동 데이터 군집분석의 최적 클러스터 사이즈 결정 ···124

(21)

차 례

CONTENTS

<그림 4-13> 주요 경제활동 변수의 군집 간 비교(Boxplot) ···126

<그림 4-14> 경제활동 데이터를 활용한 대전광역시 클러스터 군집 분포 ···128

<그림 4-15> 융합분석 최적 클러스터 사이즈 결정 ···131

<그림 4-16> 변수별 상자그림과 군집별 평균 비교 ···133

<그림 4-17> 대전광역시 지리인구통계 그룹 분류 결과(대분류) ···134

<그림 4-18> 군집 1의 세분류 결과 ···137

<그림 4-19> 군집 1의 세분류 군집별 평균 비교 ···138

<그림 4-20> 군집 5의 세분류 결과 ···140

<그림 4-21> 군집 5의 세분류 군집별 평균 비교 ···141

<그림 4-22> 대전광역시 지리인구통계 분석 결과 종합 ···146

<그림 4-23> 군집별 대표 지역 탐색 ···147

<그림 4-24> 군집별 주요 대표 지역 예시 ···148

<그림 4-25> 대덕 테크노밸리 지역(군집 2, 군집 4) ···153

<그림 4-26> 둔산동 주변(군집 2, 군집 3) ···154

<그림 4-27> 대전역 일대(군집 3, 군집 5) ···156

<그림 4-28> 유성온천역 주변(군집 2, 군집 3, 군집 5) ···158

<그림 4-29> 학하동 주변(군집 1) ···159

<그림 4-30> 공간단위 비교(집계구와 250m격자, K-Block과 250m 격자) ···161

<그림 4-31> 군집 별 1인가구 비율 비교(Boxplot) ···162

<그림 4-32> 2년 간(2018. 6 ~ 2020. 5) 카드지출 총합(십분위) ···164

<그림 4-33> 군집별 2년 간 카드지출 총합 ···165

<그림 4-34> 카드 지출의 업종별 비율의 군집 간 비교(Boxplot) ···167

<그림 4-35> 대전광역시 월별 카드지출 변화(2018. 6. ~2020. 5.) ···168

<그림 4-36> 상호작용지도 기반의 지리인구통계 정보 공유 및 정책의사결정 지원 과정 ·· 169

<그림 4-37> 영국 CDRC의 오픈 지오데모그래픽에서 제공하는 인터랙티브 지도 ·· 170

<그림 4-38> 개방형 지리인구통계 분석도구 인터랙티브 리포트(시범 구축) ···171

그림차례

LIST OF FIGURES

(22)

<그림 4-39> 개방형 지리인구통계 분석도구 인터랙티브 리포트(창 분할을 통한 지표 간 비교 예시) ···172

<그림 4-40> 개방형 지리인구통계 분석도구 인터랙티브 리포트(지역 시계열 변화 탐색 예시) ···173

<그림 4-41> 개방형 지리인구통계 분석도구 인터랙티브 리포트(행정구역 단위 결과 탐색 예시) ···174

<그림 4-42> 행정동 단위 군집 비율 비교 예시(둔산1동과 은행선화동) ···175

<그림 4-43> 현장검증을 위한 도구 활용 ···177

<그림 5-1> V-RESAS(Vital Signs of Economy) ···183

<그림 5-2> 소득이 낮고 고령인구 비율이 높은 지역 발굴(예시) ···184

<그림 5-3> 대전광역시 2020 주요업무계획 ···186

<그림 5-4> 대전광역시 도시재생사업 지구 내 군집 현황 ···189

<그림 5-5> 인터랙티브 지도 기반의 다양한 이슈 공론화 ···193

(23)
(24)

CHAPTER 1

1. 연구의 배경 및 목적 ···3 2. 연구의 범위 및 방법 ···9 3. 선행연구 검토 및 차별성 ···11 4. 연구의 기대효과 ···14

서론

(25)
(26)

01 서론

시대가 급변함에 따라 기술 및 데이터 활용환경도 변화하고 있으며, 이에 대응 가능한 새로운 정책기초자료 개발 및 활용 필요성도 증대하고 있다. 본 연구에서는 국민의 일상생활을 파악할 수 있는 공공 및 민간 빅데이터(국민활동 데이터)를 활용하여, 지역의 사회경제적 특징 등을 반영한 지역특성 세분화·유형화 자료를 구축함으로써 생활밀착형 정책 지원을 위한 새로운 지역통계자료 를 개발하고자 하였다. 이를 위해 기존의 지리인구통계(Geodemographic) 이론을 바탕으로 개방 형 지리인구통계 분석도구를 개발하고, 국민이 생활하는 공간을 세밀한 단위로, 해당 지역의 특성을 쉽고 간단하게 파악할 수 있도록 하였다.

1. 연구의 배경 및 목적

1) 연구 배경

정책 패러다임이 증거기반(evidence-based policy)으로 전환되고, 데이터 경제의 부상, 디지털 뉴딜의 등장 등 정책적 환경이 급변하고 있다. ‘데이터기반행정 활성화 에 관한 법률’이 제정되고, 관련 시행령 및 시행규칙 제정안도 마련되어 올해 12월 10 일부터는 정책 현장에 시행될 예정이다1). 정책의 효과성과 실효성을 높이기 위해 데이 터를 정책개발 및 시행을 위한 도구로 활용하기 위한 구체적인 가이드라인 및 법적 근 거가 마련됨에 따라, 향후 데이터 활용수요는 더욱 증가할 전망이다.

1) 법률저널, 2020. “‘데이터 기반 행정법’으로 과학적 행정체계 구축”, 9월 8일.

http://www.lec.co.kr/news/articleView.html?idxno=721734 (2020년 11월 18일 검색)

(27)

이러한 변화의 동인 중 하나는 바로 기술적 환경의 변화이다. 오픈데이터, 빅데이터 의 등장과 활용 확대, 오픈소스 프로그램 개발 및 적용 확대 등 기술의 개방성은 높아 지고 점점 더 보편화 되고 있다. 누구나 쉽게 다양한 데이터에 접근할 수 있고, 분석·

활용할 수 있는 기술적 환경이 조성되고 있다. 이로 인해, 기존에 정보의 홍수 시대에 는 필요한 정보를 검색할 수 있는 능력이 중요했으나, 최근에는 다양한 데이터와 분석 기술을 활용하여 데이터를 읽을 수 있는 ‘데이터 활용역량(Data Literacy)’에 대한 관 심과 중요성이 높아지고 있다.

이와 더불어 사회적 환경도 투명하고 합리적인 의사결정을 지향하고, 국민소통과 사 회적 참여가 확대되는 등 상향식·협력적 문제해결 방식이 대두되고 있다. 지역의 문제 를 협력적으로 진단하고 해결방안을 모색하는 방향으로 사회혁신이 추진되고 있다. 해 당 과정에서 소통의 도구로 데이터 활용이 증가하고 있으며, 기존의 전문가 중심의 지 역계획, 마을만들기에서 다양한 이해관계자가 문제를 발굴하고 함께 해결방안을 모색 하여 ICT 기반의 문제해결 및 사회혁신 움직임이 강화2)되고 있다.

시대가 급변함에 따라 기술 및 데이터 활용환경도 변화하고 있으며, 이에 대응 가능 한 새로운 정책기초자료의 개발 및 다양화가 필요하다. 이제는 데이터 전문가가 아니 라도 쉽고 직관적으로 지역의 특성을 파악하고 문제를 인식할 수 있는 기초자료가 필요 하다. 국가정책에 있어 통계는 ‘정책의 현 주소와 나갈 방향’을 가르쳐 주는 청진기이 자 조타수3)이다. 기존의 통계자료는 생산단위 측면에서는 총량적이고 개략적인 지역 의 패턴·흐름을 파악하기에는 효과적이나, 세밀하고 구체적인 정책적 관심지역 진단 및 파악에는 한계가 있다. 최근, 국토조사 등 소지역 단위의 격자기반 국토지표 생산이 확대됨에 따라 소지역 단위 국토통계 데이터 활용여건도 변화하고 있다.

2) [Code for Japan 사례] “함께 생각하고, 함께 만드는 사회‘를 목표로, 조직이나 지역의 벽을 허물고 아이디어를 교환하고, 협력하여, Open으로 사회를 Update하고자 하는 단체.

프로그래밍 명령어인 ‘Code’의 의미를 부여하여 Code for Japan은 IT를 활용하여 창조적 사회를 업데이트 한다는 의미를 담고 있음. 행정가, 시민, NPO, 기업, 학생 등 다양한 사람이 IT를 도구로 활용하여 함께 생각하고, 함께 만드는 과정에 참여. Code for 각 지역으로 확대(자료 : https://www.code4japan.org/aboutus2, 2020 년 6월 15일 검색)

3) 통계청. 2019. 통계청, “제25회 통계의 날 기념행사” 실시. 8월 29일. 통계청 보도자료

(28)

한편, 내용적 측면에서 보면, 국민의 생활이나 활동을 파악할 수 있는 사회경제적 지표 발굴은 부족한 실정이다. 국민의 활동을 파악할 수 있는 빅데이터의 등장으로 세 밀하고 구체적인 공간단위(생활공간)로 지역특성을 신속하게 파악하고, 관심지역을 탐 색·진단할 수 있는 도구 개발이 필요하다. 현실감 있는 정책을 발굴·추진하기 위해서 는 유동인구, 카드사용정보, 개인신용정보 등 국민의 활동을 표현할 수 있는 다양한 민간 빅데이터 활용이 중요하다. 하지만 누구나 민간 빅데이터를 쉽게 분석하고 활용 하기에는 한계가 있으므로, 해당 데이터를 활용하여 지역특성을 쉽게 파악할 수 있는 새로운 지역통계 데이터 개발이 필요하다.

해외에서는 공간을 바탕으로 해당 지역에 거주하는 사람들의 인구통계, 사회경제적 특성을 고려한 지역 세분화 및 유형화 자료(Geodemographic) 개발 및 활용이 활성화 되어있다. 인구통계(census) 데이터를 바탕으로 소지역 단위의 지역특성 세분화 및 유 형화 자료인 지리인구통계를 개발하여 , 민간분야는 물론 공공분야에서도 활용하고 있 다. 영국 통계청은 지자체 및 대학과 협업을 통해 지리인구통계 자료를 개발·공개하고 있으며, 웹 기반의 ‘Open and Free Geodemographics’개발·활용을 확대하고 있다.

전통적으로 지리인구통계 자료는 주로 기업 마케팅을 위한 ‘지역 타겟팅(area targeting)’ 기초자료로 활용되어 왔으나, 최근에는 공공부문에서 정책관심지역 발굴, 지역특성 모니터링 및 지역맞춤형 정책 수립 지원을 위한 기초자료로 활용하고 있다.

다양한 국토정책 이슈에 대응하여 정책적 관심지역, 정책대상지역 등을 발굴하기 위해 서는 공공 및 민간의 데이터를 위치 기반으로 융합 활용하여 현실세계를 반영한 유연한 공간단위의 새로운 지역통계자료의 생산과 활용이 필요하다. 지역마케팅(Area marketing)4) 관점에서 개별 지역의 사회경제적 특성을 고려한 지역세분화 및 유형화 자료를 개발하여 지역의 현안을 면밀하게 탐색·진단하는 국토·지역정책 컨설팅 도구로 활용할 수 있다.

4) 지역마케팅(area marketing)이란 지역의 특성에 맞는 상품전략을 세우는 것으로, 기업의 지역전략, 지역의 구체 적 특성을 고려한 마케팅 기본방향을 전략적 시점으로 접근하는 마케팅 기법

(29)

2) 연구 목적

이 연구의 목적은 현실감 있는 정책 발굴 및 추진을 위해 국민의 일상생활을 파악할 수 있는 공공 및 민간 빅데이터(국민활동 데이터)를 활용하여, 소지역 단위의 사회경 제적 특징 등을 세분화·유형화한 새로운 지역통계 자료를 구축하는 것이다. 이를 위 해, 국민의 생활패턴 및 경제활동을 파악할 수 있는 데이터를 발굴하여, 공간정보와 융합한 소지역 단위의 정책기초자료 개발하고, 누구나 쉽게 지역의 특성을 종합적으로 파악할 수 있는 개방형 지리인구통계(Geodemographics) 분석도구를 개발하고자 한 다. 국민의 거주·이동 특성과 경제적 특성을 소지역 단위로 분석·유형화하는 방법론을 정립하고, 대전광역시를 대상으로 시범 적용한 결과를 바탕으로, 향후 개방형 지리인 구통계 분석도구의 활용 확대방안 모색한다.

이 연구의 시작은 지역 특성에 맞는 정책 추진을 위해, “이 지역은 어떤 사회경제적 특징을 가지고 있는가?”에 대한 해답을 쉽고 빠르게 파악할 수 있는 ‘지역특성 세분 화·유형화’ 자료의 부재에서 출발한다. 맞춤형·생활밀착형 정책 수립을 위해서는 지역 에 대한 기초적인 이해가 필요하며, 지역의 특성을 나타내는 객관적 지표 개발이 필요 하다. 국토 및 지역정책 기초자료로 활용이 가능한, 지역의 사회경제적 특징을 나타내 는 새로운 통계데이터 개발 및 활용을 위해 소지역 단위의 세밀하고 구체적인 기초자료 개발이 필요하다.

소지역 기반의 국민활동과 관련한 공공 및 민간 빅데이터를 융합 활용하여 생활공간 을 탐색할 수 있는 자료와 콘텐츠를 개발하고, 국토정책이슈에 대응한 관심지역 발굴 및 지역의 민생경제 현황 모니터링에 활용할 필요가 있다. ‘어떤 지역에 어떤 사람이 살고 있는지’, 해당 지역의 사회경제적 특성을 파악할 수 있는 개방형 지리인구통계 분석도구 구축·활용 확산을 통해 지역특성에 맞는 정책 발굴을 도모해야 한다.

이 연구의 지향점은 “지역의 특성에 대응한 정책 발굴을 위해 새로운 사회경제적 지 역통계데이터 개발 및 활용 확산”이다. 이를 위해, 첫째, 국민의 거주/이동 특성과 경 제적 특성을 소지역 단위로 분석·유형화 방법론을 개발한다. 둘째, 지역의 사회경제적

(30)

특성 유형화 방법 시범 적용을 통한 정책적 시사점을 발굴(데이터 구축 및 활용 관점) 한다. 셋째, 개방형 지리인구통계 분석도구의 공공·민간 부문에서의 활용 가능성을 검 토하고 활용 확대방안을 모색한다. 이를 통해 지역의 사회경제적 특징 파악이 가능한 새로운 통계데이터 생산 및 활용 확산을 도모하고자 한다.

그림 1-1 | 연구 흐름도

자료 : 저자 작성

(31)

※ 주요 개념

○ 국민활동 데이터

- 국민활동 데이터는 국민의 생활패턴 및 경제활동을 파악할 수 있는 데이터

- 국민의 소득/소비/지출/대출, 여가활동, 에너지 이용 등 국민의 일상활동과 관련한 데이터 - 사람의 흐름, 돈의 흐름을 파악할 수 있는 데이터

- 본 연구에서는 국민활동 데이터 중, 국민의 거주/상주 관련 데이터(주민등록인구 데이터), 사람의 이동 데이터(이동통신사 유동인구 데이터), 경제활동 데이터(소득·소비·지출 데이터) 등을 활용

○ 지리인구통계(Geodemographics) : 지리(Geo)+인구통계(Demographics)

- 지리인구통계는 사람들이 살고 있는 곳에 대한 분석이며, 지리/공간을 의미하는 ‘geo’와 가정이나 개인 등 인구통계학적 특성을 의미하는 ‘demographics’을 합성5)

- 인구통계 등 공개된 통계정보와 독자적으로 수집한 정보를 활용하여, 거주지역의 유사성을 바탕으로 지역을 분류

- 어떤 특징을 가진 집단이 어떤 지역에 많이 거주하고 있는지, 거주자의 유사성에 주목한 분류방법론 - 인구통계정보는 성별, 연령, 직업, 소득, 가족구성, 주거형태 등 개인과 집단을 특징하는 정보들을

가지고 있으며, 이에 주소 등 위치를 나타내는 공간정보를 융합하여 공간적 분류6)

- 1980년대 후반부터 영국, 미국 등에서 발전하였으며 마이크로 마케팅(micro marketing)의 세분화 (segmentation) 방법론의 일환으로, 인구통계데이터를 수리통계적 방법으로 거주지역을 분류하여 지리적 인구특성 자료를 구축

- 지역의 특성을 나타내는 객관적 지표로 활용되고 있으며, 정부·공공기관, 연구기관, 민간기업 등 다양한 목적을 지닌 사용자가 구축·제공

- 지리인구통계 데이터를 활용하여 지역분석, 지역정책수립, 상권분석을 간단하고 신속하게 수행

○ 개방형 지리인구통계 분석도구

- 지역의 사회경제적 특성을 소지역 단위로 쉽고 간단하게 파악할 수 있도록 하는 새로운 지역통계 - 공공과 민간의 빅데이터를 위치 기반으로 융합 활용하여 생산한 통계 데이터(지표) 및 해당 지역의

특성 탐색을 위한 기술 서비스를 통칭

- 데이터 관점에서는 ‘지리인구통계’ 방법론을 적용하여, 지역의 사회경제적 특징을 나타내는 지역통 계자료(지역특성에 기반한 유형화·세분화 자료) 개발

- 기술적 측면의 정보서비스 관점에서는 탐색적 데이터 분석(EDA)이 가능하도록, 지역의 사회경제적 특징을 직관적으로 파악할 수 있는 통계자료, 관련 데이터(지표)의 구체적 탐색 기능 설계 - 공공·민간 데이터를 활용하고, 데이터 접근 및 활용 소외계층도 목적에 따라 자료를 쉽게 활용할

수 있는 개방형 분석도구로, 계층·분야간 데이터 활용역량 격차 해소 및 포용적 디지털 경제 지향

5) Leventhal, 2016; Sleight, 2004

6) タ-ゲットの居住地域に着目した「ジオデモグラフィックス分類」 https://gentosha-go.com/articles/-/8532 (2020년 11월 18일 검색)

(32)

2. 연구의 범위 및 방법

1) 연구 범위

이 연구의 시간적 범위는 자료 구득성 등을 고려하여 최근 1~2년 이내에 생산된 데 이터를 분석 범위로 설정한다.

공간적 범위는, 민간 빅데이터 활용 가능성, 데이터 수집 가능성 등을 종합 검토하 여 시범적용 분석대상 지역(대전광역시)에 한정한다. 분석을 위한 공간단위는 250m 격자, 행정구역(읍면동), 조사구 등 다양한 공간단위를 활용하였다. 지역유형화 자료 는 250m 공간단위로 분석·구축하였으며, 관심지역의 결과 해석을 위한 관련 지표들은 행정구역, 조사구 등 다양한 공간단위 기반으로 탐색할 수 있도록 기능을 설계하였다.

내용적 범위는 다음과 같다. 첫째, 국민활동 데이터와 개방형 지리인구통계 분석도 구 개념을 정립하고, 국민활동 데이터 기반의 개방형 지리인구통계 분석도구 개발 의 의를 고찰한다. 둘째, 국내외 사례를 검토하여 활용 목적, 개발방법론, 적용 분야, 활 용 효과, 유용성 등의 시사점을 심층적으로 분석한다. 셋째, 국민활동 데이터를 이용 한 개방형 지리인구통계 분석도구 개발방향 및 방법론을 정립하고, 시범적용을 통한 시사점을 도출한다. 넷째, 공공 및 민간부문에서 개방형 지리인구통계 분석도구의 활 용 방안 모색 및 활용 확대를 위한 정책방안을 도출한다.

2) 연구 방법

○ 관련 이론 및 선행연구 검토

지역의 사회경제적 특성을 나타내는 대표적인 객관적 지표로 활용되고 있는 지리인 구통계(geodemographics)의 개념 및 이론, 선행연구 고찰을 통한 최근 동향을 분석하 였다. 지리인구통계의 등장부터 최근 빅데이터, 오픈소스 등 기술 트렌드에 의해 진보 된 지리인구통계 개발 동향 분석 및 정책적 활용 의의 등을 검토하였다.

(33)

○ 국내외 관련 사례 심층 분석

지리인구통계 개발·활용이 활성화 되어 있는 영국과 일본 사례를 심층적으로 분석하였 다. 이와 더불어 MOSAIC, CAMEO 등 민간의 대표적 지리인구통계 자료 구축 및 활용 사례를 면밀히 검토하였다. 특히, 민간 빅데이터를 활용한 영국의 ‘Open Geodemographics’

및 일본의 ‘Dynamic Geodemographics’ 개발·활용 사례를 분석하여 시사점을 도출하였 다. 또한, 국내 소지역통계생산 현황을 파악하기 위해, ㈜빅데이터와 미래연구소 등 외부 전문가 협동연구를 통해 소지역통계생산의 현 주소를 파악하였다.

○ GIS 기반 기초 데이터 구축 및 공간정보분석

유동인구정보(SKT), 소득·소비(지출)데이터(KCB, BC카드 등) 등 사람 및 돈의 흐름(flow)을 파악할 수 있는 데이터를 수집·가공하여, 공공의 주민등록인구 및 건물 데이터 등과 융합 분석하였다. 공간통계 기법을 적용한 공간분석 등을 수행하여 다양 한 공간단위 기반의 유형화(Classification)7)을 수행하였다.

분석에 필요한 민간 빅데이터는 SKT 및 ㈜빅데이터와 미래연구소, 그리고 코리아크 레딧뷰로(KCB)와 협동연구를 통해 받았으며, 기타 공공데이터는 국토정보플랫폼(국 토지리정보원) 및 통계청 홈페이지에서 수집하여 분석에 활용하였다.

○ 개방형 지리인구통계 분석결과 탐색을 위한 데이터 대시보드(dashboard) 개발 개방형 지리인구통계 분석도구 개발 및 시범적용 결과를 인터랙티브 지도 기반의 탐 색형 정보콘텐츠로 구축하기 위해 망고시스템 기술연구소와 협동연구를 수행하였다.

본 연구에서 구축한 인터랙티브 지도는 원내 기존연구(국토정책 인터랙티브 리포트, 20198))에서 시범 개발한 플랫폼을 활용하여, 새로운 추가 콘텐츠로 구축하였다. 국민 들이 관심지역의 생활공간 특성을 쉽게 탐색할 수 있도록, 지리인구통계 방법론 적용 결과 및 관련 지표, 참고 데이터 등을 인터랙티브 리포트 형태로 구축하였다.

7) Huge geographic matrix, Principal component analysis, Cluster Analysis, Naming 등 8) KRIHS 인터랙티브 리포트 http://interactive.krihs.re.kr/interactive (2020년 10월 2일 접속)

(34)

3. 선행연구 검토 및 차별성

선행연구는 지역정책 지원을 위한 데이터 기반 지표 개발 및 활용 연구와 다양한 인 구·사회·경제 데이터를 활용한 지역 유형화 및 활용 연구로 구분하여 검토하였다. 선 행연구 검토 결과, 기존 연구들은 지역 정책에서 활용할 수 있는 지표를 분야별로 구축 하고, 지역 유형화 단계에서 인구총조사자료 기반의 데이터 활용에 초점을 두고 있다.

- 국민공감 국토정책 실현을 위한 지표 개발 연구(2014). 임은선 외. 국토연구원 - 지역문제 해결을 위한 공간정보 활용방안 연구(2015). 이영주 외. 국토연구원 - 빅데이터 시대의 국토정책 추진방향(2017). 임은선 외. 국토연구원

- 지능화 시대에 대응한 국토조사 혁신 및 기반강화 연구(2018). 임은선 외. 국토 지리정보원

- 수요 기반의 국토조사 및 이용활성화 연구(2019). 임은선 외. 국토지리정보원

- Seth Spielman & Alex Singleton(2015) Studying Neighborhoods Using Uncertain Data from the American Community Survey : A Contextual Approach, Annals of Association of American Geographers, 105:5, 1003-1025

- Alex Singleton & Paul Longley(2015) The internal structure of Greater London : a comparison of national and regional geodemographic models, Geography Environment 2015, 2, 68-87

- Christopher Gale, Alex Singleton, Andrew Bates, Paul Longley(2016) Creating the 2011 area classification for output areas(2011 OAC), Journal of Spatial Information Science, 12, 1-27

- Alex Singleton, Seth Spielman, Chris Brunsdon(2016) Establishing a framework for Open Geographic Information Science, International Journal of Geographical Information Science, 30:8, 1507-1521

(35)

- Yunzhe Liu, Alex Singleton, Daniel Arribas-Bel(2019) A Principal Component Analysis(PCA)-based framework for automated variable selection in geodemographic classification, Geo-spatial Information Science, 22:4, 251-264

이 연구는 인구통계 데이터를 활용하는 데에서 그치지 않고, 국민의 실제 활동과 관 련된 공공데이터 및 민간 빅데이터를 활용하여 정책기초자료로 사용될 수 있는 새로운 소지역 단위 지역 유형화 모형을 개발하고자 하였다. 특히, 경제활동 및 유동인구 등 민간 빅데이터를 주민등록인구, 건축물 정보 등 공공 빅데이터와 융합 분석하여 공간 적 특성을 고려한 지역의 사회경제적 특성 파악이 가능한 지역유형화 및 세분화 자료를 개발하고, 해당 지역의 특성을 파악하였다.

이와 함께, 관심지역에 대한 해당 분석결과를 쉽게 확인하고, 이와 관련한 지표 및 참고 정보들을 함께 탐색할 수 있는 데이터 대시보드를 개발하여 누구나 쉽게 지역의 사회경제적 특성을 파악할 수 있도록 하였다.

(36)

구 분 선행연구와의 차별성

연구목적 연구방법 주요 연구내용

주요 선행

연구 1

∙ 과제명: 국민공감 국토정책 실현을 위한 지표 개발 연구

∙ 연구자(년도): 임은선 외(2014)

∙ 연구목적: 국토에 대한 국민 공감대 및 만족도 제고를 위해 국토의 다양 한 영역을 측정할 수 있는 체감형 지표 개발

∙ 국내외 문헌 조사

∙ 사례분석 및 인터뷰 조사

∙ 전문가 설문조사 및 자문

∙ 공간통계, 공간정보분석

∙ 전문가 협동연구

∙ 국토정책 패러다임 변화와 지표 동향

∙ 국토체감지표 체계의 정립과 지표 개발

∙ 국토체감지표 시범적용 및 시사점

∙ 국토체감지표 활용을 위한 추진과

2

∙ 과제명: 지역밀착형 정책지원을 위한 공간정보 융복합 활용방안 연구

∙ 연구자(년도): 이영주 외(2015)

∙ 연구목적: 지역밀착형 정책지원을 위 한 분석도구로서 공간정보 활용 가능 성 및 공간정보 기반의 융복합 활용모 델 발굴

∙ 문헌 및 사례조사

∙ 전문가 인터뷰 조사

∙ 농업경영체 DB 등 공간정 보 기반의 다양한 정보 융 합 활용

∙ GIS기반 공간정보분석/

∙ KOPSS 활용

∙ 지역밀착형 정책지원과 공간정보 활용 의의

∙ 국내외 정책동향 및 사례

∙ 지역밀착형 정책지원을 위한 공간정 보 융복합 활용모델 시범적용

∙ 공간정보 융복합 활용 확대를 위한 정책방안

3

∙ 연구명: Creating the 2011 area classification for output areas

∙ 연구자(년도): Gale, et al.(2016)

∙ 연구목적: 2011년 영국 센서스 데 이터를 활용하여 전국의 지리인구 통계 모델 개발

∙ 문헌연구

∙ GIS 기반 데이터 분석 및 지역 유형화

∙ 지리인구통계를 위한 군집 방법 론 제안

∙ 지리인구통계 유형화 결과(2011 OAC) 도출

∙ 지리인구통계를 인터랙티브 맵으로 구축

4

∙ 연구명: The internal structure of Greater London: a comparison of national and regional geo- demographic models

∙ 연구자(년도): Singleton, et al .(2015)

∙ 연구목적: 런던 대도시권의 특성에 맞는 새로운 지리인구통계 모델 개 발 및 분석

∙ 문헌연구

∙ GIS 기반 데이터 분석 및 지역 유형화

∙ 지리인구통계 유형화 결과(LOAC) 도출

∙ 지리인구통계를 인터랙티브 맵으 로 구축

본연구

∙ 국민의 일상생활을 파악할 수 있는 공공 및 민간 빅데이터(국민활동 데이터)를 발굴·활용하여, 지역의 사회경제적 특징 등을 고려한 지리 인구통계(geodemographics, 지 역특성 세분화·유형화 자료) 방법 론 개발 및 적용을 통해 새로운 통 계자료 개발

∙ 국내외 문헌조사

∙ 공간통계/공간정보분석/

공간빅데이터 분석

∙ 상호작용지도 기반 콘텐 츠 구축

∙ 전문가 자문

∙ 민간기관 협동연구 (㈜빅데이터와 미래연구

소, KCB, 망고시스템 기 술연구소 등)

∙ 국민활동 데이터와 개방형 지리인구 통계 분석도구 개발 의의

∙ 국내외 사례 분석

∙ 국민활동 데이터를 이용한 개방형 지 리인구통계 분석도구 개발

∙ 개방형 지리인구통계 분석도구 활용 방안

표 1-1 | 선행연구 요약 및 차별성

참조

관련 문서

국민의 실질소득을 유지 또는 상승시키며, 국가가 자유무역 및 공정한 시장제도 아래에서. 재화 및 서비스를 생산할

◦ 그러나 여전히 주요 수출품목이 가공식품에 집중되어 있는 상황에 서 수출품목을 신선농산물 등으로 다양화해야 하며, 이를 위해 수 출 유망품목 발굴, 수출시장 정보

지속적으로 농업에 대한 연구개발 투자는 민간 부문 특히 생산자와 공공 부문 및 민간 부문 간의 공동 협력의 결과로 자금이 지원되었다.. 그러나 이 자료에는 화학회사나

향후에는 전원에 관한 개발,데이터 저장용량 확대,소형화로 재택 의료기기에 부합 할 수 있는 시스템의 개발이 가능할 것으로 보이고 가속도 신호를 분석하여 자세

기상청은 앞으로도 지진으로부터 국민의 안전을 지키기 위해 국민의 요구에 보다 부합하고 체감할 수 있는 지진 서비스로 발전시키고자 최선을 다할

특히 본 과정을 통해 누구나 손쉽게 빅데이터 분석기술을 활용하여 사회 문제를 분석하고, 모바일 솔루션을 개발하 여 이를 해결할 수 있는 능력을 갖출

CIO와 CTO는 고급 AI 구현 기술을 보유한 조직이 설문 응답자들에 비해 이미 주도권을 잡고 있는, 인프라 및 사이버 보안에서부터 데이터 관리 및 개발

이러한 배경에서 미국, 유럽, 일본 등 해외 주요국은, 한편으로 공공정보 이용을 촉진하거나 공공부문 이 직접 빅데이터 기술 개발을 지원하는 방식으로