• 검색 결과가 없습니다.

1) 개요

분석대상 지역은 민간 빅데이터의 구득 가능성 및 분석결과 검증 및 정책적 활용을 고려하여 대전광역시로 선정하였다. 대전은 과학기술정보통신부와 함께 데이터 기반의 과학적 도시행정을 위해 ‘지능형 도시재생정책 지원 시스템’ 등을 구축하고 있으며, 인구, 경제, 주택, 안전, 환경 등 도시재생 정책지원을 위한 다양하고 새로운 데이터를 발굴·개발하고 있다.5) 이 연구에서 개발하는 소지역 단위의 사회경제적 지역통계자료 는 해당 시스템의 다른 자료들과 융합 활용이 가능할 것으로 기대된다.

분석의 공간단위는 250m×250m로 구분된 격자로 설정하였으며, 분석의 기준 시점 은 원천데이터에 따라 차이가 있으나 기준을 2019년으로 정의하였다. 데이터별 시점 은 활용 데이터 부분에서 자세히 설명하였다.

분석 방법은 다음과 같다. 먼저, SKT 유동인구 데이터와 KCB의 소득·신용정보 데 이터를 분리하여 각각의 변수로 지역 유형화 분석을 수행하였다. 두 데이터는 모두 국 민의 활동을 나타내는 데이터이지만, 각각의 데이터가 나타내는 데이터 구조 및 특성 이 상이하여, 주제별로 분석을 별도 수행하는 절차를 진행하였다. SKT의 유동인구 데 이터는 모바일 이용 데이터를 바탕으로 지역에 체류하는 인구를 집계한 정보로 ‘지역 자체의 특성을 나타내는 데이터’이고, KCB의 소득·신용정보 데이터는 ‘지역 내에 거 주하는 인구의 경제활동 특성을 나타내는 데이터’로 데이터가 나타내는 지역 특성에 차이가 있다.

1차 분석에서는 두 데이터를 분리하여 유형화 분석을 수행(유동인구를 활용한 지역 특성 유형화, 소득·신용정보를 활용한 지역 거주 인구 특성 유형화)하고, 개별 분석 결과를 결합하여 지역을 분류·유형화하고자 하였다. 1차 분석 결과를 토대로, 두가지 유형의 데이터셋을 결합하여 지역을 분류·유형화하는 2차 분석을 수행하였다.

5) 대전광역시. 2020. 지능형 도시재생정책 지원 시스템 중간보고 자료. 내부자료(미출판자료).

2) 사람의 이동특성을 고려한 지역유형화 분석

SKT의 유동인구 빅데이터를 바탕으로 먼저 지역 자체의 환경적·물리적 특성을 분석 하였다. 유동인구는 그 지역에 사는 사람뿐만 아니라, 통근·통학·쇼핑·이동 등 다양한 이유를 갖고 방문하는 사람들을 모두 집계하는 데이터이므로 지역의 환경적 특성을 나 타내는 지표이다. 유동인구를 활용한 분석에서는 지역의 환경적 특성을 유형화하고자 유동인구 빅데이터와 함께 물리적 환경을 나타내는 건축물 데이터를 함께 사용하였다.

또한, 정주인구를 대표하는 주민등록인구와 유동인구를 비교하는 변수를 추가하였다.

(1) 활용 변수

앞서 정리한 데이터 중, 유동인구를 활용한 분석에 사용한 변수는 <표 4-3>과 같다.

총 주민등록인구 수와 총 유동인구 수는 두 가지 측면(정주인구와 유동인구)의 지역 내 인구지표를 비교하기 위한 목적으로 추가하였다. 유소년 유동인구 비율과 고령 유 동인구 비율은 지역에 방문하는 인구의 연령대 구성을 파악하기 위한 변수로 추가하였 다. 평일 유동인구 비율은 해당 지역에 방문하는 유동인구의 평일 비중을 나타내는 값 이다. 일반적으로 평일 유동인구가 많을수록 주거나 업무 등 일상적인 생활이 영위되 는 지역이라고 볼 수 있으며, 반대로 공휴일 유동인구가 많은 지역은 상대적으로 여가 활동의 비중이 높은 지역이라고 판단하였다.

주민등록인구에 대해 유동인구의 수준을 파악하기 위한 지표로 주민등록인구 대비 유동인구 비율과 유동인구에서 주민등록인구를 감한 값을 변수로 추가하였다. 비율 지 표를 통해서는 상주인구 대비 유동인구의 상대적 수준을 확인할 수 있으며, 유동인구 에서 주민등록인구를 뺀 값은 절대적인 차이 값을 파악할 수 있어 상주 지역과 유동 지역에 대한 특징을 보여줄 수 있는 변수로 판단하였다.

건축물 변수는 상업시설의 수, 단독주택·공동주택의 비율, 노후건축물의 비율을 사 용하였다. 건축물의 용도별 지표를 추가하여 지역의 주요 토지이용 형태를 파악할 수 있다. 단독주택과 공동주택의 비율은 주거 형태와 환경을 나타내는 변수로 활용하였

다. 노후건축물 비율은 지역의 건축물 노후도에 대한 변수로서 낙후 수준을 판단하기 위한 변수이다.

대전광역시 내 총 9,026개의 250m×250m 격자 중 총 주민등록인구 수와 총 유동 인구 수, 총 건축물 수 값을 모두 갖고 있는 3,099개의 격자를 분석대상 격자로 추출 하였다.

분류 소분류 총합 평균 최댓값 중앙값 표준

편차

유동 인구

총 주민등록인구 수 1,474,494(명) 475.80 4917.00 66.00 721.95

총 유동인구 수 10,290,329.84(명) 3320.53 76997.19 1338.92 5291.15

유소년 유동인구 비율 - 1.82 2492.40 1.65 136.41

고령 유동인구 비율 - 9.14 8376.28 8.78 465.72

평일 유동인구 비율 - 53.20 32661.65 51.25 2614.17

주민등록인구 대비

유동인구 비율 - 103.90 24388.29 6.50 631.33

주민등록인구에 대한 유동인구의 절대적 수준

(유동인구-주민등록)

8,815,835.84(명) 2844.74 78851.19 905.42 5075.75

건축

상업시설 수 25,015(동) 8.10 480.00 2.00 18.22

단독주택 비율 - 51.72 100.00 58.70 36.14

공동주택 비율 - 12.06 100.00 0.00 24.55

노후건축물 비율 - 50.33 100.00 54.55 34.15

자료: 저자 작성

표 4-3 | 유동인구 활용 분석 변수 및 기초 통계량

(2) 분석 과정

유동인구와 건축물 데이터에서 추출한 총 11개의 변수로 보편적인 군집분석 방법론 인 K-means 군집분석을 통해 유형화 분석을 시행하였다. K-means 군집분석을 시행 하기 전, 변수들의 분포와 범위를 확인하고 정규화(normalization)와 표준화 (standardization)를 수행하였다. 일부 변수의 분포가 정규성을 갖지 않아 box-cox 변 환을 통해 정규화하였고, 개별 변수의 사이의 단위에 의한 범위의 편차가 크므로 0-1 스케일로 모든 변수를 표준화하였다.

K-means 군집분석의 최적 클러스터 사이즈를 검정하기 위해 클러스터의 개수에 따 라 군집 내 제곱합의 수준을 보여주는 Screeplot을 활용하였으며, 이 결과에 따라 군집 내 제곱합의 격차가 줄어드는 정도가 감소하는 지점인 6개를 선정하였다(<그림 4-10>

참고).

주: 군집 내 제곱합 (Total Within Sum of Square)의 변화에 따라 클러스터 사이즈 결정 자료: 저자 작성

그림 4-10 | 유동인구 군집분석의 최적 클러스터 사이즈 결정

(3) 분석 결과

유동인구와 건축물 데이터를 활용하여 k=6인 K-means 군집분석을 수행하였다.

각 군집별 변수 평균값은 <표 4-4>와 같다. 클러스터의 분포를 나타내는 지도는 <그림 4-11>과 같다.

각 군집별로 특성을 살펴보면, 먼저 군집 1은 총 주민등록인구 수, 총 유동인구 수 연령대별 유동인구 비율, 평일 유동인구 비율 등 인구와 관련된 지표가 모두 평균 이상 의 수준을 보였다. 이에 비해 주민등록인구 대비 유동인구의 비율은 전체 군집 중 가장 낮게 나타났다. 특히 군집 1에 속하는 격자들의 주민등록인구의 총합은 773,110명으 로 여섯 개의 군집 중 가장 많았다. 상업시설의 수도 가장 많게 나타났으며, 단독주택 의 비율, 노후건축물의 비율도 매우 높은 편으로, 주로 도시 내부의 구시가지 지역을 중심으로 분포하고 있다.

값 군집 1 군집 2 군집 3 군집 4 군집 5 군집 6 전체평균

클러스터 내 관측치 개수 868 153 875 292 439 472 3,099*

총 주민등록인구 수 890.68 285.88 41.69 25.49 20.82 1280.90 475.80 총 유동인구 수 5,390.47 7,284.20 542.15 1,797.40 2,135.52 5,424.16 3,320.53

유소년 유동인구 비율 1.98 1.90 1.40 1.96 1.24 2.72 1.82

고령 유동인구 비율 9.66 8.84 10.05 10.56 7.35 7.36 9.14

평일 유동인구 비율 51.93 50.88 54.89 46.40 56.90 53.91 53.20 주민등록인구 대비

유동인구 비율 10.95 59.89 38.02 210.68 463.03 11.18 103.90 주민등록인구에 대한

유동인구의 절대적 수준 (유동인구-주민등록)

4,499.79 6,998.32 500.46 1,771.91 2,114.69 4,143.26 2,844.74

상업시설 수 19.77 19.24 0.87 3.68 2.77 4.12 8.10

단독주택 비율 62.06 71.61 82.61 54.04 1.72 14.07 51.72

공동주택 비율 11.49 0.00 0.01 0.00 0.00 58.06 12.06

노후건축물 비율 64.82 65.56 52.78 53.72 33.29 27.98 50.33 군집 내 주민등록인구 수 773,110 43,739 36,476 7,444 9,142 604,583 1,474,494*

주: *값은 평균이 아닌 합계를 산출한 것임 자료: 저자 작성

표 4-4 | 유동인구 활용 분석 클러스터별 변수 평균값

군집 2는 총 유동인구 수가 평균 7,284.20명으로 가장 많았으며, 유동인구에서 주 민등록인구를 뺀 유동인구의 절대적 수준이 가장 높은 군집으로, 주로 도시 내부에서 도 역 주변과 같이 가장 활동이 많은 중심지역에 분포하고 있다.상업시설 수는 평균 19.24개로 여섯 개의 군집 중 두 번째로 많으며, 가장 많은 군집 1과 큰 차이를 보이지 않았다. 또한 공동주택은 아예 없었으며, 노후건축물의 비율이 가장 높은 수준이었다.

군집 3은 총 유동인구 수와 유동인구에서 주민등록인구를 뺀 값이 가장 낮으며, 상 업시설의 수도 가장 낮게 나타났다. 총 주민등록인구 수도 41.69명으로 낮은 수준이었 다. 이에 비해 단독주택의 비율은 82.61%로 여섯 개의 군집 중 가장 높았다. 군집 3의 공간적 분포는 주로 도시의 외곽지역에 넓게 분포하고 있다.

군집 4는 총 주민등록인구 수와 총 유동인구수가 평균에 비해 낮은 수준이며, 반면 고령 유동인구의 비율은 가장 높았다. 평일 유동인구의 비율도 평균적으로 가장 낮은 수치를 기록하였다. 또한 군집 4에 속하는 격자들의 주민등록인구 수 총합은 7,444명 으로 매우 적었다. 사람이 거의 살지 않고, 거주하는 사람 중에서도 고령인구의 비중이 높은 지역으로 추정된다. 주로, 도시 외곽에 산발적으로 분포하는 특성을 보인다.

군집 5는 주민등록인구 수의 평균이 가장 낮은 지역이며, 유소년·고령 유동인구의 비율도 가장 낮게 나타났다. 또한 단독주택과 공동주택의 비율도 낮게 나타나 주거용 건물이 거의 없는 지역인 것으로 나타났다. 이에 비해 평일 유동인구의 비율과 주민등 록인구 대비 유동인구의 비율은 가장 높게 나타나 유동인구는 가장 많은 것으로 나타났 다. 근로활동 중심지역으로 주로 교외 지역과 시가지 지역의 경계 부분에서 분포하고 있다.

군집 6은 총 주민등록인구 수의 평균이 가장 높은 지역으로, 군집 6에 속하는 격자 들의 주민등록인구 수 총합 역시 604,583명으로 군집 1에 이어 두 번째로 높게 나타났 다. 또한 공동주택의 비율이 가장 높은 군집이었으며, 노후건축물의 비율도 가장 낮았 다. 도시 내부에서도 아파트의 비중이 높은 신시가지, 재개발 지역을 중심으로 분포하 고 있다.

관련 문서