시계열 군집을 활용한 부산시 감염병 지원 정책
방향: COVID-19 사례를 중심으로
A Direction of Politic Support for Infectious Disease in Busan Using
Time-series Clustering: Focusing on COVID-19 Cases
권현호1⋅김도희1⋅박찬호1⋅이은주1⋅조기행2⋅배혜림1† 부산대학교 산업공학과1, 부산광역시2 요 약 COVID-19 확산 이후 국가 위기경보 단계가 최고 수준인 4단계로 올라갔다. 우리나라의 경우, 대구에서 발생한 집단 감염으로 인하여 경북지역에서 코로나 확진자가 급증하면서 전국적으로 확산되어 갔다. 코로나 확산에 따라 정부 및 각 지자체에서는 시민들의 불안감과 경제적 어려움을 해소하고자 지원 대책을 마련하였다. 부산시도 시민들의 정책 수요를 파악한 결과, 공공요금 인하, 기본소득 지급, 소상공인 경영지원 강화 등의 정책에 대한 수요가 다수를 차지하였다. 시민들의 수요를 바탕으로 본 연구에서는 코로나 전⋅후의 데이터를 패턴 분석하여 부산시 구/군별 업종별 시계열 군집화를 통해 경제적 지원에 있어 선제적 관점을 제공한다. 또한 향후 전염병과 재난 발생 시 예방 및 정책 방향을 설정하는 데 도움을 줄 수 있을 것이다. ■ 중심어 : 코로나, 정책 지원, 패턴, 시계열 군집화, 예방 Abstract
After the spread of COVID-19 in 2020, the country’s Crisis Alert Level went up to the highest level, Level 4. Respond of COVID-19 pandemic, Governments, and cities secured each province’s duty for the citizens. The government provided health assistance first and stepped forward to support the necessary resources for the citizens. Busan City proposed policy response to prepare and implement the Corona support for each county as well. The high occupant rate of self-busi-ness owners lost basic incomes, and the effect varies on industries. In our paper, to avoid any crisis in such an epidemic, we propose a clustering analysis for the guidance of policy support for Busan City. By analyzing patterns and clustering on districts and Sectors, we would like to provide reference materials for determining the direction of support and guiding preemptive response in the event of a similar epidemic.
■ Keyword : COVID-19, Policy Support, Pattern, Clustering, Preemptive
2020년 08월 04일 접수; 2020년 08월 19일 수정본 접수; 2020년 08월 25일 게재 확정.
Ⅰ
. 서 론
2019년 12월 중국 우한에서 처음 발생한 COVID-19는 이후 전 세계로 확산되었으며, 우 리나라에만 확진환자 12,800명, 사망환자 282명 을 발생시켰다(2020.06.30. 기준). 한국의 경우, 대구로부터 확산된 집단감염으로 인하여 경북 지역에서 코로나 확진자는 급증하였고, 경상도 권의 코로나 전파 위험도 함께 증가하였다. 코 로나 확진자가 부산에서 처음 발생(2020.02.01.) 한 이후 시민들의 불안과 공포가 증가하면서 일 상 활동과 도시 활력을 위축시켰다. 이에 부산 시는 설문조사를 통해 시민 정책 수요를 바탕으 로 코로나19 극복을 위한 부산시 정책 대응을 제언하였다(손헌일, 2020). 시민 설문조사 결과 위생용품 및 방역에 관련된 단속 및 대응 강화가 주를 이뤘지만 공공요금 인하(27.5%), 저소득층 위생용품 지원(25.6%), 소상공인 및 자영업자 경 영지원 강화(22.7%), 기본소득 지급(21.5%)과 같 은 시민들의 경제적인 어려움이 반영된 정책 수 요도 다수를 차지했다(손헌일, 2020). 본 논문에서는 앞서 언급한 정책 수요를 바탕 으로 코로나 전⋅후의 부산시 구/군별 업종별 클러스터링을 통해 경제적 지원에 있어 선제적 관점을 제공한다. 또한 코로나19와 같은 전염병 및 재난 발생 시 예방 및 정책 방향을 설정하는 데 지원한다. 본 논문은 다음과 같은 순서로 구성되어 있다. 2장에서는 코로나 관련 동향을 국내외 관점에서 제시하고, 3장에서는 제안 방법인 구/군별 직종 별 클러스터링 방법론을 설명하고, 4장에서 결과 를 바탕으로 활용 가능한 정책 방향을 제시한다.Ⅱ
. 관련 동향
Cordes and Castro(2020)는 COVID-19 진단 접근성 판단을 위한 지역 식별 연구를 진행하였 다. 뉴욕시의 우편번호 데이터를 활용하여 진단 비율, 진단 양성 비율을 먼저 식별하였고, 식별 된 Cluster를 기준으로 상황별 측면(인종, 수입, 교통사용 빈도 등)을 토대로 양성 비율이 낮은 군집은 소득, 교육 및 백인이 높은 반면 양성 테 스트 비율이 높은 군집은 불균형적으로 흑인 및 히스패닉 사람들의 건강보험이 적용되지 않았던 시사점을 지적하였다. 이 연구는 진단 테스트 비 율이 낮지만 양성 진단 비율이 높은 동부 브루클 린 지역이 정부의 진단 및 건강관리 지원이 우선 적으로 필요한 계층에 속함을 보여주었다. 국내에서는 COVID-19 소셜 빅데이터 기반 주요 이슈를 분석하였다. 코로나 확산 이후 관 련 언론 보도 및 댓글들을 분석하여 시기별로 발생한 이슈들을 살펴보았다. 키워드 별로 데이 터를 수집하여 시계열 버즈양 분석, 연관 단어 분석, 네트워크 분석 방법을 적용하여 시간 흐 름에 따라 코로나 관련 이슈들이 어떻게 변화했 는지 파악하였다(오미애, 전진아, 2020).
Ⅲ
. 부산시 구/군별 직종별 Clustering
본 실험에 사용된 데이터는 부산광역시 및 ○ ○카드사의 카드매출 데이터로 기간은 19-20년 1월 1일부터 4월 30일까지의 데이터를 사용하 였고, 구/군, 업종 구분은 표 1과 같다.3.1 Time Series Decomposition for Clustering 본 연구에서는 시계열 데이터의 Clustering 방 법론의 성능 재고를 위해 Time Series Decompose 를 활용한다. 시계열 데이터는 다양한 패턴으로 나타나는 데, 이 데이터를 추세(Trend), 계절성(Seasonal), 잔차(Residual) 등의 성분으로 나눌 수 있다. 위 와 같은 성분을 추출하는 작업은 예측 모델의 정확도를 높이거나, 더 나은 클러스터링 결과를
구/ 군별 (16) 강서구, 금정구, 기장군, 남구, 동구, 동래구, 부 산진구, 북구, 사상구, 사하구, 서구, 수영구, 연 제구, 영도구, 중구, 해운대구 업종 별 (30) 대분류 소분류 가전/가구 가전/가구 가정생활/서비스 인테리어 서비스 교육/학원 학원 교육용품 유아교육 미용 미용서비스화장품 스포츠/문화/레저 스포츠/문화/레저용품스포츠/문화/레저 여행/교통 숙박/여행 요식/유흥 한식 기타요식 일식/중식/양식 제과/커피 /패스트푸드 유흥 유통 할인점/슈퍼마켓 편의점 백화점 기타유통 음/식료품 음/식료품 의료 병원 기타의료 약국 자동차 자동차서비스/용품자동차판매 주유 주유 패션/잡화 의복/의류패션/잡화 <표 1> The Data Criteria for Clustering
도출하는데 사용될 수 있다. 본 논문에서는 추세-주기 성분만을 추출하여, 클러스터링에 사용하도록 한다. 시계열 분해 기법 은 추세-주기를 측정하기 위한 이동평균(moving average)방법을 사용한다. 차수(order) m의 이동 평균은 Equation 1과 같다(Box. G. E. 1970). (1) m 기간 안의 시계열 값 평균을 이용하여 시간 t의 추세-주기 성분을 추출 한다. 이는, 데이터의 무작위성을 줄이고, 매끄러운 추세-주기 성분만 을 추출하는 것이다. 주기 m을 택하는 방법은 주별 패턴이 있는 일별 데이터에서는 7, 월별 데 이터는 12, 분기별 데이터에서는 4를 택한다. 일 별 데이터를 사용하였으며, 주별 패턴이 있는지 확인하기 위해 시간에 따른 Autocorrelation(자 기상관)을 이용한다. 그림 1의 lag 7에서의 자기상관 계수가 가장 높은 것으로 보아 주별 패턴이 있는 것으로 볼 수 있다. 따라서 m=7을 이용해 추세-주기 성분 을 추출한다. \ <그림 1> Decomposition result of Districts for Clustering
업종별 클러스터링은 30개의 구분을 가지기 때문에 Appendix에 따로 정리하였다. 자기 상관 계수가 높은 lag는 업종의 종류에 결과가 나뉜 다. Appendix를 보면 자기상관 계수가 높은 lag 는 1, 7, 14, 28이고, lag 7에서의 자기상 관 계수 가 높은 업종들이 많아 m = 7을 이용해 추세-주 기 성분을 추출하였다.
3.2 구/군별 계층적(응집) 군집화 Decomposition 결과에 따라 7일 주기로 나눈 구별 카드 매출 금액으로 클러스터링 한 결과는 다음과 같다. 그림 2는 일반 상황(2019년)과 코로나 발생 상황(2020)의 카드 매출 금액 클러스터링 결과 를 덴드로그램으로 나타내었다. 일반 상황과 코 로나 발생 상황의 구/군별 군집화 결과는 같다. 코로나 발생으로 인해 소비가 위축되었지만, 그 로 인해 군집에 영향을 주지는 않았다. <그림 2> Dendrogram of 2019-2020 Districts Clust ring
그림 3은 일반상황(2019년)에서 클러스터링 한 결과 4개의 군집으로 묶인 구/군을 설명한다. 공통적으로 설 연휴(2월 초)와 3⋅1절 황금연휴 시기에 카드 매출 금액이 급상승하는 패턴을 보
<그림 3> Clustering Graph of Districts in Normal Situation(2019) 인다. 첫 번째 군집(동구, 서구, 영도구, 중구)은 소비가 현저히 낮은 지역이다. 두 번째 군집(금 정구, 기장군, 남구, 동래구, 사상구, 사하구, 연 제구)은 주거인구와 인구유입 모두 많은 지역이 다. 세 번째 군집(강서구, 북구, 수영구)은 다른 상황에 영향을 덜 받고 비교적 소비 금액 간 차 이가 적은 지역이다. 네 번째 군집(부산진구, 해 운대구)은 인구와 소득도 높고, 상권도 활발한 지역이다. 그림 4는 코로나 발생 상황(2020년)에서 클러 스터링 한 결과로 2019년과 군집은 같다. 대부 분 설 연휴(1월 말)에서 급상승하고 부산의 첫 코로나 확진자 발생일(2월 21일)을 기점으로 하 락하는 추세를 보인다. 그러나 같은 군집에 묶 이더라도 특수한 패턴을 띄는 지역이 있다.
<그림 4> Clustering Graph of Districts in COVID-19 (2020) 그림 5는 세 번째 군집(강서구, 수영구, 북구) 의 소비 추세를 보여준다. 각 지역은 매우 다른 패턴을 보이고 있으나, 코로나의 영향을 덜 받 았다는 공통점이 있다. 강서구의 경우, 르노 삼 성의 주말계약이 월요일에 반영되면서 월요일 마다 상승하며, 코로나로 인해 자가용 사용이 늘면서 자동차판매가 상당부분을 차지하는 구 의 특성상 매출이 크게 증가한다. 수영구의 경 우, 코로나의 영향을 크게 받지 않았고 월말월 초마다 매출이 급증하는 추세를 보인다.
<그림 5> Graph of consumption trends in the third Cluster (2019-2020) 북구의 경우 역시 코로나 전후로 매출액은 작 아졌으나, 영향이 크게 없이 같은 소비패턴을 이어가고 있다는 것을 보여준다. 그림 6은 두 번째 군집으로 같이 묶인 기장군, 동래구, 사상구, 금정구 남구, 사하구, 연제구를 이동인구와 지역적 특성에 따라 재구성한 것이 다. 거리는 차이가 없어 같이 묶이지만 지역의 특성이 다르기 때문에 군집을 나눈다. 군집A(기장군, 동래구, 사상구)는 유입유출 이동인구가 많은 지역이다. 기장군은 부산의 경 계면이기도 하면서 아울렛 등의 쇼핑으로 인해 주말에 이동인구가 주기적으로 증가하는 패턴 을 보인다. 동래구와 사상구는 시외버스 터미널 로 인해 유입유출 이동인구가 많다. 군집 B(금 정구, 남구, 사하구, 연제구)는 비슷한 패턴을 보 이지만 주거 지역으로 분류할 수 있다. 네 구역 모두 주중의 인구가 많은 주거지역이며, 일반상 황(2019년)에는 주거지역으로서의 일정한 소비 를 보이다가 코로나의 영향(2020년 2월 말 이후) 으로 소비가 확 감소하였고, 차츰 소비패턴을 회복하는 중이다. 따라서 구/군별로 Clustering을 통해 4개의 군 집 결과를 얻었고, 유입/유출 인구, 주거지역, 특 성 등을 이용하여 5개의 군집으로 결과를 도출 하였으며 표 2와 같다. Cluster Districts C1 동구, 서구, 영도구, 중구 C2 기장군, 동래구, 사상구 C3 금정구, 남구, 사하구, 연제구 C4 강서구, 수영구 북구 C5 부산진구, 해운대구
<표 2> Clustering Result of Districts
3.3 업종별 계층적(응집) 군집화 3.3.1 2019년 업종별 Clustering 업종별 클러스터링은 구별 클러스터링과는 다르게 자기상관계수가 높은 lag가 업종의 종류 에 따라 나뉜다. Appendix A에서 보듯 자기상관 계수가 높은 lag는 1, 7, 14, 28 이고, lag 7에서의 (A) (B)
자기상관 계수가 높은 업종들이 많아 m = 7을 이용해 추세-주기 성분을 추출하였다. 시계열 분해결과에 따라 클러스터링을 한 결과는 다음 과 같다. 그림 7는 2019년 카드 매출 금액을 기반으로 업종별 클러스터링을 진행한 결과를 덴드로그 램으로 나타낸 것이다. 그림 8의 덴드로그램에 서 컷오프 값을 15000으로 설정하여 총 6개의 클러스터를 도출하였다. <그림 7> Dendrogram of 2019 Sectors Clustering
<그림 8> Clustering result by Sectors (2019)
도출한 각 클러스터는 그림 8와 같다. 업종별 데이터는 자기상관관계의 특성에서 보았듯 업 종별로 특정 시기의 영향을 많이 받는다는 것을 알 수 있다. 2019년의 업종별 클러스터에서 영 향을 주는 기간들은 설 연휴(2월 초)와 개학(3월 초) 등 이 있다. 클러스터 결과는 이 기간을 전후 로 매출에 등락이 있는 업종들과 이 기간에 관 계없이 꾸준한 매출을 유지하고 있는 업종들로 나뉜다. 첫 번째 군집(학원, 기타 요식, 편의점, 기타 유통, 음/식료품, 자동차 서비스/용품, 자동차 판 매)은 설 연휴기간 동안 매출이 감소하였다가 그 이후 주기적인 증감을 보이는 업종들이다. 두 번째 군집(가전/가구, 스포츠/문화/레저용 품, 스포츠/문화/레저, 숙박, 일식/중식/양식, 제 과/커피/패스트푸드, 약국, 의복/의류)은 설 연 휴 기간과 개학 기간 전후에 매출이 감소하였다 가 그 후 꾸준히 증가하는 추세를 보이는 업종 들이다. 세 번째 군집(인테리어, 서비스, 교육용품, 유 아교육, 화장품, 미용서비스, 여행, 유흥, 기타의 료, 패션/잡화)은 개학 기간 동안 크게 증가하는 양상을 보이다가 감소하는 추세를 보이는 업종 들이며, 네 번째 군집(백화점)은 설 연휴기간 동 안 큰 증가를 보이며 그 후로도 꾸준한 증감을 보이는 업종이다. 다섯 번째 군집(할인점/슈퍼 마켓)은 설 연휴기간동안 큰 증가세 후 감소하 다가 개학기간에 맞춰 다시 증가하는 추세를 보 이는 업종이다. 마지막 여섯 번째 군집(한식, 병 원, 주유)은 개학기간 전에 큰 등락을 보이다가 작은 증감을 반복하는 추세를 보이는 업종이다. 구/군별 클러스터링 결과와는 다르게 업종별 클 러스터링은 2020년 코로나 이후 2019년의 결과 와는 다른 양상을 보이기 때문에 먼저 2020년의 업종별 클러스터링 결과를 보이고 두 결과를 비 교하려한다. 3.3.2 2020년 업종별 Clustering 아래의 그림 9는 2020년의 업종별 카드 매출 금액 클러스터링 결과를 덴드로그램으로 나타 낸 것이다. 2020년의 클러스터링 결과는 Cut-off
값 14000으로 설정하여 총 7개의 클러스터를 도 출하였다. 여기서 도출한 각각의 클러스터는 그 림 10과 같다.
<그림 9> Dendrogram of 2020 sectors clustering
<그림 10> Clustering result by Sectors (2020)
2019년과 마찬가지로 2020년 역시 특정 시 기의 영향을 많이 받았다. 2020년에서 큰 영향 을 준 시기들은 설 연휴 이후, 코로나 확진자 발생 시기, 개학 시기 등이 있다. 각각의 업종 들은 설 연휴 이후 회복세를 보이다가 확진자 발생이후 개학시기와 관계없이 감소세를 보이 는 경우, 코로나 확진자 발생 이후 감소세를 보 이다가 증가하는 추세를 보이는 경우 등으로 구분이 가능하다. 2020년 업종별 데이터에서 가장 다른 양상을 보이는 업종은 자동차 판매 업종으로 2019년 동 기 대비 상승폭이 매우 크며, 2020년 동기 다른 업종에 대비하면 매우 큰 상승폭을 보인다. 이 로 인해서 클러스터가 2019년에 비해 한 개가 추가되었다. 각각의 클러스터 결과의 해석은 먼저 2019년 대비 2020년의 추세가 어떻게 변화하였는지를 분석하고 이러한 추세의 변화가 클러스터링 결 과에 어떻게 반영되었는지를 분석하는 것으로 하였다. 첫 번째 클러스터(한식, 백화점)는 그림 11와 같다.
<그림 11> Graph of consumption trends in the 1st Cluster(2019-2020) 그림 11에서 보듯 한식과 백화점의 경우 2019 년에는 설 연휴 이후 회복세를 보이며 증감을 반복하는 양상을 보이는데 비해 2020년에는 코 로나 확진자 발생 이후 큰 폭으로 감소하다가 서서히 회복하는 추세를 보였다. 그림 12는 두 번째 클러스터(인테리어, 서비
<그림 12> Graph of consumption trends in the 2nd Cluster(2019-2020)
스, 교육용품, 유아교육, 화장품, 미용서비스, 스 포츠/문화/레저용품, 숙박, 여행, 유흥, 기타의료, 패션/잡화)를 보여준다. 구/군별 클러스터링에 서 봤듯이 한 클러스터 내에서도 다른 추세를 보이는 업종들이 존재하였다. 첫 번째 클러스터 와 유사하게 확진자 발생 이후 쭉 감소하였다가 다시 회복하는 패턴을 보이는 업종들, 확진자 발생 이후 2019년과 다르게 높은 매출을 꾸준히 유지하는 업종, 2019년과 유사한 추세를 보이지 만 매출액의 금액이 차이나는 경우, 확진자 발 생 이후 감소하여 회복하지 못하는 경우 등으로 클러스터 내에서 세분되는 양상을 보였다. 그림 13는 주유와 병원의 경우이며 2019년에 는 설 연휴 이후로는 비슷한 증감의 패턴을 보 이고 있지만 코로나 확진자 발생 이후로 외출에 대하여 소극적인 태도 및 자가격리 등으로 인하 여 2019년 대비 2020 년이 더 큰 감소폭을 보이 고 있다. 그러나 주유의 경우, 감소 추세 후 갑작 스러운 증가 추세가 나타는데, 이 이유는 코로 나로 인한 유가시세 감소로 인하여 주유에 대한 소비자의 심리가 반영되었음을 나타낸다.
<그림 13> Graph of consumption trends in the 3rd Cluster(2019-2020) 그림 14는 자동차 판매업을 나타내며, 다른 업종과는 다르게 코로나 이후 내수 판매가 증가 하는 경향을 보여 2020년 홀로 다른 클러스터에 군집화 되었다. 코로나 19의 영향에도 불구하고, 개별 소비세 인하와 각 업체별 신차효과, 할인 행사 등의 요인으로 내수 판매가 증가한 것으로 보인다.
<그림 14> Graph of consumption trends in the 4th Cluster(2019-2020) 그림 15는 2020년의 다섯 번째 클러스터인 할 인점/슈퍼마켓의 경우를 나타내며, 2019년과 2020년이 설 연휴 등에 의한 특수 등 비슷한 추 세-주기를 보인다. 2020년에는 코로나에도 불구 하고 생필품, 식료품 등을 생활에 필수적인 품목 의 소비에 의해 2019년과 비슷한 추세를 보인다.
<그림 15> Graph of consumption trends in the 5th Cluster(2019-2020)
그림 16는 여섯 번째 클러스터(가구, 일식/중 식/양식, 학원, 제과/커피/패스트푸드, 스포츠/문
<그림 16> Graph of consumption trends in the 6th Cluster(2019-2020)
화/레저용품, 약국, 자동차서비스/용품, 의류)는 한 클러스터 내에도 다른 추세를 보이는 업종들 이 존재한다. 음식, 스포츠, 자동차 서비스, 의류 업종의 경 우, 코로나 확진자 발생 이후 감소되는 추세가 지속되다가 2019년의 트렌드와 비슷하게 증감 트렌트를 보여준다. 학원같은 경우에는 코로나 이후 전염예방을 위한 비대면 수업의 증가로 2019년과 상반되는 감소 추세를 계속해서 이거 나가고 있다. 약국 같은 경우에는 코로나 전 마스크 품귀 현상으로 인하여 2019년 대비 상승의 큰 폭을 보여주고 있다. 그러나 여전히 코로나 이후에는 감소되는 추세 후 다시 회복하는 패턴을 보인다. 마지막으로 가구 추세의 변화는 2019년과는 다 르게 Cycle의 폭이 넓으며 코로나 확진자 발생이 후로 온라인 가구 쇼핑의 증가 추세를 보여주고 있다. 가전의 Cycle은 1주일 단위로 보았을 때 주 말에 현저히 높은 매출액을 보여줌을 나타낸다. 그림 17는 일곱 번째 클러스터(기타요식, 편 의점, 기타유통, 음/식료품)이며 다른 업종이지 만 음식이라는 공통점으로 가장 비슷한 업종 끼 리 군집화 되었다. 기타 요식과 편의점의 경우 첫 확진자 발생 이후 2019년 동일 업종에 비해 쭉 감소하였다가 점차 회복하는 패턴을 보이고 있다. 그에 반해 기타유통과 음/식료품의 경우 첫 2019년 동일 업종과 비슷한 패턴을 보인다.
<그림 17> Graph of consumption trends in the 7th Cluster(2019-2020) 이를 보아 클러스터 내에서 세분되는 양상을 보 였다. 2020년은 7개의 군집 결과를 얻었다. 코로나 상황이후로 새로운 군집이 도출된 업종은 자동 차 판매업이며, 이런 특수한 상황이 반영되어 독립적인 매출 증가를 보여주었다. 다른 업종들 의 경우, 코로나 확진자 발생이후 뚜렷이 매출 이 감소되는 트렌드를 보여줬으며 회복 트렌드 또한 상이하다. 그러나 코로나로 인하여 여러 업종별 매출 급감 현상은 소비자의 온라인 쇼핑 으로도 이어졌으나 여행업의 경우는 회복이 더 디게 나타난다. 2019년과 2020년의 클러스터링 군집은 표 3과 표 4에 나타난다. Cluster Sectors C1 학원, 기타요식, 편의점, 기타유통, 음/식료품, 자동차서비스/용품, 자동차 판매 C2 백화점 C3 가구, 레저, 레저용품, 숙박, 일식/중식/양식, 제과/커피/패스트푸드, 약국, 의복/의류 C4 할인점/슈퍼마켓 C5 인테리어, 서비스, 교육용품, 유아교육, 화장품, 미용서비스, 여행, 유흥, 기타의료, 패션/잡화 C6 한식, 병원, 주유
<표 3> Clustering Result of Sectors in 2019
Cluster Sectors C1 한식, 백화점 C2 인테리어, 서비스, 교육용품, 유아교육, 화장품, 미용서비스, 레저용품, 숙박, 여행, 유흥, 기타 의료, 패션/잡화 C3 병원, 주유 C4 자동차 판매 C5 할인점/슈퍼마켓 C6 가구, 학원, 레저, 일식/중식/양식, 제과/커피/패스트푸드, 약국, 자동차서비스/용품, 의복/의류 C7 기타요식, 편의점, 기타유통, 음/식료품 <표 4> Clustering Result of Sectors in 2020
결과를 보면, 코로나 상황 이후 매출감소 및 회복 속도에 있어 영향을 많이 받아 다른 군집 으로 이루어지거나 따로 특수한 패턴을 나타내 는 업종은 여행관련 업종(레저용품, 숙박)과 자 동차판매, 학원 등이 대표적이었다. 소상공인⋅ 자영업자가 가장 많은 부산진구와 해운대구의 직종과 연계하여 경영지원 강화 정책을 고려해 볼 수 있다. 동구, 서구, 영도구, 중구는 소득 및 소비가 낮은 군집이지만 또한 여행관련 업종이 많이 이루어진 곳이라 기본소득 지급과 위생용 품지원 같은 정책에 있어 우선적으로 고려할 수 있을 것이다.
Ⅳ
. 결 론
본 연구의 구/군별 클러스터링 결과는 다음과 같다. 총 5군집으로 묶였으며, 코로나 전후로 구 /군별 클러스터링 결과는 다르지 않게 나타났다. 군집1(동구, 서구, 영도구, 중구)은 소비가 적은 곳 이다. 군집2(기장군, 동래구, 사상구)는 유입 유출 이동인구가 많아 같은 군집으로 묶였다. 군집3(금정구, 남구, 사하구, 연제구)은 주거지 역으로서 시민들의 위축 심리로 인해 코로나의 영향을 많이 받은 군집으로 묶였고, 군집4(강서 구, 수영구, 북구)는 코로나의 영향을 거의 받지 않고, 구별 특수성을 보였다. 군집5(부산진구, 해운대구)는 인구도 많고, 상권도 발달한 지역 으로 금방 회복세를 보이는 군집으로 묶였다. 업종별 클러스터링 결과는 2019년에는 6개, 2020년에는 7개로 나타났다. 이는 자동차 판매 업종에서 코로나 이후 판매가 급증하는 양상을 보임에 따라 군집이 추가되었다. 나머지 군집 내에서도 코로나 이후 회복하는 양상에 차이가 있어 2019년과는 다른 군집결과를 보여준다. 본 연구의 시사점은 COVID-19의 발생에 따 라 부산시 정책 지원에 있어 선제적 관점을 제 공하기 위해 구/군별⋅업종별로 카드매출금액데이터를 활용한 Time series Clustering을 수행 했다는 데 그 의의가 있다. Clustering 성능 제고 를 위해 시계열 특성을 고려하여 분해를 하여 추세-주기를 추출하였다. 그 후, Clustering을 수 행하였고, 그 결과를 유입유출이동인원수, 인구 수, 상권 등을 파악하여 군집을 재구성하였다. 이를 저소득층 위생용품지원, 소상공인⋅자영 업자 경영지원 강화, 기본소득 지급과 같은 정 책적 지원에 활용될 수 있을 것이다. 향후 연구에서는 구/군별 및 업종을 모두 고 려한 군집화를 통해 대안을 마련한다면, 보다 시민들의 수요를 잘 반영할 수 있을 것이다. 또 한, 시계열 데이터의 분해에 있어 본 연구에서 는 다수를 차지하는 주기로 설정되어 있는데 다 른 방법론에 대한 고려가 필요할 것이다.
참 고 문 헌
[1] 손헌일, 김기욱, 허종배, 박충훈, “코로나 19 극복 을 위한 부산시 정책 대응”, BDI 정책포커스, 1-12, 2020.[2] Cordes, J., Castro, M. C., “Spatial Analysis of COVID-19 Clusters and Contextual Factors in New York City.” Spatial and Spatio-temporal Epidemiology, Vol34, 2020.
[3] 오미애, 전진아, “코로나바이러스감염증-19 소 셜 빅데이터 기반 주요 이슈 분석.”, 보건⋅복지
Issue & Focus 376, 2020.
[4] Scott, A., Knott. M., “A Cluster Analysis Method for Grouping Means in the Analysis of Variance.”, Biometrics, 30(3), 507-512, 1974
[5] Legendre, P., “Spatial autocorrelation: trouble or new paradigm?”, Ecology 74.6, 1659-1673, 1993. [6] Box, G. E., Pierce, D. A., “Distribution of residual
autocorrelations in autoregressive-integrated mov-ing average time series models”, Journal of the
American statistical Association 65.332, 1509- 1526, 1970.
사 사
이 과제는 부산대학교 기본연구지원사업(2 년)에 의하여 연구되었음.저 자 소 개
권 현 호(Hyeon-Ho Kwun) ・2019년 : 부산대학교 수학과 (이학사) ・2019년∼현재 : 부산대학교 산 업공학과 (석사과정) ・관심분야 : 빅데이터 분석, 딥 러닝 등 김 도 희(Do-Hee Kim) ・2019년 : 부산대학교 산업공학 과 (공학사) ・2019년∼현재 : 부산대학교 산 업공학과 (석사과정) ・관심분야 : 딥러닝, 프로세스 마이닝 등 박 찬 호(Chan-Ho Park) ・2017년 : 부산대학교 산업공학 과 (공학사) ・2020년∼현재 : 부산대학교 산 업공학과 (석사과정) ・관심분야 : 프로세스 마이닝, 클러스터링 등 이 은 주(Eun-Ju Lee)・2016년 : Stony Brook University,
응용통게학 (이학사) ・2019년∼현재 : 부산대학교 산 업공학과 (석사과정) ・관심분야 : 딥러닝, 시계열 분 석 등 조 기 행(KiHaing Cho) ・1992년 : 중앙대학교 심리학과 (문학사) ・1994년 : 중앙대학교 산업심리 학 (석사) ・2018년∼현재: 부산광역시 통계 빅데이터 담당관(지방서기관)
・관심분야: Decision Analytics, Consumer Behavior
배 혜 림(Hye-Rim Bae) ・1996년 : 서울대학교 산업공 학과 (공학사) ・1998년 : 서울대학교 산업공 학과 (석사) ・2002년 : 서울대학교 산업공 학과 (박사) ・2004년∼현재 : 부산대학교 산업공학과 (교수) ・관심분야 : 프로세스 마이닝, 빅데이터, BPM