부산시 교통현황과 빅데이터 계획
Transportation Conditions and Big Data Plan at Busan Metropolitan City3)
이원규
부산시 교통현황
부산시 차량 등록대수는 2015년말 현재 1,256 천대이며, 승용차는 79.9%인 1,004천대이다. 차 량 등록대수는 2000년 이후 연평균 2.95%, 승용 차는 4.12%의 증가율을 보이고 있으며, 차량통행 량 중 승용차는 65.8%에 달하고 있다. 반면, 도 로율은 2000년 17.2%에서 2014년 21.48%로 연평균 0.31% 정도 증가하였다.
도심의 차량통행속도는 2010년 28.0㎞/h에서 2015년 28.7㎞/h로 증가하였으나, 버스전용차로 는 24.9㎞/h에서 24.5㎞/h로 감소하였다.
승객통행량은 2000년 5,729천명/일에서 2014년 6,734천명/일로 연평균 1.16% 증가하 였다. 이 중 승용차는 1,151천명/일(21.4%)에서 2,161천명/일(32.1%)로 연평균 4.6% 증가한 반면, 대중교통은 2,626천명(45.8%)에서 2,854
천명/일(42.4%)로 연평균 0.6% 증가하는데 그 치고 있다.
승용차의 급속한 증가, 화물차량의 통행 도로율 의 부족 등으로 부산시에서 발생하는 교통혼잡비 용은 2000년에 26,610억원에서 2015년에는 40,618억원으로 증가한 것으로 추정되고 있다.
지자체의 빅데이터
1. 빅데이터 정의와 특징
빅데이터의 정의는 관련분야, 연구자에 따라 다 양하게 정의되고 있다. 초기에는 데이터 규모와 기 술 측면에서 출발했으나, 빅데이터의 가치와 활용 효과 측면으로 의미가 확대되는 추세이다.
일본 노무라연구소(野村總合硏究所, NRI)는
‘Volume, Variety, Velocity(3V) 측면에서 관
이원규 : (재)부산발전연구원 도시기반연구실, [email protected], Phone: 051-860-8801, Fax: 051-860-8844
리가 어려운 데이터로 이를 축척·처리·분석을 위한 기술 특히, 데이터의 본질적인 의미를 통찰하는 인 재나 조직을 포함하는 포괄적인 개념’으로 정의하 고 있다.
또한 빅데이터의 특징은 데이터 규모(Volume) 의 증가, 데이터 생성 속도(Velocity)의 증가, 데 이터 다양성(Variety)의 증가로 인한 데이터 복 잡성(Complexity)은 증가하지만, 진실성 (Veracity), 시각화(Visualization)가 추가되어 데이터 분석에 따른 새로운 가치(Value)를 창조 하는 것이다.
자료: 野村總合硏究所(2012)
그림 1. 광의의 빅데이터 정의
자료: 이원규(2014)
그림 2. 빅데이터 특징
2. 지자체와 빅데이터
1) 지자체 빅데이터 개념 재정립
기존 연구나 보고서 등에서 빅데이터에 대한 정 의나 역할은 차이가 있으며 빅데이터 분석주체나 활용처에 적합하게 개념이 진화하고 있다. 빅데이 터의 특징도 3V → 4V → 5V+C로 변하고 있고 정의도 규모(volume)보다는 가치(value)를 추구 하는 쪽으로 변화하고 있다. 따라서 지자체 차원의 빅데이터는 “기존의 정보와 새로운 공공과 민간데 이터의 공유, 융합, 능동적 실시간 시민참여를 통 하여 데이터 기반 행정구현과 정책결정 그리고 시 정혁신을 통하여 시민의 삶의 질 향상과 지역경제 활성화시키기 위한 가치 창조형 에코 플랫폼”이라 말할 수 있다(이원규, 2014).
2) 빅데이터와 교통
지자체 분야별 데이터 중에서 활용 우선순위로 는 ‘교통’이 가장 높고, 다음으로 ‘방범’, ‘방재’, ‘문 화·관광’, ‘물류’, ‘보건’, ‘의료’, ‘도시계획’, ‘민원관 리’ 분야 순으로 응답하였다. 또한, 데이터 활용 수 준으로는 ‘교통’, ‘도시계획’, ‘방범’, ‘의료’, ‘시민참 여’, ‘농·수산’, ‘보건’, ‘민원관리’, ‘문화·관광 ’, ‘방 재’ 분야로 응답하였다. 지자체에서 빅데이터를 활 용하여 보다 효율적인 정책수립을 위해 민간부문 데이터 융합이 필요할 경우에 가장 효과가 높은 분 야에 대한 전문가의 의견은 ‘통신정보(스마트폰 이 용 등)’에 44.4%, ‘교통카드 정보’와 ‘의료정보’에 각각 15.6%, ‘금융정보’에 13.3%, ‘자동차 운행 정보’에 11.1%로 응답하였다(이원규, 2014).1)
3. 부산시 교통 빅테이터 분석 사례
1) 동남권 교통카드 자료를 활용한 광역환승 분석2) (1) 개요
동남권의 광역대중교통 환승할인제는 부산, 김
1) 전국의 빅데이터 관련 산·학·연·관·민 전문가 45명의 설문 결과임
그림 3. 동남권 광역환승통행 분석 과정
구분 단일통행 환승통행 광역통행
00:00-01:00 3,403 74 2
01:00-02:00 373 3 1
02:00-03:00 18 1 -
03:00-04:00 5 - -
04:00-05:00 1,886 627 46 05:00-06:00 38,294 10,502 729 06:00-07:00 89,177 23,097 1,672 07:00-08:00 205,676 48,212 3,364 08:00-09:00 221,418 45,589 2,414 09:00-10:00 158,547 34,254 1,793 10:00-11:00 125,033 26,317 1,526 11:00-12:00 121,416 25,221 1,544 12:00-13:00 132,619 27,223 1,533 13:00-14:00 135,925 26,767 1,506 14:00-15:00 133,229 26,042 1,497 15:00-16:00 148,640 29,322 1,762 16:00-17:00 182,355 35,905 2,280 17:00-18:00 211,565 41,996 2,941 18:00-19:00 232,810 42,430 3,076 19:00-20:00 160,897 26,822 1,842 20:00-21:00 131,664 22,882 1,590 21:00-22:00 132,014 22,194 1,535 22:00-23:00 108,811 16,212 989 23:00-24:00 40,069 3,205 161
계 213,897 210 321,210
표 1. 동남권 대중교통 통행량(교통카드 기준)
(단위 : 통행/일)
해, 양산시에서 운행하는 대중교통(시내버스, 마 을버스, 도시철도, 경전철)을 대상으로 2011년 10월 17일부터 시행하고 있다.
광역대중교통 환승할인제를 시내버스가 광역버 스 형태로 운행되고 있는 창원, 울산지역까지 확대 하기 위해서는 부산, 울산, 김해, 양산, 창원의 대 중교통 교통카드 이용 현황 자료를 통한 광역환승 행태별 통행량 분석이 필요하였다.
분석대상인 대중교통수단은 버스 61개 노선, 428(432)대로 총 2,289회/일 운행하고 있고 부 산 도시철도 2호선, 부산김해 경전철이다. 교통카 드는 부산·울산·양산·창원지역은 하나로, 마이비, 이비카드, 김해지역은 하나로, 마이비, 이비, 글로 벌캐쉬 카드, 그리고 후불 신용카드이다.
(2) 교통카드 분석과정
동남권의 5개 도시(부산시, 울산시, 창원시, 김 해시, 양산시)를 대상으로 2013년 5월 29일~6 월 5일 총 8일간 사용한 34,850,196건의 교통카 드자료를 분석하였다.
(3) 분석 결과
동남권 5개 도시의 환승을 제외한 1일 평균 통 행량은 2,715,844통행이며, 18:00-19:00가
8.57%로 가장 높게 나타났다.
동남권의 5개 도시의 1일 평균 환승통행량은 534,897통행이며, 광역환승통행량은 33,803통 행으로 분석되었다. 광역환승이 가장 많이 발생하 는 시간대는 오전 07:00-08:00로 3,364통행 (9.95%)으로 나타났다.
광역통행에서 울산 및 창원지역을 통행하는 통 행량은 하루 평균 5,087통행/일로 분석되었으며, 부산광역시의 인허가를 받은 대중교통 수단에서 울산광역시의 인허가를 받은 대중교통수단으로 환 승해 통행하는 통행량이 2,188통행/일로 가장 높 게 나타났다.
2) 동남권광역교통본부(2013)
그림 4. 교통혼잡도 개념
표 2. 울산 및 창원지역을 통행하는 평균 광역환승통행량(2013)
(단위 : 통행/일)
구분 통행량 구분 통행량
부산 → 김해·양산 15,823 김해·양산 → 부산 13,587
김해 → 양산 9 양산 → 김해 13
소계 29,432
부산 → 울산 2,188 울산 → 부산 2,067
부산 → 창원 12 창원 → 부산 12
양산 → 울산 436 울산 → 양산 363
양산 → 창원 - 창원 → 양산 -
김해 → 울산 5 울산 → 김해 1
김해 → 창원 1 창원 → 김해 2
소계 5,087
2) 교통혼잡도 분석3) (1) 교통혼잡도 개념
교통혼잡도는 자동차들이 상호 간섭되어 교통량 이 도로 수용량에 근접되었을 때 나타나는 자동차 간의 상호작용으로 인한 자동차의 연속적인 지연 및 운행비용의 발생 현상을 말하며, 차량의 이동 속도는 도로 수용량 근접에 영향을 준다.
∙ 차량의 이동 속도가 낮을수록 도로 수용량에 근접하고, 차량의 이동 속도가 높을수록 도로 수용량에서 멀어짐
∙ 도로 수용량은 도로 링크 한 구간에 얼마나 많 은 차량들이 존재하는지를 의미함
(2) 혼잡시간 기반 혼잡지표
도로 구간별 교통혼잡 점수를 도출하기 위하여 혼잡시간 기반 혼합지표인 LMID와 FCI를 사용 하였다.
LMID(Lane-Mile Duration Index)는 고속 도로 혼잡의 지리적 범위와 체류시간을 함께 사용 한 지표로 각 도로 구간별 혼잡한 도로연장에
혼잡한 체류시간을 곱하여 합계를 구한 값을 사용 한다.
≅ ×
고속도로 각 구간 고속도로 구간의 합
FCI(Freeway Congestion Index)는 LMID 를 이용하여 서로 다른 고속도로간의 상호비교를 위해 전체 도로연장으로 나누는 지표이다.
총 도로연장
(3) 데이터
분석을 위한 데이터는 부산광역시 교통정보서비 스센터에 DSRC 시스템으로부터 2013년 9월 30일 수집된 개인 차량의 이동 속도 정보를 사용하였다.
그림 5. 교통혼잡도 분석을 위한 원시테이터 예시
3) 홍봉희(2015)
시간 도로명 링크ID 혼잡점수 순위 오전
6-9시
충렬대로 1350007800 5080 1 충렬대로 1350008400 5080 2 만덕대로 1350009200 5080 3 만덕대로 1370002601 5080 4 만덕대로 1370002800 5080 5
학장로 1440014200 4768 6
학장로 1440018600 4768 7
낙동대로 1390000200 4756 8 낙동대로 1390001000 4416 9 낙동래로 1390001800 4416 10 오후
18-21시
양운로 1380055700 4628 1
양운로 1380057300 4628 2
양운로 1380062100 4628 3
양운로 1380063700 4628 4
양운로 1380069700 4628 5
양운로 1380074100 4628 6
양운로 1380076800 4628 7
양운로 1380077400 4628 8
수영로 1430020700 4612 9
젊음의 거리 1340022600 4488 10 원시 데이터 형태는 그림 5와 같이 Date, Link
ID, LANE, SPEED로 구성되어 있다.
∙ DATE: 속도 수집시간( 년도, 월, 일, 시간)
∙ Link ID: 고유 링크 식별을 위한 ID
∙ LANE: 링크의 차선 수
∙ SPEED: 링크의 속도
(4) 교통혼잡도 집계
DSRC 시스템으로부터 수집된 원시 데이터로 부터 교통혼잡도를 집계하기 위하여 일단위 집계 와 누적집계를 통해서 링크별, 구별, 교차로별, 링 크셋별로 40개의 집계 테이블을 생성하였다.
그림 6. 교통혼잡도 집계
그림 7. 하둡(Hadoop)을 이용한 병렬 처리
최종적인 도로별, 링크별 혼잡점수를 도출하기 위하여 빅데이터 분석 도구인 하둡을 이용하여 병 렬 처리를 수행하였다.
∙ 원시 데이터 → 시간/공간 분할 → 그룹핑 → 구별/ 도로별 혼잡점수 도출
표 3. 도로별 링크별 혼잡점수
그림 8. 부산시 구별 교통혼잡 점수 및 순위
(5) 분석 결과
교통이 혼잡한 구간은 오전 06:00-09:00에는 충령대로, 만덕대로. 오후 18:00-21:00는 양운 로로 분석되었다. 구별로는 동래구, 해운대구, 연 제구, 부산진구, 수영구 순으로 나타났다.
부산시 교통 빅데이터 분석 시스템 계획4) 1. DW 구축 필요성
부산시에서는 교통정보서비스센터에서 수집되 는 이질적이고 방대한 누적자료에 대한 효율적인 통합관리 방안 수립과 교통관리전략의 객관적인 사전/사후 평가도구 개발에 대한 요구사항이 증가 하고 있다. 또한 교통정보 수집매체의 증가로 교통 정보 매체의 다양성이 확보될 뿐만 아니라 수집된 교통정보의 활용방안에 대한 체계적 시스템 구현 이 필요한 실정이다.
이를 위해서는 교통정보서비스센터에 누적된 교 통정보와 민간정보를 활용하기 위한 최적의 빅데 이터 플랫폼과 DW(Data Warehouse) 구축이 필요하다.
2. 부산시 교통정보서비스센터
1) 운영 현황
부산시 교통정보서비스센터는 지상 4층(연면적 2,347m², 대지면적 2,633m²)으로 주요 시설로 는 교통상황실, 운영실, 견학실, 방송실 등이 있 다. 주요 기능으로는 교통 정보 수집·가공·분석을 통합하여 실시간으로 도로소통정보 및 버스정보 제 공, 유관기관 교통정보 연계, 돌발상황 전파 등 정 보를 제공하고 있다. 주요 시스템으로는 교통정보 수집시스템, 버스정보시스템, 외부연계시스템, 교 통정보 전광판, CCTV, 각종 교통정보안내기 운영 시스템이 있으며 첨단교통시스템 시설 및 장비 구 축에 따른 지속적인 유지 관리를 수행하고 있다.
그림 9. 부산교통정보서비스센터 상황실 CCTV통합 모니 터링
4) 부산광역시 교통정보서비스센터(2015)
항목 세부내용 소
통 정 보
DSRC 수집정보 : 차량검출 가공정보 : 구간소통정보 수집주기 : 이벤트성 수집 AVI 수집정보 : 차량번호검출, 교통량
가공정보 : 구간소통정보 수집주기 : 이벤트성 수집(일부
부산시에서 연계) UTIS 수집정보 : 속도, 수집주기 : 5분 부산 버스
정보시스템
수집정보 : 속도 수집주기 : 3분 부산지방
국토관리청
수집정보 : 속도(고속도로 및 국도 일부), 수집주기 : 5분 부산지방
경찰청 [현재 미수집]
수집정보 : VDS 원시 가공정보 : 지점소통정보 수집주기 : 이벤트성 수집(검지기
수집주기 의존) 택시(등대콜) 수집정보 : 속도, 수집주기 : 5분 을숙도대교 수집정보 : 속도, 수집주기 : 1분 거가대교 수집정보 : 속도. 수집주기 : 5분 부산항대교 수집정보 : 속도, 수집주기 : 30초 기
타
부신시설 관리공단
수집정보 : 주차장 만차정보 수집주기 : 5분
부산보건환경 연구원
수집정보 : CO2, 미세먼지 수집주기 : 5분, 1시간 부산교통방송 수집정보 : 돌발(제보)
수집주기 : 1-2분
기상청 수집정보 : 기상정보(예보, 현황) 연계주기 : 30분
표 4. 부산시 교통정보서비스센터 데이터수집 목록
2) 교통정보 수집원
부산시 교통정보서비스센터에서 수집되는 교통 정보는 DSRC, AVI, UTIS, 버스정보시스템, 부 산지방국토관리청, 등대콜(택시), 울숙도대교, 거 가대교, 부산항대교, 부산시설공단, 부산보건환경 연구원, 부산교통방송, 기상청 등이다.
3. DW 구축 계획
1) DW 개요
그림 9의 DW의 ETL5)은 입력 소스에서 데이 터를 추출하여 적재를 위한 적절한 포맷으로 변환 하여 대상 DB로 적재하는 시스템을 의미한다.
ETL은 기 구축시스템의 DB서버로부터 기반정보 를 추출하여 DB 갱신여부를 체크한 후 데이터를 추출/변환과정을 거쳐 DW의 통합 DB로 공급하 며, DW에 공급된 데이터 중 주요 데이터를 선정 하여 데이터별 추출주기를 결정한다. 이후에 OLAP 분석을 통해 교통정책 의사결정 및 교통관 리시스템을 운영 지원하는 구조이다. 부산시 교통 정보서비스센터의 DW는 2016년도 내에 구축될 예정이다.
2) 데이터 표출방안
DW 구축에 의한 데이터는 센터 운영자의 경우, 통합소통정보, DSRC 소통정보, AVI 소통정보, 도로별 정체현황 등 42개, 교통 담당자는 통행률, 지체율/지체비, 상습정체구간, 5분 패턴 소통정보 등 29개가 표출된다.
3) DDB
DW를 통해 센터운영자와 교통관련 담당자에게 매일 주요 교통정보를 제공하며, DDB(Daily Dashboard)를 통해 제공되는 정보는 업무관련도 가 높은 정보 위주로 구성된다.
그림 10과 같이, 센터 운영자용 DDB에는 이력 정보인 소통상황 정보, 교통사고 정보, 상세정보인 동서고가도로 지체 정보, 버스소통 정보, 빅데이터 정보인 교통사고 위험도 예측 정보, 소통 예측정보 가 제공된다.
교통 담당자용 DDB에는 소통정보인 첨두시 소 통정보, 수단별 소통정보, 교통운영 정보인 상습정 체 정보, 돌발상황 정보, 대중교통 정보인 버스&
링크 소통정보, 요일별 버스 통행속도 정보가 제공 된다.
4) DW 구축 효과
센터 운영자의 교통정보 활용도는 DW 구축 전 에 19.51% 수준이었지만 DW 구축 후에는
5) ETL : 추출, 변환, 적재(Extract, Transform, Load)
주: OLAP : On-Line Analytical Processing
그림 10. 부산시 교통정보서비스센터 DW 구성
(센터 운영자용)
(교통 담당자용) 그림 11. DDB 구성
65.85% 정도로 높아질 것으로 분석되었고, 교통 담 당자는 DW 구축 전에는 18.92%에서 구축 후에는 83.78%로 센터 운영자 보다 높을 것으로 나타났다.
참고문헌
동남권 광역교통본부 (2013), 동남권 대중교통 광 역환승할인제 확대 타당성 연구조사 용역.
부산광역시 교통정보서비스센터 (http://its.busan.go.kr/)
부산광역시 교통정보서비스센터 (2015), 2015년 부산광역시 지능형교통체계(ITS) 구축사업 실시설계 용역.
부산광역시 차량등록사업소 (http://www.busan.go.kr/
626016300000000/officehome/Traffic YearList.bs)
부산광역시 (2011, 2015), 부산광역시 차량교통 량조사 결과, 차량통행속도 조사 결과, 승객통 행량 조사 결과.
이원규, 오동하 (2014), 빅데이터(Big Data)를 활용한 부산시 도시관리 전략, 부산발전연구 원.
홍봉희 (2013), 해운대구 주차장위반 분석 활용 및 부산시 교통 빅데이터 분석, 빅데이터 활용
&홍보 컨퍼런스.