정보를 일컫는 말로, 대표적인 예로 내비게이션이나 온라 인 지도 등이 있음’으로 나와 있다.
하지만 내비게이션이나 온라인 지도는 공간정보를 이루 는 한 개의 지형지물을 정보화한 것일 뿐이다. 실제로 내 비게이션이나 온라인 지도를 통해 의사결정을 할 때 필요 한 정보로 확장되는 경우, 공간정보는 그 지형지물의 경계 (공간) 안에서 활동하는 사람의 속성 정보화, 일어나는 행 위의 정보화, 지형지물의 유형 정보화 등 사회현상을 포괄 하는 모든 정보로 그 범위가 확대된다.
공간정보는 2010년부터 확산된 빅데이터를 활용한 IT기 술의 발전과 IoT 하드웨어의 발전으로 정보의 양적·질적 확대 및 활용가치가 무궁무진해지면서 제4차 산업혁명1)을 준비하는 9대 국가전략 프로젝트2)의 필수정보로 자리매김 했다.
이렇게 공간정보를 빅데이터 분석과 IoT 활용서비스 의 주요 정보로 인식하는 것은 방대한 양의 정형·비정형 데이터를 결합할 때 중요한 허브 역할을 하기 때문이다.
2015년 글로벌 공간정보관리(UN-GGIM) 유엔전문가회 의에서 “데이터는 다양한 소스의 결합을 통해서 그 진정한 가치를 얻게 되고, 공간은 많은 데이터 세트가 공존하게 하는 중요한 정보허브 역할을 하며 그렇게 연결된 데이터 의 웹을 보강하는 주요 프레임워크를 제공할 수 있다”라는 발표에서도 공간정보의 중요성을 알 수 있다.
공간정보,
지능공간에서 딥러닝으로
: 나도 모르는 나를 인지하다
이은영│ (주)오픈메이트 대표이사 (eunylee@openmate.co.kr)
03
1) 2016 다보스포럼 주제로 정보통신기술(ICT)의 융합으로 이루어지는 차세대 혁명을 말함. 대표적인 예로 인공지능과 기계학습이 있음.
2) 2016년 8월 10일 제2차 과학기술전략위원회에서 국가차원의 집중적 투자와 민·관의 협업을 통해 새로운 성장동력을 확보할 수 있는 9대 국가전략 프로 젝트를 발표함. ① 자율주행자동차, ② 포스트 철강 경량소재, ③ 스마트시티,
④ 인공지능, ⑤ 가상증강현실, ⑥ 정밀의료, ⑦ 탄소자원화, ⑧ 초미세먼지,
⑨ 바이오의약
용되고 있을까?
공간정보를 기반으로 한 데이터 활용 서비스는 빅데이 터 시대가 도래하기 전인 2002년부터 국내에 도입되었 고, 민간기업의 업종별(금융, 유통, 제조 등) 선두그룹은 2006년부터 gCRM이라는 서비스로 이를 도입·활용했다.
gCRM은 Geographic + CRM의 합성어로, 공간정보를 기 반으로 고객과 상품, 시장의 상황을 분석하고 그에 따른 마케팅 전략을 세울 수 있도록 지원해주는 비즈니스 솔루 션을 칭하는 말이다. 이러한 서비스를 이용하는 기업체 로는 BCcard, 삼성생명, GSRetail, 삼성전자 등이 있다.
gCRM을 통해 출점전략, 매출예측, 고객프로모션, 캠페 인, 영업권역설정 및 관리를 하고, 고객과 시장에 대한 전 략을 수립하는 것이다.
2012년 국내 빅데이터의 활용 초창기에 필자가 소속된 (주)오픈메이트는 10년의 공간정보솔루션 사업경험을 바 탕으로 빅데이터(신용평가사, 카드사, 통신사, 국가공개정 보 등의 융합)를 활용한 한국형 고객유형 판별 알고리즘을 출시했다. 당시로서는 내부 고객데이터만으로는 판단할 수 없었던 고객의 생애가치(lifetime value)를 추정할 수 있는 획기적인 마케팅 솔루션이었다. DART(Do Analyze Right Target)라 불리는 이 솔루션은 성, 연령, 주소를 기 필자는 이러한 현상을 다양한 소스에서 여러 형태(정
형, 비정형)로 생산되는 데이터를 일목요연하게 모으는 기본적인 프레임으로써 ‘공간(Point: 지번, line: 도로, Polygon: 건물, 행정동 등)’은 훌륭한 핵심 요소가 될 수 있기 때문이라고 해석한다.
더불어 2010년부터 시작된 (빅데이터) 시대에 부응하여 국가가 관리하는 정보를 공개하는 기조가 채택되면서 국 가공개정보에 대한 관심이 높아지고 있다. 국가 정보관리 체계의 기본 관리단위는 국가의 행정구역 단위이므로, 공 간정보에 대한 이해와 그에 맞는 데이터로의 형태전환을 통한 ‘공간정보화’가 중요한 역할로 떠오른 것도 그 원인이 라 할 수 있다. 공간을 기반으로 자신들이 가진 데이터와 외부의 데이터를 모두 모아야 그것이 빅데이터가 되고, 국 가공개정보까지 자유롭게 활용하기 위해서는 공간정보화 과정이 점차 필수과정이 될 것이다. 이렇게 만들어지는 모 든 데이터를 ‘공간정보’라 칭하기 때문에 결국 공간정보는 빅데이터의 출발점이라고 할 수 있다.
공간정보의 활용 사례
그렇다면 공간정보를 기반으로 한 빅데이터는 어떻게 활
<그림 1> 공간정보의 역할
위치정보 생산
데이터 서비스
다른 데이터와 결합하기 위한 허브
데이터 분석, 인사이트 발굴
개인정보 처리를 위한 데이터 집계 단위
가공 데이터 판매/운영 특집 제4차 산업혁명 시대의 공간정보 이슈와 정책
정보에 개인이 다양한 소스를 통해 쌓아놓은 행동패턴들 을 매칭시킬 수 있었기 때문이다. 그리고 이러한 정보들은
「개인정보보호법」에 위배되지 않는 최소단위의 공간단위 (block) 집계형태로 관리하고 제공하여 누구나 손쉽게 빅 데이터 기반의 소비항목별 잠재수요 추정, 프로모션 오퍼 등을 실현했다.
2013년부터는 민간기업뿐 아니라 빅데이터 시대를 준 비하기 위한 정부의 노력으로, 공공기관의 데이터 융합 플 랫폼 구축과 이를 활용한 서비스 등도 활발히 전개되었 다. 대표적으로 회자되는 관련 서비스로는 2013년 한국정 보화진흥원에서 선정한 시범사업인 ‘소상공인을 위한 점 포평가 서비스’가 있다. 이는 민간(카드사, 통신사)과 공 공(한국감정원, 중소기업청)의 데이터를 연계·융합하여, 창업자들에게 과거와 현재 시장상황에 대한 평가 및 진단 을 제공하고, 이러한 데이터를 기준으로 미래 유망한 업종 과 시장에 대한 예측을 가능하게 했다. 또한 서울시와 함 께 구축한 ‘서울시 빅데이터 융합 플랫폼’은 서울시가 그 간 보유해 온 수백여 종의 데이터와 민간데이터 그리고 그 외 공공기관(기상청, 통계청, 행정자치부 등)의 데이터를 결합하여 분석할 수 있게 하는 플랫폼서비스다. 이를 통해 서울시는 데이터 기반의 공공정책 수립과 실수요를 기반 으로 한 복지시설 최적지 선정, 공공정책 홍보적지 선정, 외국인 관광마케팅 지원이 가능하게 되었다. 그 외에도 경 찰청에서 제공되어 최근 화제가 된 ‘Geo Pros’라는 서비 스 역시 블록 단위별 각종 범죄지수를 생성하고, 우범지 역에 대한 경계를 강화하여 사고를 미연에 방지할 수 있도 록 지원해주는 대표적인 공간정보 기반의 빅데이터 활용 사례다.
로 데이터를 구축하고, 가공·분석하여 일상생활에서 개 인의 흔적들을 지속적으로 학습한다. 그리고 딥러닝·기 계학습의 분석을 통해 본인도 인지하지 못하였던 생활패 턴, 건강상태를 체크하여 상황에 따른 적절한 대응을 유도 할 수 있다.
독거노인 가정의 현관문, 화장실 좌변기, 거울, 수도꼭 지(정수기/샤워기), 냉장고 손잡이 등에 센서를 설치하고, 스마트폰에 체온 및 맥박수를 인식할 수 있는 센서와 애 플리케이션을 설치한다. 이렇게 하면 사람의 동선에 따라 시간과 함께 필요한 정보들을 모두 모니터링할 수 있다.
예를 들어, 오전 6시 30분 눈을 떠서 가벼운 운동을 하고 (침실), 35분 물을 꺼내 마시고(냉장고), 화장실에 들리고 (좌변기), 8시쯤 건강상태 확인 문자를 받는다. 체온/혈 압 등을 체크하고, 9시쯤 노인회관에 가기 위해 문을 열 고 나서는 생활패턴이 ‘정상활동 패턴’으로 자동 인식이 된다.
그러다가 사용자의 몸에 이상이 생기거나, 다른 이유로 정상활동패턴에서 벗어나면 1차 알람이 울리며 “괜찮으신 가요?”라는 확인문자가 오고, 잠시 후 다시 확인전화가 온 다. 그 전화를 받지 않으면, 경보가 울리고 주변 경찰서나 지정된 의료기관으로 연락이 간다(이것은 실제로 미국에 서 실행 중인 U-health 사례다).
이 시스템은 독거노인 가구뿐 아니라, 연령별·가구형 태별 다양한 가구원들에게 적용할 수 있고, 각 구성원들의 생활패턴을 인지하여, ‘위험상황’으로 인식할 기준치들을 설정한다면 학습된 공간정보와 IoT정보를 활용한 Smart Care 시스템으로 발전시킬 수 있다.
집 밖으로 범위를 확장시키면, 공간정보와 IoT·딥러닝·
중요한 요소다. 즉 본인도 인지하지 못하는 일상생활을 유형화하여 정상활동 범위(시간적, 공간적 범위)를 설정 하고 공간좌표에 데이터를 묶어 이상활동을 감지하는 것 이다.
공간속성 패턴의 변화 인지 사례(딥러닝)
개인의 생활패턴 주기뿐 아니라 공간속성의 패턴 변화인 지에도 이러한 기술을 활용할 수 있다.
‘상권’은 특정 상가가 흡인할 수 있는 소비자가 있는 권 역으로, 상업활동을 성립시키는 지역조건이 구비된 공간 을 뜻한다. 상권은 업종의 분포와 소비자의 성향을 기준 으로 나눌 수 있다(현재 활용가능한 공간정보 속성들은
<그림 2> 참조).
이러한 데이터들은 기본적으로 포인트 단위로 제공하기 어려우므로, 2차선 도로기준, 유동 또는 상주인구 200명 기계학습의 결합은 더욱 다양한 정보를 제공할 수 있다.
다른 사례를 살펴보자. 직장인 A씨는 평일에는 늘 비슷 한 시간에 같은 버스정류장에서 버스를 타고, 늘 같은 곳 에서 하차하여 근처의 편의점과 커피전문점 등을 거쳐 출 근한다. 점심시간이면 회사 근처의 식당에 가고, 퇴근을 하면 다시 아침에 내렸던 버스정류장에서 버스를 타고 집 으로 이동한다. 이러한 정보들은 카드거래 데이터 및 전화 기 위치 등의 정보를 통해 쉽게 감지할 수 있다(물론 개인 의 동의가 있어야만 이루어지는 서비스다). 이러한 일상의 패턴을 Smart Care 시스템이 학습하면, A씨의 첫 데이터 감지 장소가 지속적으로 벗어날 경우, ‘이사’ 또는 ‘전직’으 로 인지한다. 장소의 이탈이 일회성이면 ‘휴가’나 ‘출장’ 등 의 이벤트로 인지하여 그에 필요한 생활혜택 정보(쇼핑/
교통/문화/금융정보 등)를 제공 받을 수 있다.
위와 같은 상황에서 공간정보는 생활패턴상 정해진 시 간에 있어야 할 곳에서 움직임이 감지되는지 인식하는 데
<그림 2> Block-상권 속성정보
Location Space
사람 돈
어떤 사람인가? 누가/언제 쓰나?
어디에 살고 있나?
선호도 관심사
성별 연령대 카드거래 교통카드
행정구역 가구
생애주기 O2O App
주택유형
소득수준 통화량데이터
주택가격 소비패턴
어디서 쓰나?
점포(업종) 집객시설 핵심상권 골목상권
얼마나 쓰나?
매출추정 입지선정
출처: 오픈메이트
특집 제4차 산업혁명 시대의 공간정보 이슈와 정책
(연령·성별·/시간별 등)를 지속적으로 저장하면, 각 속 성의 변화에 따라 블록을 대표하는 핵심 요소를 추출할 수 있다. 예를 들어, ‘안정성이 높은 상권’을 찾으려면 블록 별 속성정보들 중 업종별 개체수와 방문객수 등의 변화율 이 15% 미만인 블록들을 찾아내고, 그 블록들을 가장 많 이 포함하는 상권을 찾으면 된다. 그리고 이 블록의 속성 값들이 학습된 패턴을 넘어 이상치를 계속 기록하게 되면,
‘급등·급락’하는 상권으로 분류할 수 있다.
또한 그 블록을 상주 또는 지나가는 개인의 정보들을 계 속해서 구축·학습하면 이 블록이 시간에 따라 다른 블록 (상권)으로 변하는 것을 바로 인지할 수 있고, 성별 특화상 권, 업종별 특화상권(화장품블록, 피트니스블록 등)으로 그 대표 값의 정의를 자동으로 완성할 수 있다.
더 나아가 현재 가장 이슈가 되는 젠트리피케이션의 조 짐을 미리 알아내는 조기경보 시스템으로도 활용할 수 있 다. 젠트리피케이션이 일어나기 전에는 업종의 다양성이 사라지고 특정업종(커피전문점, 화장품 등)의 변화가 급등 하는 경향을 보인다. 특정블록을 시작으로 이런 변화가 감 지되면, 지자체나 그 지역 커뮤니티에서는 긍정적인 방향 으로 전환시키는 정책을 만들어 예방이 가능하다.
이와 같이 공간정보를 빅데이터 및 IoT기술력 등과 결 합하여 데이터를 생성하는 주체들이 알아채지 못했던, 자 신의 정체성과 패턴의 변화들을 감지하여 예방과 활성화 그리고 긍정적인 효과를 증대시키는 사례들은 쉽게 찾아 볼 수 있다.
즉 공간정보는 일상생활에서 의식 또는 무의식적으로
서 활용하여 합리적이고 효율적인 자금집행, 정책수립, 정보생산 및 지식제공 사례를 조금씩 확산시킨다면, 그를 통한 수혜자들은 더욱 많아질 것이며 이런 경험의 축적이 곧 새로운 산업의 발굴과 성장을 이끌어내는 원동력이 될 것이다. 그리고 바로 그 중심에 공간정보가 있다.
3) 기본적으로 상권은 도로네트워크를 따라 형성되기 때문에 단순격자로 이를 관리하는 것에는 한계가 있고, 도보거리 5~10분 정도를 한계로 한 개의 상권이 형성 되기 때문에 행정동 등 국가 행정체계를 사용하여 데이터를 분석하기에는 한계가 있기 때문임.