제1절 빅데이터와 위험예측 모형(PRM) 기반 정책 사각지대 발굴 및 예방적 복지서비스 제공

여기서는 사회보장정보시스템 등 다양한 공공·민간 영역 빅데이터를 기반으로 분석 데이터를 구축하고 잠재적 위험예측 모형(PRM)을 적용하 여 특정 가구 및 개인의 위험확률을 예측해 정책 사각지대를 발굴하고, 특성별로 잠재적 위험집단 또는 복지서비스 수요를 예측함으로써 예방적 복지서비스를 선제적으로 제공하는 혁신적 사회안전망 강화 및 활용 방 안을 제안한다.

1. 위험예측 모형(PRM)의 개요 및 정책 활용 프로세스

잠재적 위험예측 모형(PRM)은 다양한 연계 정보들을 기반으로 축적 된 데이터베이스를 구축 및 활용하여 정책 대상별 위험요인 도출 및 개 인 또는 가구 단위의 잠재적 위험 확률(Risk probability)에 대한 예측 모형을 도출하고, 새로운 분석 및 예측 대상 상황이나 사례들로 구성된 데이터(Test data)에 이러한 모형을 적용함으로써 잠재적 위험 확률을 예측한다.

〔그림 5-1〕 사회보장 빅데이터 기반 잠재적 위험예측 모형(Predictive Risk Modeling) 활용 프로세스

이러한 모형을 적용함으로써 잠재적 위험 확률을 예측한다. 위험 수준 에 따라 정책 대상을 분류하여 선제적으로 대상 선정, 예방, 발굴 및 서비 스 지원에 활용하는 방법을 의미한다. 위험예측 모형을 정책 프로세스에 활용하기 위해서는 최초 연계정보뿐만 아니라 정책집행 및 환류데이터 축적과 분석을 통해 모형을 반복적으로 고도화할 수 있는 순환적 연구 및 정책 프로세스 환경이 매우 중요하다.

잠재적 위험예측 모형을 적용한 정책 활용 프로세스별 주요 이슈 및 고 려 사항을 살펴보면 다음과 같다. 먼저, 빅데이터와 인공지능을 기반으로 이와 같은 예측을 통한 서비스 제공 시스템 또는 플랫폼을 구축하면서 정 책목표를 분명히 설정하고, 복지서비스 전달체계에서 이러한 시스템이 어떻게 활용될 것인지 가이드라인을 마련하는 것이 필요하다. 우리의 일 상생활에서 편의를 제고하기 위한 다양한 전자제품이나 서비스의 목적은 단순하지만, 사회정책 영역에서의 이러한 방법론을 활용하는 과정에서는 항상 사람을 중심으로 또 다른 소외, 배제, 차별 등의 문제가 발생하지 않 도록 주의해야 하기 때문이다.

두 번째는 특정한 정책 대상의 다양한 위험요인과 관련된 정보 중 활용 가능한 정보와 데이터가 구축되지 않았거나 접근이 불가능한 정보의 부 재를 통계적으로 어떻게 처리하고 활용할 것인지 신중하게 결정해야 한 다. 이는 빅데이터 기반의 연계정보 처리 및 활용, 상세 정보의 존재 유무 와 편차, 활용 여부에 따라 저소득층 또는 특정한 취약계층(가구유형) 집 단으로 집중되거나 고착되는 집단 편향의 문제가 제기될 수 있기 때문이 다. 이것은 현행 사회보장정보시스템 역시 복지서비스 신청 및 조사의 이 력 정보가 있는 기존 복지 대상이 많은 비중을 차지하는 것과 관련된다.

세 번째는 위험예측에 활용되는 주요 위험요인 데이터 및 연계 정보의 한계와 속성을 정확히 이해하고 다원화하여 데이터 발굴 및 연계를 통해

분석 데이터베이스를 구축해야 한다. 이는 신규 정보 발굴 및 구축을 통 한 연계 정보 확대, 기존 연계 정보 기준 조정 및 상세 정보 추가 연계, 기 존 연계 정보 가공을 통한 신규 정보 생성 및 활용 등을 고려할 수 있다.

네 번째는 발굴 대상 특성을 고려한 예측모형 다양화가 필요하다는 점 이다. 예측모형 적용 사례에 대한 환류데이터 분석 시 지원 결과 및 범위 에 따른 집단 구분 및 다양한 환류데이터 분석을 통해 구조적인 개선 방 향을 마련해야 한다. 이는 분석구조의 다양화(분석 대상, 분석 시점), 분 석변수 유형의 다양화(정태적 정보 vs. 동태적 정보), 분석변수 선택 및 세부 정보의 활용 범위 등이 검토되어야 한다.

다섯 번째는 알고리즘 선택 및 시스템 적용 방안 선택 시 정책에서 설 명 가능한 부분을 고려해야 한다. 최근 사회정책 영역에서 이러한 위험예 측 모형을 활용함에 있어서 고도화된 기계학습 방법론 기반 위험 예측모 형이 ‘블랙박스’와 같이 설명이 불가능하다는 논쟁들이 제기되었다. 이는 정보의 비대칭성 문제를 해결하고 복지서비스의 집행 현장에서 대응을 위한 설명 가능성이 고려되어야 한다.

여섯 번째는 예측된 위험을 기준으로 서비스 발굴 지원 대상 선정의 원 칙과 기준을 설정하는 것이 중요하다. 이는 앞서 정책 활용 프로세스상에 서 예측된 위험 확률 분포를 바탕으로, Cutoff line, Grouping 및 Filtering 등 적용 원칙과 기준을 설정하는 것이다. 일반적으로 해외의 활 용 사례에서도 서비스 지원 대상 범위 선정 시 예산 제약을 고려하여 위 험 확률 상위에 해당하는 분위 등을 적용한 기준으로 설정(상위 × %)하 는 경우가 존재한다. 이러한 기준 외에도 위험 확률 예측 결과에 근거한 필수적인 서비스 제공 대상 가구 지정(mandatory) 또는 복지서비스 대 상자의 지역별 집중 현상에 따른 서비스 지원 대상 배분 및 상한 설정 범 위 등을 고려해야 한다.

요컨대 잠재적 위험예측 모형은 최근 들어 광범위한 빅데이터를 기반 으로 다양한 서비스를 제공하기 위하여 기계학습 및 인공지능 알고리즘 을 활용하는 방법론으로 주목받고 있으며, 민간 영역에서 금융서비스, 범 죄예방, 보건의료 등의 영역에서 활발하게 진행되어 점차 공공 영역의 다 양한 사회서비스 영역으로 확장되고 있다.

4차 산업혁명 시대의 포용적 사회안전망 구축을 위해서 사회보장정보 시스템 등 다양한 공공 및 민간 영역의 빅데이터 기반으로 분석 데이터베 이스를 구축하고 잠재적 위험예측 모형(PRM)을 적용하는 것이 더욱 필 요하다. 이를 통해 특정 집단, 가구 및 개인의 위험확률 예측 결과를 활용 하여 그동안 해결되지 않은 정책 사각지대를 발굴하고, 잠재적 위험집단 특성 분석을 통해 복지서비스의 수요를 예측함으로써 예방적 복지서비스 를 선제적으로 제공할 수 있는 혁신적 사회안전망의 구축을 확대하는 것 이 필요하다.

2. 사회보장정보시스템과 공공데이터 연계 및 활용 사례 : 복지사각지대 발굴관리시스템 및 e아동행복지원시스템

²²⁾

최근 다양한 공공 빅데이터를 기반으로 앞서 살펴본 잠재적 위험예측 모형(PRM)을 활용하여 잠재적 위험집단의 특성을 예측 분석하고, 이들 의 복지수요에 대한 맞춤형 서비스를 선제적·예방적으로 제공하기 위한 정책 지원 방안과 이러한 정보를 복지서비스 현장에서 직접 활용하는 사

22) 연구책임자가 보건복지부, 사회보장정보원과 협업을 통해 데이터 연계 및 시스템 구축 연구에 직접 참여하고 있으며, 이러한 연구 및 사업에 참여한 내용을 바탕으로 작성된 최현수(2018a). 사회복지 분야의 공공데이터 연계 및 활용 사례. KIPA 조사포럼, Vol.24 Spring. 한국행정연구원과 최현수(2018b). 빅데이터를 활용한 e아동행복지원시 스템 구축. 빅데이터 연구 방법론과 젠더이슈 세미나. 한국여성정책연구원을 중심으로 재구성함.

례가 다양하게 진행되고 있다. 이것은 본 연구에서 제안하는 4차 산업혁 명 대응과 포용적 복지 구현을 위한 혁신적 사회안전망 개편 및 활용 방 안의 전형적 사례라고 할 수 있다. 특히 사회보장 영역 행정데이터를 중 심으로 정책 집행이 이루어지는 복지 분야에서 4차 산업혁명의 핵심적인 기술인 빅데이터와 인공지능을 활용하여 다양한 서비스를 제공하는 것은 보건의료 분야에 비해서 상대적으로 여러 가지 제약 조건을 고려해야 하 는 상황으로 인하여 이제 시작하는 단계라고 할 수 있다.

여기서는 사회보장정보시스템과 공공 및 민간 영역의 빅데이터를 연계 하여 다양한 기술을 활용한 예측 결과를 바탕으로 정보를 공유하고 이를 바탕으로 복지전달체계 구축 및 복지서비스 제공 과정을 보여주는 혁신 적 사례로 복지사각지대 발굴관리시스템과 e아동행복지원시스템을 살펴 보고자 한다.

가. 사회보장 빅데이터를 활용한 복지사각지대 발굴 지원체계

문서에서 4차 산업혁명 대응을 위한 데이터 주도의 혁신적 포용 사회안전망 개편 방안 (페이지 180-185)