이 연구에서는 앞서 정의한 사회보장 빅데이터와 유사한 분석DB를 구 축하여 딥러닝을 포함한 다양한 기계학습 통계기법을 적용하고 여러 모 형 선택기준으로 최적의 예측모형을 살펴보았다는 점에서 기존 연구와 차별성이 있다. 분석DB에서는 기계학습 기법인 부스팅의 결과가 제일 좋 은 성능을 보여주었다. 딥러닝은 이미지 및 언어 분석에서는 탁월한 성능 을 보여주지만, 분석DB에서는 부스팅과 랜덤 포레스트의 결과보다 좋지 않음을 알 수 있다. 이는 모든 데이터에서 하나의 기계학습 기법이 좋은 성능을 보이는 것은 아니라는 것을 의미한다. 부스팅 기법은 대부분의 경 우 좋은 예측력을 보여주지만, 분석 데이터의 속성에 따라서 다른 기계학 습 방법이 더 좋을 수 있다. 사회보장 빅데이터가 이미지 및 영상 데이터 인 경우에는 부스팅 방법보다는 딥러닝 방법이 더 적합할 수 있다. 따라

서 기계학습 기법을 적용하려면 주어진 문제를 해결하기 위해 구축된 사

담론 형성 단계에서도 매우 중요하다. 이에 따라 정부는 G7 또는 G20 정 Innovation)이며 동시에 데이터 주도 정책(data-driven policy)의 개념 이라고 할 수 있다(OECD, 2014).

터와 사회보장 빅데이터를 구축하여 강화된 개인정보보호 기술을 적용하

통한 데이터 중심 정책 추진 및 사회적 가치 창출의 대표적 사례이다. 또

형의 개인정보보호 체계 및 기술의 구축도 필요하다.

열악한 지역통계를 발전시키기 위해서는 지방분권을 강화하고, 4차 산업 으로 인식하기 때문이다(European Commission, 2017). 데이터 기반 의 과학적 정책 결정이 이루어지는 예측형, 예방형 데이터 주도 보건복지 정책을 추진하기 위해서는 정부를 포함한 보건복지 분야 전반에서 데이

터 중심의 의사 결정 문화로 변화할 필요가 있다. 특히 보건복지 관련 빅 데이터 생산․관리 인프라를 기반으로 다양한 정책 변화에 따른 국민의 삶 의 질 변화와 관련된 다양한 데이터를 구축하고 이러한 데이터를 활용한 예측 결과에 기반을 둔 정책 목표 설정과 정책 설계, 환류 데이터 분석을 통한 정책 수정과 실천이 병행되어야 한다. 또한, 보건복지 분야의 데이 터 활용도 제고를 위해서는 데이터 거버넌스와 데이터 공유 플랫폼에 대 한 정부 지원과 사회적 신뢰 기반 구축이 필수적이다. 공공과 민간 데이 터가 모두 거래되는 데이터거래소, 데이터 분석과 활용을 지원하는 데이 터처리지원센터 등을 설치하여 데이터 기반의 지능형 의료서비스 제공과 지능정보사회의 사회안전망 강화를 적극 추진해야 한다.

이러한 데이터 주도 정책이 뒷받침된다면, 기계학습 분야는 더욱 발전 하고 보건복지 분야에서도 이를 활용하여 다양한 정책을 추진함으로써 4 차 산업혁명 시대를 맞이하고 있는 우리의 삶에 긍정적인 변화를 가져오 고 중요한 영향을 미칠 수 있을 것이다.

