의 순으로 변수 중요도가 높은 것으로 나타났다. 중환자 수는 정책 문제적 요인이고 백신 접종률은 정책 자원적 요인, 인구 이동량은 정책 산출적 요인 이라는 점에서 정책변동의 정책 환경적 요인으로 구분한 3개의 영역 모두의 근거가 코로나19 통제정책 수준을 분류하는 중요한 요인으로 나타났다고 볼 수 있다. 제2기를 분석 대상으로 진행한 LIME분석에서도 백신 접종률, 인구 이동량 변수가 중요 변수로 나타났다는 점에서 제2기에서는 정책 자원적 근 거와 정책 산출적 근거가 코로나19 통제수준을 분류하는데 중요한 요인으로 작용했다는 것을 확인할 수 있다.
<그림 Ⅴ-11> SHAP 분석 변수 중요도 (제2기)
석에 활용하여 설명변수의 중요도를 산출하였기 때문에 모델의 예측 정확도 등은 고려하지 못한 한계가 존재한다. 또한 설명변수의 상관관계36)로 인해 랜덤 포레스트의 변수 중요도 산정에서도 하향 편향이 존재하게 되는 한계가 있다.37) 이를 보완하기 위해 국소지역의 데이터를 활용한 LIME분석과 변수 간 연관성이 고려되는 SHAP분석을 통해 분석결과의 강건성을 검토하고자 하였다. 다만 이러한 분석방법의 한계에도 불구하고 제1기와 제2기의 변수의 중요도에 차이가 있다는 점은 확인할 수 있었다. 제1기의 경우 주로 신규 확 진자 수와 같은 정책 문제적 요인 변수들의 변수 중요도가 높게 나타났으나, 제2기에는 인구 이동량과 백신 접종률과 같은 정책 산출적 요인의 변수 중 요도가 높게 나타났음을 확인할 수 있었다. 이를 통해 제1기와 제2기의 통 제정책 변동과정에서 중요하게 고려되는 근거가 시기에 따라 차이가 있었음 을 추정해볼 수 있다.
<표 Ⅴ-8> 분석 결과의 비교
36) 코로나19 정책 환경적 요인의 특성상 각 변수들 간에는 상관관계가 존재하는 경우가 많 으며 변수간 상관관계 현황은 부록에 첨부하였다.
37) 유사한 여러 설명변수가 포함되어 설명변수 간의 상관관계가 높은 경우 각 변수는 하나 의 랜덤 포레스트(Random Forest) 모형에 비슷한 빈도로 선택되어 변수 중요도가 하향 편향(bias) 되는 현상이 나타날 수 있다(Breiman, 2001; 신승범·조형준. 2021).
구 분 변수 중요도 (Feature importance)
제1기 제2기
의사결정나무
신규 사망자 수 신규 확진자 수
치명률
인구 이동량 신규 사망자수
진단검사수
랜덤 포레스트
신규 사망자 수 인구 이동량 신규 확진자 수
신규 사망자 수 인구 이동량
중환자수
LIME
신규 사망자 수 신규 확진자 수
치명률
백신 접종률 (2차) 인구 이동량 신규 사망자 수
머신러닝에 포함된 알고리즘은 데이터 자체가 설명변수에 포함된 정보를 활용하여 대상변수의 값을 예측하거나 설명하기 위해 조합되는지를 알려주기 때문에 다른 변수를 통제해 효과의 크기를 산출하지 않는다는 특징이 있다 (김선영, 2020). 또한 머신러닝을 활용한 빅데이터 분석의 경우 비모수적 (non-parametric) 특징을 갖는 경우가 많아 분석모형이 전체 현상을 포괄 적으로 분석할 수 있다고 보는 경향이 있지만 실제로는 전체 현상을 대변하 지는 못한다(Boyd & Crawford 2012: 669). 특히 본 연구의 경우 관측치 수가 적은 데이터를 부트스트랩(bootstrap) 등의 방법을 통해 데이터의 한계 를 극복하고자 했기 때문에 분석결과의 안정성이 떨어진다는 한계가 존재한 다. 본 연구에서는 이러한 점을 보완하기 위해 다양한 분석모형을 활용하여 강건성을 높이고자 하였지만 근본적인 방법론상의 한계는 여전히 존재한다고 볼 수 있다. 따라서 머신러닝의 분석결과는 이론과 상황에 맞게 해석될 필요 가 있으며 이를 위해 본 연구에서는 행정안전부 관계자와 전화 통화 인터뷰 를 진행하였다. 그 결과 2020년과 2021년의 사회적 거리두기 단계 조정에 활용되는 근거의 중요도와 의미에 차이가 있다는 점을 확인할 수 있었다.
Q : 사회적 거리두기 단계 조정 회의에 활용되는 자료의 중요도가 2020 년과 2021년 시기에 따라 달라진 측면이 있나요 ?
A : 2020년에는 주로 확진자 수와 사망자 수가 중요한 자료로 활용되었으 나, 2021년에는 소상공인 자영업자의 경제적 피해와 변이 바이러스의 치명률 등과 같은 자료의 중요성이 높아진 측면이 있습니다.
- 행정안전부 관계자 전화 인터뷰(2021.11.8) - SHAP
신규 사망자 수 신규 확진자 수
치명률
중환자 수 백신 접종률 (2차)
인구 이동량
분석결과를 정리하면 코로나19 통제정책의 수준은 정책 문제적 요인, 정 책 자원적 요인, 정책 산출적 요인으로 구성된 설명변수 중에서 시기에 따라 변수 중요도(feature importance)가 다르게 나타난다는 점을 확인할 수 있 었다. 이를 통해 코로나19 시기에 따라 정책변동 근거의 중요도가 변화하였 다는 점을 추정해볼 수 있었다. 따라서 연구가설 2에 대한 검증결과를 정리 하면 다음과 같이 나타낼 수 있다.
<표 Ⅴ-9> 분석 결과의 정리
가설 검정 결과
가설 2: 코로나19 통제 정책수준 을 결정하기 위한 근거의 중요도 는 시기에 따라 달라졌을 것이다.
코로나19 시기에 따라 정책을 둘 러싼 근거의 중요도가 다르게 나 타났음
지지
제 4 절 근거기반 정책변동에 대한 사례연구
본 절에서는 정책변동에 영향을 미치는 정책 문제, 정책 자원, 정책 산출 의 변화와 같은 구조적 요인에 대한 근거 중에서 실제 정책변동 과정에 영 향을 주는 행위자 집단이 어떠한 근거에 기반하여 정책의 변동과 관련된 주 장을 하였는지를 검토하고자 한다. 정책변동이 다양한 정책 환경적 요인에 의해 이루어진다고 하여도 정책변동을 이끌어내기까지는 정책변동 과정의 행 위자의 역할이 필요하기 때문이다. 따라서 본 절에는 코로나19 통제정책 중
‘사회적 거리두기’ 정책을 보다 강화하려는 입장의 행위자 집단과 사회적 거 리두기 정책을 완화하려는 입장의 행위자 집단 간의 토론회와 공청회 발언을 중심으로 어떠한 근거로 상황을 인식하고 정책 변화를 주장하였는지를 확인
하고자 한다. 이와 같은 사례분석을 진행하기 위해서는 먼저 정책의 변동과 정에서 행위자 집단을 확정하여야 한다. 또한 정책변동의 시기를 특정하여야 보다 정합성 있는 정책변동에 대한 사례분석이 될 수 있다. 따라서 본 절에 서는 정책변동의 행위자 집단 현황을 먼저 살펴보고 정책변동의 시기를 2차 유행 이후 진행된 ‘5단계 사회적 거리두기 체계 개편과정’, 3차 유행 진행 중에 검토된 ‘4단계 사회적 거리두기 체계 개편과정’으로 구분하여 분석을 진행하였다.
<그림 Ⅴ-12> 사례연구 분석대상 현황