가. 제1기 (2020년 2월 ~ 2020년 10월)
SHAP 분석의 경우도 대상변수를 예측 및 분류하고 주요 설명변수를 도 출하는데 주로 사용되는 방법으로 코로나19 제1기를 대상으로 분석한 결과
<그림 Ⅴ-8>과 같이 코로나19 사망자 수가 통제정책 수준 변동에 가장 큰 영향을 미치는 변수로 확인되었다. SHAP 분석 결과의 Y축은 여러 관측치 중에서 특정 테스트 데이터(test dat)의 설명변수의 특징을 나타내고 X축은 대상변수의 예측값을 의미하며 각 설명변수의 중요도와 함께 예측과 분류에 방향을 확인할 수 있다. 신규 사망자 수, 인구 이동량, 신규 확진자 수 등은 통제정책 수준을 증가시키는 (+) 방향의 변수로 나타났다. 이와 달리 소상공 인 경기체감지수는 중요도는 크지 않지만 통제정책 수준을 감소시키는 (-) 방향의 설명변수로 나타났다.
<그림 Ⅴ-8> 정책변동 요인에 대한 SHAP 분석 (제1기)
SHAP 분석을 통해 분석에 사용된 변수의 SHAP value 절대값의 평균을 산출하면 <그림 Ⅴ-9>에서 보는 바와 같이 신규 사망자 수, 신규 확진자 수, 치명률 등의 순으로 변수 중요도가 나타났다. 앞서 살펴본 SHAP 분석에서 는 특정 테스트 변수를 지정하여 분석결과를 산출하였으나 해당 분석에서는 분석 데이터 전체를 통해 산출된 SHAP의 절대값을 나타내므로 Y축의 설명 변수에 특정 피쳐 값이 없는 것을 확인할 수 있다. SHAP 분석은 LIME 분 석과 달리 대상변수의 지정 따라 SHAP 절대값의 크기가 달라지지 않는다는 장점이 있어 변수 중요도 분석에 대한 해석에 보다 유용한 측면이 있다.
<그림 Ⅴ-9> SHAP 분석 변수 중요도 (제1기)
나. 제2기 (2020년 11월 ~ 2021년 6월)
코로나19 제2기를 대상으로 SHAP 분석한 결과는 <그림 Ⅴ-10>과 같이 중환자 수, 백신 접종률, 인구 이동량이 코로나19 통제정책 수준을 설명하는 중요 변수로 확인되었다. 앞서 살펴본 바와 같이 특정 테스트 변수에 대한
예측 및 분류에 설명변수의 SHAP 값을 통해 변수들의 예측 뱡항을 살펴보 면 중환자수는 코로나19 통제정책 수준을 감소시키는 (-) 방향의 예측변수로 나타났다. 이와 달리 백신 접종률과 인구 이동량은 코로나19 통제정책 수준 을 증가시키는 (+) 방향의 설명변수로 확인되었다. 그 외 변수들은 중요도는 크지 않지만 코로나19 통제 정책 수준을 감소시키는 (-) 뱡향의 설명변수로 확인되었다. 다만 이러한 분석결과는 특정 대상변수의 테스트 데이터를 기준 으로 한 분석이기 때문에 설명변수의 중요도를 살펴보기 위해서는 각 데이터 에 대한 설명변수들의 SHAP value를 평균한 값을 살펴보아야 한다.
<그림 Ⅴ-10> 정책변동 요인에 대한 SAHP 분석 (제2기)
코로나19 제2기를 대상으로 SHAP 분석을 통해 변수 중요도를 산출하면
<그림 Ⅴ-11>에서 보는 바와 같이 중환자 수, 백신 접종률, 인구 이동량 등
의 순으로 변수 중요도가 높은 것으로 나타났다. 중환자 수는 정책 문제적 요인이고 백신 접종률은 정책 자원적 요인, 인구 이동량은 정책 산출적 요인 이라는 점에서 정책변동의 정책 환경적 요인으로 구분한 3개의 영역 모두의 근거가 코로나19 통제정책 수준을 분류하는 중요한 요인으로 나타났다고 볼 수 있다. 제2기를 분석 대상으로 진행한 LIME분석에서도 백신 접종률, 인구 이동량 변수가 중요 변수로 나타났다는 점에서 제2기에서는 정책 자원적 근 거와 정책 산출적 근거가 코로나19 통제수준을 분류하는데 중요한 요인으로 작용했다는 것을 확인할 수 있다.
<그림 Ⅴ-11> SHAP 분석 변수 중요도 (제2기)