• 검색 결과가 없습니다.

랜덤 포레스트 기법을 활용한 장애근로자의 고용유지 예측 요인 탐색*

N/A
N/A
Protected

Academic year: 2022

Share "랜덤 포레스트 기법을 활용한 장애근로자의 고용유지 예측 요인 탐색*"

Copied!
23
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

* 이 연구는 2020 제 12회 장애인고용패널 학술대회 발표 내용을 재분석하여 작성된 것임.

** 제 1저자

*** 교신저자(sandfom3@kyungnam.ac.kr) 2021, Vol. 37, No. 2, pp.73-95

랜덤 포레스트 기법을 활용한

장애근로자의 고용유지 예측 요인 탐색

*

이 기 정** (대구교육대학교 교수) 김 영 식***(경남대학교 교수)

<요 약>

연구목적: 본 연구는 머신 러닝 기법을 적용하여 장애근로자의 고용유지를 보다 효과적으로 예측하는 변수들 을 탐색적으로 확인하고자 하였다. 연구방법: 장애인고용패널 2차 웨이브의 4차년도(2019년) 자료를 기반으 로 랜덤 포레스트(Random Forest)를 통하여 1,763명을 대상으로 132개 설명변수를 활용한 장애인 고용유지 예측 모형의 성능을 확인하고, 장애인의 고용유지를 예측하는 변인들을 탐색적으로 도출한 후, 이들 주요 예 측변수들을 활용한 로지스틱 회귀분석을 통하여 다른 변수들의 영향력을 통제한 이후에도 장애인의 고용유지 에 대한 유의미한 예측력을 지니는 변인을 확인하였다. 연구결과: 랜덤 포레스트 분석 결과, 장애인의 고용유 지를 예측하는 변수들 중 예측력이 가장 높은 것은 근로소득이었으며, 다음으로 정규근로자 여부 및 좋은 일 자리 임금 수준에 대한 인식, 가구소득 총계, 취업인식 등으로 나타났다. 또한 랜덤 포레스트 분석 결과 도출 된 예측변수를 활용하여 로지스틱 회귀분석을 실시한 결과, 좋은 일자리의 임금 수준, 가구 자산, 공공․민 간․사업체․학교의 직업교육훈련 참여 여부는 장애인 고용유지와 통계적으로 유의한 관계를 맺고 있음을 확인할 수 있었다. 결론: 향후 장애인 고용 지원 관련 연구 및 정책 결정에 있어 머신 러닝 기법의 활용 가 능성을 확인하였으며, 분석 결과 고용의 질과 관련된 변인들이 장애인 고용의 유지와 긍정적인 관계를 맺고 있음을 확인하였다.

<주제어> 장애인 고용 유지, 머신러닝, 랜덤 포레스트, 장애인고용패널

(2)

Ⅰ. 서 론

2019년 장애인 통계(한국장애인고용공단 고용개발원, 2019a)에 따르면 2018년 우리나라 만 15 세 이상 등록장애인의 수는 2,495,043명으로 동일연령 전체인구의 5.65%를 차지하고 있다. 전체 인구의 5%, 그리고 만 15세 이상 인구의 약 5.6%를 차지하는 장애인의 고용을 지원하기 위하여

「장애인 고용 촉진 및 직업재활법」은 2000년 개정되었다. 개정 이후 장애인 의무 고용 대상 사업 주의 범위를 확대 뿐 아니라, 장애인 고용 의무 적용이 제외되었던 공무원의 범위를 축소하였으며, 장애인 고용 장려금 및 부담금 제도 등이 지속적으로 개선되었다. 이에 따라 장애인의 의무고용률 은 2009년에는 1.87%에 불과하였으나 매냔 상승하는 모습을 보였으며, 중증장애 2배수 인정제가 시작된 2010년부터 2.24%로 증가하였고, 2019년 평균 2.92%로 증가하였다(e-나라지표, 2020).

「장애인 고용 촉진 및 직업재활법」과 같은 법적 지원을 근간으로 장애인의 의무고용 비율은 지 속적으로 향상되고는 있으나, 이에 반해 실질적인 데이터는 그리 긍정적이지 못하다. 경제활동에 참여하고 있는 장애인구(취업자+실업자)는 922,897명으로 전체 장애인구의 37.0%가 경제활동에 참 가하고 있고, 그 고용율은 34.5%이다. 이 수치는 전 해인 2017년 경제활동 참가 장애인 비율 38.7% 및 고용율 36.5%에 비하여 떨어진 수치이며, 2018년 전체인구의 경제활동 참가율 63.9%, 고용율 61.3%보다 1/2 수치이다. 또한 2016, 2017년, 2018년 전체인구의 경제활동 참가율(63.3%, 63.6%, 63.9) 및 고용율(61.0%, 61.3%, 61.3%)이 향상된 것에 비하면 부정적인 결과이다. 나아가 국내 특수학교 졸업생의 비진학 미취업율은 77.9%밖에 되지 않으며, 국내 특수학교 졸업생의 취업 률은 19.9%밖에 되지 않는다(김영표, 2018; 민자영, 김영표, 2020 재인용).

이에 많은 연구자들이 장애인의 고용을 향상시키기 위하여 장애인 고용에 영향을 미치는 변인을 찾고자 노력했다. 비장애인에게도 직업은 중요한 의미이지만, 장애인에게 특히 직업은 의료, 교육, 심리, 사회적 재활의 전체에 더하여 종합적인 측면에서 고려되어야 하고, 경제활동에 참가하는 것 은 이들의 삶의 질과 높은 관련성을 지니고 있을 뿐만 아니라, 장애인의 가족에게도 높은 만족을 이끌어내기 때문이다(이재섭 외, 2018). 다양한 연구들에 따르면 장애인 고용에 영향을 미치는 변 인으로 정부정책 뿐 아니라 장애인 개인적 특성이나 장애 특성, 학력이나 자격증, 심리․정서적 요 인이나 노동시장요인, 제도적 요인 등이 있다(이기정, 김영식, 2019). 그리고 이러한 연구 결과들은 장애인의 고용율 향상을 위하여 어떤 법적, 제도적 지원들이 필요한지에 대한 고민으로 연결되었 고, 많은 연구들이 장애인의 고용율을 높이기 위해서는 고용상태가 유지되도록 지원해야 함을 강조 하였다.

고용유지란 직장생활에 장애인들이 잘 적응할 수 있도록 지원하고 직장 또는 직무환경에서 장애 로 인한 불편사항을 파악하여 이를 개선하도록 조정함으로써 장애인의 직장생활과 관련한 갈등적 요소를 제거하여 직장생활을 안정적으로 유지하도록 하는 것을 의미한다(이채식, 2006). 고용유지 라는 개념을 측정하기 위해서는 취업 시점 혹은 특정 시점으로부터의 직업유지 기간 혹은 근속기

(3)

간을 활용할 수 있다. 2006년 한국장애인고용공단은 직장을 이직한 장애인의 평균 근속기간이 3년 8개월이고, 그 중 52.1%가 근무기간 2년 이내라고 발표하였다. 이후 2019년 한국장애인고용공단 발표에 따르면 장애인 임금근로자의 현재 직장(일자리) 평균 근속기간은 5년 10개월로 2006년에 비하여 향상되었으나, 전체 인구 임금근로자의 5년 11개월보다 여전히 짧은 것으로 나타났다(한국 장애인고용공단 고용개발원, 2019a).

장애인의 취업 뿐 아니라 고용이 유지 혹은 지속될 수 있도록 정부는 다양한 제도를 통하여 지 원하고 있다. 국내에는 근로지원인 제도, 보조공학기기 지원제도, 장애인 직업생활상담원, 장애인 고용환경개선 융자․지원 사업 등이 있다(한국장애인고용공단, 2019b). 또한 국외의 경우 독일은 해고보호제도나 중증장애인 대표 제도, 통합합의 제도가, 프랑스는 고용상실 상황에 있는 장애인 근로자의 고용유지 제도, 고령 장애인 근로자의 고용유지 제도, 고용유지를 위한 직업교육 지원, 후 원인 지원 제도 등을 통하여 장애인의 고용 유지를 지원하고 있다. 특히 해고 관련 제도들은 해외 에는 존재하나 우리나라에는 없어, 이러한 제도의 국내 도입에 대한 논의들이 이루어지고 있다(한 국장애인고용공단, 2017).

장애인의 고용유지와 관련된 선행연구들을 살펴보면, 연구자들은 장애인 고용유지를 위한 제도적 지원 도입의 필요성을 강조함과 동시에, 장애인 고용유지에 긍정적인 영향을 미치는 변인 연구들을 수행하고 있음을 알 수 있다. 김환희, 이영선(2012)은 장애인의 고용 유지에 영향을 미치는 변인을 개인적 특성(인구통계학적 특성 및 장애특성), 성향적 요인, 경험요인, 지식․능력․태도, 고용환경 및 조건, 직업적성 및 만족도, 사회적 관계 및 지지 등으로 구분하였다. 또한 김미연(2019)는 장애 인의 학력이나 장애유형, 자격증 여부 및 사업체 특성이 영향을 미친다고 하였고, 정다찬, 도유미, 나운환(2019)은 편의제공이 고용유지에 긍정적인 영향을 미친다고 제안하였다. 또한 성별, 나이, 배 우자유무, 가구주여부, 기초수급여부, 일자리개수, 재정일자리, 임금, 종사상지위, 일자리 만족도, 취 업 필요사항(업무조정, 근무시간조정, 편의시설), 사회적지지(취업도움자수)에서 퇴사확률에 통계적 으로 유의미한 영향을 미친다는 연구도 있다(전영환, 2019).

이러한 장애인의 고용유지에 영향을 미치는 변인에 대한 연구들은 지원에 따른 장애인 근로자들 의 고용유지 차이를 검증하기 위해 일원배치분산분석(one-way ANOVA)사용하거나(정다찬 외, 2019), 실직여부를 계산한 생존분석(생존함수와 Cox의 조건부 시각간격 모형(conditional gap time Cox model) 사용)(김미연, 2019) 혹은 콕스의 비례헤저드 회귀분석 모형(Cox’ Proportion Hazards Regression)(전영환, 2019), 로지스틱 회귀분석을 사용하고 있다(한국장애인고용공단 고용 개발원, 2019b). 그러나 이러한 분석방식은 장애인 고용유지에 영향을 미치는 다양하고 수많은 변 수들을 다 고려할 수 없다는 한계를 가진다. 또한 회귀분석의 경우 종속변수와 모형에 투입된 설명 변수간의 선형 관계를 나타내는 회귀계수의 추정 및 검정에 초점을 맞추고 있어, 해당 분석 결과를 실제 종속변수의 예측값으로 보기에도 어려움이 있다(오미애 외, 2017). 이러한 상황을 고려할 때 장애인의 고용유지에 영향을 미치는 요인들을 추정하고 예측하기 위해서는 좀 더 새로운 연구방법

(4)

을 활용할 필요가 있다.

이에 본 연구는 장애인의 고용 유지에 영향을 미치는 다양한 요인들을 보다 효과적으로 탐색하 기 위하여 머신러닝(Machine Learning) 기법 중 하나인 랜덤 포레스트 알고리즘(Random Forest) 을 사용하여 고용유지 관련 요인들을 예측해 보고자 하였다. 머신러닝 기법은 빅데이터를 분석하기 위한 방법으로, 간단하게는 머신(machine)이 대량의 데이터로부터 특정한 규칙을 찾아 학습 (learning)을 함을 의미한다(홍기혜, 2020). 데이터 분석 과정(학습)을 통하여 도출된 모형은 모형 수립 시 포함하지 않았던 데이터에 적합화하여 예측 성능이 평가되고, 그 성능이 인정되면 도출된 모형을 새로운 데이터에 대한 예측에 활용할 수 있다(Dangeti, 2017; 홍기혜, 2020 재인용). 즉, 과 거 데이터를 적합화 할 때 유의미했던 예측 인자들을 그대로 사용하여 현재 장애인 집단의 고용유 지 여부를 예측할 수 있음을 의미한다. 특히 변수에 대한 무작위성과 상호작용을 반영하여 고차원 의 모형에서도 오류를 야기하지 않는 랜덤 포레스트 알고리즘(Géron, 2017; 홍기혜, 2020 재인용) 은, 과거 선행연구와 같이 연구자가 설정한 특정 원인 이외에 많은 요인들이 개입되어 분석될 수 있다는 점에서 장애인의 고용유지에 영향을 미치는 변인을 탐색하는 등의 사회과학연구에 매우 적 합하다 볼 수 있겠다. 이러한 연구주제와 이에 따른 연구방법을 고려한 세부적인 연구문제는 다음 과 같다.

1. 랜덤 포레스트 분석 결과 장애인 고용유지에 영향을 미치는 요인에는 어떤 것들이 있는가?

2. 랜덤 포레스트 분석에 의해 밝혀진 요인들의 장애인 고용유지 예측력은 각각 어떠한가?

Ⅱ. 이론적 배경

1. 장애인 고용유지

고용유지는 취업유지, 직업유지 등의 용어로 혼용하여 사용가능하며, 취업 후 일정기간 이상 직 업활동을 통해 스스로 생활을 영위하고, 지역사회에서 통합되는 과정을 의미한다(정다찬, 2019). 또 한 이금진(2000)은 장애인의 고용유지를 취업 이후, 여러 가지 지원을 통해 만족스러운 직장 적응 을 기본으로 한 직장생활의 유지로 정의하였다. 또한 이채식(2006)은 단순히 직업획득만을 의미하 는 것이 아니라 지역사회 내에서 일정기간 이상 직업을 유지하면서 지역사회에 통합되는 과정이라 고 보았다. 이러한 정의를 살펴보면 고용유지란 단순히 취업하여 직업을 유지하는 기간을 의미하는 것 이상으로 질적인 부분도 함께 고려하고 있으며, 이는 다양한 지원을 통하여 향상될 수 있음을 포함하고 있다(손희경, 2016).

일반적으로 고용유지는 고용형태, 정리해고 비율 등과 함께 고용안정을 객관적이고 사실적으로

(5)

측정하는 하나의 요인으로 볼 수 있다(Burchell, 2002). 고용유지와 연관된 고용안전은 비장애인 뿐 아니라 장애인 고용의 질의 지표로 볼 수 있는데, 실업상태에서는 경제적 어려움 뿐 아니라, 정신 적 신체적 건강에도 부정적인 영향을 미치기 때문이다(오소윤, 2014). 특히 한국노동패널 7차년도 조사 결과에 따르면 좋은 일자리의 1순위 조건으로 안정적인 일자리가 1위(47.1%)를 차지하여, 고 용유지가 고용에 질에 미치는 영향이 중대함을 알 수 있다(오소윤, 2014).

일반적으로 장애인은 비장애인에 비하여 상대적으로 실업률이 높은데, 이러한 실업률을 낮추기 위해서는 취업률을 높이는 것도 중요하지만, 고용을 유지하는 것이 매우 중요하다. 그러나 장애인 의 경우 고용을 유지하기 위해서 많은 어려움이 따른다. 취업 이후 신체 기능의 제한 등으로 업무 수행에 어려움을 가지거나, 직장을 그만두기도 한다(김종미 외, 2014). 또한 많은 사업장이 장애 등 으로 인한 직무 수행 능력의 상실을 해고의 한 요건으로 정하고 있으며(한국장애인개발원, 2014), 인원감축이나 정리해고 시 장애가 우선적으로 고려되기도 한다(나운환 외, 2002). 따라서 장애인의 고용유지를 위해서는 이러한 어려움을 해결하고 경감시키는 지원이 필요하다.

이러한 필요성에 근거하여 장애인 고용을 유지하기 위해서 장애인 근로자가 자신에게 적합한 업 무를 가지고, 장애로 인해 겪을 수 있는 업무상의 어려움을 경감․해결하며, 직장에서 잘 적응할 수 있도록 제도적으로 지원을 제공하고 있다. 직무지원인 지원사업이나, 근로지원인서비스와 고용 관리비용 지원 제도, 보조공학기기 및 시설장비지원․융자지원 사업, 고용장려금 제도 등을 통하여 장애인의 직장적응 및 업무수행을 지원하는 등의 노력이 그 예이다(손희경, 2016). 그러나 장애인 근로자의 해고에 관련된 제도가 있는 독일과 달리 일반적인 노동법상의 해고예고 규정(근로기준법) 만으로 장애인의 해고를 다루고 있고, 대부분의 법적 지원 역시 주로 취업에 초점을 두고 있는 상 황(장애인차별금지법)이라 장애인 고용유지를 위한 다각적인 제도의 마련이 필요할 것으로 보인다.

2. 장애인 고용유지 관련 요인

장애인의 고용을 유지하는 데에는 다양한 요인들이 영향을 미친다. Foss & Peterson(1981)은 직 무만족도가 고용유지와 밀접한 관련이 있으며, Jongbloed(2010)는 직업을 유지하기에 적합하지 않 은 직무, 열악한 근로환경 등이 장애인의 직업을 유지하는데 부정적인 영향을 미친다고 하였다. 또 한 염희영 등(2006)은 지체장애인 근로자의 고용유지에 영향을 미치는 요인으로써 신체기능 요인, 직무만족도 요인, 가족관련 요인, 심리적 요인 중 직무만족도 요인이 가증 큰 영향을 미친다고 하 였고, 정다찬(2019)은 정당한 편의제공은 고용유지 영향요인이며, 특히, 작업에 대한 지도 및 직장 생활 상담, 장애인 맞춤형 업무능력 향상훈련, 출퇴근 지원, 직무조정, 근무시간 조정이 중요한 요 인이라고 제시하였다. 이렇게 국내외 연구자들은 장애인의 취업 뿐 아니라 고용이 유지되기 위한 다양한 변인들을 찾기 위하여 고용지원, 사후관리와 관련한 분의 연구가 강조되어야 한다고 하였으 며(최경수, 2018), 실제 이러한 연구들이 이루어지고 있다.

(6)

연구자

(년도) 대상 범주 요인

남정휘

(2014) 장애인

인구학적 특성 성별(남), 연령(30, 40대일수록), 가구소득(기초수급가구여부), 장애정도, 장애유형(신체외부장애인일수록) 인적자본 특성 교육수준(높을수록), 자격증 보유여부(보유) 고용환경 특성 임금수준(높을수록), 고용형태(정규직), 직장차별 경험여부

김경선 김영식 정소라 (2014)

장애인

직업재활

서비스 참여 고용 및 직업재활서비스 참여여부

인구학적 특성 성별, 연령, 학력, 혼인여부, 가구원 수(많을수록) 장애 특성 장애정도, 일상생활에서 타인의 도움 필요, 건강상태, 장애유형 근로환경 특성 임금 만족 정도(높을수록), 일자리에서 차별경험(적을수록) 인적자본 특성 자격증 보유(유), 직업교육훈련경험(유)

남정휘 (2017)

고령 장애인

인구학적 특성 성별, 연령(낮을수록), 가구소득(기초수급가구여부), 건강상태(양호), 장애정도, 장애유형 인적자본 특성 교육수준(학력이 높을수록), 자격증 보유여부(무),

고용서비스경험여부(이용경험이 없는)

근로환경 특성 임금수준(높을수록), 사업체 규모, 고용차별 경험여구, 일자리 만족도

박주영 (2017)

발달 장애인

인구학적 특성 실제 연령, 학력(낮을수록), 결혼상태 장애심리 요인 타인도움 여부, 차별경험, 자아존중감

직업관련 요인 임금, 근무유형(전일제), 자격증 여부, 직무 만족도(높을수록)

전영환

(2020) 장애인

개인적 특성 성별(남자), 나이(낮을수록), 배우자 여부(유), 가구주 여부(가구주), 가구원수, 기초수급여부(수급)

장애 및 건강 장애유형, 장애정도, 건강상태, 만성질병

경험요인 학력, 자격증, 일자리 개수(많을수록), 재정일자리 경험(있을수록), 직업훈련 근로조건 임금(높을수록), 근로시간, 종사상 지위(높을수록)

만족도 일자리 만족도(만족도가 높을수록)

취업 필요사항 업무조정(조정), 근무시간조정(조정), 출퇴근지원, 타인도움, 직장생활상담, 보조기기, 편의시설(있는 경우), 업무능력 향상 훈련

사회적 지지 취업도움자 수(많을수록)

<표 1> 장애인고용패널조사를 활용한 장애인 고용유지에 영향을 미치는 변인 연구

특히 한국장애인고용공단 고용개발원에서 실시하고 있는 장애인고용패널조사(Panel Survey of Employment for the Disabled, PSED) 데이터는 장애인 경제활동에 대한 전반적인 분석을 가능하 게 할 뿐 아니라, 장애인 취업 및 고용유지 관련 연구를 수행하는데 많이 활용되어 왔다. 이 데이 터를 활용한 장애인 고용 유지에 영향을 미치는 요인 분석 연구 결과들은 <표 1>과 같다.

(7)

Ⅲ. 연구방법

1. 분석 대상 및 자료

이 연구는 장애인의 고용유지를 보다 효과적으로 예측하는 변인들을 도출함으로써 장애인들이 그들의 고용을 유지하는데 있어 필요한 정책적 시사점을 도출하는데 목적을 둔다. 이를 위해 본 연구는 한국장애인고용공단 고용개발원에서 조사하는 장애인고용패널조사(Panel Survey of Employment for the Disadvantaged)의 2차 웨이브 4차년도 자료를 활용하여 분석을 실시하였다.

장애인고용패널조사 2차 웨이브는 2016년 기준 만 15세에서 64세까지의 전체 등록장애인 중 4,577명을 층화표집하여, 이들의 노동시장 이동과 관련 요인들에 대한 추적조사를 매년 실시하여 패널데이터를 구축함으로써 통계분석 시 추정값의 불편성과 효율성을 담보할 수 있다는 장점을 지 니고 있다(이기정, 김영식, 2018).

이 연구에서는 장애인들의 고용유지 여부를 파악하기 위하여 장애인고용패널조사 2차 웨이브의 1차년도 조사 기준 시점인 2016년 5월 15일 당시 임금근로자로 재직하던 장애인들을 대상으로 4 차년도 조사 시점에도 동일한 직장에서 임금근로자로 재직하였는지, 혹은 3년의 기간 동안 이직을 하였거나 실업 혹은 비경활 상태로 남아있는지에 따라 고용유지 변수를 생성하여 분석에 활용하였 다. 이에 따라 본 연구는 1차년도 조사 당시 임금금로자로서 4차년도 조사에도 포함된 1,763명의 장애인을 대상으로 분석을 실시하였다.

2. 변수 선정

이 연구는 장애인의 개인 특성과 배경 변수, 그리고 다양한 취업 노력 등이 이들의 고용유지에 어떠한 영향을 미치는지 추정하는데 목적을 둔다. 따라서 이에 필요한 변수들만을 선정하여 분석 자료를 구성하였다.

본 연구의 분석 기법인 랜덤 포레스트는 이분변수 혹은 연속변수를 종속변수로 하는 회귀분석과 같이 설명변수들을 통하여 종속변수를 예측하는데 활용된다(최필선, 민인식, 2018). 이에 본 연구에 서는 장애인의 고용유지를 나타내는 변수를 생성하기 위하여 장애인고용패널조사 2차 웨이브의 1 차년도 조사 기준 시점인 2016년 5월 15일 당시 임금근로자로 재직하던 장애인들이 4차년도 조사 시점에도 동일한 직장에서 임금근로자로 재직할 경우 ‘고용유지’로, 1차년도 조사 당시 임금근로자 였던 장애인이 3년의 기간 동안 이직을 하였거나 실업 혹은 비경활 상태로 남아있는 경우 ‘고용 미 유지’로 범주를 설정하여 반응변수를 생성하였다.

그리고 장애인의 고용유지를 예측하기 위해 장애인고용패널 2차 웨이브의 4차년도 자료 중 패널 기본 정보, 일자리 정보, 직업적 능력, 취업을 위한 노력과 지원, 취업 태도와 환경, 일상생활과 삶

(8)

의 질, 가구 일반 사항과 관련한 변수들을 예측 변수로 활용하였다. 본 분석에 활용된 랜덤 포레스 트 기법은 설명변수들 간의 상호작용과 비선형성을 고려할 수 있으며, 다수의 설명변수를 예측 모 형에 투입할 경우 발생하는 자유도 감소 문제로부터 상대적으로 자유롭다는 장점을 지니고 있어 많은 수의 변수들을 모형에 투입하여 종속변수에 대한 예측력이 높은 변수를 도출하는데 활용될 수 있다(최필선, 민인식, 2018). 다만 원자료상에서 전체 데이터의 67%가 결측치인 것으로 나타나 해당 변수들을 모두 분석에 포함할 경우 과다한 결측치로 인해 랜덤포레스트 분석이 제대로 이루 어지지 않음을 고려하여 전체 조사대상자의 25% 이상이 응답하지 않은 변수와 반응 변수 예측에 활용이 어려운 문자 변수 및 종속변수 예측과 무관한 변수들을 분석에서 제외하였다. 이에 본 연구 에서는 장애인고용패널조사 상의 변수 132개를 장애인의 고용유지를 예측하는 설명변수로 모형에 투입하여 분석에 활용하였다. 본 분석에 활용된 설명변수를 영역별로 구분하면 아래의 표와 같다.

영역 항목

패널 기본 정보 (10개)

성별, 실거주지역, 만연령, 혼인상태, 학력, 장애유형, 장애정도, 중복장애 유무, 장 애발생 원인, 정기적 치료 필요 여부

일자리 정보

(1개) 정규근로자 여부 취업을 위한

노력과 지원 (37개)

취업 관련 활동 경험(16개), 직업교육훈련 횟수, 향후 취창업에 필요한 사항(12 개), 장애로 인해 필요한 지원(8개)

직업적 능력 (18개)

본인의 직업적 능력(15개), 통상적인 수준이 근로 가능여부 판단, 자격증 보유 개 수, 조직적응능력

취업 태도와 환경 (11개)

취업 시 도움 줄 수 있는 사람의 수, 취업 인식(좋은 일자리의 요소), 가족의 취업 지지 정도, 장애인 정책에 대한 인지 정도, 장애인 고용에 주된 역할을 할 주체, 최저임금 체감도 자아존중감, 장애인 정책 신뢰도, 장애인고용서비스 인식, 자기효 능감, 취업 인식

일상생활과 삶의 질 (41개)

건강상태(2개), 생활습관(7개), 일상생활 중 스트레스 정도, 정신적 건강(3개), 일상생활에서 타인의 도움이 필요한 정도, 일평균 여가시간(평일/주말), 여가/

사회활동 경험(11개), 사회활동 참여 정도, 외출시 주로 이용하는 이동수단, 이 동시 장애로 겪는 어려움, 장애로 인한 일상생활 차별경험 정도, 일상생활 항목 별 만족도(7개), 일상생활의 전반적 만족도, 주관적 사회경제적 지위, 장애수용 정도

가구 일반 사항 (14개)

가구주 여부, 가구원수, 근로소득, 가구소득, 한달평균 생활비, 가구 자산, 가구 부 채 현황, 자동차 보유 여부, 국민기초생활보장수급 여부, 현 거주지 거주 동기, 거 주 주택 종류, 주거용 전용면적, 주거 환경, 가구의 경제적 어려움

<표 2> Random Forest에 투입된 설명변수 영역과 세부영역

(9)

3. 분석 방법

1) 랜덤 포레스트(Random Forest)

이 연구는 장애인의 고용유지를 효과적으로 예측하는 변수를 탐색하기 위해 랜덤 포레스트를 활 용하였으며, 이를 위하여 장애인고용패널 2차 웨이브 4차년도에 포함된 변수 132개를 활용하였다.

본 연구와 같은 이분 종속변수에 대하여 전통적인 로짓 모형을 적용하여 분석을 실시할 경우, 다수 의 예측변수 투입으로 인한 자유도 감소 문제가 발생한다. 이러한 한계를 극복하기 위해 도입된 대 안 중 하나인 랜덤 포레스트 기법은 다수의 의사결정나무(Decision Tree)를 생성하되 개별 의사결 정나무 내에서는 표본 및 변수 선택 과정에서의 무작위성을 최대한 부여함으로써 모형의 예측률을 높이는데 효과적인 기법으로 평가받고 있다(유진은, 2015).

본 연구는 1,763명의 표본을 훈련자료(training data) 및 시험자료(test data)로 나누되, 각각의 비율은 랜덤 포레스트 분석 시 일반적으로 자주 활용되는 7:3으로 설정하였다(유진은, 2015; 최필 선, 민인식, 2018). 훈련 자료는 랜덤 포레스트 분석이 실제로 이루어지는 자료로서, 훈련 자료에 대한 분석을 통하여 랜덤 포레스트 예측 모형을 도출한다. 시험 자료는 랜덤 포레스트는 모형의 강 건성(Robustness)을 확보하기 위한 자료로서 훈련 자료로부터 도출된 예측 모형이 시험 자료를 대 상으로도 유사하게 적용되는지를 확인한다(이기정, 김영식, 2019).

이 연구에서는 장애인고용패널조사 2차웨이브의 1차년도 조사 기준 시점인 2016년 5월 15일 당시 임금근로자로 재직하던 장애인들이 4차년도 조사 시점에도 동일한 직장에서 임금근로자로 재직하는데 영향을 미치는, 즉 장애인들의 고용유지에 영향을 미치는 요인을 탐색하기 위하여 표 본을 훈련자료와 시험자료로 구분하여 훈련 자료를 대상으로 고용유지 예측 모형을 도출한 후, OOB(Out-of-bag)를 대상으로도 모형의 예측성과를 분석함으로써 랜덤 포레스트 모형의 성능을 점검하였다. OOB 자료는 일종의 부트스트랩 표본으로 랜덤 포레스트 분석 시 선택되지 않은 자료 들을 의미하며, 랜덤 포레스트에서는 이를 활용하여 예측 모형의 성능 점검에 활용할 수 있다(유진 은, 2015).

또한 랜덤 포레스트는 모형에 투입한 다수의 설명 변수 중에서 무작위로 일정한 개수의 설명변 수를 활용하여 의사결정 나무들을 생성한다(이기정, 김영식, 2019). 이 연구에서는 Breiman(2001) 의 제안(이분변수인 종속변수는 설명변수개수)에 따라 의사결정나무마다 11개의 예측 변수를 적 용하여 분석을 실시하였다.

본 연구는 랜덤포레스트 모형의 예측오차를 줄이기 위해 표본과 변수들을 무작위로 선택하여 1,000개의 의사결정나무를 생성하였으며, 장애인의 고용유지를 예측하는 설명변수의 중요도를 확인하기 위하여 모형정확도개선지수(Mean Decrease Accuracy: MDA)와 지니개선지수(Mean Decrease Gini: MDG)를 활용하여 장애인의 고용유지에 대한 예측력이 높은 상위 10개 변수들을 도출하였다(김영식, 문찬주, 박환보, 2020). 또한 각 설명변수의 값에 따른 장애인의 고용유지율이

(10)

어떻게 변화하는지 살펴보기 위하여 특정 설명변수가 장애인의 고용유지에 미치는 한계효과를 나타 내는 부분의존성도표(Partial Dependence Plot)를 추가적으로 제시하였다(김영식, 2020).

2) 로짓(Logit) 모형

본 연구에서는 랜덤 포레스트로부터 도출된 주요 변수들이 장애인의 고용유지와 맺고 있는 관계 성을 보다 구체적으로 확인하고자 하였다. 이에 장애인의 고용유지 여부를 나타내는 변수를 종속변 수로, 그리고 랜덤 포레스트 분석 결과 중요도가 높은 것으로 나타난 주요 설명변수들을 설명변수 로 분석모형에 투입한 후 로지스틱 회귀분석을 실시하였으며, 이를 위한 수식은 다음과 같다.

ln

   

   

 

위 모형에서    는  의 특성을 지닌 장애인이 3년 동안 동일 직장에서 고용을 유지할 확률을 나타내며,  는 종속변수를 예측하는 주요 설명 변수들의 벡터이며, 는 상수항을 포함한 회귀계수 벡터를 의미한다.

Ⅳ. 연구결과

1. ‘장애인의 고용유지’에 대한 랜덤 포레스트 분석 결과

먼저 랜덤 포레스트 모형의 예측 성능을 점검하기 위하여 정분류율(Correct Classified Rate:

CCR), 민감도(Sensitivity)와 특이도(Specificity) 값을 활용하였다. 정분류율이란 전체 관측값 중 랜 덤 포레스트 분석 결과 장애인의 고용유지 혹은 미유지를 정확히 예측한 비율로, 정분류율이 높을 수록 모형의 예측력이 좋음을 의미한다. 그리고 민감도는 3년 동안 고용이 유지된 장애인들을 대상 으로 이들의 고용유지를 정확히 예측한 비율을 가리키며, 특이도는 고용이 유지되지 못한 장애인들 중 이들의 고용 미유지를 예측한 비율로서 이들 지표 또한 높은 값을 보일수록 모형의 예측력이 좋음을 의미한다. <표 3>과 같이 장애인의 고용유지 여부에 대한 예측성과 분석 결과를 살펴보면 정분류율과 민감도, 특이도 측면에서 모형의 타당성이 확보되고 있음을 알 수 있다. 다만, 시험자료 의 경우 특이도가 상대적으로 낮게 나타나고 있는데 이는 종속변수의 수준에 따라 표본수의 차이 가 발생할 경우 랜덤 포레스트 시험자료의 특이도와 민감도가 어느 한쪽으로 쏠리는 한계로 인해 발생한 것이다(유진은, 2015). 그럼에도 불구하고 특히, OOB 자료에서도 상당히 높은 수준의 예측 률을 보여주고 있음을 고려할 때 본 연구에서 도출된 랜덤포레스트 모형은 상당한 예측 성능을 지

(11)

모형 정분류율(%) 민감도(%) 특이도(%)

시험 자료(OOB) 79.0% 93.4% 62.6%

훈련 자료 100.0% 100.0% 100.0%

시험 자료 80.9% 94.4% 30.9%

<표 3> 장애인의 고용유지에 대한 랜덤포레스트의 정분류율, 민감도, 특이도

니고 있음을 알 수 있다.

한편, <그림 1>은 자료에 대하여 의사결정나무를 1,000번 반복추출하는 과정을 반복할 때 랜덤 포레스트의 예측 오차율이 어떻게 변화하는지 나타낸 것이다. 랜덤 포레스트는 표본 및 변수를 무 작위로 선택하여 의사결정나무를 생성해나가는 과정을 반복하는데, 이 연구에서는 1,000개의 의사 결정나무를 생성하여 그 결과를 종합하도록 설정한 후 의사결정나무 수의 증가에 따른 오차율 변 화를 확인하였다(이기정, 김영식, 2019). 아래 그림에서 가운데 그래프는 전체 자료 중에서 예측이 틀린 오차 비율을 의미하며(1-정분류율), 맨 위의 그래프는 실제로는 고용이 유지되지 않은 장애인 들인데 고용을 유지한 것으로 잘못 예측한 비율(1-특이도)을 나타내며, 가장 아래의 그래프는 실제 로는 3년간 고용을 유지한 장애인들인데 고용을 유지하지 못한 것으로 잘못 분류한 비율(1-민감 도)을 의미한다.

이는 의사결정나무의 숫자가 증가함에 따라 예측 오차율이 어떻게 변화하는지 살펴보기 위함으 로, 1,000개의 의사결정나무가 종속변수를 예측하는데 있어 적절한 숫자인지 확인하기 위한 것이 다. 본 모형의 경우 의사결정나무가 약 400개를 넘어서는 시점부터 오차율이 일정한 값으로 수렴 하는 경향을 보였다. 따라서 1,000개의 의사결정나무를 생성한 랜덤 포레스트 모형은 일정 수준의 오차율을 확보하는데 충분한 숫자임을 확인하였다.

<그림 1> 의사결정나무 개수별 장애인 고용유지에 대한 예측오차율 변화

(12)

<그림 2> 장애인의 고용유지 예측 관련 상위 10개 변수

랜덤 포레스트의 기저가 되는 의사결정나무는 종속변수를 효과적으로 예측하는 변수를 쉽게 파 악할 수 있다는 장점을 지닌다. 이에 반해 랜덤 포레스트는 복수의 의사결정나무를 반복적으로 생 성하여 그 결과를 종합하기 때문에 어떤 설명변수가 종속변수를 더욱 효과적으로 예측하는지 직관 적으로 파악하기 어려운 한계를 지닌다(이기정, 김영식, 2019). 이러한 약점 보완을 위해 랜덤 포레 스트는 의사결정나무별로 오분류율(1-정분류율)을 계산한 후, 특정한 설명변수들을 재조합하여 다 시 오분류율을 계산한 후 두 결과를 비교한다(이기정, 김영식, 2019). 이는 특정 예측 변수가 중요 하지 않다면 해당 변수 제외하고 예측 모형을 재조합하더라도 추정 결과에 큰 차이가 없을 것이기 때문이다(이기정, 김영식, 2019; 김영식, 2020). 이에 따라 개별 의사결정나무별로 해당 작업을 반 복적으로 실시함으로써 특정 설명 변수의 모형정확도개선지수를 산출한 후, 해당 지수값이 클 경우 종속변수를 예측하는데 있어 중요한 변수로 간주할 수 있다(최필선, 민인식, 2018).1)

이에 장애인들의 고용유지와 관련하여 예측변수의 중요도를 파악하기 위해 도출된 주요 변수들 의 모형정확도개선지수와 지니개선지수는 <그림 2> 및 <표 4>를 통해 확인할 수 있다. 아래의 그 림과 표는 랜덤 포레스트 모형에 투입된 132개의 설명변수 중 장애인의 고용유지에 대한 예측력이 높은 상위 10개의 변수를 정리한 것이다.

모형정확도개선지수를 기준으로 장애인들의 고용 유지와 관련된 예측 변수들을 살펴보면, 우선

‘근로소득’의 상대적 중요도 및 예측력이 가장 높은 것으로 나타났다. 다음으로 ‘정규근로자 여부’가 뒤를 이었으며, ‘좋은 일자리의 임금 수준에 대한 인식’, ‘가구소득 총계’, ‘취업 인식(상대적으로 열 악한 일자리 형태에 대한 취업 의향)’의 순으로 중요도 지수가 높은 것으로 나타났다. 다음으로는

1) 랜덤 포레스트는 예측 변수의 예측력을 측정하기 위하여 Gini 지수에 기반한 MDG(Mean Decrease Gini)도 함께 제공한다. 그러나 MDG는 MDA에 비해 상대적으로 편의(bias)가 크며, 추정 결과의 불안 정성을 안고 있는 것으로 알려져 있다(Sandri & Zuccolotto, 2010). 이에 본 연구에서는 MDA와 MDG 에 따른 결과를 모두 제시하되, 분석 결과 제시 및 이후의 해석은 MDA 값에 기반하였음을 밝힌다.

(13)

모형정확도 개선 지수 지니 개선 지수

근로소득 33.826 근로소득 43.542

정규근로자여부 21.240 가구소득총계 20.146

좋은일자리의임금수준 19.408 한달평균생활비 19.701

가구소득총계 17.486 좋은일자리의임금수준 18.378

취업인식 16.880 가구자산현황 18.234

한달평균생활비 16.135 취업인식 16.329

가구자산현황 15.627 정규근로자여부 14.677

공공민간사업체학교직업교육훈련참여 13.351 만연령 14.040

하고있는일에대한만족도 13.224 장애인고용서비스인식 10.739

가구경제적어려움 12.833 가구경제적어려움 10.724

<표 4> 장애인의 고용유지 관련 주요 10개변수의 중요도지수

‘한 달 평균 생활비’, ‘가구 자산 현황’, ‘공공ㆍ민간ㆍ사업체ㆍ학교의 직업교육훈련 참여’, ‘하고 있 는 일에 대한 만족도’, ‘가구의 경제적 어려움’의 순서로 예측력이 높은 것으로 확인되었다.

다음으로 앞서 제시된 장애인의 고용유지와 관련하여 모형정확도 개선지수 기준으로 중요도가 높은 상위 10개 변수별로 부분의존성 도표를 아래의 그림과 같이 작성하였다.

<그림 3> RF 분석 결과 주요 변수별 부분의존성 도표

(14)

종속변수가 이분변수인 경우 특정 설명변수에 대한 부분의존성은 해당 변수를 제외한 다른 모 든 설명변수들의 효과를 평균적으로 제거한 후 예측된 반응변수 확률을 의미한다(유진은, 2015;

Hastie et al., 2009). 위의 부분의존성도표에 따르면 장애인의 근로유지에 대한 중요도가 가장 높은 변수인 ‘근로소득’의 경우 장애인의 근로소득이 높을수록 높은 고용유지율이 높은 것으로 나타났다.

그리고 가구소득, 좋은 일자리의 임금 수준에 대한 인식, 가구 자산 및 한 달 평균 생활비가 높으며, 가구의 경제적 어려움이 낮을수록 장애인들의 고용유지 예측률이 높은 것으로 나타나 상대적으로 경 제력이 나은 장애인들이 그렇지 않은 장애인들에 비해 고용유지율이 높은 것을 알 수 있다.

앞선 근로소득의 분석 결과와 함께, 현재 하고 있는 일에 대한 만족도가 높고, 비정규직에 비해 정규직 근로자의 고용유지 확률이 높은 것으로 나타나 고용의 질이 장애인들의 고용유지에 중요한 요소임을 확인할 수 있다. 다만, 하고 있는 일에 대한 만족도의 경우 보통>만족>불만족의 순으로 고용유지율이 높은 것으로 나타나 해석에 있어 주의가 요구됨을 알 수 있다. 그리고 상대적 열악한 일자리 형태에 대한 취업 의향이 낮으며, 공공ㆍ민간ㆍ사업체ㆍ학교의 직업교육훈련에 참여한 장애 인들일수록 고용유지율이 낮게 나타남을 알 수 있다.

2. Random Forest 분석 결과에 기반한 로지스틱 회귀분석 결과

이상과 같이 장애인의 고용유지를 예측하는 랜덤 포레스트 분석 결과 중요도가 높은 것으로 나 타난 주요 설명변수 10개와 종속변수인 고용유지 여부 변수의 기술통계량은 <표 5>와 같다.

구분 사례 수 평균 표준편차 최소값 최대값

고용유지 여부 1,763 0.54 - 0 1

근로소득 1,534 2,433.09 1,767.87 0 14,000

정규근로자여부 1,271 0.46 - 0 1

좋은일자리의임금수준 1,441 310.70 132.98 40 1,000

가구소득총계 1,534 4,187.77 3,622.17 0 80,000

취업인식 1,436 2.57 0.84 1 5

한달평균생활비 1,534 291.06 180.63 33 2,520

가구자산현황 1,534 16,046.03 16,828.70 0 150,000

공공민간사업체학교직업교육훈련참여 1,491 0.05 - 0 1

하고있는일에대한만족도 1,317 3.66 0.69 1 5

가구경제적어려움 1,534 2.05 0.86 1 5

<표 5> 장애인의 고용유지 관련 주요 변수들의 기술통계량

(15)

이에 따르면 분석 대상 1,763명 중 54%가 2016년 대비 2019년에도 동일한 직장에서 고용을 유 지하고 있으며, 46%는 기존의 직장에서 이직을 하였거나 실업 혹은 비경활 상태에 있음을 알 수 있다. 그리고 랜덤 포레스트 분석 결과 예측력이 가장 높은 것으로 나타났던, 분석 대상 장애인들 의 2018년 평균 근로소득은 2,433만원이며, 동 기간 평균 가구소득은 4,187만원, 가구 자산은 약 1억 6천만원, 한달 평균 생활비는 291만원이며, 이들이 생각하는 좋은 일자리의 임금 수준은 월 311만원 수준인 것으로 나타났다. 또한 정규직 근로자의 비율은 46%, 공공/민간/사업체/학교의 직 업교육훈련에 참여한 장애인들의 비율은 5%, 고용형태에 따른 취업 인식은 2.57점(5점 만점), 하고 있는 일에 대한 만족도는 3.66점(5점 만점)이었으며, 가구의 경제적 어려움에 대한 인식은 2.05점 (5점 만점)인 것으로 나타났다.

또한 본 연구는 <표 6>과 같이 고용유지 집단과 미유지 집단 간에 랜덤 포레스트를 통해 도출된 주요 변수들의 평균 차이를 검증함으로써 해당 변수들의 종속변수에 대한 영향력을 탐색적으로 살 펴보았다. 이에 따르면 랜덤 포레스트를 통해 도출된 10개 설명 변수 중 ‘취업인식’과 ‘하고 있는 일에 대한 만족도’를 제외한 8개 변수에서 고용유지 집단과 미유지 집단 간에 통계적으로 유의한 평균 차이가 존재함을 확인할 수 있다. 즉, 근로 미유지 집단이 유지 집단 보다 통계적으로 유의하 게 낮은 수준의 근로소득을 가지거나, 가구의 경제적 어려움도 통계적으로 유의하게 높게 느끼는 등 랜덤 포레스트 분석을 통하여 장애인 고용유지에 영향을 미치는 변인들은 실제 집단 간 차이를 유발하고 있음을 확인할 수 있고, 이는 나아가 이러한 변수들의 고용유지 예측력이 일정 부분 확보 되고 있음을 의미한다.

구분 근로 미유지 근로 유지 평균 차이

근로소득 1,681.142 2,885.203 -1,204.06***

정규근로자여부 0.546 0.428 0.118***

좋은일자리의임금수준 275.657 328.373 -52.716***

가구소득총계 3,604.795 4,538.291 -933.496***

취업인식 2.585 2.569 0.016

한달평균생활비 253.194 313.825 -60.631***

가구자산현황 13,173.82 17,772.95 -4.599.13***

공공민간사업체학교직업교육훈련참여 0.095 0.021 0.074***

하고있는일에대한만족도 3.613 3.675 -0.062

가구경제적어려움 2.161 1.988 0.173***

*** p < .001

<표 6> 고용유지 집단과 미유지 집단 간 설명변수 평균 차이

(16)

한편 본 연구는 장애인의 고용유지를 예측하는 랜덤 포레스트 분석 결과 도출된 주요 설명 변수 들을 활용하여 로지스틱 회귀분석을 실시함으로써 다른 예측 변수들의 영향력을 통제한 상태에서 각 개별 변수들의 실질적인 고용유지 예측력을 살펴보고자 하였으며, 이에 따른 분석 결과는 <표 7>과 같다.

회귀계수 (표준오차) Odds ratio

ln_근로소득 0.126 (0.120) 1.135

정규근로자여부 -0.249 (0.157) 0.779

ln_좋은일자리임금 0.484** (0.205) 1.622

ln_가구소득 -0.266 (0.166) 0.766

취업인식 -0.142 (0.089) 0.867

ln_한달생활비 0.235 (0.204) 1.265

ln_가구자산 0.163** (0.066) 1.177

공공민간사업체학교직업교육훈련참여 -1.550*** (0.318) 0.212

하고있는일에대한만족도 0.025 (0.107) 1.026

가구경제적어려움 0.032 (0.091) 1.033

표본수 1,151

LR  68.13

** p < .01, *** p < .001

<표 7> 장애인의 고용유지에 대한 로지스틱회귀분석 결과

<표 7>에 따르면 로지스틱 회귀분석에 포함된 10개의 예측 변수 중 다른 변수들의 영향력을 통 제한 상태에서도 장애인의 고용유지에 통계적으로 유의한 영향력을 미치는 것으로 나타난 변수는 총 3개(좋은 일자리의 임금 수준, 가구 자산, 공공ㆍ민간ㆍ사업체ㆍ학교의 직업교육훈련 참여 여부) 인 것으로 나타났다. 즉, 랜덤 포레스트 분석 결과 장애근로자의 고용유지를 효과적으로 예측하는 것으로 나타난 상위 10개의 변수 중 변수 간의 다중공선성 및 선형성을 가정한 로지스틱 회귀분석 에서도 여전히 통계적으로 유의한 결과를 보인 변수는 ‘좋은 일자리의 임금 수준에 대한 인식’과

‘가구 자산’, ‘직업교육훈련 참여 여부’임을 알 수 있다. 특히, 장애근로자가 좋은 일자리로 인식하 는 임금 수준이 높고, 가구 자산이 많을수록 이들의 고용유지율이 높은 것으로 나타나 경제적으로 안정적인 장애인들이 그렇지 못한 장애인들에 비해 고용을 유지하려는 경향을 보임을 알 수 있다.

이에 반해 공공ㆍ민간ㆍ사업체ㆍ학교의 직업교육훈련에 참여한 장애인들은 그렇지 않은 장애근로자 에 비해 고용유지율이 낮게 나타나 직업교육훈련을 통해 습득한 지식, 기술 등이 장애인들의 보다

(17)

나은 일자리로의 직업 탐색과 이동을 가능케 하는 요인으로 기능할 수 있음을 추정해볼 수 있다.

Ⅴ. 결론 및 제언

본 연구는 장애근로자의 고용유지를 예측하는 요인을 확인하기 위해 장애인고용패널조사 2차 웨 이브의 4차년도 자료 중 장애인 1,763명의 응답결과를 활용하여 장애근로자의 고용유지 여부를 종 속변수로 설정하고 이를 예측하는 설명변수들을 탐색해보았다. 그리고 그 분석결과에 기반하여 로 짓모형을 활용함으로써 기타 변수들의 영향력을 통제한 상태에서 개별 변수들의 실질적인 고용유지 예측력을 보다 실증적으로 살펴보고자 하였다.

구체적으로는, 랜덤 포레스트 기법을 활용하여 장애근로자의 고용유지를 효과적으로 예측하는 요 인을 탐색적으로 도출하는데 일차적인 목적을 두고, 132개 설명변수를 활용하여 장애인 고용유지 예측 모형을 도출한 후, 장애인 고용유지에 영향을 미치는 설명변수들의 상대적 중요도를 확인하여 종속변수에 대한 예측력이 높은 상위 10개의 설명변수를 도출하였다. 그리고 해당 설명변수들을 활 용하여 장애근로자 고용유지를 종속변수로 하는 로지스틱 회귀분석을 실시함으로써 다른 예측 변수 들의 영향력을 통제한 상태에서 장애인의 고용유지에 영향을 미치는 변수들을 확인하였다. 주요 분 석결과를 요약하면 다음과 같다.

첫째, 랜덤 포레스트 기법을 활용하여 장애근로자의 고용유지에 영향을 미치는 예측변수들 중 중 요도가 높은 변수들을 확인한 결과, ‘근로소득’, ‘정규근로자 여부’, ‘좋은 일자리의 임금 수준에 대 한 인식’, ‘가구소득 총계’, ‘취업 인식(상대적으로 열악한 일자리 형태에 대한 취업 의향)’, ‘한 달 평균 생활비’, ‘가구 자산 현황’, ‘공공ㆍ민간ㆍ사업체ㆍ학교의 직업교육훈련 참여’, ‘하고 있는 일에 대한 만족도’, ‘가구의 경제적 어려움’의 순으로 예측력이 높은 것으로 나타났다. 고용유지를 예측하 는 가장 주요한 변수들은 근로소득과 정규근로자 여부인데, 이는 다양한 선행연구 결과와도 일치하 는 결과이다(남정휘, 2014, 2017; 박주영, 2017; 전영환, 2020). 또한 하고 있는 일에 대한 만족도 의 역시 고용유지를 예측하는 변수로 나타나 남정휘(2017), 박주영(2017), 전영환(2020) 등의 연구 결과와 일치한다.

일반적으로 직장 내에서 발전가능성, 근무조건, 관계, 장애인식 및 이해도와 함께 고용안전성과 보상은 장애인 고용의 질을 평가하는 지표로 활용된다(이운식, 2010; 오소윤, 2014). 또한 변경희 (2010)은 개인차원의 고용의 질 지표로 임금, 직무만족도, 직업위세, 직업적 배려를 제시하면서 직 무만족도를 고용의 질을 구성하는 하위 요인으로 포함시켰다. 앞선 결과에서 도출된 고용유지에 영 향을 미치는 요인들은 모두 고용의 질과 연관된다. 특히 Adam Smith에 따르면 임금은 좋은 일자 리를 판별하는 단일지표로서, 금전적 보상은 피고용인들로 하여금 일을 하게끔 만드는 중요한 동기 이며(Blyton & Jenkins, 2007), 고용의 질 지표 관련 모든 연구들은 금전적 보상을 포함하였다(오

(18)

소윤, 2014 재인용). 나아가 금전적 보상은 조직몰입(정연앙, 손일상, 최재환, 2003), 직무만족도(심 영국, 류재숙, 2006)등에 영향을 미친다. 즉, 장애인 고용의 유지는 고용의 질과 직접적으로 연결되 기 때문에, 고용이 유지되도록 하기 위해서는 고용의 질을 높일 필요가 있음을 의미한다.

둘째, 장애인의 고용유지에 대한 예측력이 높은 것으로 나타난 변수들을 설명변수로 장애인의 고 용유지를 종속변수로 하는 로지스틱 회귀분석 결과 ‘좋은 일자리의 임금 수준에 대한 인식’, ‘가구 자산 현황’, ‘공공ㆍ민간ㆍ사업체ㆍ학교의 직업교육훈련 참여’가 다른 변수들의 영향력을 통제한 상 태에서도 장애인의 고용 유지에 통계적으로 유의한 영향력을 미치는 것으로 나타났다. 이를 통해 볼 때 장애인들의 고용유지를 위해서는 장애인들의 좋은 일자리에 대한 인식 개선은 물론, 보다 안 정적인 경제적 여건 조성, 현재 제공 중인 직업교육훈련 프로그램에 대한 검토 및 개선 과정을 통 하여 장애인들이 고용유지율을 높이기 위한 정책 대안을 마련할 필요가 있음을 알 수 있다.

좋은 일자리 임금에 대한 인식이나, 가구자산은 임금과 간접적으로 고용의 질 혹은 임금 변수와 연계될 수 있다고 볼 수 있다. 따라서 본 연구 결과만으로 설명하기는 부족함이 있으나, 장애인 근 로자들의 높은 임금에 대한 욕구를 충족시킬 필요성과 함께 선행연구들에서도 제안하고 있는 장애 인 근로자들의 기초수급자 수급권 유지를 통한 근로유인과 중소기업 장애인근로자의 임금소득 향상 을 위한 정책적 노력이 고용유지에 긍정적인 영향을 미칠 것으로 보인다.

반면 공공ㆍ민간ㆍ사업체ㆍ학교의 직업교육훈련 참여의 경우에는 고용유지에 부정적인 영향을 미치는 것으로 나타났다. 공교롭게도 본 패널 데이터는 공공ㆍ민간ㆍ사업체ㆍ학교의 직업교육훈련 에 참여하는 것은 취업 및 취업유지를 위한 활동이라고 구분하고 있음에도 불구하고, 이러한 결과 가 나온 이유에 대해서는 추가적인 연구를 통하여 분석할 필요가 있다. 단순히 직업교육훈련에 풀 타임으로 참여하기 위하여 고용이 중단되었는지, 교육의 결과로 좀 더 좋은 직장으로의 이직을 위 하여 중단되었는지, 혹은 훈련으로 인하여 중단된 고용 이후 재취업이 오히려 어려워졌는지 등 고 용유지에 대한 직업교육의 긍정적이거나 부정적인 영향을 알 수 없기 때문이다. 일반적으로 장애인 고용의 질 지표 중 발전가능성 영역의 교육훈련의 기회는 매우 중요한 하위지표이기 때문에(오소 윤, 2014; 이운식, 2010) 이러한 의미에서 보면 직업교육훈련을 받는 경우 고용이 단절된다는 결과 는 그리 걱정할 부분이 아닐 수는 있으나, 추가적인 연구를 통하여 실제 이렇게 긍정적인 영향을 미치는 것인지는 분석될 필요가 있다.

이상과 같은 분석 결과는 이제는 장애인 근로자의 취업 여부에만 고민할 것이 아니라, 장애인의 고용유지를 높이기 위한 노력 즉, 고용의 질을 높이기 위한 전반적인 노력이 필요함을 의미한다.

뿐만 아니라, 장애인의 취업 및 고용이 유지되고 있는 일자리의 종류가 너무 제한적으로 제안되고 있는지는 아닌지 고민할 필요가 있지는 아닌지 고민할 필요가 있다. 비장애인의 경우에도 취업을 위한 절박한 마인드가 현재에는 필요하다 할 수 있겠지만 이렇게 고용의 질이 낮은 혹은 일반적으로 피하고 싶은 일자리만 제공되고 있는 것은 아닌지에 대한 현실적인 검토가 필요할 것으로 보인다.

또한 앞서 언급한 바와 마찬가지로, 고용된 장애인 근로자들의 공공ㆍ민간ㆍ사업체ㆍ학교의 직

(19)

업교육훈련 참여의 결과가 어떠한지에 대한 연구 혹은 추적이 필요하다. 일반적으로 직업교육훈련 은 기본적으로 더 좋은 일자리로의 이직을 기대하고 수행된다. 그러나 본 연구 결과에 따르면 직업 교육훈련은 고용유지에 부정적인 영향을 미친다. 즉 직업교육훈련을 통하여 실제 더 좋은 일자리로 의 재취업이 보장되었는지 혹은 훈련 이후에도 동일 일자리에 유지되었거나 혹은 재취업에 어려움 을 겪었는지를 추가적으로 조사해보지 않는 이상 이러한 교육이 긍정적인 결과를 도출할 것이라는 기대는 불가능하다. 따라서 실제로 고용 중 직업교육훈련에 대한 효과성에 대한 추가적인 연구 혹 은 훈련 이후 고용여부에 대한 추적 연구만이 직업교육훈련의 중요성을 뒷받침할 수 있을 것으로 보인다.

마지막으로 본 연구는 장애인 고용유지와 관련된 변인들을 효과적으로 예측하기 위하여 머신러 닝 기법과 로짓 모형을 함께 사용하였다. 많은 선행연구는 주로 회귀분석에 근거하여 인과관계를 추론하는데 그 목적을 두어 분석되었으며, 그 결과 어떤 변인들이 장애인의 고용에 영향을 미치는 지에 대하여 논의되었다. 그러나 본 연구에서는 선행연구와 같은 인과성 추론이 아닌, 종속변수 값 에 대한 예측, 즉 장애인의 고용유지를 예측할 수 있는 새로운 설명변수들을 찾는데 장점이 있는 머신러닝 기법을 활용함으로써, 기존에는 대두되지 못했던 새로운 설명변수를 발굴하는데 그 의의 를 찾을 수 있다. 나아가 분석 결과 선행연구에서 장애인 고용유지에 영향을 미친다고 밝혔던 학력 이나 성별, 장애유형 등의 인구학적 특성이나 학력, 자격증 보유 유무 등의 인적자본적 특성이 아 닌, 정규직 여부나 일자리 만족도, 높은 임금 수준에 대한 인식, 좋은 일자리에 대한 인식 등의 요 인 등이 중요한 예측변인으로 대두된 것은 장애인 고용 지원 정책 중에서도 장애인 일자리의 질 향상을 위한 직접적인 노력과 정서적 지원이 큰 영향을 미칠 것이라는 것을 의미하기도 한다. 이러 한 기존과 다른 변수들의 도출에 따라 장애인 고용유지 뿐 아니라 고용의 질 향상을 위한 다양한 정책적 제언 및 효과 검증 등에서 머신 러닝과 같은 빅데이터 분석의 필요성은 강조되고, 적용 가 능성은 더 높아질 것으로 보인다.

참고문헌

김경선, 김영식, 정소라 (2014). 경향점수 매칭과 재발사건생존분석을 활용한 장애인 고용 및 직업 재활 서비스의 직업유지 효과 분석. 장애와 고용, 24(1), 83-109.

김미연 (2019). 장애인 임금근로자의 실직위험률에 미치는 영향요인 분석: 장애인고용패널 데이터 를 중심으로. 한국케어매니지먼트연구, 31, 155-178.

김영식 (2020). 청년층의 대학 진학 및 취업 관련 지역 이동 예측 요인 탐색. 교육재정경제연구 29(4), 129~149.

김영식, 문찬주, 박환보 (2020). 고교생의 교사 인식 관련 예측 요인 탐색. 한국교원교육연구,

(20)

37(1), 465-494.

김영표 (2018). 일본의 특수교육체제에 대한 비교교육학적 접근을 통한 국내 특수교육의 발전 방향 탐색. 예술인문사회융합 멀티미디어 논문지, 8(5), 749-758.

김종미, 김호진, 고제훈, 김성천, 최종철 (2014). 2014년 장애인 경제활동 실태조사. 한국장애인고 용공단 고용개발원

김환희, 이영선 (2012). 장애인의 직업유지요인 탐색. 장애와 고용, 22(3), 183-210.

나운환, 조성열, 김동범, 전미리, 박철현, 남정휘 (2002). 장애인 고용 및 승진 실태조사: 노동시장 차별을 중심으로. 국가인권위원회.

남정휘 (2014). 취업 장애인의 직업유지 가능성에 영향을 미치는 요인에 관한 연구. 재활복지, 18(2), 77-100.

남정휘 (2017). 고령 장애인의 고용유지 가능성에 영향을 미치는 요인에 관한 연구. 장애와 고용, 27(3), 33-56.

박주영 (2017). 발달장애인근로자 고용현황과 직업유지 요인. 발달장애연구, 21(1) 51-68.

변경희 (2010). 임근 근로장애인의 ‘고용의 질’ 개념 및 결정요인. 장애인과 고용, 67, 189-212.

민자영, 김영표 (2020). 직업체험 인턴쉽 프로그램이 발달장애인의 적응행동 및 직업준비에 미치는 효과. 특수교육논총, 36(3), 99-122.

손희경 (2016). 독일과 한국의 장애인 근로자 고용유지를 위한 제도 비교 연구. 이화여자대학교 석 사학위논문.

심영국, 류재숙 (2006). 호텔의 인사정책 공정성과 임금만족도가 직무만족 및 조직몰입에 미치는 영향, 호텔관광연구, 23, 15-34.

오미애, 최현수, 김수현, 장준혁, 진재현, 천미경 (2017). 기계학습 기반 사회보장 빅데이터 분석 및 예측모형 연구. 한국보건사회연구원.

오소윤 (2014). 장애인 고용의 질에 미치는 영향요인: 여성장애인을 중심으로. 대구대학교 재활과학 대학원 석사학위논문

유진은 (2015). 랜덤 포레스트: 의사결정나무의 대안으로서의 데이터 마이닝 기법. 교육평가연구 28(2), 427-448.

이금진 (2000). 정신장애인의 직업유지기간에 영향을 미치는 요인에 관한 연구. 이화여자대학교 대 학원 석사학위논문.

염희영, 정보인, 정민예, 유은영 (2006). 지체장애 근로자의 직업유지에 영향을 주는 요인. 직업재활 연구, 16(1), 27-44.

이기정, 김영식 (2019). 랜덤 포레스트를 활용한 장애인 취업 예측 모형: 취업 여부 및 정규직 취 업을 중심으로. 장애와 고용 29(3), 145-165.

이운식 (2010). 장애인 고용의 질 척도개발에 관한 연구. 대구대학교 대학원 박사학위논문.

(21)

이재섭, 최민석, 감소영, 김소영, 김지연 (2018). 전국장애학생직업기능경진대회 발달장애영역에 대 한 전문가들의 경험과 인식. 특수교육논총, 34(2), 187-209.

이채식 (2006). 정신지체인의 직업유지에 미치는 요인에 관한 연구 - 취업알선 서비스 경험자를 중심 으로. 박사학위논문, 경기대학교

전영환 (2019). 비례헤저드 회귀분석 모형을 이용한 장애인근로자의 고용유지에 미치는 영향 요인 분석. 재활복지, 24(2), 63-83.

전영환 (2020). 비례헤저드 회귀분석 모형을 이용한 장애인근로자의 고용유지에 미치는 영향 요인 분석. 재활복지, 24(2), 63-83.

정다찬 (2019). 장애인 근로자의 정당한 편의제공이 직무만족과 고용유지에 미치는 영향. 대구대학 교 대학원 석사학위논문

정다찬, 도유미, 나운환 (2019). 장애인 근로자의 정당한 편의제공이 직무만족과 고용유지에 미치는 영향. 재활복지공학회논문지, 13(4), 287-296.

정연앙, 손일상, 최재환 (2003). 임금만족이 조직몰입에 미치는 영향에 관한 연구. 산업관계연구, 13(1), 87-106.

최경수 (2018). 초등학교 장애학생 대상 진로직업교육 관련 연구동향. 특수교육논총, 34(2), 25-42.

최필선, 민인식 (2018). 머신러닝 기법을 이용한 대졸자 취업예측 모형. 직업능력개발연구, 21(1), 31-54.

한국장애인개발원 (2014). 직무지원인 지원사업 직무지원서비스 매뉴얼. 경기: 한국장애인개발원 한국장애인고용공단 고용개발원 (2017). OECD 주요 국가의 장애인 고용 정책 및 현황 비교 연구.

경기: 한국장애인고용공단 고용개발원

한국장애인고용공단 고용개발원 (2019a). 한 눈에 보는 2019 장애인 통계. 경기: 한국장애인고용 공단 고용개발원.

한국장애인고용공단 고용개발원 (2019b). 중증장애인 취업자의 고용유지에 미치는 영향 요인 연구.

경기: 한국장애인고용공단 고용개발원.

홍기혜 (2020). 랜덤포레스트 머신러닝 알고리즘 기반 남․여 청소년의 자살생각 예측 및 분석. 한 국사회복지학, 72(3), 157-180.

e-나라지표[웹사이트].(2020.3.31.). URL: http://www.index.go.kr/main.do?cate=6 Breiman. L. (2001). Random forests. Machine Learning, 45(1), 5–32.

Burchell, B. (2002). The Prevalence and Redistribution of Job Insecurity and Work Intensification. In B. Burchell, D. Ladipo, & F. Wilkinson (Eds.), Job Insecurity and Work Intensification (pp. 61-76). London: Routledge.

Blyton, P & Jenkins, J. (2007). Work. CA: SAGE Publication Inc.

Dangeti, P. (2017,) Statistics for Machine Learning. Birmingham, UK: Packt Publishing Ltd.

(22)

Foss, G. , & Peterson, S. L. (1981). Social-interpersonal skills relevant to job tenure for mentally retarded adults. Mental Retardation, 19, 103-106.

Géron, A., (2017). Hands-On Machine Learning with Scikit-Learn and Tensor Flow.

CA: O'Reilly Media.

Hastie, T., Tibshirani, R., & Friedman, J. H. (2009). The elements of statistical learning: Data mining, inference, and prediction (2nd ed.). New York: Springer.

Jongbloed, L. (2010). Job Retention for People with Disabilities. A Report for the Canadian Disability Policy Alliance. Accessed May 12, 2021.

http://69.89.31.83/~disabio5/wp-content/uploads/2012/11/Job_Retention_Review_Sept_2 010_REVISED.pdf

Sandri, M., P. Zoccolotto. (2010). Analysis and correction of bias in total decrease in node impurity measures for tree-based algorithms. Statistics and Computing, 20(4), 393-407.

(23)

* This paper was prepared by re-analyzing the contents of the 12th Conference on Panel Survey of Employment for the Disabled.

** First author

*** Corresponding author (sandfom3@kyungnam.ac.kr) Abstract

Predictive Model for the Employment Retention of Persons with Disabilities

*

Lee, Kijyung**(Daegu National University of Education) Kim, Youngsik***(Kyungnam University)

Purpose: The purpose of this study was to explore variables affecting employment retention of person with disabilities applying the machine learning method. Method: This study utilized the random forest method, one of the most representative machine learning approach. After controlling the other variables, those that influence the employment of the person with disabilities were identified using logistic regression analysis. Result: The random forest analysis the predictive power of the variables that predicted employment maintenance of person with disabilities were determined, and earned income had the highest predictive power, followed by regular/irregular job status, awareness of wage level, total household income, and employment recognition. Further, the logistic regression analysis confirmed that awareness of wage level, household assets, and participation in vocational education and training had a statistically significant effect on the maintenance of employment for person with disabilities. Conclusion: This study findings, based on new approach using machine learning method, provide useful policy implications for improving the employment status and quality of employment of persons with disabilities.

Key words : Employment Retention of Persons with Disabilities, Machine Learning, Random Forest, PSED

게재 신청일 : 2021. 04. 22 수정 제출일 : 2021. 05. 13 게재 확정일 : 2021. 05. 25

참조

관련 문서

1 John Owen, Justification by Faith Alone, in The Works of John Owen, ed. John Bolt, trans. Scott Clark, &#34;Do This and Live: Christ's Active Obedience as the

As a result of the simple analysis, we found that variables related to drinking problems of college students were religion, family, residence, parents'

The number of the sample apartment houses is 949, the sale price was determined as the subordinate variables and the characteristics of structure,

Sex, parents' educational background, and the state of employment of mother were investigated as demographical variables to determine if there were

We analyzed the employment effects of public pre-employment training and the determinants of employment quality by the trainees' individual properties such as

Through an empirical analysis of employability of persons with cerebral palsy this study aims to examine the factors affecting their employability and

웹 표준을 지원하는 플랫폼에서 큰 수정없이 실행 가능함 패키징을 통해 다양한 기기를 위한 앱을 작성할 수 있음 네이티브 앱과

_____ culture appears to be attractive (도시의) to the