• 검색 결과가 없습니다.

제2절 연구의 내용 및 방법

2. 연구 방법

이 연구는 통계청이 제공하는 가계동향조사 및 가계금융·복지조사 마 이크로데이터를 분석한다. 가계동향조사와 가계금융·복지조사 조사데이 터 비교에는 2011~2016년 가계동향조사와 2012~2017년(조사연도) 가 계금융·복지조사를 활용하고, 가계금융·복지조사 조사데이터와 행정보 완데이터 비교에는 2017년(조사연도) 가계금융·복지조사를 활용한다(통

제1장 서 론 23

계청, 각 연도, 가계동향조사 2011~2016년 원자료; 통계청, 각 연도, 가 계금융·복지조사 2012~2017년 원자료; 통계청, 2017c).

별도의 언급이 없는 한 이 연구는 기본적으로 통계청의 공식 소득분배 지표 분석 방법(통계청, 2019d)을 준용하여 소득 분포를 분석한다. 즉, 가구소득을 가구원 수의 제곱근으로 나누어 균등화한 후 개인 단위로 분 석한다(통계청, 2019d, pp. 3-4).5) 예를 들어 이 연구에서 분석하는 빈 곤율은 균등화한 가구소득이 빈곤선보다 작은 가구에 속한 개인의 비율 을 의미한다. 소득분배지표로는 분위별 소득경계값, 분위별 소득점유율, 5분위배율, 지니계수, 빈곤율, 빈곤갭비율 등을 활용한다. 분위별 소득점 유율은 전체 인구의 소득합에서 각 분위에 속한 인구의 소득합이 차지하 는 비율을 의미한다(통계청, 2019d, p. 7). 5분위배율은 소득 분포를 5분 위로 구분한 후 5분위(상위 20%)의 소득점유율을 1분위(하위 20%)의 소 득점유율로 나눈 값이다(통계청, 2019d, p. 7). 지니계수는 0~1의 값을 갖는 분배지표로, 값이 클수록 불평등함을 의미한다(통계청, 2019d, p.

5). 빈곤율은 소득이 빈곤선 미만인 인구의 비율로, 빈곤갭비율은 빈곤선 과 빈곤층 평균 소득의 차이를 빈곤선으로 나눈 값으로 정의한다(통계청, 2019d, pp. 8-10).6) 빈곤선은 가처분소득 중위값의 50%로 설정한다(통 계청, 2019d, pp. 8-9). 통계청은 가계동향조사와 가계금융·복지조사 데이터에 별도의 개인가중치를 포함하여 제공하지 않으므로, 이 연구는 가구가중치를 개인에게 할당하여 개인가중치로 사용한다.

5) 소득 분포를 분석할 때는 다음과 같이 두 가지 측면에서 가구 단위 또는 개인 단위의 선 택이 필요하다. 첫째, 측정 단위의 측면에서, 개인소득(예를 들어 개인의 근로소득)과 가 구소득(예를 들어 가구 내 모든 가구원의 개인근로소득의 합)의 선택이 존재한다. 둘째, 분석 단위의 측면에서, 개인 단위 분석(예를 들어 5만 명의 평균 소득)과 가구 단위 분석 (예를 들어 2만 가구의 평균 소득)의 선택이 존재한다.

6) 통계청은 소득이 빈곤선 이하일 때 빈곤한 것으로 정의하지만, 이 연구에서는 소득이 빈 곤선 미만일 때 빈곤한 것으로 정의하였다. 이 연구가 정의한 빈곤갭비율은 통계청의 “평 균 빈곤갭”(통계청, 2019d, p. 10)에 해당한다.

24 소득조사 마이크로데이터 비교 분석: <가계동향조사>와 <가계금융·복지조사>를 중심으로

제1장 서 론 25

다음으로는 가계동향조사와 가계금융·복지조사의 조사데이터 간 가구 및 개인 특성 차이 및 소득원천 분포 차이와 가처분소득 분포 차이의 관계 를 좀 더 자세하게 살펴본다. 전통적으로 소득 불평등을 하위 집단으로 분 해하거나(decomposition by subgroup) 소득원천별로 분해하는 (decomposition by income source) 다양한 방법이 개발되어 있지만 (대표적인 예로 Mookherjee & Shorrocks, 1982; Shorrocks, 1982;

Lerman & Yitzhaki, 1985), 이 연구의 목적이 본격적인 소득 불평등 분 해는 아니기 때문에 다음과 같이 비교적 간단한 방법을 활용하여 분석을 실시한다. 첫째, DFL 방법(DiNardo, Fortin, & Lemieux, 1996)으로 데이터에 새로운 가중치를 부여하여 두 데이터의 가구 및 개인 특성을 유 사하게 조정한 후 소득 분포가 어떻게 변화하는지를 살펴본다. 예를 들어 가계동향조사 데이터를 재가중하여(reweight) 가구 규모, 성, 연령, 교육 수준, 경제활동 상태 등의 분포를 가계금융·복지조사와 유사하게 조정한 후,8) 이처럼 가구 및 개인 특성이 조정된 가상적인(counterfactual) 가계 동향조사 소득 분포를 실제 가계금융·복지조사 소득 분포와 비교한다. 만 약 재가중 후 가상적인 가계동향조사 소득 분포가 실제 가계금융·복지조 사 소득 분포와 유사하게 나타난다면, 데이터 간 가구 및 개인 특성 차이 가 소득 분포 차이를 발생시킨 주된 요인이라는 결론을 내릴 수 있다. 반 면 재가중 후에도 데이터 간 소득 분포 차이가 크게 나타난다면, 가구 및 개인 특성에 따른 하위 집단 내에서 데이터 간 소득 분포 차이가 크게 존 재한다는 사실을 알 수 있다. 둘째, 각 데이터에 대해 근로소득에서부터 출발하여 단계적·누적적으로 사업소득, 재산소득, 사적이전소득, 사적이 전지출(-), 공적이전소득, 공적이전지출(-)을 합산한 소득의 분포를 분석 한 후 그 결과를 비교한다. 예를 들어 가계금융·복지조사보다 가계동향조

8) 구체적인 재가중 절차는 제3장에서 분석 결과와 함께 서술한다.

26 소득조사 마이크로데이터 비교 분석: <가계동향조사>와 <가계금융·복지조사>를 중심으로

사가 사적이전소득을 크게 포착한다면(이원진, 구인회, 2015, p. 42), 사 적이전소득 추가에 따라 불평등 및 빈곤이 감소하는 효과가 가계금융·복 지조사보다 가계동향조사에서 더 크게 나타날 가능성이 있다.

마지막으로 개별 소득원천 분포 차이를 중심으로 가계금융·복지조사 조사데이터와 행정보완데이터 간 소득 분포 차이를 분석한다. 우선 두 데 이터 간 소득원천 분포 차이를 기술적으로 분석한 후 다음과 같은 시뮬레 이션을 통해 개별 소득원천의 행정자료 보완으로 인한 가처분소득 분포 의 변화를 살펴본다. 통계청이 제공하는 2017년(조사연도) 가계금융·복 지조사 조사데이터와 행정보완데이터는 동일한 가구ID/개인ID 변수를 공유하기 때문에 가구 또는 개인 단위에서 조사데이터의 각 소득원천 변 수값을 개별적으로 행정보완데이터의 해당 소득원천 변수값으로 대체하 는 시뮬레이션이 가능하다. 예를 들어 조사데이터의 근로소득을 행정보 완데이터의 근로소득으로 대체한 후 가처분소득 분포의 변화를 살펴보 면, 근로소득의 행정자료 보완으로 인해 가처분소득 불평등이 얼마나 증 가하는지를 확인할 수 있다.9)

9) 이 보고서의 표와 서술에서는 수치의 합/차이/비율 등을 반올림하지 않은 상태에서 계산 한 후 반올림하여 보고하였기 때문에, 반올림하여 보고한 개별 수치의 합/차이/비율 등과 일치하지 않을 수 있다.

소득조사 마이크로데이터의