• 검색 결과가 없습니다.

제2절 연구 방법

1. 데이터 4)

본 연구는 마이크로 데이터(micro data)와 매크로 데이터(macro data)를 사용하여 분석을 한다. 먼저 결혼이민자 및 그 자녀의 일반적인 현황을 정부 부처가 생산하는 여러 매크로 데이터를 이용하여 분석한다.

분석에 사용되는 데이터는 「지방자치단체 외국인주민현황 통계」, 「출입 국·외국인정책 통계월보」, 「혼인·이혼 통계」, 「다문화가족 지원포털 다 누리 통계자료」, 「다문화 가정 학생 현황」, 「다문화 학생 통계 현황」이다.

이러한 데이터들을 통하여 외국인과 결혼이민자가 우리나라에 얼마나 살 고 있는지, 비율은 어느 정도 인지에 대한 통계를 정리할 수 있고, 그 자 녀들의 연령대 및 외국인 부모님 출신국별 현황, 그리고 학교급별 학생 현황을 알 수 있을 것으로 기대된다.

결혼이민자 및 그 자녀들의 일반적인 현황을 살펴본 후에는 마이크로 데이터를 사용하여 결혼이민자 및 그 자녀의 인구자질과 한국여성 및 그 자녀의 인구자질을 비교한다. 인구자질 비교에서 마이크로 데이터를 사 용한 이유는, 다시 말하면 조사 데이터(survey data)를 사용한 이유는 본 연구에서 살펴보려 하는 지표를 가능한 동일하게 맞추기 위함이다. 즉, 본 분석에 주로 사용되는 『2012년 전국 다문화가족 실태조사』(이하, 다

4) 본 절에서 서술하는 『2012년 전국 다문화가족 실태조사』의 상세한 내용은 전기택 외 (2013)를 참조하였고, 샘플 추출 및 조사 전반에 관한 자세한 내용은 상기 보고서를 참조.

문화 조사)와 비교 가능한 변수를 가공할 수 있는 마이크로 데이터를 찾 아 인구자질에 대하여 비교분석하였다.

그러나 각 조사 데이터의 한계점으로 인하여 비교 가능한 지표를 만들 기 위하여 여러 데이터를 사용하였다. 인구자질 비교에 사용된 데이터는

「2012년 여성가족패널조사」, 「한국복지패널조사」, 「한국노동패널조사」,

「청년패널조사」이다.

분석에 주로 사용되는 데이터는 앞서 언급한 것처럼 다문화조사의 원 자료(raw data)를 사용한다. 다문화 조사는 우리나라의 다문화 가정에 대한 전반적인 조사를 하는 데이터일 뿐만 아니라 전국을 대표하고 있는 유일한 데이터이다. 따라서 이 데이터를 사용한 연구는 모집단의 특성에 가장 가까운 결과를 도출할 수 있는 최대 장점이 있다.

이 조사는 2012년 7월 10일~2012년 7월 31일에 걸쳐서 조사가 되었 고, 조사대상은 4부류로 나눌 수 있는데 전국의 다문화가족 15,341가구, 결혼이민자·귀화자 총 15,001명(여성 12,531명, 남성 2,470명), 결혼이 민자의 배우자 총 13,859명(여성 2,278명, 남성 11,581명), 만 9~24세의 결혼이민자 자녀 총 4,775명(여성 2,271명, 남성 2,504명)으로 구성된다.

주요 조사내용을 살펴보면, 가구 구성표에는 가구 구성원, 자녀 보살 핌, 월평균 소득 등 10개 항목이고, 결혼이민자·귀화자 등은 혼인상태, 가족관계 만족도, 경제활동 등 112개 항목, 배우자는 혼인상태, 가족관계 만족도, 경제활동 등 53개 항목, 만 9~24세 자녀는 한국어 사용, 학교 폭 력 경험 등 71개 항목이 조사되었다.

이 조사 결과, 전국에는 다문화가족 266,547가구, 결혼이민자·귀화자 등 283,224명(여성 226,084명, 남성 58,140명), 배우자 234,505명(여 성 42,337명, 남성 192,168명), 만 9~24세 자녀 66,536명(여성 32,655명, 남성 33,882명)이 우리나라에 살고 있는 것으로 추정되었다.

다문화와 관련된 많은 실증연구들이 소규모의 독자적인 데이터로 분석 한 것이 많은데, 이러한 연구는 연구자의 관심분야에 대하여 그 어떤 데 이터보다 구체적인 정보를 확보할 수 있고, 그 특성에 대한 심층적인 분 석을 할 수 있다는 점이 장점으로 작용하지만, 모집단을 대표할 수 없다 는 점에서 결정적인 약점을 가지고 있다. 또한, 결혼이민자와 관련된 대 부분의 연구의 대상은 센터에 방문하는 이들을 대상으로 하는 경우가 많 은데, 센터에 방문하는 결혼이민자들의 경우 대부분 보통 이상의 생활수 준을 유지하고 있는 경우가 많기 때문에 그런 점에서 모집단과 매우 큰 편향(bias)을 가질 가능성이 크다. 이해 비해 본 연구에서는 전국을 대표 하고 일반화 시킬 수 있는 전국 규모의 데이터인 다문화 조사를 사용하여 분석을 한다.

그리고 본 연구에서는 결혼이민자와 그 자녀와의 관계를 분석하기 위 하여 데이터를 통합하였다. 다문화 조사 데이터는 앞서 언급한 바와 같 이, 조사 대상이 4가지 집단으로 구분되어 있는 특징이 있다. 즉, 가구, 결 혼이민자, 그 배우자, 자녀의 정보가 떨어져 있기 때문에 이를 통합해야 만(merge) 결혼이민자와 그 자녀와의 관계 분석이 가능해진다. 이에 따 라 본 연구에서는 우선적으로 각 데이터의 가구 번호를 중심으로 데이터 를 통합하였다. 다시 말하면, 한 가구 내에 결혼이민자, 그 배우자, 자녀 가 존재하고 있는 데이터를 구축하였다고 말할 수 있다.

그러나 한 가구에 2명 이상의 자녀가 있는 경우가 존재하기 때문에 가 구 번호로 통합을 하였을 시에는 가구당 자녀 수 별로 데이터가 존재하게 된다. 즉, 자녀가 2명일 경우 결혼이민자와 그 배우자의 정보도 2개가 되 어 중복이 되는 것이다. 따라서 본 연구에서는 2개의 데이터 세트를 구축 하여 결혼이민자의 분석, 즉 취업확률, 소득, 생활만족도에서는 자녀가 제외된 데이터를 사용하고, 자녀에 대한 분석은 자녀 정보를 포함한 데이

터로 분석을 한다. 그러나 자녀의 정보가 중복되는 데이터로 추정할 경우 에는 표준 오차가 작아지는 경향이 있기 때문에 과대 추정(over- esti-mate)될 위험성이 존재한다. 따라서 표준 오차를 수정해야 할 필요성이 생기게 되는데, 본 연구에서는 이를 보정하기 위하여 Huber-White의 수정된 표준 오차로 강건한 추정량(robust estimator)을 계산하여 유의 성을 검토한다.

그리고 한국 여성 및 그 자녀의 인구자질과 결혼이민자 및 그 자녀의 인구자질을 비교하기 위하여 여러 마이크로 데이터를 사용하였다. 먼저 결혼이민자와 한국여성의 학력, 건강상태, 취업률, 소득 비교에는 『2012 년 여성가족패널조사』를 사용하였다. 여성가족패널조사는 2007년부터 조사가 이루어져 본 분석에 사용된 2012년 조사는 제 4회 차 조사가 된 다. 모집단의 대표성을 중시하기 위해서는 1회 차 조사를 사용하는 것이 바람직하지만, 같은 시기의 경향 분석하는 것을 중시하였기 때문에 2012 년 조사를 사용하였다5).

생활만족도의 경우는 여성가족패널조사에서 조사가 이루어지지 않았 기 때문에 다른 마이크로 데이터를 사용하였다. 분석에 사용된 데이터는

『한국복지패널조사』와 『한국노동패널』이다. 이 두 조사는 모두 같은 시 기인 2012년 데이터를 사용하였다. 자녀의 경우에는 『청년패널조사』를 사용하였고, 2007년 조사가 사용되었다. 자세한 설명은 제 3장에서 하도 록 한다.