• 검색 결과가 없습니다.

미국 PSID(Panel Study of Income Dynamics) 가. 표본설계 개요

제2절 국내외 패널조사 신규 표본가구 추가 사례

2. 미국 PSID(Panel Study of Income Dynamics) 가. 표본설계 개요

PSID의 표본설계의 목표는 초기 표본으로 추출가중치에 의해 미국의 전국 인구를 대표할 수 있도록 하는데 있다. 이와 더불어 성인표본과 같이 거주하던 아동이 성인 이 되면서 집을 떠나기 때문에 전국 인구의 구성상에 변화를 반영하기 위해 주기적으 로 표본을 재투입해야 한다. 1997년에 미국 전체 인구를 대표하기 위해 PSID 표본에 대해 두 가지 중요한 변화가 있었다. 첫째는 주요표본(core sample)의 감소와 두 번 째, 1968년 이후 재진입 가구와 그들의 성인 아동표본의 투입이다. 원 표본(original core sample)은 1996년 거의 8,500가구에서 1997년 6,168가구로 감소하였으며, 1997년과 1999년에 511가구가 표본으로 추가되었다. 따라서 이와 같이 새롭게 진 입한 표본을 고려한 전체 표본은 1999년에 6,434가구였으며, 2007년에는 약 8,400 가구로 증가하였다. 패널에 새롭게 진입한 표본 크기는 예산의 제약성에 영향을 주며 패널에 새롭게 진입한 표본을 중심으로 부차 그룹에 대한 분석을 위한 설계를 하지 않았기 때문에 중요하다 이러한 신규진입 표본의 주요 장점으로는 전체 표본의 전국 대표성을 유지할 수 있다는 것이다.

PSID 이민자 표본은 최근 미국으로 이주한 대표적인 표본을 추가함으로서 PSID 미국 가구의 표본을 갱신하도록 설계되었다. 부가 표본에 대한 이주표본의 적절성은 1968년 이후 미국으로 이주한 사람들로서 1968년에 원래의 PSID 표본을 선정할 당 시에 미국에 살고 있는 사람과 결혼하지 않은 사람이다. 이러한 최근의 이민자들은 1997년의 PSID 표본을 대표하지 못한다.

1990년 센서스로부터 1968년 이후 각각의 PSU에 거주하는 이민자 수를 얻기 위 해 군 단위에서 1990년 전국표본 데이터베이스를 병합하였다. 이러한 작업은 1968 년 이후 최소 이민자를 갖는 각각의 28개 층들을 병합하도록 PSU들을 그룹화 할 수 있었다. 이민자 표본은 SRC의 1990년 전국 표본의 28개 병합된 층으로부터 선정하 였다. 각각의 층들은 1968녀 이후 총 이민자 모집단의 약 1.5~2%를 대표하도록 하 였다. 각 층으로부터 하나의 PSU를 선전하는 방법으로는 Kish-Scott방법1)을 사용 하였으며 1990년 SRC 전국표본의 현재 “A” 1/2-표본 PSU들로부터 24개 PSU를 추 가로 선정하였다. 이 표본중 나머지 4개의 PSU들은 PSID 이민자 부가 표본에 대해 새롭게 선정된 PSU를 사용하였다.

총 194개의 2단계 추출단위(SSU)를 1968년 이후 이민자 모집단의 비율에 따라 층 에 배분하였다. 가능한 한 많은 이전의 SSU 목록을 유지하도록 Kish-Scott 과정을 2 단계 추출에서 사용하였다. 만일 하나의 PSU에 할당되는 SSU들이 많이 필요하다면 SSU의 1990년 SRC 추출프레임으로부터 SSU들을 추출하였다. 194개의 SSU중에서 103개는 기존의 SSU들이고 91개는 새롭게 추출된 SSU들이다.

나. 이민자 표본에 대한 가중치 부여

1997년과 1999년의 이민자 부가조사에서 조사된 각 가구들은 이들이 거주하고 있는 지역을 파악하여 확률추출을 반영한 초기 기저가중치를 할당하였다. 이민자 부 가조사 가구에 대한 이러한 기저 가중치는 미국 인구수로 조정하였다. 따라서

“19997년 PSID 기본 가구 가중값=16.198*이민자가구 가중값” 으로 계산하였다.

1) Kish, Leslie, and Scott, Alastair “Retaining units after changing strata and probabilities.”

Journal of the American Statistical Association, Vol. 667, Number 335, Applications Section, Sept. 1971.a

1997년과 1999년의 가구와 개인의 PSID 가중치는 해당연도의 미국의 인구 추계 치를 반영하도록 조정되었다. 이러한 조정과정의 첫 번째 단계는 가구영역과 1997년 이민자 부가조사에 포함된 1968년 핵심 패널에 적합된 개인 간에 총 인구가중값을 배당하였다. 1997년 CPS 데이터를 근간으로 1968년 이후 미국에 이주한 가구는 전 체 미국인 가구의 약 7.5%로 추정된다. 따라서 이민자 부가조사 표본은 미국인 가구 1억 가구 중에서 약 7백 50만 가구를 대표하며, 1968년의 PSID 표본은 9천8백만 가 구를 대표하게 된다. 1997년 이민자 부가조사 표본은 전체 551가구중 1997년 조사 에 참여한 441개 가구의 응답가구와 추가로 1999년에 조사에 참여한 70가구로 이루 어진 것이다.

다. 이민자 가구의 식별 방법

이민자 가구와 개인은 다른 PSID 표본과 쉽게 구별하기 위해 단일한 값을 부여하 였다. 1997년 면접 ID는 10001-10441까지의 번호를 부여하였고, 1968년 면접 ID 는 3001-3441을 부여하였다. 1999년에 추가된 표본은 이 ID를 연속하여 사용하도 록 함으로서 3442-3511 까지를 부여하였다.

〈표 2-8〉 기존표본과 신규표본의 구분

빈도 코드 설명

18,974 1~2930 Individual is associated with a family from the SRC cross-section sample

1,673 3001~-3511 Individual is associated with a family from the New Immigrant sample

16,342 5001~6872 Individual is associated with a family from the Census sample

8,211 7001~9308 Individual is associated with a family from the Latino sample