• 검색 결과가 없습니다.

제1절 표본조사의 배경

Frankel과 Frankel(1987)은 Public Opinion Quarterly의 50주년 기 념호에서 표본조사의 역사 대해 고찰한 바 있다. 이들의 논문은 여전히 인용되고 있는데, 표본추출의 역사에 관해 거시적으로 관심이 있는 독자 들은 이들의 고찰을 참고할 만하다. Frankel 과 Frankel(1987)은 두 단 계로 표본추출의 역사를 고찰하였는데, 첫 번째 단계에서는 확률 추출방 법으로 패러다임이 전환된 Neyma(1934)의 논문에 따라 기본적인 확률 추출방법의 수립이다. 두 번째 단계는 기본적인 방법의 개선과 전화 표 본추출과 컴퓨터화 정도와 같은 새로운 기술에 대한 확장으로 특성화 된다. 이러한 이분법적인 분류는 1978년 이후 표본추출에 많은 발전을 가져왔다. 예를 들어 선거여론조사에서 등록-기반 표본추출(Green 과 Gerber, 2006), 이동전화에 대한 개인 표본추출(AAPOR, 2010) 등은 표준적인 표본추출기법의 혁신이다. 또 다른 기술적인 혁신인 웹조사는 집중적인 연구에서 사용되는 중요한 방법이 되고 있다. Couper(2000)가 언급한 바와 같이 이 시점에서 수립된 웹으로 부터의 표본추출방법은 일반적으로 받아들일 수 없는 방법이며, 이러한 사실은 10년이 지난 현 재까지 사실로 받아들여지고 있다. 이러한 표본추출의 문제는 일련의 가

2) M. Bricks(2012)의 "The Future of Survey Sampling" 논문을 편역하여 수록한 내용임.

능한 해법들을 양산하고 있다.

Neyman(1934)에 의해 발전된 확률 표본 추출과 그 이후 거의 모든 조사 표본추출 저서들은 추론에 있어서 매우 구체적인 체계를 가지고 있다. 모집단에 있는 모든 단위들의 프레임을 구성할 수 있고 그 프레임 에 있는 모든 단위들이 표본으로 추출될 양의 확률을 가지며, 이러한 확 률은 각각의 표본단위들에 대해 측정이 가능하다고 가정한다. 일단 표본 으로 추출된 모든 단위들의 특성 값들은 정확하게 측정이 가능하다. 추 정치들은 모든 가능한 표본들의 분포를 사용하여 추정된다. 다단계 표본 추출과 확률 표본 추출방법과 같은 다양한 방법들이 이러한 일반적인 체계를 만족한다. 무응답, 모집단의 불완전한 포괄성, 측정오차 등은 이 러한 순수한 확률 추출의 가정에 위배되는 문제들이다.

최근에 다른 표본추출방법들이 제안되고 있으며, 이들 중 하나는 확률 추출 체계내에서 정확하게 일치하지 않는 방법들이다. 이들 중 하나는 응답자-기반 표본추출(response-driven sampling;Heckman, 1997)방법 으로 매우 드문 모집단이나 접근이 어려운 모집단에 대해 사용되는 방 법이다. 이 방법은 네트워크 (Network)또는 스노우볼(Snowball) 표본추 출로서 조사에 적합한 사람들을 알고 있는 이들에게 드문 집단의 구성 원들을 질문하는 방법이다. 이러한 추출방법에 대해 수학적인 모형을 자 료 분석에 이용하였다. Volz and Heckman(2008)은 관측된 표본이 특 정한 조건하에서 확률 표본과 같음을 보였으나, 이러한 조건들은 현실적 으로 매우 드물게 만족한다.

또 다른 두 가지 새로운 표본추출방법은 전통적인 표본추출방법과 매 우 근접한 표본추출방법으로 응답자 네트워크를 사용한 적응 표본추출 (adaptive sampling; Thompson and Seber, 1996)과 간접표본추출 (indirect sampling; Lavallee, 2007)이다. 전형적으로 적응설계는 인구 집단에 대해서는 사용되지 않고, 자연과학에서 드물게 발생하고 군집을

이루고 있는 모집단에 대해 밀도를 추정하는 데 이용된다.

간접표본 추출은 가구나 개인조사에서 사용되었다. 간접표본추출은 목 표모집단이 아닌 개인이나 단위의 확률 표본에서 시작되었다. 그 다음 목표모집단을 표본단위와 연계하면 목표모집단의 추출확률을 계산할 수 있다. Kalton 과 Brick(1995)는 이러한 접근 방법을 가구의 종단면 조 사에서 첫 번째 웨이브 이후 표본가구로 진입한 개인의 가중치를 할당 하는데 이용하였다. 이러한 접근 방법은 충분히 발전 가능성이 있는 방 법이다.

이와는 다르게 추론의 관점에서 표본추출이론을 살펴보면, Godambe (1966)과 Royall(1970)은 설계 기반 접근방법으로서 추출된 표본단위의 확률에 기반 한 모집단의 추론에 대해 언급하였으며, 이들 이외의 연구 자들은 다른 통계분야에서 사용되는 보다 전형적인 모형 가정을 이용하 였다(모형기반 또는 베이지안 접근 방법으로 불리워짐). Holt와 Smith(1979)는 설계기반 표본추출이 조건부 원리에 부합되지 않을 수 있음을 지적하였고, Hansen, Madow 그리고 Tepping(1983)은 설계기 반의 활용성에 대해 주장하였고, 모형기반 접근의 가정에서의 작은 오차 가 대규모 표본을 추출했을 때 추정치의 오차에 심각한 편향을 가질 수 있음을 보였다. 근본적인 문제점들이 해결되지 않았음에도 여전히 설계 기반 접근 방법은 표본추출에서 중요한 방법으로 존재한다.

대부분의 조사 자료를 이용한 추론은 설계기반에 의존하고 있지만 소 지역 추정과 같은 학문영역에서는 모형기반 방법이 이용되고 있다. 일부 학자들은 확률표본의 시대는 저물고 있다고까지 말하고 있다. 이는 자료 를 수집하는 데 소요되는 비용과 무응답 문제, 그리고 비포괄성 등의 이 유로 설계기반 추론의 비효율성에 기인한다. 낮은 응답률과 포괄성을 갖 는 확률 표본은 비확률표본이나 자발적 표본에 비해 좋지 못하다는 것 이다. 이러한 문제는 표본추출 방법의 개발이 필요하고, 향후 직면할 문

제이다. 즉, 자료 수집과 추론을 위해 계속 확률표본추출을 고집할 것인 지 아니면 다른 방법을 사용할 것인지에 대한 문제이다.