• 검색 결과가 없습니다.

Sampling and Questionnaire - 성공적인 표본조사를 위한 두 밑그림 그리기

문서에서 연구 잘 하는 길 (페이지 77-93)

강미나 _ 국토연구원 연구위원

조사방법의 개요

설문조사라고 하면 선거를 앞두고 후보들의 지지도를 조사하는 전화나 인구주택총조사 면접원 의 가구방문, 혹은 길거리에서 특정 상품이나 특정 의견을 묻는 조사의 경험을 쉽게 떠올릴 수 있을 것이다. 이처럼 설문조사는 우리 생활에서 흔하게 사용되고 가깝게 위치하고 있다.

또한 근래에 선거를 앞두고 각 조사업체마다 발표한 조사결과를 보면 모든 투표권자의 의견을 조사하지는 않았지만 실제 결과와 큰 차이가 없었던 기억도 떠올릴 수 있으리라고 생각한다.

설문조사처럼 현상을 알아내는 방법, 다시 말해서 자료를 얻는 방법으로 널리 사용되는 것이 조사방법인데, 이 방법은 19세기 후반부터 사회과학에서 사용되기 시작하였다. 우리가 실제를 파악하고자 하는 대상 전체(모집단)를 조사하거나 전체 대상의 일부로부터 자료를 수집 하여 특정현상을 분석하게 된다.

앞의 선거입후보자의 당락에 대한 조사에서처럼 대부분의 조사연구는 모집단에 대해서 전수조사를 하는 것이 아니라 모집단의 일부를 조사분석해서 모집단의 속성을 미루어 짐작하게 된다. 이를 표본조사라고 한다. 그리고 많은 설문조사의 경우 표본조사를 통해서 자료를 수집하 게 된다. 파악하고 싶은 전체 대상으로부터 실제 일부조사대상, 즉 표본을 추출하는 과정을 표본추출(sampling)이라고 한다. 모집단을 전수조사하게 되면 시간과 경비, 노력면에서 많은

비용이 필요하지만 그렇다고 그 결과가 반드시 표본조사의 결과보다 더 정확하다고 볼 수 있는 것이 아니다. 때에 따라서 표본조사가 더 효율적이고 신뢰성이 높을 수 있다(홍두승, 2005). 따라서 표본조사에서 표본이 모집단을 잘 대표하도록 추출해 내는 작업이 매우 중요하고 이를 표본설계라고 한다. 한편 설문지를 이용한 조사는 빠른 시간에 객관적이고 정확한 정보를 입수할 수 있는 장점이 있다. 따라서 성공적인 조사결과를 얻기 위해서 가장 중요한 두 가지 밑그림 작업인 표본설계와 설문지 작성에 대해 알아보도록 하겠다.

표본설계

표본설계와 관련된 개념과 실제 과정을 주거실태조사의 예를 들어서 간략히 소개해보겠다.

주거실태에 대한 설문조사는 그동안 여러 기관 또는 개인이 간헐적으로 수행해 왔다. 그러나 주택법에 근거하여 공식적으로 실시하는 주거실태조사는 국토해양부의 위탁사업으로서 2006년 부터 국토연구원에서 매년 수행하고 있는 사업이다. 주거실태조사는 격년으로 짝수 해에는 일반가구를 대상으로 주거실태 및 주거의식을 조사하고 홀수 해에는 정책적인 요구에 따라 노인가구 및 노인 개인, 혹은 장애인가구 및 장애인 개인, 그밖의 다른 조사주제 등을 조사하고 있다. 일반가구조사가 2006년과 2008년에 수행되었고 2007년에는 노인가구를 대상으로 하는 특수조사가 수행되었다. 2009년에는 장애인을 대상으로 하는 주거실태조사를 수행하였다.

일반가구를 대상으로 하는 주거실태조사에서 모집단(population)은 우리가 알고자 하는 대상의 총체인 전국의 모든 가구라고 할 수 있다. 노인가구조사의 경우에는 전국의 노인가구가 대상이 될 것이다. 모집단은 경우에 따라 그 실체를 정확히 알 수 없는 추상적인 집단일 수 있다. 따라서 조사목적을 위해서 조작적으로 조사모집단(Survey Population)을 규정하기도 한 다. 예를 들어서 노인의 주거실태 및 주거정책에 대한 의식을 조사한다고 할 때 모집단은 전국의 노인가구가 대상이 되지만, 조사를 위해서 조사모집단은 섬지역과 특수사회시설을 제외 한 전국에 거주하는 노인가구로 정의하고 표본을 추출할 수 있다. 즉 표본이 실제로 추출되는 모집단을 조사모집단이라고 한다.

그런데 주거실태조사는 실제로 평균 60가구를 중심으로 한 단위로 묶은 조사구 (Enumeration Unit)를 모집단으로 이용하는 조사구 조사1)이다. 즉 통계청에서 제공하는 10%

<그림 1> 표본추출방법의 종류

표본 조사구 중에서 실제 조사가 곤란한 섬 조사구와 일반적 특성을 갖지 못하는 기숙시설 조사구와 특수사회시설 조사구를 제외한 아파트 조사구 및 보통 조사구를 조사모집단으로 사용한다.

조사구를 추출하기 위해서는 전체 조사모집단인 조사구의 리스트가 필요한데 이러한 연구 대상 모집단 전체의 목록을 표본추출틀(Sampling Frame)이라고 한다. 주거실태조사에서는 아파트 조사구 및 보통 조사구목록을 표본추출틀로 사용하였다. 예를 들어 만일 유치원교사의 처우만족도를 조사한다고 하면 이때 전국 유치원에 등록되어 있는 선생님의 명단이 필요하며 이 목록이 표본추출틀이 된다.

1. 표본추출방법의 유형2)

일반적으로 사회조사에서 사용하는 표본추출방법은 크게 확률표본추출방법(Probability

1) 통계청의 인구주택총조사, 가계조사, 경제활동인구조사 외에도 여러 가지 조사가 조사구조사로 수행된다.

2) 홍두승. 2006. 제4절 표본추출방법의 결정을 재구성.

자료: 홍두승, 2005. 그림 4-1 재인용.

Sampling)과 비확률표본추출방법(Nonprobability Sampling)으로 구분할 수 있다. 확률표본추 출방법은 모집단의 규모와 성격을 정확히 알고 있을 뿐 아니라 모집단의 개별구성요소가 표본에 포함될 확률이 동일할 때 사용한다. 한편 개별요소의 추출확률이 동일할 필요가 없거나 확률표 본추출방법의 적용이 불가능할 경우에는 비확률표본추출방법을 쓴다.

확률표본추출방법에는 층화표본추출, 단순무작위표본추출, 계통표본추출, 집락표본추출 등 이 있고 비확률표본추출에는 편의표본추출, 유의표본추출, 눈덩이표본추출, 할당표본추출 등이 있다. 이들 여러 방법은 필요에 따라 복합적으로 사용되고 있다.

▪ 확률표본추출

확률표본추출은 모집단의 모든 구성원들이 표본으로 뽑힐 가능성이 동일할 때 표본은 모집단을 대표한다는 근거로부터 출발한다. 이런 의미에서 확률표본추출은 기본적으로 각 요소가 표본에 포함될 수 있는 확률을 같게 하고자 하는 것이다.

주거실태조사는 층화표본추출방법을 사용한다. 층화표본추출(Stratified Sampling)방법은 모집단을 하위집단으로 층화시킨 다음 각 하위집단에서 적절한 수의 표본을 뽑아내는 방법이다.

이 방법은 동질적인 하위집단에서의 표본추출오차가 이질적인 집단에서의 오차보다 더 작다는 데 그 근거를 두고 있다. 2006년도 주거실태조사에서 고려한 층수는 모두 28개이다. 각 시·도 별 통계생산을 위해서 7개 특별·광역시와 9개 도 지역으로 1차로 층화하였다. 그리고 9개 도 지역에 대해서는 동부와 읍면부가 고용 형태 및 소득·소비구조면에서 차이를 나타내는 점을 감안하여 다시 동부와 읍·면부로 2차 층화하였다. 다만, 서울시의 경우에는 주택문제의 중요성을 고려하여 4개 권역(북동, 남동, 남서, 북서)으로 2차로 층화하였다(<그림 2> 참조).

이처럼 2차 층화의 방법을 이용하여 보다 동질적인 하위집단을 만들 수 있었다. 한편 주거실태조 사는 조사구 내의 가구수에 비례하는 확률비례추출방법(Probability Proportional to Size Sampling)3)을 적용하여 표본조사구를 추출하였다.

3) 확률비례추출방법(Probability Proportional to Size Sampling)은 하위집단에서 뽑는 표본수의 크기에 비례하여 하위집단을 추출하는 방법이다. 예를 들어 남자 60명, 여자 40명을 뽑는 표본이라고 하면 이 표본을 추출하기 위해서 남자그룹과 여자그룹의 비율이 3:2가 되도록 소집단을 뽑는 방법이다. 주거실태조사에서 이 방법을 사용하 는 이유는 조사구가 동일한 가구수로 형성되어 있지 않고, 각기 다른 크기의 가구로 구성되어 있기 때문이다.

<그림 2> 층화표본추출 방법

자료: 국토연구원, 2007년도 주거실태조사 연구보고서.

확률표본추출방법 중에 단순무작위표본추출방법(Simple Random Sampling)은 모집단의 전체 구성요소를 파악한 다음 개별요소에 대하여 일련번호를 부여하고 난수표를 이용하여 필요한 수의 표본을 추출하는 방법이다. 계통표본추출방법(Systematic Sampling)은 일단 명부 가 마련되면 처음 표본은 무작위로 선택하고 그 다음부터는 일정한 간격으로 추출하여 필요한 표본수를 모두 추출하는 방법이다. 집락표본추출방법(Cluster Sampling)은 개인단위의 명부를 마련하는 것이 현실적으로 불가능할 때 사용하는 방법으로 일단 집락으로 추출하고 여기에서 다시 개인을 추출하는 방법이다. 이때에는 가능하면 집락을 이질적인 요소로 구성시켜서 다양한 개인의 속성이 포함되도록 한다. 가중표본추출방법은 필요에 따라 표본추출률(Sampling Rati o)4)을 달리하여 표본을 추출하는 방법이다.

▪ 비확률표본추출

확률표본추출이 불가능하거나 모집단을 정확하게 규정지을 수 없는 경우, 그리고 반드시 확률표 본추출을 써야 할 필요가 없는 경우 비확률표본추출의 방법을 쓰게 된다. 이 방법은 간편하고

다른 크기의 조사구를 추출할 때 이 방법을 쓰게 되면 최종 추출되는 가구가 동일한 가중치를 갖게 되는 자체가중표 본(Self-Weight Sampling)이 되게 된다(윤연옥. 2003).

4) 표본추출률은 모집단에서 개별 가구가 선택될 확률로서 예를 들어 1만 가구의 모집단에서 1천 가구를 추출하기 위해 10명 간격으로 표본을 뽑았다면 10이 표본추출간격(Sampling Interval)이라고 하고 1000/10000=10%를 표본

4) 표본추출률은 모집단에서 개별 가구가 선택될 확률로서 예를 들어 1만 가구의 모집단에서 1천 가구를 추출하기 위해 10명 간격으로 표본을 뽑았다면 10이 표본추출간격(Sampling Interval)이라고 하고 1000/10000=10%를 표본

문서에서 연구 잘 하는 길 (페이지 77-93)