• 검색 결과가 없습니다.

제3절 표본설계 개요

「출산력 및 가족보건‧복지실태조사」의 목적에 따라 2010년 인구주택 총조사 자료를 분석하여 주어진 허용오차를 만족하는 적정 표본수를 산 정하고, 전국을 3개 권역으로 층화 한 다음, 조사구 특성에 따라 정렬한 후 표본조사구를 추출하도록 하였다.

1. 모집단 층화

2010년 인구주택 총조사 조사구를 지역특성에 따라 3개의 층으로 분 류하였다.

∙ 7대 시‧도(서울‧부산‧대구‧인천‧광주‧대전‧울산의 동부)

∙ 기타 시 (경기‧강원‧충북‧충남‧전북‧전남‧경북‧경남‧제주의 동부)

∙ 읍‧면지역(그 외 읍‧면지역)

한편 조사구의 특성에 따라 주거유형별 특성을 분류지표로 활용하였다.

∙ 일반조사구와 아파트 조사구

따라서 모집단조사구를 행정구역별로 정령한 후 이를 기준으로 3개 층으로 층화하고, 주거형태에 따라 재정렬하여 지역별로 표본조사구가 편향되지 않도록 하고, 층화 효과를 얻도록 하였다.

56

∙2012년 전국 출산력 및 가족보건‧복지실태조사

2. 모집단 분석

2010년 인구주택총조사 결과 지역별로 15~49세 가임기여성의 인구수 분포를 파악하면 다음과 같다. 서울과 경기지역이 전체 가임기 여성의 약 45%를 자지하는 것으로 나타나, 지역별 가임기 여성인구비율에 따라 표본을 배분할 경우 서울 및 경기 지역이 표본의 대다수가 배분될 우려 가 있다.

〈표 1-1〉2010년 인구주택 총조사의 지역별 가임기 여성인구

(단위: 명)

지역 동부 읍면부

일반 아파트 계 일반 아파트 계

서울 1,556,359 1,233,203 2,789,562 - -

-부산 377,822 476,196 854,018 7,457 14,714 22,171 대구 265,781 344,581 610,362 10,976 32,570 43,546

인천 303,090 428,237 731,327 7,123 1,654 8,777

광주 114,489 290,483 404,972 - -

-대전 161,902 249,087 410,989 - -

-울산 95,995 148,850 244,845 14,589 31,662 46,251 경기 1,007,408 1,677,076 2,684,484 198,717 256,229 454,946 강원 76,218 152,365 228,583 63,519 34,365 97,884 충북 89,332 162,931 252,263 58,197 49,077 107,274 충남 68,763 153,448 222,211 119,204 108,653 227,857 전북 95,828 231,407 327,235 54,744 18,591 73,335 전남 56,689 146,885 203,574 85,923 49,030 134,953 경북 146,964 215,007 361,971 123,427 84,513 207,940 경남 207,141 334,629 541,770 100,146 121,872 222,018

제주 74,585 30,750 105,335 23,229 1,206 24,435

4,698,366 6,275,135 10,973,501 867,251 804,136 1,671,38 7

따라서 층의 규모를 대폭 축소하여 지역별 편차를 줄이고, 본 연구의 목적에 따라 전국적인 출산력을 추정하기위해 앞에서 고려한 3개 지역 별 층과 조사구 유형에 따라 2개의 분류지표를 적용하여 총 6개의 층으

제1장 서론

57

로 모집단을 층화하여 각 층별 조사구 분포를 파악하면 다음과 같다.

〈표 1-2〉2010년 인구주택 총조사 90% 조사구의 층별 규모

(단위: 개)

층 분류 모집단

조사구수 가구수

1. 7대 시 일반 74,823 4,272,936

2. 기타시 일반 51,224 2,881,060

3. 읍‧면 일반 43,169 2,309,268

4. 7대 시 아파트 59,820 3,607,375

5. 기타시 아파트 57,424 3,456,383

6. 읍‧면 아파트 16,733 930,444

전 체 303,193 17,457,466

3. 표본 규모

먼저 조사구를 1차 추출단위로 고려하고, 표본 조사구내에서 약 50가 구를 조사하는 것으로 할 경우 총 18,000가구의 표본수가 결정된다. 이 는 가구수 기준으로 95% 신뢰수준 하에서 0.75%의 허용오차를 만족하 는 수준이다.

  

′ 

  

  

여기서 는 층의 가임기 여성의 출현율이고, ′은 목표 오차이다.

이를 기준으로 각 층별로 허용오차를 계산하면 읍면 일반 층이 2.7%로 가장 크고, 7대시 아파트 층이 1.47%로 가장 적게 나타났다.

58

∙2012년 전국 출산력 및 가족보건‧복지실태조사

4. 표본 배분

조사구 또는 가구수에 따라 표본을 비례 배분할 경우 읍‧면지역의 표 본규모가 과소 표집될 가능성이 있기 때문에 본 조사의 목적에 부합하 도록 가임여성의 규모에 따라 표본조사구를 배분하였다. 앞의 <표 1-2>

로부터 6개 층별 조사구수의 분포를 파악한 결과 읍‧면지역의 아파트 조사구를 제외하고 큰 변동이 없는 것으로 파악되어 정해진 표본규모에 따라 각 층별로 조사구 규모에 따라 비례 배분하여 층별 표본수를 결 정하였다. 표본가구수를 기준으로 조사구당 50가구를 조사완료할 경우 총표본 조사구수는 360개이며, 표본가구수는 18,000가구이다.

〈표 1-3〉16개 시도 및 동부 읍‧면부 표본배분 결과

(단위: 개)

지역 동부 읍‧면부

일반 아파트 일반 아파트

서울 26 20 0 0 46

부산 11 14 0 1 26

대구 9 12 1 1 23

인천 10 14 0 0 24

광주 5 13 0 0 18

대전 7 11 0 0 18

울산 5 8 1 1 15

경기 16 26 3 4 49

강원 4 7 3 2 16

충북 4 8 3 2 17

충남 3 6 5 5 19

전북 4 11 2 1 18

전남 3 7 4 2 16

경북 5 8 5 3 21

경남 6 11 3 4 24

제주 6 2 2 0 10

124 178 32 26 360

제1장 서론

59

〈표 1-4〉층별 표본 배분결과

(단위 : 개, 가구, %)

층 구분 조사구

추출확률

표본 조사구수

조사대상

가구수 층별 목표오차

1. 7대시 일반 0.0009756 73 3,650 1.66

2. 기타시 일반 0.0009956 51 2,550 1.98

3. 읍‧면 일반 0.0007413 32 1,600 2.50

4. 7대 시 아파트 0.001538 92 4,600 1.47

5. 기타시 아파트 0.0014977 86 4,300 1.52

6. 읍‧면 아파트 0.0015538 26 1,300 2.77

전 체 0.0011874 360 18,000 0.75

5. 표본가구의 선정

각 층별 표본조사구수는 지역별로 만 15~49세의 출산가능인구수의 제곱근 비례 배분하여 읍‧면 지역의 가임여성가구가 과소 표집 되지 않 도록 하였다. 각 층에서의 표본조사구 추출은 층별 가임여성의 수를 크 기 측도로 고려하여 확률비례 계통추출법을 사용하였다. 한편 2010년 인구주택 총조사 조사구 중에서 조사구의 가구수가 적은 조사구는 인접 조사구에서 표본가구를 추가하였다. 즉 인구주택 총조사 조사구 가구 수 가 45가구 미만인 표본 조사구는 인접한 조사구에서 5가구를 추가하여 조사 대상가구를 50가구가 되도록 하며 50가구 이상일 경우는 거처번호 순으로 하여 50가구 이후 거처에 속하는 가구는 조사대상 가구에서 제 외하였다.

6. 무응답 대체

표본조사구내에서 무응답이 발생할 경우 거처번호가 51번째 이후 가 구를 순서대로 대체하며, 해당 조사구에 무응답 가구를 대체할 수 없을

60

∙2012년 전국 출산력 및 가족보건‧복지실태조사

 : 모집단 총 조사구수(=

)

: 층의 모집단 조사구수

: 층의 표본조사구 수

 : 층의 번째 조사구의 총 가구수

경우 인접조사구에서 5가구까지만 대체를 허용하였다.

한편 표본으로 추출된 조사구가 재개발, 천재지변에 의해 조사가 불가 능할 경우 동일 층 내에서 예비조사구(표본조사구의 20%)로 대체하여 조사를 수행하도록 하였다.

7. 가중치 조정 및 추정

가임기 여성의 총 인구수 및 가구의 평균 가임이 여성수 등을 추정하 기위해 먼저 복합표본추출방식으로 표본을 추출하였기 때문에 추출단위 들의 추출확률이 서로 다르다. 따라서 불균등 확률 추출의 경우 추정치 의 편향을 제거하기위해 가중치 조정을 실시하여야 하며, 이를 위해 먼 저 가중표본합계치(Weighted Sample Total)를 산출하고, 가중표본합계 치를 사용하여 평균, 구성비 등의 통계치를 산출하도록 하였다. 또한 조 정 가중치는 조사구가 표본으로 추출된 확률, 각 조사 미완률을 반영하 여 산출하며 사후층화(Post Stratification)조정을 수행하여 추정치의 편 향을 방지하도록 하였다. 특히 추출틀의 노후화로 인해 2012년 현재 가 임기 여성의 층별 분포를 반영하지 못하기 때문에 이러한 문제점을 보 완하기위해 통계청의 2012년 추계인구를 활용하여 사후조정하도록 하였다.

가구조사 결과에서 어떤 특성 를 갖는 가구수 및 인구수에 대한 가중표본합계치는 조사완료된 가구수를 기준으로 다음과 같이 산출하도 록 한다. 이를 위해 먼저 필요한 기호를 정의하면 다음과 같다.

제1장 서론

61

 : 층의 번째 조사구내 표본 가구수(=50)

 : 층의 번째 표본 조사구의 번째 가구의 추출확률

 : 층의 번째 조사구의 응답가구수

 : 층의 번째 조사구의 번째 가구의 가중치

 : 층의 번째 조사구의 무응답조정가중치

 : 층의 번째 조사구의 번째 가구의 사후가중치

 : 층의 번째 조사구의 번째 가구의 최종가중치

① 층의 번째 조사구의 번째 가구의 추출확률 계산

  

× 



(1)

② 가중치는 추출확률의 역수이므로 식(1)로부터 다음과 같이 가중치 를 계산할 수 있다. 이때 표본조사구내 표본가구수는 조사구별로 동일하 게 50가구씩 조사함으로  을 대입하여 구한다.

 

  

× 

×

③ 무응답 조정가중치

  



④ 최종 가중치

 ×  × 

⑤ 전국 가구의 평균 산출

 



62

∙2012년 전국 출산력 및 가족보건‧복지실태조사

여기서 

  

 

  



로서 표본가구들의 가중치의 총계이다.

⑥ 분산과 표준오차

    

        

 

여기서 

  



  

 ,   

 이다.

   

 

⑦ 상대표준오차

   

  

× 

관련 문서