SAMPLING
Ⅲ. 표본설계
3.1 톤~4.9톤
일반형-카고형-5톤 미만 덤프형-5톤 미만 밴 형-5톤 미만
5.0톤~7.9톤 일반형-카고형-8톤 미만
밴 형-5톤 이상
8.0톤~11.9톤 일반형-카고형-10톤 미만, 12톤 미만
덤프형-12톤 미만
12톤 이상 일반형-카고형 12톤 이상
덤프형-12톤 이상
<표 3-32> 화물차 모집단의 차종 구분
63
-◦ 차종별 표본수는 사전에 주어진 5,500대를 승용일반형 2,200대, 승용다목적형 800대, 승합차 800대, 화물차 1,200대, 이륜자동차 500대로 우선 할당함.
분류 모집단수 표본수
승용 일반형 9,748,397 2,200
승용 다목적형 3,121,639 800
승합차 948,078 800
화물차 2,615,767 1,200
자가용 차량 계 16,433,881 5,000
이륜 자동차 1,823,208 500
계 18,257,089 5,500
<표 3-33> 자가용 차량 모집단 수와 표본 수
승용일반형 승용다목적 승합차 화물차 자가용차량 이륜자동차
서울 220 115 60 95 490 75
부산 160 40 60 75 335 30
대구 160 40 55 65 320 25
인천 150 45 60 65 320 25
광주 150 40 55 65 310 25
대전 150 40 55 65 310 25
울산 150 40 55 65 310 25
경기 215 115 60 100 490 50
강원 110 40 45 65 260 25
충북 110 40 45 65 260 25
충남 110 40 45 80 275 30
전북 110 40 45 80 275 25
전남 110 40 45 75 270 25
경북 110 40 45 85 280 35
경남 110 55 45 90 300 35
제주 75 30 25 65 195 20
합계 2,200 800 800 1,200 5,000 500
<표 3-34> 자가용 차량 지역별 종류별 표본 수
(단위 : 대)
64
-◦ 그리고 각 차종별 특성에 따라 부모집단을 설정하고, 부모집단별 표본수를 비 례배분하고, 적정수준이 되도록 절충
◦ 시도규모별 표본수 결정은 부모집단별 최소단위의 표본수가 통계분석의 최소 의미 수준인 25대 이상이 되도록 조정함.
- 실제로 지역별 표본의 할당은 부모집단별로 정해진 표본수에 각 시도별 차량 대수를 기준으로 1차 비례배분한 후, 차종별 표본의 크기, 최소단위의 기본 표본수(추정단위 기준 25 이상) 등을 고려하여 절충 배정함.
3) 추정방법
◦ 불비례할당표본추출의 경우, 모집단을 대표하는 통계치가 필요할 때에는 비중 (weight)을 계산해서 적용하여야 함. 여기서 비중의 의미는 표본차량 1대가 모 집단을 얼마나 대표하는가를 나타내는 것임.
- 따라서 추정에 필요한 최소단위의 표본수가 적을수록 과잉일반화
(overgeneralization)의 오류를 피할 수 없게 되며, 모집단의 대표값을 구하여 도 면접자가 임의 선정한 표본이기 때문에 이것이 모집단을 대표한다고 확신 할 수 없는 문제점이 있음.
◦ 본 조사에서의 추정은 지역별, 차종별, 차종의 크기별로 층화하였으므로 각각에 대해 다음과 같이 추정방법을 달리 적용하였으며 최소단위의 표본수를 고려하 여 지역단위(서울, 광역시, 기타도시)의 평균값 적용
- 차종별 추정
⋅
- 시도별 추정
⋅
- 종합추정
65 -- 종합추정치 ˆX의 분산은 다음과 같이 산출함.
이 공식에서
: h차종의 표본수
: h 차종의 번째 에너지 에너지사용량
: h차종의 모집단수
: 총에너지 사용량
: h차종의 k지역 표본의 크기
: h차종의 k지역 모집단수
: h차종의 k지역의 번째 에너지사용량
- 표본오차는 분산을 추정치로 나눈 상대표준오차 Vse로 계산
마. 상업 ․ 공공 부문
1) 모집단 분석 및 표본 수
◦ 산업부문 대분류별로 사업체기초통계의 총근로자수 기준으로 5인 이상과 5인 미만으로 층화함.
- 5인 이상의 층은 절사법을 이용하여 표본수를 배정하였으며 4인 미만의 경우 네이만 배분법을 사용
◦ 2009년 기준 사업체기초통계조사가 표본 틀로 사용되었으며 이 통계조사에서 건설업과 운수업을 제외한 모든 사업체가 조사 모집단임.
- 모집단은 2,530,255업체(업소)이며 사전에 주어진 표본수는 12,214업체(업소)로 표본 추출율은 0.5%
66 -산업
소분류
4인 이하 5인 이상 합계
모집단 표본 모집단 표본층 표본 전수층 모집단 표본
35 277 31 669 36 44 946 111
36 218 25 310 19 23 528 67
37 644 48 565 36 26 1,209 110
38 1,612 56 2,149 94 33 3,761 183
39 27 15 41 5 10 68 30
45 20,296 145 2,879 65 40 23,175 250
46 191,594 132 34,634 239 162 226,228 533
47 597,724 462 14,609 226 230 612,333 918
55 46,180 557 1,393 47 69 47,573 673
56 567,329 415 13,176 166 45 580,505 626
58 4,712 68 5,743 129 78 10,455 275
59 2,497 100 896 34 26 3,393 160
60 289 43 450 26 14 739 83
61 2,757 21 2,366 85 54 5,123 160
62 1,417 30 1,626 35 44 3,043 109
63 728 30 697 29 21 1,425 80
64 5,806 36 14,774 53 39 20,580 128
65 5,708 31 2,471 65 66 8,179 162
66 6,495 80 3,087 21 69 9,582 170
68 97,058 244 15,595 126 75 112,653 445
69 12,142 193 1,009 40 31 13,151 264
70 1,599 48 1,897 43 55 3,496 146
71 21,160 63 10,204 101 114 31,364 278
72 9,341 65 7,509 118 88 16,850 271
73 14,424 151 1,424 34 23 15,848 208
74 2,627 73 2,090 83 79 4,717 235
75 21,052 75 7,043 183 145 28,095 403
84 2,196 53 9,572 199 149 11,768 401
85 136,367 177 26,087 321 144 162,454 642
86 44,990 45 14,626 185 163 59,616 393
87 21,543 51 17,817 164 16 39,360 231
90 7,566 200 1,547 60 41 9,113 301
91 91,476 724 1,812 63 43 93,288 830
94 82,326 120 5,891 118 87 88,217 325
95 87,706 410 6,332 98 38 94,038 546
96 176,938 861 2,873 59 12 179,811 932
91121 26 11 270 34 6 296 51
96121 6,703 434 572 33 17 7,275 484
합계 2,293,550 6,323 236,705 3,472 2,419 2,530,255 12,214
<표 3-35> 상업․공공부문 절사점 기준 모집단 수 및 표본 수
2) 추출방법
◦ 우선 한국산업표준분류에 따른 산업별 중분류에서 종업원수가 5인 이상과 5인 미만 2개의 그룹으로 나누어 각각을 부모집단으로 설정.
◦ 중분류를 기준으로 허용오차 9~30%가 되도록 절사법을 사용하여 표본수를 배
67 -정하였으며, 사용된 변수는 총종사자수임.
◦ 최근 관심이 집중되고 있는 골프장 및 욕탕업은 특별히 허용오차를 17, 15%로 정한 후 절사법을 사용하여 표본수를 배정
◦ 배정된 표본은 층화 계통 추출법을 이용하여 추출
◦ 다음의 표는 정해진 허용오차와 이를 기준으로 결정된 표본 수임.
산업분류 허용오차 표본수
35 전기, 가스, 증기 및 공기조절 공급업 16% 111
36 수도사업 20% 67
37 하수, 폐수 및 분뇨 처리업 20% 110
38 폐기물 수집운반, 처리 및 원료재생업 18% 183
39 환경 정화 및 복원업 9% 30
45 자동차 및 부품 판매업 26% 250
46 도매 및 상품중개업 26% 533
47 소매업; 자동차 제외 30% 918
55 숙박업 15% 673
56 음식점 및 주점업 30% 626
58 출판업 20% 275
59 영상·오디오 기록물 제작 및 배급업 23% 160
60 방송업 18% 83
61 통신업 26% 160
62 컴퓨터 프로그래밍, 시스템 통합 및 관리업 27% 109
63 정보서비스업 28% 80
64 금융업 21% 128
65 보험 및 연금업 23% 162
66 금융 및 보험 관련 서비스업 18% 170
68 부동산업 26% 445
69 임대업;부동산 제외 25% 264
70 연구개발업 19% 146
71 전문서비스업 29% 278
72 건축기술, 엔지니어링 및 기타 과학기술 서비스업 24% 271
73 기타 전문, 과학 및 기술 서비스업 30% 208
74 사업시설 관리 및 조경 서비스업 21% 235
75 사업지원 서비스업 30% 403
84 공공행정, 국방 및 사회보장 행정 20% 401
85 교육 서비스업 24% 642
86 보건업 25% 393
87 사회복지 서비스업 16% 231
90 창작, 예술 및 여가관련 서비스업 23% 301
91 스포츠 및 오락관련 서비스업 22% 830
94 협회 및 단체 18% 325
95 수리업 30% 546
96 기타 개인 서비스업 21% 932
91121 골프장 17% 51
96121 욕탕업 15% 484
계 12,214
<표 3-36> 상업․공공 부문 산업분류별 허용오차 및 표본 수
68 -3) 추정방법
가) 표본층 규모 공식
◦ 부모집단 (h층)에서의 표본층 규모 공식 :
․
․․
․․
여기서
: 전수층을 나타내는 첨자
: 표본층을 나타내는 첨자
: 특성변수
: 모집단수
: h층 부모집단수
: h층 부모집단 총계
: h층 부모집단 총계추정치
: 신뢰계수
: h층 부모집단 변이계수
허용상대오차
◦ 부모집단 (h층)의 총표본규모
층전수층의표본규모
69
-총 표본규모 :
◦ 절사점(cut-off point)결정
- 특정변수를 크기순으로 나열한 후 주어진 상대허용오차(표본오차)와 신뢰구간 에서 표본층의 표본크기를 구하고 가 최소 되는 점을 절사점으로 결정하고 절사점 위의 표본을 전수층과 표본층으로 구분
◦ 산업소분류 추정치 는 다음과 같음.
여기서
: 특성 X에 관한 값의 합계추정치
: 특성 X에 관하여 조사된 값
: 추출율의 역수
: 산업대분류
: 산업중분류
: 산업소분류
: 조사한 사업체를 나타내는 첨자
: 전수층을 나타내는 첨자
: 표본층을 나타내는 첨자
- 그리고 이 특성 에 대한 분산 은 다음과 같음.
- 또한 산업중분류의 추정치 은 산업소분류 추정치 의 합으로 나타냄.
70
-- 그리고 의 분산 을 합산하여 의 분산 을 계산하며
의 표준오차 및 상대표준오차 는 다음과 같음.
×
- 표본오차는 상대표준오차를 이용한다.
4) 대체표본
◦ 표본층에서 얻은 표본 대해서는 표본틀에서 처음 추출된 표본의 전후에 있는 표본을 대체표본1, 대체 표본2로 추출하여 두 그룹의 대체표본을 설정
바. 가정 부문
1) 모집단 분석 및 표본 수
◦ 2005년 인구주택 총조사 가구가 표본 틀로 사용되었으며 각 시도의 섬지역은 제외
◦ 다음의 표는 16개 시도별/시부군부별 모집단 조사구수와 표본 조사구수 그리 고 표본 가구 수를 나타냄.
71
-모집단 조사구수 표본 조사구수 표본 가구수
서울 48,806 180 1,800
부산 18,056 66 660
대구 12,120 45 450
인천 12,591 45 450
광주 6,752 25 250
대전 7,230 27 270
울산 5,044 19 190
경기 시부 47,669 174 1,740
군부 1,382 -
-강원 시부 5,727 18 180
군부 2,094 6 60
충북 시부 4,951 16 160
군부 2,490 7 70
충남 시부 6,316 17 170
군부 3,340 9 90
전북 시부 7,475 22 220
군부 1,615 4 40
전남 시부 5,004 14 140
군부 3,873 9 90
경북 시부 10,817 27 270
군부 2,904 11 110
경남 시부 13,017 38 380
군부 2,605 11 110
제주 시부 1,905 7 70
군부 749 3 30
계 234,532 800 8,000
<표 3-37> 가정부문 모집단 및 표본의 크기
72
-◦ 다음의 자료는 16개 시도별/시부군부별 모집단 가구수 자료이며,. 서울시와 광 역시는 시부와 군부를 층화하지 않았음.
전체 시지역 군지역 합계
서울 3,255,372 0 3,255,372
부산 1,160,786 0 1,160,786
대구 795,226 0 795,226
인천 789,112 0 789,112
광주 440,480 0 440,480
대전 465,871 0 465,871
울산 322,841 0 322,841
경기 3,043,112 55,587 3,098,699
강원 331,129 84,177 415,306
충북 304,515 96,529 401,043
충남 336,394 121,207 457,601
전북 411,794 46,679 458,474
전남 274,567 121,008 395,576
경북 570,269 101,387 671,657
경남 769,872 77,773 847,642
제주 108,550 20,530 129,081
합계 13,379,890 724,877 14,104,767
<표 3-38> 가정부문 모집단의 크기
◦ 다음의 자료는 거처종류별, 난방시설별, 연건평수별, 가구원수별 모집단 수임.
거처종류 시지역 군지역 합계
상가내주택 159,627 22,973 182,600
다세대 1,142,606 19,666 1,162,272
연립 469,690 40,218 509,908
단독 2,149,178 349,923 2,499,101
대형APT 2,491,247 39,861 2,531,108
소형APT 3,859,874 168,237 4,028,111
기타 3,107,668 83,999 3,191,667
합계 13,379,890 724,877 14,104,767
<표 3-39> 가정부문 거처종류별 모집단의 크기
73
-난방시설 시지역 군지역 합계
연탄등 132,547 44,378 176,925
전기보일러 259,286 55,167 314,453
LPG보일러 414,577 135,436 550,013
기름보일러 2,474,702 420,773 2,895,475
중앙난방 900,201 10,319 910,520
지역난방 1,327,030 1,281 1,328,311
도시가스 7,871,547 57,523 7,929,070
합계 13,379,890 724,877 14,104,767
<표 3-40> 가정부문 난방시설별 모집단의 크기
연건평 시지역 군지역 합계
25평이하 4,068,159 166,020 4,234,179
25평초과 9,311,730 558,858 9,870,588
합계 13,379,889 724,878 14,104,767
<표 3-41> 가정부문 사용건평별 모집단의 크기
가구원수 시지역 군지역 합계
3인이하 8,144,029 504,892 8,648,921
4인이상 5,235,860 219,986 5,455,846
합계 13,379,889 724,878 14,104,767
<표 3-42> 가정부문 가구원수별 모집단의 크기
74
-◦ 다음의 자료는 지역별, 거처종류별 표본 조사구 수임.
상가내
주택 다세대 연립 단독 대형A
PT
소형A
PT 기타 계
서울 1 23 14 26 35 32 49 180
부산 1 9 3 16 13 15 9 66
대구 1 4 1 10 9 11 9 45
인천 1 14 1 7 8 12 2 45
광주 0 1 0 6 6 9 3 25
대전 0 3 1 7 6 7 3 27
울산 0 2 1 3 3 6 4 19
경기 시부 2 26 11 36 39 45 15 174
군부 0 0 0 0 0 0 0 0
강원 시부 1 0 1 6 2 6 2 18
군부 0 1 0 4 0 1 0 6
충북 시부 0 1 0 5 2 6 2 16
군부 0 0 1 4 0 2 0 7
충남 시부 0 1 1 5 3 5 2 17
군부 1 0 1 5 0 1 1 9
전북 시부 0 1 1 7 3 7 3 22
군부 0 0 0 3 0 1 0 4
전남 시부 0 1 0 4 2 4 3 14
군부 0 0 0 7 0 1 1 9
경북 시부 1 2 1 8 4 7 4 27
군부 0 1 0 5 1 2 2 11
경남 시부 1 1 2 7 6 11 10 38
군부 0 1 0 6 1 2 1 11
제주 시부 0 2 0 2 1 1 1 7
군부 0 0 1 2 0 0 0 3
계 10 94 41 191 144 194 126 800
<표 3-43> 가정부문 지역별 거처종류별 표본 조사구 수
75
-◦ 다음의 자료는 거처종류별, 난방시설별, 연건평수별, 가구원수별 표본 조사구 수이다. 각 조사구에서는 10개의 가구가 랜덤으로 선택됨.
거처종류 시지역 군지역 합계
상가내주택 9 1 10
다세대 91 3 94
연립 38 3 41
단독 155 36 191
대형APT 142 2 144
소형APT 184 10 194
기타 121 5 126
합계 740 60 800
<표 3-44> 가정부문 거처종류별 표본 조사구 수
난방시설 시지역 군지역 합계
연탄 등 13 6 19
전기보일러 21 7 28
LPG보일러 28 9 37
기름보일러 163 31 194
중앙난방 47 1 48
지역난방 70 1 71
도시가스 398 5 403
합계 740 60 800
<표 3-45> 가정부문 난방시설별 표본 조사구 수
76
-연건평 시지역 군지역 합계
25평이하 179 10 189
25평초과 561 50 611
합계 740 60 800
<표 3-46> 가정부문 사용건평별 표본 조사구 수
가구원수 시지역 군지역 합계
3인이하 413 52 465
4인이상 327 8 335
기타 0 0 0
합계 740 60 800
<표 3-47> 가정부문 가구원수별 표본 조사구 수
2) 추출 방법
◦ 2011년 표본규모(안)에서 제시한 표본규모를 행정구역 모집단 가구수의 비율로 비례배분을 원칙으로 하여 지역별 에너지원별 총 추정량이 가능하도록 표본크 기를 조정
◦ 조사구 기준으로 표본 설계하였고 경기·강원 등 9개 도는 시부와 군부로 나누 어 총 25개의 부모집단을 설정
◦ 조사구 기준으로 거처종류, 난방시설, 연건평수, 가구원수에 따른 특성지표를 만들어 모집단 비율과 유사하도록 표본을 배분
◦ 표본조사구가 추출되면 각 표본 조사구에서 10가구가 조사되며 조사구의 특성 (거처 종류, 거처의 형태 등)을 고려하여 표본을 추출
3) 추정방법
◦ 7개 특별 광역시 및 9개도의 동부, 읍면부의 특성 X의 합계추정치 , 시도별 합계추정치 및 전국추정치는 다음과 같음.