• 검색 결과가 없습니다.

한국복지패널 가중치의 포괄성 분석

앞에서 살펴본 가중치 조정과정을 고려하여 한국복지패널1차년도 자료에 대한 보 다 엄밀한 가중치 조정이 되도록 하며, 주요 세부 변수별로 이미 부여된 가중치의 포괄성을 고려하여 향후 패널 가중치 조정과정에 반영하도록 함으로서 보다 적절한 가중치를 부여하여 자료의 정확성을 제고하는데 목적이 있다. 이를 위해 복지패널 1 차년도 가중치의 사후층화 조정 인자(post-stratification factor : PF)를 다음과 같이 정 의하기로 한다. 이는 2절에서 설명한

F(⋅)

와 같다.

PF= N

ij ˆ

N

ij

(5.1) PF는 1에 가까울수록 표본 셀

ij

의 값이 모집단 셀

ij

와 일치하며, 1보다 크면 과 소 추정, 1보다 작으면 과대추정을 의미한다. 또한 PF값이 1을 기준으로 지나치게 차 이가 나면 모집단의 분포와 표본의 분포가 서로 괴리가 있어 추정량의 분산이 커지 게 되는 단점이 있기 때문에 통상적으로 각 셀별로 0.5에서 2.0사이에 놓이도록 재조 정한다.19) 포괄성 분석을 위해 한국복지 패널 1차년도 자료를 이용하여 패널가구 및 개인에 부여된 가중치를 다음의 기준에 따라 분석하고, 기준이 되는 모집단 분포는 통계청 자료를 바탕으로 포괄성을 파악하고자 한다.

․ 지역별*연령대별 분포(10세 이하, 10~20세미만, 20~30세미만, 30~40세미만, 40~50세미만, 50~60미만, 60~70세미만, 70세 이상)

․ 지역별*가구규모별 분포(1인, 2인, 3인, 4인, 5인, 6인, 7인) ․ 지역별*주거유형별의 분포

․ 지역별*성별*교육정도별 분포

18) 본 연구에서는 가구와 개인 가중치의 포괄성만을 분석대상으로 하여 부가조사인 “아동”에 대한 가 중치는 제외하기로 한다.

19) Westat(1996) " Current Best Method Manual"

1. 주요 분석 변수별 포괄성 분석

가. 지역별 연령대별 인구분포

2005년 12월 말 현재 통계청의 인구주택 총 조사 결과를 바탕으로 한 지역별 연 령별 인구 분포는 다음과 같다.

〈표 5-1-1〉 지역별*연령대별 인구분포

(단위:명) 지역 10세미만 10~19세 20~29세 30~39세 40~49세 50~59세 60~69세 70세이상 전국 47,041,434 5,551,237 6,535,414 7,333,970 8,209,067 8,023,940 5,133,735 3,568,920 2,685,151 서울 9,762,546 991,679 1,243,130 1,835,235 1,783,293 1,633,559 1,163,035 701,502 411,113 부산 3,512,547 341,047 481,378 576,709 545,716 629,405 473,263 288,417 176,612 대구 2,456,016 279,580 361,335 391,273 417,927 434,457 279,389 176,090 115,965 인천 2,517,680 307,002 377,637 389,114 459,240 475,211 249,224 149,896 110,356 광주 1,413,644 187,013 220,869 247,488 245,128 227,230 137,709 86,171 62,036 대전 1,438,551 179,583 218,668 247,309 253,241 246,922 145,246 85,520 62,062 울산 1,044,934 139,752 163,701 150,637 197,810 201,211 107,102 51,221 33,500 경기 10,341,006 1,404,108 1,486,287 1,534,613 2,038,120 1,846,746 943,959 627,853 459,320 강원 1,460,770 167,279 194,412 200,744 224,698 247,182 164,393 146,977 115,085 충북 1,453,872 172,845 204,818 215,512 230,165 238,508 153,124 128,404 110,496 충남 1,879,417 220,737 255,207 267,115 287,167 288,428 204,222 183,856 172,685 전북 1,778,879 209,425 249,673 240,517 260,174 272,185 206,884 176,114 163,907 전남 1,815,174 210,728 236,031 202,795 251,914 271,220 217,994 217,258 207,234 경북 2,594,719 286,724 343,866 354,144 395,128 408,979 303,350 262,463 240,065 경남 3,040,993 379,775 423,062 406,571 526,500 519,091 331,774 245,077 209,143 제주 530,686 73,960 75,340 74,194 92,846 83,606 53,067 42,101 35,572 자료: 통계청 KOSIS-인구주택총조사 지역별*연령대별 인구분포

강원, 전남, 경북 지역은 타지역에 비해 60대 인구비율이 각각 10.1%, 12%, 10.1%

로 상대적으로 높게 나타나고 있으며, 전남지역은 70세 이상인구비율도 11.4%로 가 장 높게 나타나고 있다. 한편 10세 이하 인구비율이 가장 낮은 지역은 부산지역으로 9.7%이며, 10대 인구비율이 가장 높은 지역은 광주로 15.6%, 20대는 부산지역으로 18.8%, 30대는 경기지역으로 19.7%, 40대는 울산지역으로 19.3%로 나타났다.

지역별 포괄성을 살펴보면, 전북, 전남, 경북 지역이 타지역에 비해 과대 추계된 것으로 나타났고, 부산, 울산, 경기, 강원, 충북, 충남 및 경남지역이 약간 과소추계 된 것으로 파악되었다. 그러나 지역별로는 사후층화인자가 안정적으로 분포하고 있 음을 알 수 있다.

〈표 5-1-2〉 지역별*연령대별 1차 가중치의 사후조정인자(PF)

지역 10세미만 10~19세 20~29세 30~39세 40~49세 50~59세 60~69세 70세이상 전국 1.00 0.84 1.04 1.35 0.91 1.13 1.08 0.78 0.83 서울 0.97 0.84 0.97 1.34 0.99 1.00 1.05 0.67 0.66 부산 1.01 0.74 1.12 1.43 0.81 1.32 0.96 0.77 0.73 대구 0.99 1.02 1.04 1.37 1.12 1.25 0.95 0.61 0.54 인천 1.05 0.67 1.12 1.28 0.85 1.17 1.11 0.62 0.80 광주 0.95 0.97 1.05 1.18 1.02 1.06 1.15 0.90 0.94 대전 0.98 0.81 1.30 1.57 0.80 1.47 0.93 0.63 0.66 울산 1.02 0.92 0.97 0.93 0.97 1.14 1.02 0.82 0.95 경기 1.02 0.85 1.08 1.42 0.89 1.10 1.02 0.65 0.73 강원 1.01 0.61 1.06 1.27 0.75 1.03 1.94 1.10 1.07 충북 1.03 0.85 0.82 1.53 0.75 1.14 1.18 0.96 0.94 충남 1.01 0.99 0.92 1.09 0.92 1.07 1.12 0.90 0.96 전북 0.85 1.26 1.26 1.77 1.23 1.45 1.05 0.82 0.84 전남 0.82 0.89 1.14 1.79 1.08 1.59 1.51 1.09 1.12 경북 0.85 0.71 1.24 1.80 0.81 1.39 2.26 1.08 1.39 경남 1.11 0.82 0.80 1.03 0.84 0.86 0.82 1.40 1.12 제주 0.97 1.01 1.94 1.26 0.79 1.70 1.16 0.68 0.51

연령대별로 60~69세의 지역별 사후층화인자를 살펴보면 강원, 전북, 전남, 경남, 강원 지역을 제외하고 나머지 지역에서 1보다 작은 값을 가짐으로 약간씩 과대 추 계된 것으로 파악되었다. 전체적으로 연령대별로 살펴보면, 10대, 30대, 60대, 70세 이상의 그룹에서 1보다 작은 값을 가짐으로 과대 추계된 것으로 나타나며, 나머지 연령대에서는 과소 추계된 것으로 파악되었다. 특히 20대의 경우 앞서 언급한 바와 같이 전반적으로 사후조정 인자값이 1보다 크기 때문에 과소 추계된 것으로 나타났 다. 경북의 50대의 경우 2.26으로 상대적으로 큰 가중치가 적용되며, 제주지역의 70 대 이상에서는 0.51로 작은 가중치가 적용되게 된다. 그러나 대부분 PF값이 0.5~2.0

사이에 놓여 있어 매우 안정적인 분포를 이루는 것으로 판단된다.

나. 지역별 가구규모별 분포

<표 5-1-4>로부터 지역별 가구규모별 사후층화 인자의 분포를 살펴보면, 전반적으 로 안정된 가중치 분포를 보이고 있으나, 7인가구의 경우 표본 빈도수가 0인 광주, 대전, 울산, 강원, 충북, 제주지역은 0으로 나타나 별도의 조정이 필요하며, 대전지역 의 1인가구와 인천, 경기, 전남, 경북지역의 7인가구의 경우 포괄성이 매우 떨어지는 것으로 나타나, 추가적인 재가중 작업이 필요한 것으로 파악되었다. 한편 가구 규모 별로 보면 1인, 5인, 6인, 7인 가구의 포괄성이 다른 가구에 비해 포괄성이 떨어지는 것으로 파악되었다. 전체적으로 1~6인가구의 경우 안정적이나, 7인가구의 경우에는 6인가구와 병합하여 사후조정인자를 고려해야 할 것으로 판단된다.

〈표 5-1-3〉 지역별*가구규모별 가구분포

(단위:가구)

지 역 합 계 1인가구 2인가구 3인가구 4인가구 5인가구 6인가구 7인가구

전국 15,863,817 3,170,675 3,520,545 3325,162 4,289,035 1,222,126 266,930 69,344 서울 3,305,929 675,739 670,455 732,043 917,243 248,450 49,781 12,218 부산 1,185,165 222,515 256,616 273,074 327,089 84,334 17,456 4,081 대구 813,765 148,331 165,227 181,837 240,111 62,613 12,761 2,885 인천 822,029 141,511 159,668 184,658 253,576 65,424 13,869 3,323 광주 459,454 87,447 92,150 93,224 130,972 45,114 8,573 1,974 대전 478,193 98,678 94,452 99,946 134,007 40,161 8,794 2,155 울산 338,796 57,923 63,620 75,717 111,541 24,813 4,280 902 경기 3,323,650 562,995 647,469 720,869 1,032,819 280,570 62,532 16,396 강원 519,598 122,139 139,079 101,089 109,914 35,022 9,511 2,,844 충북 504,253 114,584 126,337 95,873 116,567 38,291 9,808 2,793 충남 658,365 149,102 184,935 121,076 139,123 47,364 12,643 4,122 전북 618,552 136,754 164,954 114,667 135,529 50,636 12,452 3,560 전남 664,856 163,718 198,991 111,249 125,403 49,856 11,960 3,679 경북 937,767 224,611 261,810 176,099 201,591 57,488 12,792 3,376 경남 1,054,700 226,117 254,494 209,444 270,996 74,033 15,713 3,903 제주 178,745 38,511 40,288 34,297 42,554 17,957 4,005 1,133

〈표 5-1-4〉 지역별*가구규모별 1차 가중치의 사후층화인자(PF)

지 역 합 계 1인가구 2인가구 3인가구 4인가구 5인가구 6인가구 7인가구

전국 1.00 1.27 0.91 0.95 0.92 1.09 1.20 1.89

서울 0.96 1.29 0.75 0.93 0.96 1.08 1.32 1.08

부산 0.97 1.12 0.85 0.92 0.99 1.14 0.94 1.27

대구 0.97 1.03 0.84 0.86 1.07 1.26 1.18 1.23

인천 0.94 1.30 0.75 0.93 0.91 1.03 1.55 8.18

광주 1.09 1.58 1.22 1.14 0.82 1.07 1.61 0.00

대전 1.03 2.02 0.77 0.91 0.96 1.09 1.69 0.00

울산 0.96 1.01 0.96 1.04 0.85 1.20 1.20 0.00

경기 0.94 1.01 0.80 0.90 0.97 1.13 1.06 2.45

강원 1.07 1.80 1.18 1.20 0.59 1.62 1.11 0.00

충북 1.05 1.90 1.15 0.93 0.73 0.96 1.19 0.00

충남 1.00 1.00 1.14 1.18 0.89 0.65 1.33 0.75

전북 1.07 0.97 0.93 1.17 1.11 1.72 1.70 1.15

전남 1.26 1.37 1.45 1.17 1.01 1.28 1.03 2.83

경북 1.24 1.85 1.40 1.06 0.88 1.35 1.40 4.93

경남 0.99 1.98 1.12 0.80 0.79 0.71 1.19 1.83

제주 0.96 1.15 0.58 1.56 0.96 1.60 0.66 0.00

다. 지역별 주거유형별 분포

<표 5-1-6>으로부터 지역별 거처유형별 사후층화 인자의 분포를 살펴보면, 전반적 으로 안정된 가중치 분포를 보이고 있으며, 단독 및 아파트인 경우에 대해서도 대 전, 강원의 단독주택을 제외하고 나머지 지역별로는 안정적으로 나타나고 있으나, 그 외 거처유형별 사후층화 인자의 분포는 별도의 재가중 작업이 필요한 것으로 나 타났다. 이러한 차이는 조사과정에서 거처유형을 명확하게 정의하지 못한 결과로 사 료된다.

〈표 5-1-5〉 지역별*주거유형별 가구분포

(단위: 가구)

지역 계 단독주택 아파트 연립주택 다세대주택 비 거주용

건물 내 주택 주택이외

거처 전국 15,887,128 7,064,128 6,628,993 526,948 1,168,481 281,721 216,857 서울 3,309,890 1,404,272 1,218,779 144,827 414,983 55,607 71,422

부산 1,186,378 499,297 520,856 39,135 87,704 23,860 15,526

대구 814,585 389,744 356,812 7,287 43,355 15,166 2,221

인천 823,023 225,376 381,050 20,099 172,683 10,659 13,156

광주 460,090 180,507 260,726 5,110 3,410 7,042 3,295

대전 478,865 195,240 234,075 14,208 24,977 7,014 3,351

울산 339,095 135,939 168,478 7,691 16,988 8,190 1,809

경기 3,329,177 1,122,015 1,641,505 145,671 304,876 43,943 71,167

강원 520,628 284,699 197,686 19,658 3,648 12,579 2,358

충북 505,203 269,602 202,990 15,668 6,002 9,339 1,602

충남 659,871 380,558 225,113 21,481 16,809 12,160 3,750

전북 619,958 337,086 253,607 13,534 3,313 10,598 1,820

전남 666,319 431,318 197,949 12,067 4,950 14,235 5,800

경북 938,840 549,465 310,112 25,808 25,622 23,409 4,424

경남 1,056,007 551,099 424,420 24,198 22,063 22,049 12,178

제주 179,199 107,911 34,835 10,506 17,098 5,871 2,978

〈표 5-1-6〉 지역별*주거유형별 1차 가중치의 사후층화인자(PF)

라. 지역별*성별*교육정도별 분포 서울 남자 4,554,087 535,703 464,400 1,383,272 473,740 1,361,395 257,792 77,785

여자 4,660,085 716,681 569,318 1,503,914 466,841 1,069,263 145,377 188,691 부산 남자 1,642,661 229,215 220,567 552,415 167,460 396,671 42,506 33,827 여자 1,691,101 320,515 258,714 545,427 160,380 286,041 21,939 98,085 대구 남자 1,149,149 176,570 148,554 349,920 141,118 272,244 34,024 26,719 여자 1,159,407 229,210 168,483 350,321 126,028 195,407 17,032 72,926 인천 남자 1,178,249 175,478 146,249 454,001 133,663 219,125 24,274 25,459 여자 1,175,982 225,012 166,165 463,869 108,029 138,654 10,614 63,639 광주 남자 649,375 97,136 71,017 183,446 70,488 188,499 23,069 15,720 여자 664,535 123,635 86,439 205,235 67,535 130,994 10,876 39,821 대전 남자 670,500 101,346 74,216 183,431 64,640 187,307 44,157 15,403 여자 671,519 127,410 85,652 204,051 65,754 134,978 17,176 36,498 울산 남자 499,311 77,527 61,628 190,609 56,099 93,331 8,112 12,005 여자 472,583 89,709 68,041 179,149 45,324 58,390 3,693 28,277 경기 남자 4,794,403 727,124 527,597 1,621,120 491,774 1,129,909 183,454 113,425 여자 4,778,358 893,062 594,730 1,718,155 440,283 794,396 79,116 258,616 강원 남자 686,157 133,888 93,029 211,588 61,513 139,285 18,698 28,156 여자 684,226 174,149 95,943 197,040 52,043 80,402 6,809 77,840 충북 남자 681,910 135,420 86,050 211,048 64,963 137,935 18,032 28,462 여자 679,586 169,113 90,066 207,459 51,274 80,297 7,156 74,221 충남 남자 883,132 196,714 112,849 276,994 84,885 148,689 21,250 41,751 여자 875,796 239,518 111,352 257,698 58,419 88,449 7,858 112,502 전북 남자 817,259 165,358 104,843 242,537 69,865 172,610 22,820 39,226 여자 850,369 210,246 111,375 230,941 59,790 109,109 10,065 118,843 전남 남자 832,265 200,015 121,319 245,846 79,745 122,762 13,070 49,508 여자 872,171 250,481 114,150 215,451 57,536 66,819 4,648 163,086 경북 남자 1,211,271 242,968 162,749 378,422 140,197 204,711 22,706 59,518 여자 1,229,116 312,756 163,934 348,786 108,157 116,207 8,310 170,966 경남 남자 1,413,997 250,952 184,567 485,353 148,567 261,842 29,053 53,663 여자 1,423,224 314,249 194,849 455,877 123,214 161,232 11,012 162,791 제주 남자 242,383 40,979 30,536 73,368 36,182 47,141 5,992 8,185 여자 247,806 54,544 31,449 68,524 32,110 29,078 2,506 29,595 자료: 통계청 KOSIS "2005년 인구센서스 결과“- 외국인 제외

〈표 5-1-8〉 지역별*성별*교육수준별 1차 가중치의 사후층화인자(PF)

학 및 미교육의 경우 응답자가 타 부문에 비해 민감하게 고려하는 부분으로 응답자 편향에 의한 표본자료의 불안정성에 기인한 것으로 판단된다.

2. 1차년도 가중치 재조정과정

우선 가중치 재조정을 실시하기에 앞서 위에서 제시한 PF 에 대한 표로부터 PF값 이 0.5~2.0의 범위를 벗어나는 항목에 대하 1차적으로 셀결합(cell collapsing)를 실시하 고, 다음으로 관련된 모집단의 주변셀(marginal cell) 값을 이용한 가중치 조정을 수행 한다. 이에 적용할 이론은 2절에서 이미 다룬바 있기 때문에 이를 활용하기로 한다.

가. 셀 결합 후 PF 값의 분포

<표 5-1-4>의 지역별*가구규모별 PF 로부터 6인과 7인가구의 PF가 지역별로 매우 불안정하게 나타나, 이를 해결하기 위해 6인가구와 7인가구를 결합하여 “6인 이상”

가구로 표를 재구성하여 이에 대한 PF를 구한 결과가 다음과 같다.

〈표 5-1-9〉 셀 결합 후 지역별*가구규모별 1차 가중치의 사후층화인자(PF)

지 역 합 계 1인가구 2인가구 3인가구 4인가구 5인가구 6인이상

가구주)

전국 1.00 1.27 0.91 0.95 0.92 1.09 0.77

서울 0.96 1.29 0.75 0.93 0.96 1.08 0.79

부산 0.97 1.12 0.85 0.92 0.99 1.14 1.01

대구 0.97 1.03 0.84 0.86 1.07 1.26 0.84

인천 0.94 1.30 0.75 0.93 0.91 1.03 0.54

광주 1.09 1.58 1.22 1.14 0.82 1.07 0.51

대전 1.03 2.02 0.77 0.91 0.96 1.09 0.48

울산 0.96 1.01 0.96 1.04 0.85 1.20 0.69

경기 0.94 1.01 0.80 0.90 0.97 1.13 0.84

강원 1.07 1.80 1.18 1.20 0.59 1.62 0.69

충북 1.05 1.90 1.15 0.93 0.73 0.96 0.66

충남 1.00 1.00 1.14 1.18 0.89 0.65 0.89

전북 1.07 0.97 0.93 1.17 1.11 1.72 0.65

전남 1.26 1.37 1.45 1.17 1.01 1.28 0.82

경북 1.24 1.85 1.40 1.06 0.88 1.35 0.61

경남 0.99 1.98 1.12 0.80 0.79 0.71 0.78

제주 0.96 1.15 0.58 1.56 0.96 1.60 ·1.18

주: 6인 이상: 6인가구와 7인가구를 결합함)

셀 결합 후 사후조정 인자값은 “대전”을 제외하고 매우 안정된 값을 가지며, 결과

나. 셀결합 후 가중치 조정과정

〈표 5-1-12〉 지역별*거처유형별 재조정된 최종 가중치에 대한 사후층화인자(PF)

〈표 5-1-13〉 지역별*성별*교육수준별 최종 가중치에 대한 사후층화인자(PF)

다. 최종 가중치를 적용한 추정치 비교

기존의 가중치를 보다 안정적으로 조정한 최종 가중치를 이용하여 소득 관련 변 수를 이용하여 분산 감소 효과가 어느 정도 인지를 평가하고자 한다. 이를 위해 “가 구의 경상소득”을 활용하여 평균과 표준오차를 비교하였다.

〈표 5-1-14〉 지역별*거처유형별 가구가중치 조정전후 소득변수별 비교

조정 전 조정 후

구 분 평 균 표준오차 평 균 표준오차

경상소득 3152.95 40.448094 3114.71 40.366488

가처분소득 2825.25 45.605614 2795.08 44.53447

가중치 조정전후의 경상소득과 가처분소득의 표준오차를 비교해보면 조정 후 두 변수의 표준오차가 각각 0.2%와 2.34% 감소한 것으로 나타나 상대적으로 안정화되 었음을 확인 할 수 있다.

〈표 5-1-15〉 지역별*성별*교육수준별 개인가중치 조정전후 소득변수별 비교

조정 전 조정 후

구 분 평 균 표준오차 평 균 표준오차

경상소득 3152.75 30.4756702 3152.98 30.471524

가처분소득 2825.09 41.1521693 2825.28 41.1479471

한편 <표 5-1-15>에 제시한 개인가중치의 경우 지역별*성별*교육수준별로 가중치 조정전과 후의 소득변수별 비교에서도 가중치 조정후의 표준오차가 감소한 것으로 나타나 가중치가 안정화되었음을 알 수 있다.

Ⅵ. 결론

본 연구로부터 한국복지패널 1차년도 자료의 가구 및 개인가중치의 포괄성에 대 해 살펴보고 개인 및 가구의 인구사회학적 변수들의 모집단 자료를 이용한 가중치 재조정(보정)을 통해 일부 변수의 범주에 대해 포괄성이 떨어지는 문제점을 해결하

본 연구로부터 한국복지패널 1차년도 자료의 가구 및 개인가중치의 포괄성에 대 해 살펴보고 개인 및 가구의 인구사회학적 변수들의 모집단 자료를 이용한 가중치 재조정(보정)을 통해 일부 변수의 범주에 대해 포괄성이 떨어지는 문제점을 해결하