조사 설계
4. 표본 가중치
4.1. 표본가중치 개요
◦ 복합표본설계(complexsamplingdesign)에 의해 얻어진 조사자료를 분석할 때는 일반적으로 개별 응답개체의 조사값 가 해당 표본가중치 와 곱 해져 합산되는 가중표본총합들을 바탕으로 수행됨.
◦ 식품소비행태조사의 최종 표본 추출단위는 가구이지만 단계별로 조사구,가 구,가구 구성원(즉,주 구입자,성인 가구원,청소년 가구원)의 순으로 추출 되어 조사가 이루어짐.따라서 조사단위별로 모집단을 대표하는 표본가중치 을 각각 산출하여 관련된 통계분석이 가능하도록 함.
4.2. 조사구 가중치
◦ 일차추출단위인 조사구의 표본가중치는 크기비례계통추출을 반영한 설계가 중치와 30가구 이하의 소규모 조사구 절사에 대한 보정,그리고 조사구 무 응답에 대한 조정 등 세가지 표본조사의 변동요소를 반영하여 다음과 같이 계산됨.
◦ 조사구 설계가중치는 층별 조사구 포함확률의 역수로 다음과 같이 정의됨.
-여기서 는 조사구의 표본포함확률,는 층 표본조사구
수,와 는 각각 층 번째 조사구 내 가구 수와 층 내 총가구 수임.
◦ 전체 조사구를 대표할 수 있는 가중치의 산출이 가능하게 하도록 조사구 추 출에서 제외(절사)시킨 소규모 조사구들에 대한 포함률의 조정을 고려함.
-조사구 절사조정 가중치는 조사구 설계가중치에 절사로 제외된 조사구 규모를 반영하여 확대한 값임.
-여기서 ′는 표본층 내 조사구 절사조정계수이고,와 ′
는 각각 절사 전후 조사구 수 비(ratio)임.
◦ 조사구 무응답은 크게 두 종류로 나뉘는데,(i)조사구에 대한 접근불가와 (ii)조사구 내 모든 표본가구의 조사 불응의 경우임.
-부적격 조사구는 2곳의 일반조사구 2개로 기숙사동과 재개발 지역 등의 이유로 조사 부적격으로 나타남.
-일부 지역에서 표본조사구 및 목표응답 가구의 부족을 우려하여 7곳의 무응답조사구를 대체하여 조사에 투입함.서울 3곳과 부산,대구,울산, 경북에서 각각 한 곳씩임.
-조사구 내 모든 표본가구 불응인 곳은 모두 53개 조사구로 경기도 13개, 경남 9개,서울 6개,강원 7개 등임.
-접촉불가 조사구는 총 39개로 이 중 37개는 아파트조사구인 데 관리사 무소 거절이 36개,민원 1개임.나머지 2개의 조사구는 일반조사구로 모 두 원룸지역·접근불가임.
◦ 무응답 조사구에 대해 원조사구가 대체된 곳을 제외하고 조사구 절사가중 치에 대해 무응답 조정층별 응답 가중치 조정을 실시하여 조사구 최종가중 치를 산출함.
-무응답 조정층은 2010인구주택총조사에서 파악한 표본조사구별 정보를 이용한 의사결정나무모형의 분석에 의하면 표본층(혹은 권역)과 대졸자 가구주 비중에 의해 구성할 수 있음.
-조사구 무응답조정 가중치는 무응답조정층별로 다음과 같이 계산됨.
-여기서 는 조사구 무응답조정계수로 조정층 내 응답조사구는 절사 가중치 기준의 가중응답률의 역수,무응답조사구는 0의 값이 곱해짐.
4.3. 주 구입자 가중치
◦ 주 구입자란 가구 내 식품 주 구입자로 표본가구를 대표하는 조사 대상으로 주 구입자 가중치는 가구 가중치로 이해할 수 있음.
◦ 주 구입자 가중치는 조사구 내 가구추출률을 반영한 설계가중치,가구 무응 답 조정,그리고 보조정보를 이용한 우리나라 전체 가구의 인구사회학적 분 포에 벤치마킹하는 래이킹 비 조정(rakingratioadjustment)의 세 가지 요소 가 차례대로 반영됨.5
-주 구입자 설계가중치는 조사구 최종가중치에 조사구 내 가구 포함확률 의 역수가 곱하여져 산출됨.
-주 구입자 무응답조정은 조사구별(비가중)가구응답률의 역수가 무응답 조정계수로 곱해져 수행되었는데,일부 낮은 가구응답률을 갖는 조사구 에 대해서는 조정계수가 과도하지 않도록 상한값이 고려됨.
5래이킹 비 조정이란 모집단에 대한 두 개 혹은 그 이상의 보조변수의 정보가 범주 별 주변합 형태로 주어질 때,조정 전 가중치를 개별 보조변수들에 대해 반복적으로 비율적합하는 방식을 통해 차원별 모집단 빈도표의 주변총합과 일치시키는 방법임.
-주 구입자의 최종가중치는 통계청의 2013년 추계인구 추정에 따른 인구 사회학적 가구 특성 총합과 일치하도록 래이킹 비 조정을 적용하여 산출 함.래이킹 비 조정에 고려된 보조변수는 표본층,가구 구성원 수,가구 주 성별 및 연령,가구주 교육 수준별 추계가구 수를 고려함.
4.4. 성인 가중치
◦ 성인 가구원이란 주 구입자를 포함한 가구 내 모든 성인 구성원을 일컬으며, 이들 모두는 조사 대상자임.
◦ 성인 가중치는 가구 가중치에 해당하는 주 구입자 가중치를 기본으로 하여, 가구 내 성인 무응답조정과 성인의 인구사회학적 총합 구성비를 고려한 래 이킹 조정을 적용하여 계산함.
-성인 가구원 설계가중치는 주 구입자 최종가종치로 정의되며 이에 가구 내 성인 수 대비 응답성인 수의 응답률의 역수가 곱해져 성인 무응답조 정 가중치가 산출됨.이때 주 구입자 무응답가중치 산출과 마찬가지로 과도한 조정이 되지 않도록 조정계수의 상한선을 갖도록 고려됨.
-성인 최종가중치는 성인 가구원 무응답조정 가중치에 래이킹 비 조정을 적용하여 통계청의 2013년 추계인구에서 추정한 기본적인 인구사회학적 성인의 특성별 총합과 일치하도록 산출됨.이때 고려된 보조정보는 표본 층별,성별,연령별 성인총합이 고려됨.
4.5. 청소년 가중치
◦ 청소년 가구원이란 가구 내 만 13세에서 18세까지의 모든 청소년 구성원을 일컬으며,이들 모두는 조사 대상자임.
◦ 청소년 가중치는 먼저 (i)청소년 설문지 조사에 대한 가구 응답구분과 무응 답성향분석에 근거하여 무응답 조정층별로 가구 가중치에 해당하는 주 구 입자 가중치를 조정하고,(ii)청소년 가구 내 청소년 무응답을 조정하며, (iii)청소년의 인구사회학적 총합 구성비를 고려한 래이킹 조정을 적용하여 청소년 최종가중치를 계산함.
-청소년 설계가중치는 주 구입자 최종가중치로 정의되며 이에 표본(응답) 가구의 특성별로 무응답 조정층을 구성하고 조정층 내 가구의 청소년 조 사 응답률의 역수에 조정계수가 곱해져 청소년 가구무응답조정 가중치 가 산출됨.
-청소년 무응답조정 가중치는 청소년조사 응답 가구 내 청소년 응답률의 역수를 곱하여 산출됨.이때 무응답조정에 대한 상한선은 고려되지 않음.
-청소년 최종가중치는 통계청의 2013년 추계인구에서 제공하는 기본적인 인구사회학적 특성별 총합과 일치하도록 청소년 무응답조정 가중치에 래이킹 비 조정을 적용하여 산출함.이때 고려된 보조정보는 광역지역 별,성별,연령별 청소년 총합이 포함됨.
5. 추정
5.1. 추정 개요
◦ 본 조사의 조사 대상은 주 구입자,성인 가구원,청소년 가구원으로 이루어 져 있어,각 조사 대상의 모수추정 및 자료분석이 가능함.
◦ 각 조사 대상은 선택되는 복합표본 추출방식(complexsampling)과 표본틀 의 모집단 포괄범위(coverage)및 무응답 정도를 고려한 표본가중치를 함께 고려하여 모수추정 및 자료분석이 이루어져야 함.만약 이러한 고려없이
조사 자료를 분석한다면 추정량에 편향(bias)이 발생함은 물론 추정량의 정 도(precision)수준이 과소평가되어 자료분석의 통계적 유의성이 왜곡될 수 있음.
5.2. 모수추정
5. 2. 1.총합추정
◦ 본 조사를 통해 얻게 되는 대부분의 모수는 총합추정량(totalestimator)에 기 초하여 산출됨.
-특성치 에 대한 총합추정량 은 다음과 같이 나타낼 수 있음.
-여기서 와 는 각각 층 번째 조사구 내 번째 표본응답개체의 표본가중치와 조사값을 나타내며,(=16)는 총 표본층 수,는 층내 조 사구 수,는 조사구 내 표본응답개체를 나타냄.
5. 2. 2.영역총합추정
◦ 식품소비행태를 권역별,성별,연령별 등의 세부 영역으로 나눈 통계를 구하 는 것은 영역추정(domainestimation)이라 칭함.
◦ 영역 총합추정을 위해서는 식품소비행태가 특정한 영역에 포함되는지의 여 부를 나타내는 지시자(indicator)를 먼저 정의한 후 총합을 추정함.
∈ ∉
-여기서 ⊂ 는 특정 세부 영역 를 나타냄.
-영역총합추정량(domaintotalestimator)은 위의 변수로 정의되는 가중합 형태로 다음과 같이 추정함.
5. 2. 3.총합함수추정
◦ 모수는 종종 × 총합벡터
′의 함수인
으로 표현 되며 표본추정량은 총합추정량을 해당 함수에 대입하여 구할 수 있음.
-여기서
′와
′
는 각각 개의 조사값과 총합추정량임.
◦ 비추정은 위의 총합함수추정의 특수 형태(즉, )인 데 평균과 영역별 비율 등이 그 예임.
-두 총합의 비추정은 다음과 같이 정의됨.
-여기서 와 는 특성치 와 의 총합추정량임.
-만일 모든 개체에 대해 ≡ 이라 놓는다면,는 모집단 크기 에 대 한 추정량 이 되며 비추정량은 다음의 평균추정량이 됨.
5.3. 분산추정
5. 3. 1.총합추정
◦ 총합추정량 을 층별 총합추정량의 단순평균합 형태로 표현한다면 층간 독 립표본의 성질을 이용하여 다음과 같이 분산추정식을 추정할 수 있음.
- 는 조사변수 의 층총합 의 불편 추정량이고, 는 층내 표본 추출률임.
-의 표현은 분산추정식 이 일차추출단위 합성값 에 대한 연 산자 형태로 나타날 수 있음을 나타냄.
-본 조사의 경우,층내 표본 추출률 는 매우 작아 위의 식에서 생략될 수 있음.
5. 3. 2.영역총합추정
◦ 영역총합추정량의 분산추정식은 의 일차추출단위 합성값을 적절히 교 체하여 다음과 같이 구할 수 있음.
5. 3. 4.상대표준오차추정
◦ 일반적으로 표본오차를 분산이나 표준오차로 표현할 때,흔히 상대표준오차
◦ 일반적으로 표본오차를 분산이나 표준오차로 표현할 때,흔히 상대표준오차