• 검색 결과가 없습니다.

추정

문서에서 식품소비행태조사 2020 (페이지 62-68)

조사 설계

4. 추정

부, 규칙적 운동여부의 총 5가지의 비율특성을 추가적으로 고려 - 혼합계수는 총 15가지 비율특성별 혼합계수의 가중평균으로 0.7615

❍ 청소년 응답수는 총 622명이고 이들의 최종가중치는 전체 평균 4,599.0이고 134.0~

44,293.0의 범위를 가지며 분산증가분은 2.017의 정도임<표 2-19>.

- 권역별로 수도권의 청소년 최종 가중치의 평균값이 8,067.0으로 가장 크고, 강원권 이 가장 작은 1,410.0의 평균값

<표 2-19> 혼합표본 권역별 청소년 혼합 가중치 분포

권역 청소년수 합계 평균 표준편차 최솟값 중위수 최댓값 Lw

수도권 173 1,395,583 8,067.0 5,777.0 584.2 6,914.9 44,293.0 1.513 충청권 60 329,020 5,483.7 3,575.5 343.5 5,065.4 13,885.8 1.425 호남권 116 346,004 2,982.8 2,148.3 164.9 2,401.0 10,561.4 1.519 대경권 142 281,082 1,979.5 1,339.0 134.0 1,848.4 6,098.4 1.458 경남권 71 424,271 5,975.6 5,173.4 448.7 4,602.5 32,711.8 1.750 강원권 60 84,601 1,410.0 1,009.1 357.5 1,075.6 4,701.6 1.512 전국 622 2,860,561 4,599.0 4,638.5 134.0 2,946.4 44,293.0 2.017

단 포괄범위(coverage) 및 무응답 정도를 고려한 표본가중치가 함께 고려되어 모수추 정 및 자료 분석을 진행해야 함.

4.2. 모수추정

4.2.1. 총합추정

❍ 본 조사를 통해 얻게 되는 대부분의 모수는 총합추정량(total estimator)에 기초하여 산출됨.

- 특성치

에 대한 총합추정량



은 다음과 같이 정의

 

  

  

  





(식 2-2)

- 여기서





는 각각

번째 조사구내

번째 표본응답개체의 표본가중치와 조사값을 나타내며,

는 총 표본층 수,

는 층내 조사구 수,



는 조사구 내 표본 응답개체 수

- 이는 1절에 기술한 바와 같이 두 개의 독립표본으로부터 얻는 두 개의 총합추정량의 가중합의 형태로 식 (2-1)과 동일한 추정량이 됨.

❍ 조사단위별로 총합추정량이 계산되어지며, 3절에서 기술한 바와 같이 주구입자, 성인 구입자, 청소년구입자 각각의 표본가중치와 조사값을 선택하여 사용함.

4.2.2. 영역총합추정

❍ 식품소비자행태를 권역별, 성별, 연령별 등의 세부 영역으로 나눈 통계를 구하는 것은

영역추정(domain estimation)이라 칭함.

❍ 영역 총합추정을 위해서는 식품소비자행태가 특정한 영역에 포함되는지의 여부를 나타 내는 지시자(indicator)를 먼저 정의한 후 총합을 추정함.

- 영역지시자와 새로운 변수를 다음과 같이 정의

  

  ∈  ∉ 

  

여기서

⊂  

는 특정 세부영역

를 나타냄.

- 영역총합추정량(domain total estimator)은 위의 변수로 정의되는 가중합 형태로 다음과 같이 추정



  

  

  





4.2.3. 총합함수추정

❍ 모수는 종종

 × 

총합벡터

 ′

의 함수인

   



으로 표현되며 표 본추정량은 총합추정량을 해당 함수에 대입하여 구할 수 있음.

  



여기서

 ′

  ′    





는 각각

개의 조사값과 총합추정량임.

❍ 비추정은 위의 총합함수추정의 특수형태(즉,

  

)인데 평균과 영역별 비율 등이 그 예임.

- 두 총합의 비추정은 다음과 같이 정의

    

여기서





는 특성치

의 총합추정량

- 만일 모든 개체에 대해

≡ 

이라 놓는다면,



는 모집단 크기

에 대한 추정량



이 되며 비추정량은 다음과 같은 평균추정량으로 계산

   

(식 2-3)

- 위의 평균추정량을 독립된 두 표본으로부터 얻게 되는데 다음과 같이 두 추정량의 가 중합이 됨. 단,





는 각각 표본

 

으로부터 얻게되는 총합과 크기에 대한 추정량

  



 

  

 

(식 2-4)

4.3. 분산추정

4.3.1. 총합추정

❍ 총합추정량



을 층별 총합추정량의 단순평균합 형태로 표현한다면 층간 독립표본의 성질을 이용하여 다음과 같이 분산추정식을 추정할 수 있음.

 

  

 

  

 

  

  

  

(식 2-5)

-

   

는 조사변수

의 층 총합

      

의 불편추정

량이고,

 

는 층 내 표본추출률

-



의 표현은 분산추정식



이 일차추출단위 합성값



에 대한 연산자 형태 로 나타날 수 있음을 의미

- 본 조사의 경우, 층 내 표본추출률

은 매우 작아 위의 식에서 생략 가능

4.3.2. 영역총합추정

❍ 영역총합추정량의 분산추정식은



의 일차추출단위 합성값을 적절히 교체하여 다 음과 같이 구할 수 있음.

  

- 여기서

    

은 영역총합추정량의 일차추출단위 합성값

4.3.3. 총합함수추정

❍ 총합함수 추정량의 분산추정식은 함수식

 



에 대해 총합추정량



의 선형합으로 근 사시켜 분산추정량으로 구할 수 있음.

 



≃ 





-

  

 

  

 

 



의 총합



의 선형근사식이고,

-

 

 

 



 



의 총합추정량



에 대한 편미분값임. 하지만, 실제 추

정시에는 모총합



를 알 수 없음. 따라서

 

 

 



을 대신하여 사용 가능

❍ 비추정량



의 경우, 위의 테일러정리를 이용한 결과를 적용하여 다음과 같은 분산추정

치를 적용할 수 있음.

  

- 여기서

     

는 비추정량의 분산추정을 위한 일차추출단위 합성값

4.3.4. 평균추정

❍ 평균추정량

   

의 분산추정식은



의 특수형태로 모든 개체에 대해

≡ 

인 경우에 해당함.

  

(식 2-6)

- 하지만 위의 식은 혼합표본의 특성보다는 전체 표본에 대한 총합인 식 (2-6)이 고려 된 다소 간소한 근사적 분산추정의 형태에 해당

❍ 식품소비행태조사의 혼합표본 특성을 고려하면 두 독립표본에 대한 혼합추정 총합들에 대한 테일러정리를 이용한 선형근사 분산추정량을 사용할 수 있음.

- 기존표본

와 신규표본

에 대한 총합 및 크기에 대한 4가지 총량의 함수인 식 (4-3)의 평균추정을 고려하여 이에 대해 테일러 선형근사를 적용하여 분산추정식을 유도하면 다음과 같이 표현 가능

      

(식 2-7)

- 따라서 평균추정량 (혹은 비율추정량)에 대한 분산계산은 기존표본과 신규표본에 대 해 각각 분산을 추정한 후, 이를 식 (4-4)로 취합하여 계산하는 것이 바람직

- 식 (2-7)과 비교하여 식 (2-6)은 매우 단순하지만 다소 부정확(박인호 외, 2014, 표

4-1 참고)

4.3.5. 상대표준오차추정

❍ 일반적으로 표본오차를 분산이나 표준오차로 표현할 때, 흔히 상대표준오차(relative standard error, RSE), 혹은 변동계수(coefficient of variation, CV)로 불리는데 다 음과 같이 정의됨.

 

 

- 위의 변동계수는 앞서 고려한 통계량



,



,



,



에 대해 각각 정의

문서에서 식품소비행태조사 2020 (페이지 62-68)