• 검색 결과가 없습니다.

네이만배분법과 수정절사법의 효율성 비교

N/A
N/A
Protected

Academic year: 2022

Share "네이만배분법과 수정절사법의 효율성 비교"

Copied!
23
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

네이만배분법과 수정절사법의 효율성 비교

진 영*

표본설계의 목적은 가능한 한 적은 비용으로 될 수 있는 한 작은 분산 을 갖는 추정량을 찾아내어 표본조사의 정확도를 높이고자 하는데 있다.

일반적으로 사업체부문 표본조사와 같은 대규모 표본조사에서는 네이만배 분법과 수정절사법을 사용하는데, 1997년 3월의 『통계분석연구』에 운수 업과 서비스업 통계자료를 이용해서 두 방법의 효율성을 비교한 논문을 게재하였다. 하지만 시간 제약으로 인해 표본 크기에 따른 비용 측면만 비 교를 하고 추정치의 효율성에 대해서는 연구를 하지 못했다. 따라서 본 논 문에서는 이전의 연구를 보완하여 층별 분산과 왜도에 따른 4가지 유형의 임의 모집단에 대한 모의실험을 통하여 두 방법의 효율성을 비교해 보았 다. 연구방법은 허용오차를 일정수준으로 고정한 상태에서 각 방법으로 추 출된 표본크기를 비교하여 비용측면의 효율성을 알아보고, 각 방법에 의해 동일한 표본크기를 추출했을 때의 허용오차와 변이계수를 비교하여 추정 치의 효율성을 알아 보았다.

< 차 례 >

Ⅰ. 서 론 Ⅱ. 네이만배분법 Ⅲ. 수정절사법 Ⅳ. 모의실험 Ⅴ. 결 론

* 통계연수원 교육연구과

본 연구에 유익한 논평을 해주신 동국대학교 김종호 교수임에게 감사드리고, 연구과정에 서 많은 격려와 도움을 주신 강상목 사무관과 경기대학교 이상은 교수님에게 감사드린다.

(2)

Ⅰ. 서 론

우리는 일상생활에서 통계조사의 예를 흔히 볼 수 있다. 어느 신문사 의 여론조사에서 우리나라 학생들의 75%가 ‘내가 가장 존경하는 인물은 부모님이라고 생각한다’라든가 ‘기상청 발표에 의하면 내일 서울에 비가 올 확률은 40%이다’라는 것이 그 예이다.

통계조사는 대부분 표본조사로 실시되며, 표본조사는 우리 생활속에서 사회적 또는 자연적 집단에 대한 정보를 얻는 효과적인 수단중 하나이다.

표본조사는 경제성, 신속성, 정확성을 고려하여, 최소의 비용으로 정확도 (accuracy)를 최대한 높이는 조사라야 한다. 표본설계시 가장 고려해야 할 사항은 표본크기와 추정치에 대한 정도(정도, precision)이다. 표본크기가 필요이상으로 크면 추정의 정도는 높아지나 과다한 비용이 요구되며, 반 대로 표본의 크기가 너무 작으면 비용은 감소하나 추정의 정도가 작아진 다. 따라서, 표본크기만 고려한 결과 추정치의 정도가 높지 않다면 바람직 한 표본조사라고 할 수 없으므로, 표본설계의 목적은 가능한 한 적은 비 용으로 될 수 있는 작은 분산을 갖는 추정량을 찾아내고자 하는데 있다.

따라서, 바람직한 표본설계의 기준으로는 최소비용으로 요구하는 정도를 얻거나 또는 주어진 비용으로 어떤 특성치의 추정치가 최대 정도를 가진 것이라고 할 수 있다.

또한 , 표본설계는 적절한 표본크기의 결정과 이 표본들의 적절한 추 출방법을 고려하여야 하며, 모집단의 성격과 조사의 목적을 고려하여 추 출방법과 배분방법을 생각해야 한다. 대표적인 표본추출방법과 배분방법 을 생각해야 한다. 대표적인 표본추출방법으로는 단순임의 추출법(simple random sampling method), 층화추출방법(stratified sampling method), 계 통추출방법(systematic sampling method), 집락추출방법(cluster sampling method) 등을 들 수 있다.

일반적으로 사업체부문 표본조사의 표본설계시에는 네이만배분법 (Neyman allocation method)과 수정절차법(modified cut-off sampling method)을 주로 사용하는데, 이 방법들을 사용하는 것이 현실적으로 타당

(3)

성이 있는지에 대한 검정과 두 방법에 대한 효율성을 비교해보는 것이 본 연구의 목적이다.

우선 네이만배분법과 수정절사법에 대해 기술하고, 층별 분산과 왜도 에 따른 4가지 유형의 모집단에 대한 모의실험을 통하여 두 방법의 효율 성을 비교하였다. 허용오차를 일정수준으로 고정한 상태에서 네이만배분 법과 수정절사법의 표본크기를 비교하여 비용측면의 효율성을 알아보고, 동일한 표본크기를 각 방법으로 추출했을 때 허용오차와 변이계수 (coefficient of variation, CV)를 비교하여 두 방법에 의한 추정치의 효율 성을 알아보았다.

Ⅱ. 네이만배분법

층화추출에서는 모집단을 유사한 특성을 가진 여러 개의 중복되지 않 는 부분집단을 층(stratum)으로 나눈다. 층을 형성하는 것을 층화 (stratification)라 하며, 층화를 한 다음 각 층에서 표본을 추출하여 모집 단의 특성치를 추정하는 것을 층화추출이라고 한다.

층화추출에서의 표본배정방법은 표본크기(

n

)를 각 층에 합리적으로 배정하는 방법을 가리키는데, 표본의 배분은 각 층의 크기와 층내 변동에 따라 결정된다. 대표적인 방법으로는 비례배분방법(proportional allocation method)과 최적배분방법(optimum allocation method)을 들 수 있다. 비례 배분방법은 각 층의 크기(

N

h)는 알 수 있지만 층내 변동에 관하여 전혀 알 수 없는 경우에 표본크기(

n

)를 모집단에 대한 각 층의 크기에 비례하 여 배정하는 방법으로 시행하기 쉽고 집계하는데 간편하며 크기가 작은 층이 크기가 큰 층보다 층내변동이 작다는 가정을 전제로 한다. 최적배분 방법은 표본의 크기(

n

)를 각 층에 배분하는데 있어서, 일정한 비용하에서 분산

V( y

st)?을 최소로 하여 각 층에 배정하거나, 일정한 분산

V( y

st)?하 에서 비용을 최소로 하는 각 층의 표본크기(

n

h)를 결정하는 방법이다.(박 홍래 1992).

(4)

네이만배분법은 최적배분방법의 특수한 경우로 표본의 크기(

n

)를 일 정하게 정하게 하고 추정량의 분산을 보다 작게 하여 정도를 높인 배분법 으로 총표본크기(

n

)와 각 층에 대한 최적의 표본크기(

n

h)는 다음과 같다.

n =

(

W

h

S

h)2

E

2+

W

h

S

2h/N (1-1)

n

h= n ⋅(

N

h

S

h

N

h

S

h ) (1-2)

여기서

N

는 모집단 크기를 나타내고,

N

h

h

층의 모집단 크기이며,

E( = d/k)

는 허용오차이다.

k

는 신뢰수준을,

d( = X-X

ˆ)는 정도를 의미하 며,

W

h(= Nh/N)

h

층의 가중치를 나타낸다. 또한 네이만배분법에 의한 모집단 총계의 추정량 ( τˆ ney) 및 그 추정량의 분산 ( V(

ˆ

ˆ τ ney)) 그리고 변 이계수 ( ( CV(

ˆ

ˆ τ ney))는 다음과 같다.

ˆ τ ney=

L

h = 1(

N

h

n

h

nh

i= 1

y

hi) (1-3)

ˆ V(

ˆ τ ney) =

L

h

N

h2 (Nh -

n

h)

N

h

s

h2

n

h (1-4)

ˆ CV(

ˆ τ ney) =

ˆ V(

ˆ τˆ τneyney) ×100 (1-5)

여기서

y

hi

h

층내

i

번째 단위의 특성치이다.

s

h2

h

층의 표본분산 이고,

y

h

h

층의 표본평균을 나타내며, 이의 수식은 다음과 같다.

(5)

s

h2=

nh

i(yhi- yh)2

n

h-1 (1-6)

y

h=

nh

i

y

hi

n

h (1-7)

네이만배분법은 층별 분산을 고려하여 표본을 추출하는 것으로 일반적 으로 비례배분법에 비해 상대효율이 크다. 특히 층별 분산이 매우 상이한 층이 적어도 2개 이상 있고, 그 층의 크기가 모집단에서 상대적으로 그다 지 작지 않을 경우에 매우 효과적이다. 그러나 이와 같은 조건이 충족되 지 못할 경우에는 큰 효과를 기대할 수 없으며, 층별 분산의 근사치를 사 용한다면 그 효과가 반감될 수도 있다. 여러 가지 항목을 조사할 경우에 각 항목마다 층별 분산이 다른데 특정 항목에만 초점을 맞추어 최적 배분 시키면, 다른 항목에 대해서는 최적배분이 되지 않을 뿐만 아니라 비례배 분방법보다 효율이 떨어질 수도 있다(박재수 1989).

Ⅲ. 수정절사법

모집단을 특성치의 크기에 의해 다음과 같이 두 개의 층으로 층화해보 자. 모집단의 추정에 90%이상 기여를 하지만 추출단위수는 전체 모집단 의 일부분에 해당하는 대규모 층과 모집단 추정에 미미한 부분을 차지하 지만 추출단위수는 전체 모집단의 대부분을 차지하는 소규모 층으로 층화 를 한다. 이때, 모집단 추정에 큰 영향이 없는 소규모 층은 조사를 하지 않고, 대규모 층만 조사를 하여 전체 모집단에 대한 추정을 하는 방법을 절사법(切사법, the cut-off sampling method)이라 한다. 이 방법은 모집 단의 특성치의 분포가 한쪽으로 편중되어 있고, 소규모 추출단위의 표본 틀에 대해 신뢰성이 없는 경우에 주로 사용한다. 그러나, 급성장하여 특성 치의 크기가 상당히 커진 추출단위가 절사된 소규모 층에 포함됐을 경우 에는 좋은 추정치를 얻을 수 없으므로, 변화가 심한 모집단의 경우에는

(6)

주의하여야 한다.

일반적으로 대규모 층이 전체 모집단의 추정에 미치는 영향이 90% 이하 일 경우에는 절사법이 적합하지 않다(Hansen, Hurwits and Madow 1953).

이러한 절사법을 보완한 것으로 수정절사법이 있다. 이 방법은 전체 추정에 상당한 기여를 하는 대규모 층은 전수조사를 하고, 모집단 추정에 큰 영향이 없는 소규모 층(표본층)에서는 표본을 추출하여 대규모층(전수 층)의 부족한 범위(coverage)를 보완하도록 하는 표본설계방법이 다.(Hidiroglou 1986).

이는 원래의 절사법을 약간 변형시킨 것으로 모집단 추정에도 무리가 없고, 표본크기를 축소하는 효과를 가져오며, 소규모 추출단위의 표본틀에 대해 신뢰성이 있는 경우에 사용하면 절사법보다 효율적이다. 수정절사법 에 의한 표본설계는 동일한 허용오차 범위 내에서 최소가 되는 표본크기 를 찾을 수 있으며, 대규모 층에 포함되는 추출단위가 전체 모집단에 기 여하는 비중이 커서 표본관리를 집중적으로 할 수 있고, 최소의 표본크기 이므로 조사업무의 부담이 줄어 비표본오차를 줄이는 효과가 있다(통계청 1991).

수정절사법에 의한 표본층의 표본크기(

n

s) 공식은 다음과 같다.

n

s=

k

2⋅( Qm⋅CVm)2

E

2

1+

k

2⋅( Qm⋅CVm)2

N

s⋅E2

(2-1)

여기서

N

s는 표본층의 모집단 크기를 나타내며,

Q

m

m

번째 특성치 총 계중 표본층이 차지하는 비(比),

CV

m는 표본층의

m

번째 특성치의 변이 계수로

m = 1,⋯,N

이며, 수식으로 나타내면 다음과 같다.

Q

m= 1 - Pm (2-2)

(7)

P

m=

m - 1

i = 1

x

i

N

i = 1

x

i

(2-3)

CV

m=

VAR

m

MEAN

m = 표준편차

평균 (2-4) 여기서,

P

m

m

번째 특성치 총계중 전,수층이 차지하는 비(比)이고,

x

는 특성치를 의미한다.

MEAN

m=

N

i = m

x

i

N

s

은 표본층의

m

번째 특성치 평균

이며,

VAR

m= 1 ( Ns-1) ․



N i = m

x

2i-

(

N

i = m

x

i)2

N

s

는 표본층의

m

번째 특 성치의 분산을 나타낸다.

수정절사법에 의한 총 표본크기는 전수층의 표본크기와 표본층의 표본크 기를 합하여 구한다.

n= n

c+ns (2-5) 여기서

n

c ( = Nc= N-Ns )는 전수층의 표본크기이다.

수정절사법의 표본추출방법은 다음과 같다. 추출단위를 특성치의 크기 순 으로 나열한 다음, 주어진 표본오차(허용오차)와 신뢰수준하에서 표본층의 표본크기(

n

s)를 구한 후, 표본크기인

n( = n

c+ns)이 최소가 되는 절사점 (cut-off point)을 정한다. 이 절사점을 중심으로 전수층 표본층(

N

s)으로 구별하여, 절사점 상위의 전수층에 속하는 추출단위는 모두 표본에 포함 시키고, 절사점 이하의 표본층에서는 비복원으로 표본을 계통추출한다. 이 때, 모집단의 총계의 추정량 ( τˆ cut)및 그 추정량의 분산 ( Vˆ( τˆ cut)) 그리 고 변이계수 ( CV

ˆ

( τˆ cut))의 수식은 다음과 같다.

(8)

ˆ τ cut=

L

h = 1ˆ

X

h=c

X

h+s

ˆ X

h=

cNh

i= 1

x

hi+ (

sN

h

sn

h )

cnh

i= 1

x

hi (2-6) ˆ( τˆ

V

cut)=

h

L

s

N

2h (s

N

h-snh

sN

h) ․

sS

2h

sS

h (2-7)

ˆ CV(

ˆ τ cut) =

ˆ V(

ˆ τˆ τcutcut) ×100 (2-8) 여기서 s

x

hi는 h층내 표본층에서 I번째의 특성치이고, s

s

h2

는 h층내 표본층 의 표본분산을 의미하며, s

x

h은 h층내 표본층의 표본평균을 나타낸다 (Glasser 1962; 통계청 1991).

sS

h 2=

snk

i (s

x

hi-s

x

hi)2

sn

h-1 (2-9)

s x

h=

snk

i

sx

hi

sn

h (2-10) 수정절사법은 특성치가 작은 추출단위가 특성치가 큰 추출단위보다 상대 적으로 많으며, 왜도(skewness)가 상당히 큰 양수인 모집단에 많이 적용 된다. 그러나 층화된 모집단의 인식 부족으로 인해 모집단의 특성에 대해 과대 추정할 수도 있으며, 전수층(또는 표본층) 크기의 급속한 변동으로 인해 현 상태의 역현상을 추정치에 반영할 수도 있음을 유의하여야 한다 (Hansen, Hurwits and Madow 1953).

Ⅳ. 모의 실험

각 표본추출방법의 효율성을 알아보기 위해 임의의 모집단에 대한 모 의실험을 통하여 네이만배분법과 수정절사법의 효율성을 비교해 보자. 앞 에서 언급한 바와 같이, 네이만배분법은 층별 분산의 차이가 큰 경우에 사용하고, 수정절사법은 왜도가 상당히 큰 양수인 경우에 주로 사용한다.

그러므로 층별 분산과 왜도에 의해 다음과 같이 4가지 경우의 모집단을

(9)

가정하고, 각각의 모집단에 네이만배분법과 수정절사법을 적용하여 두 방 법의 효율성을 비교해 보기로 한다.

첫 번째 모집단은 층별 분산의 차이가 나며 모집단의 분포형태가 종모 양인 경우이고, 두 번째 모집단은 층별 분산의 차이가 나며 모집단의 분 포 형태가 왼쪽으로 치우친 모양의 경우이며, 세 번째 모집단은 층별 분 산의 차이가 없으며 모집단의 분포형태가 종모양인 경우이고, 네 번째 모 집단은 층별 분산의 차이가 없으며 모집단의 분포형태가 왼쪽으로 치우친 경우이다.

이러한 조건에 맞게 모집단 규모를 2000개․4개 층으로 층화하여 자료 를 임의로 발생시킨 다음, 허용오차를 일정한 수준으로 고정한 상태에서 네이만배분법과 수정절사법을 각 모집단에 적용하여 구한 표본크기를 비 교하여 비용측면의 효율성을 알아보았다. 또한, 각 모집단에서 두 가지 방 법으로 표본크기가 같게 300개에서 500개까지 50개 간격으로 표본을 100 번 추출했을 때의 허용오차(조사의 정도)와 총계에 대한 100개 변이계수 의 평균을 비교하여 추정치의 효율성을 알아보았다.

위와 같은 모의 실험은 각 모집단의 모든 층에서 표본추출에 따른 단 위비용이 일정하다는 가정아래 실행하였으며, 각 모집단에 대한 실행결과 는 다음과 같다.

첫 번째, 층별 분산의 차이가 있고, 모집단의 분포형태가 종모양인 경 우이다. <표 3.1>는 각 층별 모집단의 특성치 및 분포형태를 나타내며, 두 가지 방법에 의한 허용오차에 따른 표본크기는 <표 3.2>와 같고, 동일 한 표본크기에 대대 두 방법으로 표본을 추출했을 경우에 각 방법에 대한 허용오차와 총계에 대한 변이계수는 <표 3.3>과 같다.

< 표 3.1 > 층별 모집단 특성치 및 분포형태

(10)

<표 3.2>에서 허용오차가 1%일 때, 수정절사법에 의한 표본크기가 네 이만배분법에 의한 표본크기보다 약간 크지만, 허용오차가 증가할수록 두 방법의 표본크기의 차이가 점점 커지는 것을 알 수 있다.

<표 3.2>에서 허용오차가 1%일 때 네이만배분법과 수정절사법에 의 한 표본크기는 모집단의 약 65%, 약 74%로 차이가 그다지 크지 않다. 또 한 허용오차가 1%에서 9%까지 증가함에 따라 네이만배분법에 의해 필요 한 표본크기는 모집단의 약 65%에서 약 3%로 감소하였고(⊿62%, 표본수 는 1247개), 수정절사법의 경우는 약 74%에서 약 11%로 감소하여(⊿

63%, 표본수는 1256개), 허용오차가 증가함에 따라 표본크기의 감소비율 및 표본수는 비슷하게 나타난다. 그렇지만, 요구하는 표본크기의 차이는 점점 커져, 허용오차가 9%일 때 네이만배분법은 단지 52개의 표본만을 필요로 하는 반면에 수정절사법은 네이만배분법보다 약 4배 많은 216개의 표본을 필요로 한다. 또한, 허용오차가 증가함에 따라 네이만배분법의 경 우는 표본크기가 급격히 감소하는 반면에 수정절사법의 경우는 서서히 감 소한다. 그러므로 네이만배분법에 의해 표본설계하는 것이 수정절사법에 의해 표본설계하는 것보다 비용절감의 효과가 더 있다고 할 수 있다.

(11)

<표 3.3>에서 수정절사법에 대한 네이만배분법의 상대효율인

ˆ RE ney cut

=

ˆ CV(

ˆτ cut)

ˆ CV(

ˆτ cut) 의 평균은 약 1.5로 네이만배분법이 수정절사법보 다 효율성이 약 1.5배 높게 나타난다. 또한 동일한 표본크기를 수정절사법 으로 추출했을 때의 허용오차가 네이만배분법으로 추출했을 때의 허용오 차보다 평균적으로 약 2배정도 높다. 이는 동일한 표본크기를 추출했을 때, 네이만배분법에 의한 추정치의 정도가 수정절사법에 의한 추정치정도 보다 약 2배정도 더 높다는 의미로 해석할 수 있다.

그러므로 층별 분산의 차이가 있고 종모양의 분포형태를 나타내는 모 집단의 경우에는 네이만배분법에 의해 표본설계하는 것이 수정절사법에 의해 표본설계하는 것모다 비용절감의 효과도 크고, 추정치에 대한 효율 성도 높다.

(12)

<표 3.3> 표본크기에 따른 허용오차 및 변이계수

(N=2000, k=1.96) 항목

크기

네이만배분법 수정절사법

허용오차(%) 변이계수(%) 허용오차(%) 변이계수(%)

300 3.52 4.69 7.30 7.51

350 3.20 3.95 6.57 6.07

400 2.95 3.40 5.97 5.08

450 2.73 3.00 5.45 4.38

500 2.54 2.65 5.00 3.76

두 번째, 층별 분산의 차이가 있고, 모집단의 분포형태가 왼쪽으로 치 우친 경우이다. <표 3.4>은 각 층별 특성치 및 분포형태를 나타내며, 두 가지 방법에 의한 허용오차에 따른 표본크기는 <표 3.5>와 같고, 동일한 표본크기에 대해 두 방법으로 표본을 추출했을 경우, 각 방법에 대한 허 용오차와 총계에 대한 변이계수는 <표 3.6>과 같다.

(13)

<표 3.5>에서 허용오차가 1%일 때 네이만배분법이 수정절사법보다 약 3배정도 많은 표본을 요구한다. 이는 모든 층의 단위비용이 일정하다 고 가정했을 때, 네이만배분법에 의한 표본설계가 수정절사법에 의한 표 본설계보다 약 3배정도 비용이 더 소요된다는 것을 의미한다.

<표 3.5>에서 허용오차가 1%일 때, 네이만배분법은 모집단의 약 86%

의 표본을 필요로 하는 반면에 수정절사법은 단지 전체의 약 27%의 표본 만을 필요로 한다. 허용오차가 증가함에 따라 두 방법 모두 표본크기가 점차 감소하여, 허용오차가 9%일 때 네이만배분법의 경우는 392개의 표 본이 감소했고 수정절사법은 211개 표본이 감소했다.

단순하게 표본크기의 감소만을 비교하면, 네이만배분법이 수정절사법 보다 더 많이 감소했지만, 표본크기는 네이만배분법이 수정절사법보다 평 균적으로 약 4배정도 많다. 그러므로, 수정절사법에 의해 표본설계하는 것 이 네이만배분법에 의해 표본설계하는 것보다 비용절감의 효과가 크게 나 타난다.

(14)

<표 3.6>에서 동일한 표본크기를 두 방법으로 추출하였을 때의 허용 오차 및 총계에 대한 변이계수는 네이만배분법보다 수정절사법이 훨씬 작 아 수정절사법이 네이만배분법보다 효율성이 높게 나타난다. 그러므로, 층 별 분산의 차이가 있고 모집단의 형태가 왼쪽으로 치우친 경우에는 수정 절사법으로 표본설계를 하는 것이 비용절감 효과가 크고, 효율성도 높다.

< 표 3.6 > 표본크기에 따른 허용오차 및 변이계수

(N=2000, k=1.96)

항목 크기

네이만배분법 수정절사법

허용오차(%) 변이계수(%) 허용오차(%) 변이계수(%)

300 32.5 43.11 11.00 19.19

350 29.6 37.18 6.65 11.45

400 27.2 30.53 4.00 6.64

450 25.2 27.81 2.30 4.33

500 23.5 24.32 1.35 1.93

세 번째, 층별 분산의 차이가 없고, 모집단의 분포형태가 종모양인 경우 이다. <표 3.7>은 각 층별 특성치 및 분포형태를 나타내며, 두 가지 방법 에 의한 허용오차에 따른 표본크기는 <표 3.8>와 같고, 동일한 표본크기 에 대해 두 방법으로 표본을 추출했을 경우 각 방법에 대한 허용오차와 총계에 대한 변이계수는 <표 3.9>과 같다.

(15)

<표 3.8>에서 허용오차가 1%일 때 수정절사법에 의한 표본크기가 네 이만배분법에 의한 표본크기보다 약 1.3배 크며, 허용오차가 커질수록 두 방법이 요구하는 표본크기의 차이가 점점 커지게 된다.

허용오차가 1%에서 9%로 증가함에 따라 네이만배분법에 의한 표본크 기는 모집단의 약 58%에서 약 2%로 감소하였고 (⊿56%, 표본수는 1120 개), 수정절사법에 의한 표본크기는 모집단의 74%에서 약 6%로 감소하여 (⊿68%, 표본수는 1341개), 수정절사법에 네이만배분법보다 감소한느 정 도가 크다. 그렇지만 동일한 허용오차에서 필요한 표본크기는 네이만배분 법이 수정절사법보다 작아, 허용오차가 9%일 때 네이만배분법은 단지 34 개의 표본만을 필요로 하고, 수정절사법은 네이만배분법보다 약 3.6배 많 은 124개의 표본을 필요로 한다. 그러므로 네이만배분법에 의한 표본설계 가 수정절사법에 의한 표본설계보다 비용절감의 효과가 크다고 할 수 있 다.

(16)

< 표 3.8 > 허용오차에 따른 표본크기

(N=2000, k=1.96)

<표 3.9.1>에서 수정절사법에 대한 네이만배붑의 상대효율인

ˆ RE( ney cut

) =

ˆ CV(

ˆτcut)

ˆ CV(

ˆτney) 의 평균은 약 1.1로 네이만배분법이 수정절사법 보다 효율성이 높으며, 수정절사법으로 추출했을 때의 허용오차가 네이만 배분법으로 추출했을 때의 허용오차보다 평균적으로 약 1.9배 높게 나타 난다. 이는 동일한 표본크기에 의해 추정했을 때, 네이만배분법으로 추정 된 추정치가 수정절사법에 의한 추정치보다 신뢰도가 약 1.9배 높다라는 의미로 해석할 수 있다. 그러므로, 네이만배분법이 수정된 절사법보다 효 율성이 좋다고 할 수 있다.

그런데 모집단 크기가 1000개 미만인 경우에는 수정절사법이 네이만배 분법보다 효율성이 약간 높은 경우가 발생하여 변이계수만으로는 어느 방 법이 효율성이 높은지 판정하기가 어려운 경우가 있다. 하지만 동일한 표 본크기를 추출하기 위한 허용오차는 모집단 크기에 관계없이 수정절사법 이 네이만배분법보다 높게 나타난다. <표 3.9.2>는 표본규모를 200개․4 개층으로 하여, 각 모집단에서 두 가지 방법으로 표본크기가 같게 100번

(17)

추출했을 때의 허용오차(조사의 정도)와 총계에 대한 100개 변이계수의 평균을 비교한 표이다. <표 3.9.2>에서 표본규모를 130,…,160개로 10개씩 증가했을 때 두 방법에 대한 상대효율을 비교해 보면, 수정된 절사법에 대한 네이만배분법의 상대효율인

ˆ RE( ney cut

) =

ˆ CV(

ˆτcut)

ˆ CV(

ˆτney) 의 평균은 약 0.84로 네이만배분법이 수정된 절사법보다 효율성이 낮게 나타난다. 하지 만 동일한 표본규모를 추출하기 위한 허용오차는 수정된 절사법으로 추출 했을 경우의 허용오차가 네이만배분법으로 추출했을 때의 허용오차보다 평균적으로 약 1.5배정도 높아 네이만배분법이 수정된 절사법보다 효율성 이 높게 나타난다.

그러므로 층별 분산의 차이가 없고 모집단 분포형태가 종모양인 경우 에는 네이만배분법에 의해 표본설계하는 것이 수정절사법에 의해 표본설 계하는 것보다 비용절감의 효과도 크고 추정치에 대한 효율성도 높다. 그 렇지만, 층별 분산의 차이가 있고 분포형태가 종모양인 모집단보다는 그 효과가 작게 나타남을 알 수 있었다.

< 표 3.9.1 > 표본크기에 따른 허용오차 및 변이계수

(N=2000, k=1.96) 항목

크기

네이만배분법 수정된 절사법

허용오차(%) 변이계수(%) 허용오차(%) 변이계수(%)

300 2.77 3.68 5.35 4.19

350 2.53 3.09 4.85 3.51

400 2.33 2.67 4.40 2.98

450 2.17 2.35 4.05 2.62

500 2.02 2.07 3.73 2.28

(18)

< 표 3.9.2. > 표본크기에 따른 허용오차 및 변이계수

(N=200, k=1.96) 항목

크기

네이만배분법 수정된 절사법

허용오차(%) 변이계수(%) 허용오차(%) 변이계수(%)

130 3.15 1.98 4.85 1.75

140 2.80 1.72 4.30 1.48

150 2.45 1.48 3.50 1.19

160 2.12 1.24 2.95 0.99

네 번째, 층별 분산 차이가 없고 모집단의 분포형태가 왼쪽으로 치우 친 경우이다. <표 3.10>은 각 층별 특성치 및 분포형태를 나타내며, 두 가지 방법에 의한 허용오차에 따른 표본크기는 <표 3.11>와 같고, 동일한 표본 크기에 대해 두 방법으로 표본을 추출했을 경우, 각 방법에 대한 허 용오차와 총계에 대한 변이계수는 <표 3.12>과 같다.

(19)

<표 3.11>에서 네이만배분법에 의한 표본크기가 수정절사법에 의한 표 본크기보다 평균적으로 약 4.5배 크다. 이는 모든 층의 단위비용이 일정 할 때, 네이만배분법에 의한 표본설계가 수정절사법에 의한 표본설계보다 약 4.5배 비용이 더 소요된다는 것을 의미한다.

<표 3.12>를 보면 수정절사법에 의한 허용오차와 총계에 대한 변이계수 가 네이만배분법보다 훨씬 작아 수정절사법이 네이만배분법보다 효율성이 높다. 그러므로 층별 분산의 차이가 없고 분포형태가 왼쪽으로 치우친 모 집단의 경우에는 수정절사법에 의해 표본을 추출하는 것이 네이만배분법 에 의해 표본을 추출하는 것보다 훨씬 비용절감의 효과가 크고, 효율성도 높다.

(20)

<표 3.12 > 표본크기에 따른 허용오차 및 변이계수

(N=2000, k=1.96) 항목

크기

네이만배분법 수정된 절사법

허용오차(%) 변이계수(%) 허용오차(%) 변이계수(%)

300 34.5 44.32 11.00 17.67

350 31.5 38.27 6.70 11.11

400 29.0 33.85 4.10 7.33

450 27.0 29.28 2.30 4.75

500 23.5 24.72 1.35 2.16

V. 결론

층별 분산과 왜도에 따른 4가지 유형의 모집단에 대해 모의실험을 해 본 결과, 모집단의 분포형태에 따라 네이만배분법과 수정절사법의 효율성 이 다르게 나타났으며, 통계조사의 모집단의 유형에 따라 그에 적합한 표 본추출기법을 적용하려는 노력이 보다 적은 비용과 정도가 높은 추정치의 도출을 유도할 수 있음을 알 수 있다.

모집단의 분포형태가 종모양인 경우에는 수정절사법보다 네이만배분법 을 적용하는 것이 비용절감의 효과가 더 컸지만, 추정치의 효율성은 층별 분산에 따라 차이를 보였다. 층별 분산의 차이가 있는 경우에는 네이만 배분법에 의한 추정치가 효율성이 높았으나, 층별 분산의 차이가 없는 경 우에는 어느 방법에 의한 추정치가 효율성이 높은지 판단하기가 어려웠 다. 하지만 추정치의 신뢰도를 볼 수 있는 허용오차는 층별 분산과 관계 없이 네이만배분법이 수정절사법보다 작아, 결과적으로는 네이만배분법에 의한 추정치가 수정절사법에 의한 추정치보다 효율성이 높다고 할 수 있 다.

(21)

그러므로 모집단의 분포형태가 종모양인 경우에는 네이만배분법으로 표본설계를 하고, 모집단이 왼쪽으로 치우친 분포형태인 경우에는 수정절 사법을 표본설계를 하는 것이 효과적이라고 할 수 있다. 특히 대규모 표 본조사의 표본설계시에는 모집단의 유형을 감안하여 신중하게 표본선정기 법을 적용하여야 할 것이다.

(22)

< 참 고 문 헌 >

[1] 박재수(1989), “표본조사법”, 박영사.

[2] 박홍래(1992), “통계조사론”, 영지문화사.

[3] 통계청 (1991), “절사법 표본설계응용”.

[4] 이상은․진영(1997), “비용면에서 본 Modified Cut-off 방법과 Neyman 배분법의 효 율성 비교,” 『통계분석연구』 제2권 제1 호, 1-22, 통계청.

[5] Cochran, W.G.(1963), Sample Tecniques, New York : John Wiely.

[6] Glasser, G.J.(1962)," On the Complete Coverage of Large Units in a Statistical Study," The International Statistical Institute 30, 28-32.

[7] Hansen, M.H., W.N. Hurwiz, and W.G. Madow(1953), Sample

Survey Methods & Theory Vol.2, New York: John Wiley.

[8] Hidiroglou,M.A.(1986)," The Construction of a Self-Representing Stratum of Large Units in Survey," The American

Statistician 40, 27-31.

(23)

Comparison of Efficiency between the Neyman Allocation and Modified

Cut-off Methods

Young Jin

<Abstract>

In sample design, the goremost issues are determining sample size and improving the precision of estimators. However, the costs of conducting a survey can comprise the integrity of those important issues.

If each sample unit of the survey incurs the same cost, we can tell the cost of the survey from the sample size and measure the precision of the estimators with relative efficiency. Thus, determining the proper sample size can satisfy the one of the main purposes of sample survey, cost-efficiency. Minimizing the errors of estimators and variances of unbiased estimators from a sample survey will increase their precision.

The Neyman allocation and modified cut-off methods are most commonly used for designing large-scale sample surveys such as establishment survey.

참조

관련 문서

때문에 소설일반에 대한 이론이 미흡함으로써 문학 이론 혹은 비평 이론으로서 한계를 지닌다... 후기로 올수록 신비평가들은 지나친 사실성, 작품의 객관성만을 탐구함으로

직접 반죽법 (Straight dough method).. 1) 비상반죽법(Emergency dough method) 2)

The subjects were bowling community members and general bowling users in G Metropolitan City in 2013 selected by a convenience sampling

대규모점포의 실내공기질 유지기준과 비교 시 총부유세균이 기준을 초과하는 수치를 나 타냈으며, 신축공동주택 실내공기질 권고기준 과 비교 시

Penalty Function Method, Sequential Linear Programming, Constrained Steepest Descent Method, Method of Feasible Directions(MFD), Sequential Quadratic Programming(SQP), etc.

Currently, the method of radioactive strontium( 90 Sr) analysis uses the nitric acid method and resin method.. The act of nitric acid method and

붕산 노심 과 무붕산 노심 CVCS 설계관점 비교.. 설계특성 붕산

일반적으로, 만약 어떤 지지부가 주어진 방향으로 물체의 이동(translation)을 방해하면, 물체에는 그 반대방향으로..