분석방법 - 연구방법 - 베트남 지역별 차별 출산력 분석

3. 연구방법

3.3 분석방법

본 연구의 분석자료는 베트남의 63개 지역을 대상으로 2010년부터 2015년까지의 “인구변동 및 가족 계획 조사(Population change and Family Planning survey)”와

“베트남 가계 표준 조사(Vietnamese Household Living Standard Survey)“를 바탕으로 한다. 데이터의 구성이 63개 지역별 단위의 횡단면 테이터(Cross-sectional data)를 여러 기간에 기록한

시계열 데이터(Time-series data)의 성격을 모두 가지고 있으므로 패널 데이터 형식이라고 볼 수 있다. 따라서 패널데이터분석을 실시함으로서 횡단면 혹은 시계열 데이터에 비해 더 많은 정보와 변수의 변동성을 제시하여 효율적인 추정량을 얻고, 다중공산성(Multi-collinearity)의 문제를 완화시키고자 하였다(Wooldridge, 2002).

패널 분석은 횡단면분석이나 시계열분석에서 통제 불가능한 누락변수(Unobserved omitted variable)에 대한 처리를 해준다.

다시 말해 패널 분석은 회귀모형에서 설명되지 않고 남은 오차항에서 지역(개체)특성효과와 시간특성효과로 분리하여 모수추정치를 보다 정확하게 효율적으로 산출한다. 여기서 지역(개체)특성효과는 베트남 각 지역들의 합계출산율에 영향을 미치는 요인 중 시간이 지나도 변하지 않는 특성으로, 각 지역의 지리적 특성이나 기후, 문화 등이 있다. 이에 반해 시간특성효과는 특정시기에 모든 베트남 지역들의 합계출산율에 영향을 미친 효과이다. 예컨대 정부의 출산 정책, 경제 변동 등 모든 지역의 출산율에 영향을 미치지만 특정 시점에서만 영향을 미치는 요소들로 생각하면 된다. 이와 같이 패널 분석은 선형 회귀모형에서 고려하지 못했던 지역(개체)특성 효과와 시간특성효과를 포함시킴으로써 2010 년부터 2015 년까지의 베트남 지역별 출산력

차이에 대한 설명력을 높일 수 있으며 이와 함께 독립변수들의 영향력도 좀 더 정확하게 측정할 수 있다. 이를 식으로 나타내면 아래와 같이 나타낼 수 있다.

𝑌_𝑖𝑡 = 𝛼 + 𝛽𝑋_𝑖𝑡+ ⋯ + 𝜖_𝑖𝑡 𝜖_𝑖𝑡 = 𝜇_𝑖+ 𝜆_𝑡+ 𝜐_𝑖𝑡

𝜇𝑖= 관찰되지않은개체₍지역₎특성효과 (𝑢𝑛𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑏𝑙𝑒 𝑖𝑛𝑑𝑖𝑣𝑖𝑑𝑢𝑎𝑙 𝑒𝑓𝑓𝑒𝑐𝑡) 𝜆𝑡= 관찰되지않은시간특성효과 (𝑢𝑛𝑜𝑏𝑒𝑟𝑣𝑎𝑏𝑙𝑒 𝑡𝑖𝑚𝑒 𝑒𝑓𝑓𝑒𝑐𝑡)

𝜐𝑖𝑡=확률적교란항₍ 𝑟𝑒𝑚𝑎𝑖𝑛𝑑𝑒𝑟 𝑠𝑡𝑜𝑐ℎ𝑎𝑠𝑡𝑟𝑖𝑐 𝑑𝑖𝑠𝑡𝑢𝑟𝑏𝑎𝑛𝑐𝑒 𝑡𝑒𝑟𝑚 즉각지역_𝑖와시간_𝑡에따라변하는순수한오차항⁾

위의 식을 베트남의 지역별 차별 출산력에 미치는 영향력을 분석하기 위한 방정식으로 풀어보면 다음과 같다. 종속변수(𝑌_𝑖𝑡)는 연도별 지역별 합계 출산율이며, 독립변수(𝑋_𝑖𝑡)는 연도별 지역별 근결정요인과 원결정요인들이다. 이렇게 구축된 데이터를 합동(Pooling)하여 평균치를 산출하여 선형회귀모형을 실행하면 각 지역특성들이 합계출산율에 미치는 회귀계수(𝛽)가 추정된다. 그리고 상수항(α), 관찰되지 않는 지역특성 및 시간 효과는 오차(𝜖_𝑖𝑡)로 남게 된다. 이와 같이 패널 분석은 지역(개체)특성효과와

시간특성효과를 구분할 수 있기 때문에 분석하고자 하는 패널 데이터에서 지역과 시점 차이를 어떻게 가정 하느냐에 따라 패널 분석 모형이 유형화 될 수 있다. 이렇게 관찰되지 않는 효과가 임의적(Random) 혹은 확률적이라고 가정하는 모델을 확률효과모형(Random effect model)이라고 하고 이를 고정된 모수로 가정하는 모델을 고정효과모형(Fixed effect model)이라고 한다. 두 모형 모두 지역(개체)특성효과를 인정하지만 가정에

있어서 고정효과모형은 시간에 따라 고정불변의

지역(개체)특성으로 가정하고 확률효과모형은 지역(개체) 간 특성이 유동적으로 확률적분포라 가정하는 것이다.

문서에서 베트남 지역별 차별 출산력 분석 - S-Space (페이지 32-35)