• 검색 결과가 없습니다.

제1절 인구통계 분석을 위한 주요 개념과 측정

본 장에서는 인구변동 요인들의 모니터링에 관한 주요 지표들을 살펴 본다. 출산력, 사망력, 이동력과 함께 한국 사회에서 출산과 밀접히 연관 된 요인인 혼인력 지표들도 검토한다. 본격적인 검토에 앞서 이 절에서는 인구변동 모니터링 지표들을 이해하기 위해 필요한 주요 인구학적 개념 과 그 측정 방법에 대해 간략히 논의한다. 참고로, 인구학적 개념에 대한 엄밀한 정의가 내려질 수는 있지만, 현실에서 사용하는 용어가 반드시 이 러한 엄격한 개념 정의에 상응하는 것은 아니다. 본 연구 또한 관례적으 로 사용하는 용어에서는 이를 따르고 있다.

첫째, 인구통계 분석에서 빈번히 사용되는 개념들로 비(ratio), 구성비 (proportion), 백분비(percentage), 비율(rate), 확률(probability)이 있 다. 우선, 비는 두 수(, ) 사이의 상대적 크기를 표시하는 숫자이다(예컨 대 ). 비의 특별한 형태로 구성비가 있다. 구성비는 분자가 분모에 포함 되는 숫자이며(예컨대 

=    ), 비에 100을 곱한 수가 백분비이다.

인구학에서 빈번히 사용되는 비 측정치들로는 부양비, 노년부양비, 유소년 부양비, 성비, 모아비(CWR: child-woman ratio) 등이 있다.11)

11) 인구학에서 사용하는 비의 종류와 그 측정 방법에 대해서는 이흥탁(1994)과 Palmore &

Gardner(1983)를 참고하기 바란다.

4

앞에서 살펴본 비 개념이 일반적으로 인구나 사건의 구성(composition) 을 정태적으로 살펴보는 반면 시간의 경과에 따른 동태(dynamics)를 살 펴보는 개념이 율 혹은 비율이다. 비율은 ‘특정 관측 기간’ 동안에 발생한 사건을 통해 측정된다. 산출 방법을 좀 더 구체적으로 살펴보면, 어떤 인 구학적 사건(예컨대 출산)의 발생률(incidence rate)은 해당 관측 기간 동안 발생한 인구학적 사건들의 수(분자)를 해당 관측 기간 동안 인구학 적 사건이 발생할 위험에 노출된 인구(분모)로 나눈 값이다.

엄밀한 의미에서 관측 기간 동안 인구학적 사건에 노출된 위험(risk)은 생존 인년(number of person-years lived)으로 측정된다. 물론 이는 연 (year) 단위로 위험을 측정하는 것을 지칭하는 일반적인 용어일 뿐 더욱 세 분화된 측정이 이루어진다면 다른 단위(예컨대 월, 일)를 사용하는 것도 가 능하다(person-month, person-day). 더 나아가 반드시 측정이 역년 (calendar year) 기준으로 이루어질 필요도 없으며 혼인(초혼) 이후 경과 기간, 첫째 출산 이후 경과 기간과 같이 다른 방식으로 사건 발생을 측정하 는 것도 가능하다. 그러나 실제 인구(모집단)를 대상으로 이러한 생존 인년 자료를 산출하는 것은 쉽지 않다. 측정 단위가 세분화될수록 산출 과정은 더욱 복잡해진다. 이에 따라 인구학적 사건의 발생 위험(person-years lived)은 연앙인구(年央人口; mid-year population)를 통해 측정되는 것 이 일반적이다. 우리나라 통계청 또한 출산율이나 사망률처럼 인구학적 사 건의 발생률을 산출하는 과정에서 연앙인구를 사용한다.12)

그러나 유의할 필요가 있는 점은 이러한 연앙인구 개념이 생존 인년의 추정치(estimate) 혹은 근사치(approximation)라는 것이며, 인구학적 사건들이 관측 기간 동안 발생할 위험이 일정하지(uniform) 않을수록 발

12) 출생이나 사망과 같은 인구학적 사건들에 관한 정보가 주민등록제도와 밀접히 연관되어 있다는 점에서 우리나라 통계청은 1993년부터 주민등록연앙인구(1월 1일 인구와 12월 31일 인구의 산술평균)를 사용하고 있다.

생률 측정에서의 오차는 커지게 된다는 것이다. 관측 기간의 중간 시점 인구를 생존 인년의 추정치로 사용할 때 통상적으로 1년을 초과하는 관 측 기간(observation window)을 사용하지 않는 이유도 이와 관련이 있 다. 한편 자료의 규모가 크지 않으면서 사건 발생 시점을 상대적으로 정 확히 측정할 수 있는 사회조사(패널조사) 자료가 활용 가능하다면 ‘생존 인년’에 기초한 비율 측정이 바람직하다. 이러한 방식의 사건 발생 위험 측정은 생존분석(survival analysis)의 발전과 더불어 그 활용도가 급격 히 높아지고 있다.

비율과 비슷한 개념으로 확률이 있다. 비율의 계산에서 연앙인구가 분 모로 사용되는 반면 확률의 계산에는 연초인구(population at the be-ginning of the observation period)가 사용된다. 결국 인구이동이 없 는 폐쇄 인구(closed population)를 가정할 때 연초인구에 기초한 ‘사망 확률’은 연앙인구에 기초한 ‘사망률’에 비해 최소한 같거나 작게 되는 구 조이다. 인구분석에서 사건 발생 확률을 정확히 계산하기 위해서는 사건 발생 위험이 있는 분석 대상 코호트에서 발생한 사건들만을 고려할 필요 가 있다.

언어 사용에서의 관례에도 불구하고 확률과 비율은 개념적으로 엄격히 구분된다. 예컨대, 개념 정의상 확률이 1을 초과할 수 없는데 비해 비율은 1을 초과할 수 있다. 비율은 반드시 측정 단위(관측 기간)와 연관 지어 해 석되어야 한다. 이러한 확률과 비율의 차이는 생존분석에서도 드러나는 데, 연속형 시간 모형인 콕스모형(Cox regression)에서 사건 발생 위험 을 측정하는 해저드(hazard)가 비율(hazard rate)인 반면 이산형 시간 모형(예컨대, discrete-time logit model)에서의 해저드는 확률 (hazard probability)에 해당한다.13) 한편 비율을 확률로 전환시키는 방

13) 연속형 시간 모형과 이산형 시간 모형에서 해저드의 상이한 의미에 대해서는 Singer &

법에 대해서는 전통적인 생명표 산출 과정에서 좀 더 구체적으로 살펴볼 수 있다( → )(제2절 참고).

둘째, 인구통계 분석을 위한 또 다른 중요한 개념으로 코호트(cohort) 와 기간(period) 개념이 있다. 기본적으로 인구통계 자료 분석은 코호트 분석과 기간 분석으로 구분된다. 코호트는 특정한 기간 동안 동일한 인구 학적 사건을 경험한 개인들의 집단으로 정의된다. 일반적으로 인구학에 서 코호트는 출생 코호트(birth cohort)를 의미한다. 코호트 분석은 시간 의 경과에 따라 코호트가 경험하는 인구학적 사건을 추적하는 접근이다.

반면 기간 분석은 특정의 역년(calendar year; 통상적으로 1년) 동안 관 측된 인구학적 사건을 분석한다(Swanson & Stephan, 2004, p. 755, p. 769). 일반적인 통계 분석 모형의 측면에서 보면 코호트 분석은 종단 면 분석(longitudinal analysis), 기간 분석은 횡단면 분석(cross-sec-tional analysis)에 상응한다.

인구 분석에서 코호트 접근과 기간 접근을 개념적으로 명확히 보여 줄 수 있는 도구로 렉시스 다이어그램(lexis diagram)이 있다. 렉시스 다이 어그램의 횡축은 역년을 기준으로 한 시간의 흐름을, 종축은 분석 대상 인구학적 사건을 측정하는 준거점(예컨대 출생 시점)으로부터의 경과 기 간(예컨대 연령)을 표시한다. 렉시스 다이어그램에서 그려지는 대각선은 개인들(코호트)의 생애를 나타낸다. 예컨대, [그림 4-1]의 렉시스 다이어 그램에서 음영 처리된 부분을 만들어 내는 두 대각선은 각각 2015년 초 출생자(위 대각선)와 2015년 말 출생자(아래 대각선)의 생애 궤적을, 그 리고 이들 두 대각선에 의해 둘러싸인 음영 영역은 2015년 출생 코호트 전체의 생애 궤적을 나타낸다.

Willett(2003)을 참고하기 바란다.

코호트 접근과 달리 기간 접근은 어떤 특정의 ‘기간’(대체로 1년) 동안 에 관측된 인구학적 사건을 분석한다. [그림 4-1]의 렉시스 다이어그램에 서 기간 분석(Period 2015)은 2015년 한 해 동안 발생한 인구학적 사건 을 관측한다. 기간 분석에서 분석 대상자는 인구학적 사건에 따라 상이한 방식으로 구성된다. 예컨대, 사망력 분석(예컨대 기대수명)에서는 전체 연령계층을 모두 아우르는 반면 출산력 분석(예컨대, 합계출산율)에서는 가임기의 연령계층(통상적으로 15~49세)을 대상으로 한다.

[그림 4-1] 렉시스 다이어그램(Lexis Diagram)

5

4

3 Period

Cohort 2015

2 2015

1

0

2015 2016 2017 2018 2019

연도

자료: 저자 작성

일반적으로 코호트 분석에서는 기간 분석에 비해 장기간에 걸쳐 관측 된 자료가 요구된다. 이러한 이유로 인해 시의성 있는 자료 산출 목적에 서는 기간 분석의 활용도가 높다. ‘완결된’ 기간 정보에 기초하여 ‘완결되

지 않은’ 코호트 전망치를 산출하고자 하는 유인이 있지만, 이는 정당화

식을 취한다. 이렇게 다양한 연령계층을 아우르는 표본조사를 활용하여 인구학적 사건의 발생 여부와 그 시점(timing)을 추적할 때에는 좌측 절 단 자료(left-truncated data)의 특성을 고려한 모형을 사용해야 하며, 그 해석 과정에서도 가상 코호트의 생애를 묘사하고 있다는 점에 유의할 필요가 있다.

마지막으로, 인구통계 자료 분석에서 빈번히 사용되는 방법으로 표준 화(standardization)와 분해(decomposition)에 대해 간략히 언급하고 자 한다. 기본적으로 표준화는 인구의 구성(composition) 효과를 통제 하기 위한 조정 절차를 의미하는데, 일반적으로 인구분석 과정에서 연령 이나 지역과 같은 하위 범주별 구성이 상이한 집단들에서 관측되는 비율 이나 구성비를 비교하는 목적으로 사용된다. 작동 원리상 회귀모형의 통 계적 통제(statistical control)와 유사하다. 비록 표준화(분해) 기법이 다 변량 환경에서도 적용되기는 하지만(예컨대, Das Gupta, 1993; Li, 2017), 일반적으로 통계적 통제에 비해서는 그 활용도가 높지 않은 것이 현실이다.

Preston, Heuveline, & Guillot(2001, p. 26)는 (직접) 표준화 기법 이 사용될 조건으로 다음과 같은 세 가지를 언급한다. 첫째, 둘 혹은 그 이상의 집단 간 혹은 시간의 경과에 따라 동일 집단에서 관측되는 비율이 나 구성비의 비교, 둘째, 각 집단 내 하위 범주(연령, 지역)별로 비율 혹은 구성비에서의 변이 분석, 마지막으로 집단 간 비율 혹은 구성비 차이가 존재하는 상황에서 이러한 하위 범주(연령, 지역)별 구성 차이의 통제가 바로 그러한 상황들이다. Hinde(1998, p. 24)는 비교 대상 인구 집단들 의 하위 범주별 비율(예컨대 연령별 사망률 패턴)이 유사할 때 표준화 기 법이 적절히 기능함을 지적한다.

표준화 기법에는 직접 표준화와 간접 표준화가 있다. 직접 표준화 방법

은 비교 대상 인구 집단별로 산출한 비율(예컨대 연령별 사망률)을 표준 인구(standard population)에 적용하여 산출한 표준화 비율과 비교하 는 방식이다. 직접 표준화 방법에서의 문제는 표준 인구의 선정과 관련되 는데, 표준 인구를 어떤 인구로 하는가에 따라 차이의 크기뿐만 아니라 방향도 바뀔 수 있다(Palmore & Gardner, 1983, p. 21). Preston et al.(2001, p. 26)은 두 집단을 비교할 때는 그 평균을, 세 집단 이상을 비 교할 때는 전체 집단들의 인구 구조의 평균이나 중앙값에 가까운 인구를

은 비교 대상 인구 집단별로 산출한 비율(예컨대 연령별 사망률)을 표준 인구(standard population)에 적용하여 산출한 표준화 비율과 비교하 는 방식이다. 직접 표준화 방법에서의 문제는 표준 인구의 선정과 관련되 는데, 표준 인구를 어떤 인구로 하는가에 따라 차이의 크기뿐만 아니라 방향도 바뀔 수 있다(Palmore & Gardner, 1983, p. 21). Preston et al.(2001, p. 26)은 두 집단을 비교할 때는 그 평균을, 세 집단 이상을 비 교할 때는 전체 집단들의 인구 구조의 평균이나 중앙값에 가까운 인구를