• 검색 결과가 없습니다.

각 장에서 설명하는 연구관심을 수행하기 위해 본 연구보고서에서는 흔히 콕스모형이라고 불리는 콕스비례위험모형(Cox proportional hazards model)을 사용하여 한국노동패널 1-11차(1998-2008) 자료를 분석할 것이다(Cleves, Gould, & Gutierrez, 2004; Klein &

Moeschberger, 2003). 콕스모형은 다음과 같은 형태로 표현할 수 있다.

h(t) = h0(t)exp(DTβ + XTα) (1)

<식 1>에서 h(t)는 시간 t 에서의 위험을 뜻하며 h0(t) 는 흔히 기본 위험(baseline hazards)이라고 불리는 시간 t 에서의 위험을 뜻한다. 통 계적 분석에 있어 로그우도(log likelihood)를 구할 때 기본위험은 분자 와 분모에서 상쇄되기 때문에 별 의미를 가지지 못한다. 위 식에서 D 는 각 장에서 관심을 가지는 주요설명 변수, 흔히 처치변수(treatment variable)라고 불리는 변수를 뜻한다. 만약 처치변수가 여러 범주로 이루 어진 변수인 경우에는 가변수(dummy 혹은 indicator variables)를 만들 어 변수를 측정하기 때문에 <식 1>에서는 벡터의 형태로 표현하였다.

통산 벡터는 열벡터를 표현하므로 각 변수에 위첨자로 표현된 T는 전치

44∙여성근로자의 노동조건에 따른 출산수준 차이와 정책방안

(transpose)를 나타낸다. 만약 근무시간형태를 통제한 후 임금의 효과나 임금의 효과를 통제한 후 근무시간형태의 효과를 보고자 한다면 D에 근 무시간형태와 임금변수를 함께 넣어 추정할 것이다.

<식 1>에서 X는 혼동변수를 뜻한다. 본 연구에서는 앞서 밝힌 것처 럼 산업과 직업 그리고 여러 근로조건변수 사이의 모호한 인과관계로 인해 X에 산업과 직업을 포함시키지 않은 모형과 산업과 직업을 포함시 킨 모형을 모두 추정하여 결과를 제시할 것이다. 이러한 두 가지 모형에 더하여 각 처치변수와 교육과의 상호작용을 포함하는 모형 또한 추정할 것인데 이는 다음과 같은 식으로 표현할 수 있다.

h(t) = h0(t)exp(DTβ1 + ETβ2 + (DE)Tβ3 + XTα) (2)

<식 2>에서 E는 교육을 뜻하는 변수이고 DE는 상호작용항을 나타낸 다. <식 2>에서 우리의 관심은 상호작용항에 있는 계수 즉, β3의 방향 과 크기에 놓여있다.

지금까지 설명한 콕스비례위험모형에서 핵심적인 가정은 출산위험이 변수의 값에 따라 비례적으로 설정된다는 점이다. <식 1>의 예를 들어 보면, 혼동변수인 X의 값이 동일하다면, D가 0과 1을 갖는 하나의 지수 변수라는 가정 아래, 처치변수가 0의 값을 가질 때는 시간 t 에서의 위 험이 h0(t)=h0(t)exp(0*β+XTα)이고 처치변수가 1의 값을 가질 때는 h1(t)=h1(t)exp(1*β+XTα)이기 때문에 h1(t)/h0(t)=exp(β)로 나타난다. 다 시 말하면 위험이 일정수의 배수인 비례형태를 띠고 있는 것이다.

하지만 향후 제시할 위험분포에 관한 그래프를 보면(6, 7, 8장의 그림 참조), 시간에 따른 위험이 비례적인 모습을 나타내지 않는 경우를 많이 볼 수 있다. 이렇게 비례위험모형에 대한 가정이 어긋나는 경우를 대비

제4장 방법론 및 자료45

하여 본 보고서에서는 흔히 이산위험모형(discrete hazards model)이라 고 알려진 모형을 추정할 것이다. 흔히 이산위험모형은 다음과 같은 로 짓모형으로 나타낼 수 있다(Singer & Willet, 2003).

logith(t) = DTβ + XTα + ΣδtI(T=t) (3)

위 식에서 I(·)는 표시함수(indicator function)을 나타내는 것으로 괄 호 안에 들어 있는 조건이 참의 값을 가질 때는 1을 나타내게 되고 거 짓의 값을 가질 때는 0을 표시하게 된다. 따라서 ΣδtI(T=t)는 관찰이 시 작된 처음시기, 즉 우리의 경우 15세 때 첫 달부터 49세 마지막 달까지 의 표시함수를 모형에 포함한 후 계수를 추정한다는 것을 의미한다. 그 리고 각 달의 계수, 즉 δt는 기본위험을 표시하게 된다.

하지만 본 보고서와 같이 매달의 결과를 측정하지만 상대적으로 관측 된 사례수가 그리 많지 않은 자료를 분석할 경우 모든 표시함수를 모형 에 사용하는 것은 쉽지 않다. 이러한 경우 시간에 따른 기본위험에 일정 한 형태의 함수관계를 가정하는 모형을 사용할 수 있다(Singer &

Willet, 2003: 12장). 시간에 따른 기본위험이 매우 다양한 형태를 띨 수 있으나 본 보고서에서는 2차 함수의 형태를 띤다고 가정한다. 경험적 분석을 제시하는 장에서 보게 될 여러 위험함수(hazard function) 그림 들은 이러한 가정이 현실의 자료와 다르지 않다는 것을 보여 줄 것이다.

따라서, 본 보고서에서는 다음과 같은 모형을 추정할 것이다.

logith(t) = DTβ + XTα + δ1T + δ2T2 (4)

<식 4>를 기본모형으로 하여 각 변수의 활용에 따라 앞에서 콕스비

46∙여성근로자의 노동조건에 따른 출산수준 차이와 정책방안

례위험모형을 논의하면서 도입한 다양한 형태의 모형을 추정할 것이다.

예를 들어 <식 4>를 <식 2>와 같은 상호작용항을 포함하는 모형으로 발전시키는 것이 어려운 일은 아니다.