• 검색 결과가 없습니다.

1) 준모수적(Semi-parametric)모형 : Cox 비례해저드 모형

Cox 비례해저드 모형은 모집단의 생존시간 분포에 대한 가정을 하지 않는 준모수 형 모형이다. 해당 모형에서 개체 의 시점에서의 해저드함수 와 이에 영향을 미 치는 독립변수 에 대한 관계는 다음과 같이 표현된다. 여기서 는 기저선(baseli ne)해저드로 모든 독립변수 에 대한 값이 0일 경우의 시점에서의 해저드를 의미한다.

  



    

이상의 식에서 살펴보면 Cox 비례해저드 모형의 종속변수는 해저드이다. 따라서 추정된 회귀계수 는 기저선 해저드에 대한 의 해저드비(위험비, hazard ratio)를 의미한다. 즉 일반회귀분석에서 는 의 변화에 따른 종속변수의 증감을 의미하지만 해저드 모형에서는 기저선 해저드를 기준으로 한 상대적 증감을 의미한다. 이상에서 제시한 식은 다음과 같이 전환이 가능하다.

 





 

    

이상의 식에서 제시된 바와 같이 해저드 자체는 시간에 따라 복잡하게 변화가 가능 하지만 기저선 해저드와 의 시점에서 해저드 의 비(Hazard ratio)는 [그 림 4-2]와 같이 시간에 관계없이 일정한 값을 가진다. 즉 독립변수가 종속변수인 해저 드에 미치는 영향력은 항상 일정하다. 해당 모형을 비례해저드 모형이라고 부르는 이 유는 여기에 있다.

[그림 4-2] 비례해저드 간의 차이

자료: 박재빈(2007: 185)

이상의 식을 회귀계수의 직관적인 해석을 위해 변환하면 다음의 식과 같으며 Cox 비례해저드 모형에서 종속변수의 값인 해저드는 확률 값이 아닌 독립변수의 회귀계수 는 log해저드비 만큼의 변동을 의미한다.

log 

 

 

  

 

⋯ 

Cox 비례해저드 모형에서 생존함수

는 와  의 관계를 통해 다음과 같 이 표현할 수 있다.

   





해당 식을 살펴보면

를 구하기 위해서는 기저선 해저드 를 알아야 하는 데 Cox 비례해저드 모형에서 는 임의의 함수로 그 분포형태는 알려져 있지 않기 때문에 기저선 생존함수 역시 알 수 없다. 따라서 원칙적으로 Cox 비례해저드 모형에 서 생존함수

의 추정은 불가능하다16). 이에 따라 Cox 비례해저드 모형은 독립변

16) Breslow method를 활용하여 생존함수를 추정할 수 있으나 특정 가정을 충족해야 하며 이 때 추정된 생존함수는 모집단이 아닌 표본에 대한 생존함수이다(송경일, 최종수, 2013: 170).

수의 영향력 검증이 주요 목적일 때 활용된다.

Cox 비례해저드 모형의 경우 앞서 제시한 비례성 가정이 충족되지 않으면 모수추 정치를 신뢰할 수 없고 통계적 검정력이 감소한다(Box-Steffensmeier and Zorn, 20 01). 그러나 사회과학에서는 현실적으로 공변수의 효과가 시간에 따라 달라지는 경우 가 많기 때문에 비례가정을 충족하기가 어렵다. 예를 들어 공변수의 값은 변화하지 않 지만 그 효과가 시간이 지남에 따라 영향력이 변화하는 변수가 있을 수 있다. 또한 시 간에 따라 공변수의 관찰값 자체가 변화하는 경우가 있다. 이렇게 시간의 변화에 따라 변화하는 시간의존 변수를 Cox 비례해저드 모형을 통해 분석할 경우 적절하지 않은 분석결과를 도출하기 때문에 시간의존 변수의 효과를 고려한 분석모형을 적용하여야 한다. Cox 비례해저드 기반으로 시간의존 변수의 효과를 반영하여 분석하는 방법에는 층화해저드(Stratified hazard)모형과 비비례해저드(Non proportional hazard)모형 이 있다. 층화해저드 모형의 경우 비례해저드 가정을 위반한 공변수가 있을 때 해당변 수 층화하여 기저선 해저드의 시간의존 효과를 모형화하는 방법이다. 그러나 층화해저 드 모형의 경우 층화한 공변수에 대한 영향력을 도출할 수 없고 범주형 변수에만 적용 이 가능하며 시간의존 공변수가 다수일 경우 적용에 한계가 있다. 한편 비비례해저드 모형의 경우 시간의존 공변량의 효과를 공변량과 시간의 상호작용항을 통해 모형화하 는 방법이다. 비비례해저드 모형의 경우 시간의존 공변수에 대한 모형화가 쉽고 다양 한 시간의존 공변수를 포함할 수 있다는 장점이 있다. 비비례해저드 모형을 수식으로 표현하면 다음과 같다.

  

 

    

시간의존 변수가 라고 할 때 의 총효과는 주효과인 와 와 시간함수의 곱으 로 만들어진 상호작용항인  의 효과로 구성된다. 시간의 함수  는 시간의존 효과의 시간에 따른 형태에 의하여 결정된다. 시간종속효과가 시간에 대하여 선형이면

    로그시간에 대하여 선형이면    log 이다.

본 연구모형의 경우 일부 시간의존 공변수을 포함하고 있기 때문에 이상에서 제시 한 비비례해저드 모형을 적용하여 시간의존 공변수의 효과를 추정하고자 한다.

2) 모수적(Parametric)모형

다변량 사건사 분석방법 중 모수적 모형은 앞서 제시한 Cox 비례해저드 모형과는 달리 생존함수가 어떤 특정한 분포에 따르는 것으로 간주한다. 모수분포의 가정에 따 라 지수분포(Exponential distribution), 와이불분포(Weibull distribution), 곰베르츠 분포(Gompertz distribution), 로그정규분포(Log normal distribution), 로그로지스 틱분포(Log-logistic distribution) 등을 가정한 모형으로 구분된다. 지수분포는 해저 드가 상수로 해저드가 시간에 따라 일정하게 나타나는 형태다. 와이블분포는 해저드가 시간에 따라 단조감소 혹은 단조증가 하는 분포로 해저드가 초기에는 높았으나 점차 감소하거나 이와는 반대로 시간이 지날수록 해저드가 증가하는 경우에 해당된다. 곰베 르츠분포는 해저드가 시간과 더불어 선형으로 증가하거나 감소하는 경우에 적용한다.

로그정규분포는 왼편이 볼록한 우편향(right skewed)한 분포에 해당되며 해저드가 초 반에는 증가하다가 시간이 지남에 따라 감소하는 양상으로 나타난다. 로그로지스틱분포 는 정규분포와 비슷한 형태지만 첨도가 정규분포곡선 보다 높다(김경숙 외, 2014; 박 재빈, 2007: 307-315).

모수적 모형은 앞서 제시한 Cox 비례해저드 모형과 같은 비례해저드(Proportional Hazard: PH)모형과 가속화실패시간(Accelerated Failure Time: AFT)모형으로 구분 된다. 비례해저드 모형은 Cox 비례해저드 모형과 매우 유사하다. 종속변수가 해저드로 회귀계수 는 기저선해저드에 대한 의 해저드비를 의미하며 해저드비는 시간에 따 라 일정하다. 모수적 비례해저드 모형에는 와이블분포, 지수분포, 곰베르츠분포 모형이 있다. 반면 가속화실패시간모형의 종속변수는 사건발생까지의 시간

으로

자체에 대한 독립변수의 효과를 모형화하기 때문에 회귀계수 는 기저선 생존시간에 대한  의 영향력을 의미한다는 점에서 비례해저드 모형과는 차이가 있다. 가속화실패시간모형 은 다음의 식으로 표현된다.

log   

 

 

⋯ 

 

이상에서 제시한 모수적 모형의 생존함수는 다음 <표 4-2>에 제시된 공식에 의해 추정된다.

분포 구분

  모수

지수 PH exp    exp  

AFT exp    exp   

와이블 PH exp    exp   

AFT exp    exp     곰베르츠 PH exp

   

 exp   

로그정규 AFT   

ln   

 

로그로지스틱 AFT

  

   exp   

자료: Statacorp(2013: 227-229)을 토대로 정리

<표 4-2> 모수적 모형의 생존함수 추정

앞서 제시한 모형 중 지수분포, 와이블분포, 곰베르츠분포 모형은 Cox 비례해저드 모 형과 같이 각 시점의 해저드가 비례성을 가진다. 따라서 해저드 함수가 [그림 4-3]의 (b)형태를 따른다. 반면, 로그정규분포 및 로그로지스틱분포는 시간에 따른 해저드의 크기가 다른 AFT모형에 해당된다. [그림 4-3]에 (C)형태에 해당된다. 본 연구에서는 이상에서 제시한 Cox 비례해저드 모형과 5가지의 모수형 모형을 추정하고 모형 간의 비교를 통해 최종모형을 선택하고자 한다.

[그림 4-3] PH모형과 AFT모형의 해저드함수

자료: 박재빈(2007: 304)을 토대로 정리