Ⅲ. 연구방법
4. 분석방법
기술적인 분석을 통하여 조사대상자의 일반적 특성과 월령별 모유수유율을 살펴보 고 우리나라 여성의 모유수유 실천 결정에 영향을 미치는 요인을 로짓분석을 하여 파악 하고자 한다. 또한, 모유수유 기간 결정에 영향을 미치는 요인을 로짓분석 및 시간에 따 른 위험(hazard)의 특정 분포를 가정하지 않고, 독립변수가 종속변수에 미치는 영향을 측정할 수 있는 콕스의 비례위험모형(Cox's proportional hazard model) 생존분석 (Survival analysis)을 통해 자료를 분석하였다.
분류된 각 변수에 따른 모유수유 실천 유, 무를 알아보기 위하여 카이제곱 검 정을 실시하였다. 다음, 모유수유 실천 결정에 유의미한 영향을 미치는 변수들을 알아보기 위하여 로짓분석을 실시하였다. 같은 변수들이 모유수유 기간 결정에 유의 미한 영향을 미치는지 분석하고자 모유수유 조기중단 유, 무에 대하여 로짓분석을 한번 더 실시한 후, 최종적으로 비례위험 회귀모형 생존분석을 사용하였다.
가. 로짓분석
종속변수가 범주형 변수일 때 비선형함수형태의 회귀모형을 설정할 수 있다면 독립 변수의 수준이 변화할 때 종속변수의 기대값인 확률은 0과 1로 수렴할 수 있을 것이다.
선형회귀모형에서는 독립변수들의 값 에서 종속변수가 1이 될 확률은 1보다 크거나 0보다 작게 나타날 수 있다. 먼저 확률
│을 아래와 같은 오즈비(odds)로 변환하여 보자.
│
│
│
│여기서 오즈비 은 어떤 사건이 발생되지 않을 확률에 대한 발생될 확률의 비 율을 의미한다. 오즈비 의 범위는
│ 일 때 0에서
│ 일 때 ∞로 변하게 되므로 오즈비의 범위는 ≤ ≤ ∞이 된다. 이때 오즈비에 자연대수(natural logarithm)를 취하면 범위는 ∞와 ∞로 변하 게 되고, 이러한 변환을 로짓변환(logit transformation) 이라고 한다. 이때 모형은 로짓 에 대하여 선형이 되고 다음과 같이 정의한다.
│
│ ⋯ ---(1)
식(1)을
│에 관하여 정리하면,
│
⋯
⋯
---(2)
이 되고, 식(2)을 로지스틱 반응함수라고 한다. 로지스틱 반응항수의 형태를 이해하 기 위해서 우선 독립변수가 하나인 단순 로지스틱 반응함수를 살펴보기로 하자.
│ ---(3)
식(3)에서 절편 β 0
와 기울기 β 1이 변함에 따라 로지스틱 반응함수가 어떠한 형태
를 갖는지 살펴보면, 로지스틱 반응함수는 β1의 부호에 따라 확률 0과 1 사이에서 단조 증가 혹은 단조감소하게 된다. 확률 0.2 와 0.8 사이에서는 거의 선형적인 형태를 가지 고, 독립변수 범위의 양끝에서는 0 과 1로 서서히 접근하게 된다. 로지스틱 회귀모형은 선형회귀모형의 제한적인 가정들을 극복할 수 있기 때문에 종속변수가 두가지 값만 취 하는 모형에 널리 사용된다.
로지스틱 회귀모형의 가정을 요약하면, 로지스틱 회귀모형은 종속변수와 독립변수 들 사이의 함수관계를 선형으로 가정하지 않고, 비선형관계로 가정한다. 오차항의 정 규성이 가정되지 않는다. 로지스틱 회귀모형에서 독립변수들의 척도는 연속형, 이산형 또는 혼합형으로 구성될 수 있으며, 최대우도추정법(maximum likelihood method)을 사용하기 때문에 추정량의 신뢰성을 확보하기 위해서 표본크기가 어느 정도 대표본이 되어야 한다(성웅현, 2001).
이 연구는 모유수유 실천에 대한 로짓분석에서 로지스틱 회귀모형의 가정을 만족한 다. 또한, 로지스틱 반응함수에서 개별 독립변수의 효과를 오즈비에 대한 해석을 사용 하였다.
나. 생존분석
로그순위 검정법은 두 군 또는 여러 군의 생존경험을 비교하는 분석법으로 이 검정법은 치료법과 같이 하나의 변수에 관한 분석에 중점을 두고 있다. 그러나 생 존과 관련되어 여러 예후변수가 있을 때 여러 변수들의 영향을 동시에 알아보는 다변량 분석법(multivariate analysis)이 특히 요구되며, 이러한 목적에 Cox 모형이 유용하다. Cox 모형은 생존시간에 대해 어떠한 분포형태도 가정하지 않으므로 비 모수적이지만 모형에 근거하여 회귀계수를 추정한다는 점이 모수적 방법과 유사 하여 비모수와 모수의 중간 형태인 준모수적(semiparametric) 모형이라고 일컬어 지고 있다. 그러나 Cox 모형은 다른 형태의 가정, 즉 비례적 위험함수
(proportional hazard)의 가정에서 출발하므로 비례위험 회귀모형(Cox´s
⋯ ---(5)
여기서
⋯
는 회귀 모형계수이다. 만약 모든 예후변수가 영(zero) 의 값을 가지게 되면, 다시 말하면 위험함수에 미치는 예후변수들의 영향이 전혀 없다면, 위험함수는 기본적으로 h0(t)가 되므로 이를 기저위험함수(baseline hazard function)라 하며, Cox 모형에서는 h 0(t)에 대하여 어떠한 분포형태도 가 정하지 않는다.각 예후변수의 유의성 결과보다도 의학자료의 분석에서는 생존에 미치는 각 예 후변수의 영향의 정도를 상대위험도(hazard ratio, relative risk or odds ratio)로 표현하고 있다.
‘비례위험’이라는 말은 어느 환자의 위험률과 다른 환자 의 위험률의 비가 시 간 변화에 대해 일정하다는 것을 의미하는데, 여러 개의 설명변수를 생각할 때 번째 환자의 위험함수의 비는 다음과 같다.
⋅ ⋯
⋅ ⋯
⋯ ≈ “상수” ---(6)
적절한 Cox 모형 선정방법시 forward, backward 또는 stepwise 다단계변수 선 택법도 모형 선정방법에 속하지만 오로지 통계적인 기준에만 근거하여 모형을 찾 는 것은 바람직하지 못하다. 그 이유는 통계적 기준에만 근거하여 적합한 Cox 모 형을 선정할 때, 적합한 모형은 실제로 유일한 것이 아니며 몇 가지 좋은 모형이 모두 적절할 수 있기 때문이다. 특히 분석하고자 하는 생존자료에 대해 깊이 이해 한다면 목적하는 바에 따라서 여러 모형을 단계적으로 적합시켜 이들 결과를 비 교함으로써 적절한 모형을 선정할 수 있다.
모유수유 기간을 고려한 생존분석은 모유수유를 마쳤거나 조사당시 모유수유를 마 치지 못한 대상 모두를 편입함으로서 중도절단된 자료를 이용하여 비례위험모형은 다 변량 생명표를 제시함으로서 다른 회귀분석과 달리, 중도절단 편의(bias)를 통제한다.
또한, 이 모델은 비례성 가정을 만족하지 못한 요소를 층화 분석할 수 있도록 한다.
생존분석을 하기 위해선 먼저 종속변수인 모유수유 기간에 대한 정확한 이해를 필요 로 한다. 본 연구는 모유수유 시작부터 모유수유 중단까지의 기간에 대한 분석이다.
생존분석이란 어떤 사건(event)이 발생할 때까지의 시간으로 자료가 구성된 경우 사 용하는 통계적 방법으로서 사건의 발생 여부에 대해 불확실한 자료가 포함되어 있다는 특징을 가지고 있다. 이러한 불확실한 자료를 중도절단된 자료(censored data)라 부르 며 중도절단된 자료가 발생하는 이유는 추적이 불가능한 경우(loss to follow up), 중도 탈락(drop out), 사건이 발생하기 전에 연구를 종료하는 경우(termination of the study), 이 연구와 상관없는 다른 원인에 의한 사망(death from unrelated cause)과 같은 네가지 요인들을 생각할 수 있다(남정모, 1997).
본 연구에서 중도절단되어 들어간 자료를 살펴보면 모두 우측 중도절단된 자료(right censored)로 시작 시점이 모두 다르게 적용되어 조사기간 내에서 중도 탈락(drop out) 된 경우, 12개월 이상 모유수유를 하였으나 추적조사 실패한 경우, 첫돌이 되기 전에 연 구기간이 종료된 경우로 연구기간 내에 모유수유를 중단하지 않은 경우도 있다. 즉, 1998년 1월부터 2000년 6월까지 조사 자료에서 <그림 3>과 같이 우측 중도절단된 자료 가 존재한다. 그 유형별로 살펴보면 출생 후 첫돌(12개월)이 될 때까지를 조사함으로써 2000년 6월 조사시점까지 첫돌이 되지 않은 경우(n=151명), 연구기간 내에 출생후 12개 월 시점에서 아직도 모유수유 중인 경우(n=74명), 연구종료 및 모유수유 중단이 아닌 다 른 사건으로 종결된 경우가 있었다(n=2명).
그림 3. 우측 중도절단된 자료의 예
calendar time
1998.1 1999.1 2000.1 2000.6 2001.1
calendar time
1998.1 1999.1 2000.1 2000.6 2001.1
0
첫 돌duration (months)
1 2 3 4 5 6 7 8 9 10 11
0
첫 돌duration (months)
1 2 3 4 5 6 7 8 9 10 11
이들 중도절단된 자료의 생존시간은 불확실하나 중도절단되기 직전까지는 모유수 유 중단 사건(event)이 발생하지 않았다는 부분적인 정보를 가지고 있다. 따라서 생존 분석에서는 이러한 점을 최대로 이용하여 분석한다는 특징이 있다. 만약 중도절단된 자 료를 분석에서 제외된다면 잘못된 연구결과를 제시할 수도 있다. 생존분석에서는 모든 연구대상의 관찰시간을 알아야 하고 또한 중도절단 여부를 명확히 알아야 하므로 연구 를 시작하기 전에 다음 사항들을 검토하여야 한다. 생존시간의 시작점을 확실히 정의 할 수 있는지, 정확한 생존시간을 측정할 수 있는 기준이 있는지 및 사건의 발생여부를 확실히 구별할 수 있는지를 검토해 보았다. 모유수유 기간은 출생 후 모유수유를 시작 하여 모유수유를 중단하기 직전까지 모유수유를 한 경우를 기준으로 한다. 여기서 생존 시간을 측정할 수 있고, 사건의 발생여부인 모유수유 중단을 모유수유 중인 경우와 확 실히 구별할 수 있었다.
이처럼 정의되는 생존분석을 이용하는 경우 모유수유 중단은 모유수유를 시작해야 만 가능하기 때문에 일단 모유수유를 시작한 경우만이 이 연구에서 분석의 대상이 된 다. 1,066명 중에서 모유수유를 시작한 740명이 분석대상이 되는데, 이 가운데에는 조 사당시 아직 모유수유 중이거나 조사기간 12개월까지만 모유수유 기간을 조사한 사례 227명이 포함되어 있다. 이 연구에서는 우측 중도절단(right censored)된 것으로 분석에 포함시킨다.
분석에 사용할 자료가 허용한다면 위의 경우를 충분히 고려하여 분석대상자를 선택 하는 것이 더 좋은 결과를 얻을 수 있을 것이다.
본 연구는 SAS version 8.2의 LOGISTIC, PHREG 프로시져를 이용하여 분석하 였다.
PROC LOGISTIC은 모유수유 실천 결정에 유의미한 영향을 미치는지 알아보기
PROC LOGISTIC은 모유수유 실천 결정에 유의미한 영향을 미치는지 알아보기