• 검색 결과가 없습니다.

Ⅲ. 연구방법

4. 분석방법

기술적인 분석을 통하여 조사대상자의 일반적 특성과 월령별 모유수유율을 살펴보 고 우리나라 여성의 모유수유 실천 결정에 영향을 미치는 요인을 로짓분석을 하여 파악 하고자 한다. 또한, 모유수유 기간 결정에 영향을 미치는 요인을 로짓분석 및 시간에 따 른 위험(hazard)의 특정 분포를 가정하지 않고, 독립변수가 종속변수에 미치는 영향을 측정할 수 있는 콕스의 비례위험모형(Cox's proportional hazard model) 생존분석 (Survival analysis)을 통해 자료를 분석하였다.

분류된 각 변수에 따른 모유수유 실천 유, 무를 알아보기 위하여 카이제곱 검 정을 실시하였다. 다음, 모유수유 실천 결정에 유의미한 영향을 미치는 변수들을 알아보기 위하여 로짓분석을 실시하였다. 같은 변수들이 모유수유 기간 결정에 유의 미한 영향을 미치는지 분석하고자 모유수유 조기중단 유, 무에 대하여 로짓분석을 한번 더 실시한 후, 최종적으로 비례위험 회귀모형 생존분석을 사용하였다.

가. 로짓분석

종속변수가 범주형 변수일 때 비선형함수형태의 회귀모형을 설정할 수 있다면 독립 변수의 수준이 변화할 때 종속변수의 기대값인 확률은 0과 1로 수렴할 수 있을 것이다.

선형회귀모형에서는 독립변수들의 값 에서 종속변수가 1이 될 확률은 1보다 크거나 0보다 작게 나타날 수 있다. 먼저 확률

  │을 아래와 같은 오즈비(odds)로 변환하여 보자.

  

  │

  │ 

  │

 

  │

여기서 오즈비    은 어떤 사건이 발생되지 않을 확률에 대한 발생될 확률의 비 율을 의미한다. 오즈비   의 범위는

  │ 일 때 0에서

  │ 일 때 ∞로 변하게 되므로 오즈비의 범위는  ≤    ≤ ∞이 된다. 이때 오즈비에 자연대수(natural logarithm)를 취하면 범위는  ∞와 ∞로 변하 게 되고, 이러한 변환을 로짓변환(logit transformation) 이라고 한다. 이때 모형은 로짓 에 대하여 선형이 되고 다음과 같이 정의한다.



  │

 

  │      ⋯  

  ---(1)

식(1)을

  │에 관하여 정리하면,

  │   

   

     ⋯  

       ⋯  

---(2)

이 되고, 식(2)을 로지스틱 반응함수라고 한다. 로지스틱 반응항수의 형태를 이해하 기 위해서 우선 독립변수가 하나인 단순 로지스틱 반응함수를 살펴보기로 하자.

  │     

       ---(3)

식(3)에서 절편 β 0

와 기울기 β 1이 변함에 따라 로지스틱 반응함수가 어떠한 형태

를 갖는지 살펴보면, 로지스틱 반응함수는 β1의 부호에 따라 확률 0과 1 사이에서 단조 증가 혹은 단조감소하게 된다. 확률 0.2 와 0.8 사이에서는 거의 선형적인 형태를 가지 고, 독립변수 범위의 양끝에서는 0 과 1로 서서히 접근하게 된다. 로지스틱 회귀모형은 선형회귀모형의 제한적인 가정들을 극복할 수 있기 때문에 종속변수가 두가지 값만 취 하는 모형에 널리 사용된다.

로지스틱 회귀모형의 가정을 요약하면, 로지스틱 회귀모형은 종속변수와 독립변수 들 사이의 함수관계를 선형으로 가정하지 않고, 비선형관계로 가정한다. 오차항의 정 규성이 가정되지 않는다. 로지스틱 회귀모형에서 독립변수들의 척도는 연속형, 이산형 또는 혼합형으로 구성될 수 있으며, 최대우도추정법(maximum likelihood method)을 사용하기 때문에 추정량의 신뢰성을 확보하기 위해서 표본크기가 어느 정도 대표본이 되어야 한다(성웅현, 2001).

이 연구는 모유수유 실천에 대한 로짓분석에서 로지스틱 회귀모형의 가정을 만족한 다. 또한, 로지스틱 반응함수에서 개별 독립변수의 효과를 오즈비에 대한 해석을 사용 하였다.

나. 생존분석

로그순위 검정법은 두 군 또는 여러 군의 생존경험을 비교하는 분석법으로 이 검정법은 치료법과 같이 하나의 변수에 관한 분석에 중점을 두고 있다. 그러나 생 존과 관련되어 여러 예후변수가 있을 때 여러 변수들의 영향을 동시에 알아보는 다변량 분석법(multivariate analysis)이 특히 요구되며, 이러한 목적에 Cox 모형이 유용하다. Cox 모형은 생존시간에 대해 어떠한 분포형태도 가정하지 않으므로 비 모수적이지만 모형에 근거하여 회귀계수를 추정한다는 점이 모수적 방법과 유사 하여 비모수와 모수의 중간 형태인 준모수적(semiparametric) 모형이라고 일컬어 지고 있다. 그러나 Cox 모형은 다른 형태의 가정, 즉 비례적 위험함수

(proportional hazard)의 가정에서 출발하므로 비례위험 회귀모형(Cox´s

      

      ⋯   ---(5)

여기서   

는 회귀 모형계수이다. 만약 모든 예후변수가 영(zero) 의 값을 가지게 되면, 다시 말하면 위험함수에 미치는 예후변수들의 영향이 전혀 없다면, 위험함수는 기본적으로 h0(t)가 되므로 이를 기저위험함수(baseline hazard function)라 하며, Cox 모형에서는 h 0(t)에 대하여 어떠한 분포형태도 가 정하지 않는다.

각 예후변수의 유의성 결과보다도 의학자료의 분석에서는 생존에 미치는 각 예 후변수의 영향의 정도를 상대위험도(hazard ratio, relative risk or odds ratio)로 표현하고 있다.

‘비례위험’이라는 말은 어느 환자의 위험률과 다른 환자 의 위험률의 비가 시 간 변화에 대해 일정하다는 것을 의미하는데, 여러 개의 설명변수를 생각할 때  번째 환자의 위험함수의 비는 다음과 같다.

  

     ⋅  ⋯  

  ⋅  ⋯  

   ⋯   ≈ “상수” ---(6)

적절한 Cox 모형 선정방법시 forward, backward 또는 stepwise 다단계변수 선 택법도 모형 선정방법에 속하지만 오로지 통계적인 기준에만 근거하여 모형을 찾 는 것은 바람직하지 못하다. 그 이유는 통계적 기준에만 근거하여 적합한 Cox 모 형을 선정할 때, 적합한 모형은 실제로 유일한 것이 아니며 몇 가지 좋은 모형이 모두 적절할 수 있기 때문이다. 특히 분석하고자 하는 생존자료에 대해 깊이 이해 한다면 목적하는 바에 따라서 여러 모형을 단계적으로 적합시켜 이들 결과를 비 교함으로써 적절한 모형을 선정할 수 있다.

모유수유 기간을 고려한 생존분석은 모유수유를 마쳤거나 조사당시 모유수유를 마 치지 못한 대상 모두를 편입함으로서 중도절단된 자료를 이용하여 비례위험모형은 다 변량 생명표를 제시함으로서 다른 회귀분석과 달리, 중도절단 편의(bias)를 통제한다.

또한, 이 모델은 비례성 가정을 만족하지 못한 요소를 층화 분석할 수 있도록 한다.

생존분석을 하기 위해선 먼저 종속변수인 모유수유 기간에 대한 정확한 이해를 필요 로 한다. 본 연구는 모유수유 시작부터 모유수유 중단까지의 기간에 대한 분석이다.

생존분석이란 어떤 사건(event)이 발생할 때까지의 시간으로 자료가 구성된 경우 사 용하는 통계적 방법으로서 사건의 발생 여부에 대해 불확실한 자료가 포함되어 있다는 특징을 가지고 있다. 이러한 불확실한 자료를 중도절단된 자료(censored data)라 부르 며 중도절단된 자료가 발생하는 이유는 추적이 불가능한 경우(loss to follow up), 중도 탈락(drop out), 사건이 발생하기 전에 연구를 종료하는 경우(termination of the study), 이 연구와 상관없는 다른 원인에 의한 사망(death from unrelated cause)과 같은 네가지 요인들을 생각할 수 있다(남정모, 1997).

본 연구에서 중도절단되어 들어간 자료를 살펴보면 모두 우측 중도절단된 자료(right censored)로 시작 시점이 모두 다르게 적용되어 조사기간 내에서 중도 탈락(drop out) 된 경우, 12개월 이상 모유수유를 하였으나 추적조사 실패한 경우, 첫돌이 되기 전에 연 구기간이 종료된 경우로 연구기간 내에 모유수유를 중단하지 않은 경우도 있다. 즉, 1998년 1월부터 2000년 6월까지 조사 자료에서 <그림 3>과 같이 우측 중도절단된 자료 가 존재한다. 그 유형별로 살펴보면 출생 후 첫돌(12개월)이 될 때까지를 조사함으로써 2000년 6월 조사시점까지 첫돌이 되지 않은 경우(n=151명), 연구기간 내에 출생후 12개 월 시점에서 아직도 모유수유 중인 경우(n=74명), 연구종료 및 모유수유 중단이 아닌 다 른 사건으로 종결된 경우가 있었다(n=2명).

그림 3. 우측 중도절단된 자료의 예

calendar time

1998.1 1999.1 2000.1 2000.6 2001.1

calendar time

1998.1 1999.1 2000.1 2000.6 2001.1

0

첫 돌

duration (months)

1 2 3 4 5 6 7 8 9 10 11

0

첫 돌

duration (months)

1 2 3 4 5 6 7 8 9 10 11

이들 중도절단된 자료의 생존시간은 불확실하나 중도절단되기 직전까지는 모유수 유 중단 사건(event)이 발생하지 않았다는 부분적인 정보를 가지고 있다. 따라서 생존 분석에서는 이러한 점을 최대로 이용하여 분석한다는 특징이 있다. 만약 중도절단된 자 료를 분석에서 제외된다면 잘못된 연구결과를 제시할 수도 있다. 생존분석에서는 모든 연구대상의 관찰시간을 알아야 하고 또한 중도절단 여부를 명확히 알아야 하므로 연구 를 시작하기 전에 다음 사항들을 검토하여야 한다. 생존시간의 시작점을 확실히 정의 할 수 있는지, 정확한 생존시간을 측정할 수 있는 기준이 있는지 및 사건의 발생여부를 확실히 구별할 수 있는지를 검토해 보았다. 모유수유 기간은 출생 후 모유수유를 시작 하여 모유수유를 중단하기 직전까지 모유수유를 한 경우를 기준으로 한다. 여기서 생존 시간을 측정할 수 있고, 사건의 발생여부인 모유수유 중단을 모유수유 중인 경우와 확 실히 구별할 수 있었다.

이처럼 정의되는 생존분석을 이용하는 경우 모유수유 중단은 모유수유를 시작해야 만 가능하기 때문에 일단 모유수유를 시작한 경우만이 이 연구에서 분석의 대상이 된 다. 1,066명 중에서 모유수유를 시작한 740명이 분석대상이 되는데, 이 가운데에는 조 사당시 아직 모유수유 중이거나 조사기간 12개월까지만 모유수유 기간을 조사한 사례 227명이 포함되어 있다. 이 연구에서는 우측 중도절단(right censored)된 것으로 분석에 포함시킨다.

분석에 사용할 자료가 허용한다면 위의 경우를 충분히 고려하여 분석대상자를 선택 하는 것이 더 좋은 결과를 얻을 수 있을 것이다.

본 연구는 SAS version 8.2의 LOGISTIC, PHREG 프로시져를 이용하여 분석하 였다.

PROC LOGISTIC은 모유수유 실천 결정에 유의미한 영향을 미치는지 알아보기

PROC LOGISTIC은 모유수유 실천 결정에 유의미한 영향을 미치는지 알아보기

문서에서 모유수유 결정요인에 관한 연구 (페이지 45-53)

관련 문서