Lee, Min-kyu
Ⅲ. 분석 모형
중도절단된(censored) 종속변수들 사이에 서로 상호의존성이 존재 하는 경우,7) 단변량 토빗 모형으로 추정한다면, 편의된 모수 추정치를 얻을 수 있다(유승훈, 2003). 따라서 중도절단된 종속변수들 사이의 상호관계를 반영하기 위해서 다변량 유사비상관회귀분석 토빗 모형을 적용하는 것이 타당하다(Cornick et al., 1994; Huang, 1999; Huang, 2001).8)
7) 본 연구에서는 전복 소비 횟수가 0인 사례에 대해서도 설명변수들을 관찰할 수 있는 중도절단자료(censored data)를 사용한다. 만약, 전복 소비 횟수가 0인 사 례들이 데이터에서 제외되어 있어서 전혀 관찰할 수 없는 절단자료(truncated data)의 경우에는 truncated regression model을 적용해야 한다. 분석에서 활용 된 자료의 성격상, censored regression model의 활용이 적절하다.
8) 영의 자료를 포함한 횟수에 대한 분석으로 포아송 분포, 음이항 분포, 혼합 분포 (0의 횟수를 모형화하는 식과 양의 횟수를 모형화하는 식의 결합) 등 다른 분포 모형의 사용을 고려할 수 있다. 본 연구에서는 다변량 모형의 적용을 고려했기 때문에 변량 간의 관계를 추정된 분산-공분산 행렬을 통해서 쉽게 파악할 수 있는 다변량 토빗 모형을 적용했다. 토빗모형을 제외한 다른 모형을 통해서는
본 연구에서는 Maddala(1983)가 제시한 이변량 SUR 토빗 모형을 적용한다. 각 응답자 의 연간 내식 전복 소비 횟수에 대한 관측변수 ()와 연간 외식 전복 소비 횟수에 대한 관측변수()는 다음과 같은 식으로 표현할 수 있다.
′ ( 1 )
′ (2)
i f i f ≤ (3)
i f i f ≤ (4)
여기서 , 는 추정해야 할 모수벡터, , 는 오차항, , 는 각각 전복 소비량에 관련된 설명변수 벡터를 의미한다. 또한, 는 연 간 내식으로 전복을 소비한 횟수에 대한 잠재변수(latent variable)이 며, 는 연간 외식으로 전복을 소비한 횟수의 잠재변수이다.9) 모든 관측치들은 와 의 값에 의해서 식 (5)처럼 네 가지 경우로 분류될 수 있다.
( 5 )
변량 간의 상관관계를 파악하기가 쉽지 않다. 좋은 제언을 해 주신 익명의 심사 자에게 지면을 통해 감사를 드린다.
9) y*1i와 y*2i가 0보다 큰 경우에 대해서 소비횟수가 관측된다.
오차항 (, )은 식 (6)과 같이 이변량 정규분포를 따른다고 가정 한다.
∼
( 6 )식 (6)을 식 (1)과 식 (2)에 대입하면, (, )는 이변량 정규분포
′ ′ 를 따르게 된다. 여기서 , , 는 각각 와
의 한계분포의 표준편차와 이들의 상관계수이다. (, )의 확률밀도 함수(probability density function)는 식 (7)의 로 표현된다.10)
exp
′
( 7 )그러면 식 (5)의 네 가지 경우를 모두 반영하는 우도함수가 다음과 같은 형태를 가진다.
×
∞ ′
×
∞ ′
×
∞ ′
∞ ′ (8)
식 (8)에 최우추정법(maximum likelihood estimator)을 적용하면 모수를 추정할 수 있다. 추정된 상관계수 의 부호에 따라 각 소비 횟 수의 상호 의존성을 판별할 수 있다. 추정된 상관계수 가 0이라면 단 변량 토빗 모형으로 추정하는 것이 적절하게 된다. 만약, 통계적으로 유의하게 추정된 의 부호가 양수인 경우는 내식 소비 횟수가 많은
10)
′, ′ ′, ′ ′′, ′ ∼ 응답자일수록 외식 소비 횟수도 많다는 것을 의미한다. 즉, 내식과 외 식 소비가 서로 양의 영향을 미치는 보완적인 관계에 있음을 나타낸 다. 반면, 의 부호가 음수이면 내식 소비 횟수가 많은 응답자일수록 외식 소비 횟수가 적어진다는 것을 의미한다. 이는 내식 소비와 외식 소비가 서로 대체적인 관계에 있다는 것을 말한다.