• 검색 결과가 없습니다.

2. 연구 방법

2.4 CE의 절차

2.4.3 한계지불의사

2.4.3.2 분포 추정 방법

  

exp



 exp



_[식 11]

26)이하 본 연구에서는 Class를 ‘집단’으로 기술하기로 한다.

27)MWTP의 moment에 관한 내용은 2.4.3.2 분포 추정 방법에 기술하였다(p.52).

LCM에서는 최우추정을 통해 집단마다 다른 모수(β1, β2,…,βm)가 추정되 게 된다. 본 연구에서는 Pacifico and Yoo(2011)의 lclogit.ado 코드를 활 용하였다. 이 코드에서 표본을 잠재 집단으로 나누는 기준은 Dempster et al.(1977)이 결측값을 다루기 위해 고안한 EM(Expectation and Maximization) 알고리즘에 기반을 둔다.

LCM에서 결측값은 각 집단의 점유율이다. 각 집단의 점유율을 동수에서 시작, 추정을 수차례 되풀이하여 로그우도를 최대로 하는 점유율 조합을 도출하는 방법이다. 따라서 LCM에서 집단의 수는 외생변수(exogenous variable)이고, 집단별 점유율은 내생변수(endogenous variable)가 된다.

LCM에서 최적 집단의 수는 정보량 규준(Information criteria)에 의해 결 정된다(Train, 2008). 널리 쓰이는 정보량 규준으로는 BIC AIC, C-AIC(Consistent-Akaike Information Criterion)가 있다. 이 값들은 로그 우도, 추정 모수의 수, 관측치를 이용하여 계산된다28).

집단 간 모수의 차이를 검증하기 위하여 Wald χ2 통계량을 활용하였다 (Liao, 2004). G개의 집단 간 추정 계수의 차이가 없다는 귀무가설(H0

12=…=βG)에 대한 Wald χ2 통계량(W)은 [식 12]와 같이 도출한다. 이 통계량은 자유도가 G-1인 χ2 분포를 따른다.

28)BIC= -2*로그우도+파라메터 수*ln(응답자 수) AIC=-2*로그우도+파라메터 수

CAIC=-2*로그우도+파라메터 수*[ln(응답자 수)+1]

G

Hoyos(2010)는 MXL이 이질성을 연속 값(continuous value)으로 표현하 는 반면, LCM은 이산 값(discrete values)으로 표현한다는 점에서 차이가 있다고 하였다. MXL은 표본 내에서의 이질성을 나타내고 LCM은 하위 표본인 집단 간의 이질성을 나타낸다는 점에서 전자를 Intra-heterogeneity라 하고 후자를 Inter-heterogeneity라 표현하기도 한 다(Lee et al., 2003).

로는 두 방법의 상대적 비교는 가능하나, 어느 하나가 완벽히 우월하다 는 결론을 내리기는 불가능하다고 하였다. 이후, MXL과 LCM을 비교한 다수의 연구 결과가 제시되었다. Hole(2008)은 MXL과 LCM의 두 정보 량규준(AIC, BIC)을 비교하여, 로그정규분포를 가정한 MXL이 LCM보다 선호된다고 하였다. 전자의 AIC와 BIC 값은 2222.22, 2301.32였고, 후자 의 값은 2316.70, 2456.64였다.

Shen(2009)은 Ben-Akiva and Swait(1986)가 제안한 AIC 기반 검정 방 법과 예측 확률의 정확성(Success index)을 기준으로 LCM이 MXL보다 우월하다고 하였다30). AIC기반 검정 방법이란 두 Model이 중첩되지 않 은 경우31)에 Model의 우월성을 가리는 방법이다. Model A, B 중 Model A가 참이라는 가설을 검정하는 방법은 다음과 같다. Model B의 적합도 (ρ2B)가 Model A의 적합도(ρ2A)보다 큰 확률이 우변의 AIC를 활용한 값 이 표준 정규분포의 누적확률 안에 포함됨을 의미한다([식 13]). [식 14]

는 Akaike Log-likelihood index이다.

Pr   ≥ ≤  

   _[식13]

   



_[식14]

K : 속성변수의 수

Φ: 정규분포의 누적 확률 함수

30)예측확률의 정확성이란 각 대안을 선택할 확률을 계산하고, 실제 대안 j를 선택했을 때, 대안 j를 선택할 확률이 가장 높음을 기준으로 계산한다.

31)두 Model의 함수 형태가 다르거나, 변수의 조합이 다른 경우를 의미한다.

Sagebiel(2011)은 다음 네 가지 정량적 기준에 의해 LCM과 MXL의 상 대적 우월성을 검증하였다;①Measures of fits(Log-likelihood, McFadden R2, AIC, BIC, Chi-square, Correction prediction), ②Ben-Akiva(1986) 검 정, ③Variance of conditional WTP values, ④Choice probabilities.

Sagebiel(2011)은 LCM의 Measure of fit이 높고, WTP의 분산이 작다는 점에서 MXL보다 장점이 있다고 하였다. 그럼에도 LCM이 MXL보다 우 월하다는 결론은 내릴 수 없다고 하였다. 그보다 모형의 선택은 사전 확 률분포 형태, 즉 이질성에 대한 사전 가정과 연구의 목적에 의해 결정된 다고 하였다. 글의 마지막에는 Model의 선택은 연구자의 본능 혹은 직 관(finger tip feel: Fingerspitzengefühl)에 맡겨야 한다고 하였다.

본 연구에서는 선행연구에서 활용된 정량적 기준에 따라 LCM과 MXL을 비교하되, 추정방법을 우월성을 가리는 기준으로는 활용하지 않을 것이 다. Greene and Hensher(2003)가 지적한 대로, 두 방법은 서로 겹치지 않는 고유의 장점이 있으며, 선호체계를 나타내는 데 보완적으로 사용할 수 있기 때문이다.

2.4.2 선호에 대한 이질성의 원인

2.4.2.1 조건부로짓모형

Allison(1999)은 집단화된 표본을 로짓이나 프로빗 모형으로 분석한 경 우, Wald χ2 검정으로 추정계수의 통계적 차이를 규명할 수 있다고 하 였다. 검정 통계량(W)의 산정 식은 [식 14]와 같으며, 이 값은 자유도가 1인 χ2 분포를 따른다32). 성별, 거주지 등 이항의 범주형 변수의 경우, 두 집단의 추정계수의 차이를 이 방법으로 검증할 수 있다. 세 개 이상 의 집단인 경우에는 [식 12]의 방법을 따른다(p. 44 참조).

 

 



  



 











 



_[식 14]

반면, 나이, 소득 등 집단으로 나눌 수 없는 연속변수는 이질성의 원인은 다음의 절차에 따라 규명한다33); ①사회경제적 변수와 속성변수를 곱하 여 교차변수(Interaction variable)를 구성한다. 교차변수를 구성하는 이유 는 한 실험 내에서 사회경제적 변수의 변이가 없기 때문이다. ②교차변 수를 간접효용함수에 추가하고 모수를 추정한다. ③모수의 부호와 유의 성을 기준으로 이질성의 원인을 규명한다.

32)Allison(1999)은 MLE(maximum likelihood estimation)가 OLS(ordinary least square)와 달 리 잔차에 대한 변동이 발생하기 때문에 Wald 검정하는 것이 바람직하다고 하였다.

33)범주형 변수도 교차변수로 검증할 수 있으나, 본 연구에서는 다루지 아니한다.

2.4.2.2 혼합로짓모형

Revelt and Train(1998)과 Birol et al.(2006)을 비롯한 연구에서 MXL에 속성변수와 사회경제적 특성변수의 곱으로 구성된 교차변수를 추가하여 조건부 이질성(conditional heterogeneity)을 규명하였다. 실제로 이들 연 구에서 교차변수의 추가로 모형의 적합도가 높아짐이 확인되었다.

MXL에서 교차변수의 추정계수가 의미하는 바는 다음과 같다. 예컨대, n 번째 속성변수의 모수가 평균이 5이고 표준편차가 2인 정규분포를 따른 다고 하자. 이 속성변수와 m번째 사회경제적 특성변수를 곱한 교차변수 의 추정계수가 -3이면, 원래 정규분포는 그림 10과 같이 n번째 속성변수 의 수준이 한 단계 증가할 때, 음(-)의 방향으로 3만큼 이동함을 의미한 다. 하지만 교차변수를 포함한 MXL을 모두 추정하는 데 상당한 시간이 소요되며, 분포 간 통계적 차이를 드러내기 쉽지 않다는 점에서 효과적 인 대안은 아니라고 판단된다.

범주형 변수의 경우, 집단별로 모수를 추정하고, 그 통계적 차이를 규명 하는 방법을 고려해 볼 수 있다. Morris et al.(2009)은 도시의 공중 도로 를 구성하는 속성에 대한 선호를 분석한 연구에서 표본을 사용 빈도에 따라 4집단으로 구분하고, 각각에 대한 MXL의 결과를 제시하였다. 하지 만 집단별 선호에 대한 현황(유의성 여부)만 제시했을 뿐, 집단 간 모수 의 차이는 통계적으로 제시하지 않았다. 이는 비교 대상 모수가 일부는 정규분포를 따르고 일부는 고정값을 갖는 경우에 모수의 통계적 비교가 쉽지 않았기 때문으로 판단된다.

Boxall and Adamowicz(2002)는 MXL은 방법 자체로는 이질성의 원인을 규명하기에 적합하지 않다고 하였다. 그 이유는 무엇보다 MXL의 추정 결과로 모수의 이질성이 특정되어 있기 때문일 것이다. MXL의 추정 결 과는 모집단의 모수를 의미한다. 모수 자체로는 분포의 특정 부분, 그림 11의 음의 영역에 해당하는 응답자들의 사회경제적 특성을 규명 (profiling)할 수 없다. 그것이 가능하다면, 교차변수의 계수를 추정하여 모수의 분포가 얼마나 이동했는지를 규명하는 것보다 효과적일 것이다.

추정 모집단의 모수를 사전확률로 하고 응답자 개개인의 모수, 개별 모 수(individual parameter)를 추정하는 대안이 있다. 개별 모수는 [식 15]

와 같이 추정 모집단의 모수, 즉 사전 확률분포(f)를 구성하는 모수 벡터 P와 응답자 개개인의 관측된 선택(yn)을 바탕으로 개별 모수(βn)를 추정 하는 방법이다(Revelt and Train, 2000; Train, 2003). 본 연구에서는 개 별 모수를 추정하고, 특정 부분(그림 11에서 음영으로 처리한 부분, 즉 정책 추진에 반대하는 집단)에 해당하는 집단의 사회경제적 특성을 규명 함으로써 이질성의 원인을 규명해 볼 것이다.





    



  







  

_[식 15]

2.4.2.3 잠재집단모형

LCM 결과로 이질성이 있는 m개의 집단이 도출되었다고 하자. LCM에 서 집단 간 이질성의 원인을 규명하는 방법에는 두 가지가 있다. 하나는 m개의 집단 간 사회경제적 변수의 통계적 차이가 있는지를 규명하는 방 법이고, 하나는 사회경제적 특성이 포함된 LCM 모형을 활용하는 방법이 다.

2.4.2.3.1 공변량을 포함하지 않는 모형

해당 집단에 속할 확률에 미친 영향 정도를 의미한다.

CL은 표본을 사회경제적 특성에 따라 복수의 집단으로 사전에 구분하 고, 집단 별로 도출된 모수의 차이를 규명하는 방법인 반면, LCM은 이 질적인 선호체계를 갖는 복수의 집단이 내생적으로 도출된다는 점에서 차이가 있다.

2.4.3 한계지불의사

2.4.3.1 점 추정 방법

모수를 고정값으로 처리한 CL, MNP, LCM34)은 [식 4-4]를 적용하여 한 계지불의사를 구하면 된다(p.26~27). 이때, Krinsky and Robb(1986)의 방법을 적용하면, MWTP의 분포를 특정할 수 있다. 이 방법은 추정된 모수를 평균 벡터로 하고, 그 분산과 공분산을 분산-공분산 행렬 (variance-covariance matrix)로 하는 다변량정규분포(multivariate normal distribution)에서 값을 하나씩 추출하여 MWTP를 계산하고, 이를 수차례 반복하여 모의 분포(simulated distribution)를 구하는 방법이다.

2.4.3.2 분포 추정 방법

MXL에서 한계지불의사를 추정함에 다음 경우를 고려해야 한다; ①해당

34)LCM의 경우, 각 집단의 한계지불의사를 구하고, 각 집단의 점유율을 고려한 가중- 한 계지불의사(weighted MWTP)를 도출하기도 한다. 본 연구에서는 LCM의 장점을 최대 한 살린다는 의미에서 가중-한계지불의사는 도출하지 아니하였다.

속성변수의 모수(βk)만 확률분포를 따를 때(Model A), ②비용변수의 모 수(βfee)만이 확률 분포를 따를 때(Model B), ③속성변수와 비용변수의 모수가 모두 확률분포를 따를 때(Model C)이다. 예컨대, βk와 βfee가 모 두 정규분포를 따르는 Model C의 MWTP 추정 식은 [식 17]과 같다.



 



∼   



 



 

∼   

 

_[식 17]

그림 12는 두 모수의 상관계수 ρ가 0인 이변량 정규분포의 결합분포 (joint distribution)를, 그림 13은 ρ가 1에 가까운 이변량 정규분포의 결 합분포를 나타낸다. 이는 상관계수의 유무와 그 크기에 따라 두 속성변 수의 조합이 달라질 수 있음을 의미한다. 따라서 속성변수와 비용변수의

그림 12는 두 모수의 상관계수 ρ가 0인 이변량 정규분포의 결합분포 (joint distribution)를, 그림 13은 ρ가 1에 가까운 이변량 정규분포의 결 합분포를 나타낸다. 이는 상관계수의 유무와 그 크기에 따라 두 속성변 수의 조합이 달라질 수 있음을 의미한다. 따라서 속성변수와 비용변수의