총 예상경비(고속버스)
76%
22%
2%
0~10만원미만 10만이상~20만미만 20만이상~30만미만 30만이상~40만미만 40만이상~50만미만 50만이상~
총 예상경비(전체)
57%
26%
9%
4%1%3%
0~10만원미만 10만이상~20만미만 20만이상~30만미만 30만이상~40만미만 40만이상~50만미만 50만이상~
<그림 3-13> 여가통행시 1인당 총 통행경비
3) 여가통행 시간가치 분석
P
n(b) : 개인n
이 대안b
를 선택할 확률V
in : 대안i
에 대한n
의 효용βk : 매개변수(Parameter)
선택가능한 대안
a
,b
두 가지에 대한 대안a
의 선택여부를 나타내는 변수y
an이 가질 수 있는 관찰값은 다음의 1과 0중 어느 하나의 값이 된다.y
an={
1: 개인 n이 대안 a를 선택한 경우 0: 개인 n이 대안 b를 선택한 경우(단,
y
bn= 1 - yan) 따라서, 조사자의 입장에서 개인n
이 대안i
를 선택한 결과를 관측할 수 있 는 확률은 다음의 식 (2)와 같이 나타낼 수 있다.f
n(i) = Pn(a)yan×Pn(b)ybn (2)최우추정법에서는 표본의 크기가 N개인 표본(예 : N명의 사람들에 대한 설문 조사 결과)에서 관찰된
y
an,y
bn,X
an,X
bn의 자료값을 이용하여β0, β1, … , βk의 값을 추정하게 된다. 이때 모형의 추정을 위해 우도(尤度)함 수(Likelihood Function)를 도입한다. 우도함수란 “현상은 가장 개연성 있는 확률 의 표출이다.”고 표현되는 함수이다. 이러한 우도함수의 형태는 다음과 같이 나 타난다.
L
*(β0, β1, … , βk) = ∏N
n = 1
P
n(i)yanP
n(j)ybn= ∏N
n = 1[ exp ( Van)
∑i exp ( V in) ]yan×[ exp ( Vbn)
∑i exp ( V in) ]ybn
= ∏N
N = 1[
exp (∑
k
βk
X
ank)∑i exp (∑
k
βk
X
ink) ]yan×[exp (∑
k
βk
X
bnk)∑i exp (∑
k
βk
X
ink)]ybn
L
*(β0, β1, … , βk) : 우도(尤度)함수(Likelihood Function) (3)N
: 표본의 수P
n(i) : 개인n
이 대안i
를 선택할 확률i
: 대안a , b
조사를 통해서 수집된 자료에는 통행자별 대안선택결과(종속변수)와 효용함수 의 설명변수들이 포함된다. 따라서, 식 (3)의 우도함수에서 분석가가 모르는 것은 설명변수의 계수뿐이다. 만약 모든 통행자가 합리적으로 행동한다고 가정하면, 즉 효용함수에 근거해서 도출된 개인의 대안별 선택확률에 근거해서 선택행위를 한다면 조사된 결과는 발생확률이 가장 높은 상황이다. 따라서, 우도함수를 극대 화하는 계수값을 찾는 과정이 곧 로짓모형 내의 효용함수의 계수를 찾는 과정이 라고 할 수 있다.
우도함수를 극대화하는 계수값을 찾기 위하여 우선 식 (3)의 우도함수를 대수 변환(Log Transformation)하면 다음과 같이 변형된다.
L( β
0, β1, … , βk) = Ln L*(β0, β1, … , βk)= ∑N
n = 1[ yan⋅ Ln Pn(a) + ybn⋅ Ln Pn(b) ]
(4)
이항선택모형에서는
y
bn= 1 - yan이 성립하므로P
n(b) = 1 - Pn(a)이다.따라서 식 (4)의 로그우도함수는 다음과 같이 변형된다.
…
⋅ ⋅ (5)
이때 식 (5)의 로그우도함수를 극대화시키는 효용함수의 계수 β0
ˆ
, βˆ
1, … , βˆ
k의 값을 찾게 된다. 이를 위해 로그우도함수L
을β0
ˆ
, βˆ
1, … , βˆ
k에 대해 각각 편미분하여 이를 0으로 놓는다.∂L
∂ β
ˆ
0 = ∑N
n = 1
{ y
an⋅ ∂PnP
(a) / ∂ βn(a)ˆ
0 + ( 1 - yan)⋅ ∂[ 1 -Pn(a) ] / ∂ βˆ
01-Pn(a)
}
= 0∂L
∂ β
ˆ
1 = ∑N
n = 1
{ y
an⋅ ∂PnP
(a) / ∂ βn(a)ˆ
1 + ( 1 - yan)⋅ ∂[ 1 -Pn(a) ] / ∂ βˆ
11-Pn(a)
}
= 0:
:
∂L
∂ β
ˆ
k = ∑N
n = 1
{ y
an⋅ ∂PnP
(a) / ∂ βn(a)ˆ
k + ( 1 - yan)⋅ ∂[ 1 -Pn(a) ] / ∂ βˆ
k1-Pn(a)
}
= 0(6) 식 (6)의 연립방정식을 풀면 최우추정치
ˆ
β0, βˆ
1, … , βˆ
k를 구할 수 있다. 그 런데 위의 연립방정식은 로그우도함수L
을 극대화시키기 위한 필요조건 (Necessary Conditions)일 뿐이다. 따라서 추정치ˆ
β0, βˆ
1, … , βˆ
k에 대하여 다음의 식을 만족하는지의 여부를 확인해야 한다.
∂2
L
*(∂βk)2 < 0 (
k = 0 , 1 , … , k
) (7)추정치
ˆ
β0, βˆ
1, … , βˆ
k에 대해서 식 (7)이 만족되면 연립방정식을 풀어서 구한 추정치들이 유일한(Unique) 최우추정치임을 알 수 있게 된다.② 다항로짓모형에의 최우추정법 적용
다항로짓모형에서의 최우추정법 적용과정은 이항로짓모형의 경우가 일반화된 것이다. 각 개인
n
이 선택가능한 대안이 두 개 이상인 경우 표본의 크기가 N개 인 표본에 대해서 도출되는 우도함수의 형태는 다음과 같다.L
*( β) = ∏Nn = 1 ∏
Ai∈A( n)
P
n(i)yin(8)
L
*( β) : 우도(尤度)함수(Likelihood Function)A( n)
: 개인n
이 선택가능한 대안의 집합P
n(i) : 개인n
이 대안i
를 선택할 확률y
in={
1: 개인 n이 대안 i를 선택한 경우0: 개인 n이 대안 i를 선택하지 않은 경우
식 (8)의 우도함수를 대수변환(Log Transformation)하면 로그우도함수는 다음과 같이 도출된다.
L( β) = Ln L
*( β) = ∑Nn = 1 ∑
Ai∈A ( n)
y
in⋅ Ln Pn(i) (9) 이항로짓모형의 경우와 마찬가지로 로그우도함수L
을 극대화시키는 효용함 수의 계수ˆ
β0, βˆ
1, … , βˆ
k의 값을 찾기 위해 로그우도함수L
을β0
ˆ
, βˆ
1, … , βˆ
k에 대해 각각 편미분하여 이를 0으로 놓는다.∂L
∂ β
ˆ
0 = ∑N
n = 1
{
Ai∑∈A( n)y
in⋅ ∂PnP
(i) / ∂ βn(i)ˆ
0}
= 0∂L
∂ β
ˆ
1 = ∑N
n = 1
{
Ai∑∈A( n)y
in⋅ ∂PnP
(i) / ∂ βn(i)ˆ
1}
= 0:
:
∂L
∂ β
ˆ
k = ∑N
n = 1
{
Ai∑∈A( n)y
in⋅ ∂PnP
(i) / ∂ βn(i)ˆ
k}
= 0(10)
위의 식 (10)의 연립방정식을 풀면 최우추정치
ˆ
β0, βˆ
1, … , βˆ
k를 구할 수 있 다. 그런데 위의 연립방정식은 로그우도함수L
을 극대화시키기 위한 필요조건 일 뿐이다. 따라서 이항로짓모형의 경우와 마찬가지로 추정치ˆ
β0, βˆ
1, … , βˆ
k에 대하여 식 (7)의 조건을 만족하는지의 여부를 확인해야 한다. 추정치 β0
ˆ
, βˆ
1, … , βˆ
k에 대해서 식 (7)의 조건이 만족되면 연립방정식을 풀어서 구 한 추정치들이 유일한 최우추정치임을 알 수 있게 된다.③ 최우추정법에서 Newton-Rapson방법의 적용
위의 식 (5)이나 식 (6)의 로그우도함수는 변수 β0, β1, … , βk에 대해서 비 선형(Nonlinear)식의 형태를 가지게 된다. 따라서 실제적으로 로그우도함수를 극 대화시키는 최우추정치
ˆ
β0, βˆ
1, … , βˆ
k의 값을 찾기 위해서는 반복계산법 (Iteration Method)을 이용하여 근사치를 구하게 된다. 이때 이용되는 방법에는 Newton-Rapson 방법, 경사탐색법, DFP(Davidson-Fletcher-Powell) 방법 등이 있다.여기서는 로짓모형의 정산에서 가장 일반적으로 사용되는 방법인 Newton-Rapson 방법에 대해서 언급한다.
Newton-Rapson 방법은 로짓모형의 경우에 가장 효과적인 정산(Calibration)방법 으로 알려져 있다. 다음의 그림은 1차원에서의 Newton-Rapson 방법에 반복과정 (Iteration Process)을 나타내고 있다.
<그림 3-14> Newton-Rapson방법의 기본원리
위의 그림에서 곡선은 ∇
이고, 목적은 이 되는 β 를 찾는 것이다. 일차원에서의 Newton-Rapson 방법의 알고리즘(Algorithm)을 정리하면 다음과 같다.
- Step 0 : 추정하고자 하는 β의 초기값을 ‘0’(Zero)으로 둔다. 즉, β0= 0 - Step 1 : 점 A에서
에 대한 선형근사(Linear Approximation)를 구한다.
- Step2 : Step 1에서의 선형근사식의 해를 구한다. 이것이 β1이 된다.
- Step 3 : | β0- β1|을 구한다. 이 차(Difference)가 충분히 작으면 β1이 해가 되고, 충분히 작다고 볼 수 없는 경우에는 Step 1로 되돌아가서 반복 과정을 되풀이한다.
위의 일차원에서의 Newton-Rapson 방법을 다차원으로 확장시켰을 때의 알고 리즘(Algorithm)은 다음과 같다.
- Step 0 : 해의 초기 추정치로서 β0= [ β01, β02, … , β0k]를 선택한다.
(일반적인 경우에 β0= 0을 선택한다. ) 반복단계를 ω = 0으로 설정하고, 반복단계의 종료의 판단기준으로서
e
1과e
2를 설정 한다. (일반적으로e
1= 10- 4 ,e
2= 10- 2로 설정한다. ) - Step 1 : β ω에서 ∇ 에 대한 선형근사식을 구한다. 이 선형근사식은 ∇ ∇ 에 의해서 주어진다.
- Step 2 : ∇ ⋅∇을 풀어서 βω를 구한다.
- Step 3 : 이 작은지를 점검한다. 이때 기준은
이거나
이다.(모든 … 에 대해서)
이 기준들을 만족하면 반복과정을 종료하고 이 해가 되고, 그렇지 않으면 이 되고 Step 1로 되돌아가서 반복과정 을 되풀이한다.
(2) 최우추정법 적용시 모형의 검정
최우추정법을 통하여 도출된 모형을 검정하는 단계는 크게 다음의 세 가지로 구분할 수 있다.
우선 합리성 검정 단계를 거쳐야 한다. 이 단계에서는 도출된 효용함수에서 설명변수의 계수의 부호가 합리적인지를 검토하는 것이다. 예를 들어 승용차 이 용의 효용함수에서 차내통행시간의 부호가 양(+)의 부호를 가지면 합리적이지 못하므로 이 효용함수는 재검토되어야 한다는 것이다.
두 번째 단계는 통계적 검정 단계이다. 여기서는 설명변수의 계수의 부호가 합리적인 경우에 도출된 모형이 통계적으로 유의한지를 검토하게 된다.
마지막 과정이 적용가능성 검정 단계이다. 이 과정에서는 설명변수로 도입된 변수가 장래에도 추정가능한 변수인가를 검토함으로써 모형의 적용가능성을 검 토하게 된다. 만약 장래에 설명변수의 추정이 불가능하다면 도출된 모형을 통해 서 수요추정을 하는 것은 불가능할 것이기 때문에 이러한 모형의 사용은 제고되 어야 할 것이다.
본 과제에서는 세 가지 검정단계 중에서 특히 중요한 통계적 검정 단계에 대해 서 언급한다. 통계적 검정 단계에는 개별계수에 대한 가설검정, 모형전체에 대한 가설검정, 모형의 적합도(Goodness of Fit)측정의 세 가지 검정이 있다.
① 개별계수에 대한 가설검정
최우추정법을 통하여 도출된 모형에 대해서는 각 설명변수에 대한 개별계수들 의 추정치가 통계적으로 어느 정도 신뢰성이 있는지 검토해야 한다. 이 때에는
t
-검정을 사용하고, 귀무가설과 대립가설의 설정은 다음과 같이 한다.- 귀무가설
H
0: βk= 0- 대립가설
H
1: βk≠0 (단,k = 0 , 1 , … , K
)설정된 가설들을 검정하기 위하여
t
-통계량을 사용하게 되고,t
-통계량의 계 산치가 기각역에 속하게 되어 βk= 0이라는 귀무가설을 기각하게 되면k
번째 특성(설명변수)은 통계적으로 유의한 것으로 받아들일 수 있게 된다.② 모형전체에 대한 가설검정
개별계수에 대한 가설검정 외에도 모형전체의 통계적 유의성을 검정하기 위한 가설검정이 필요하다. 최우추정법으로 도출된 모형에 대해서는 ‘우도비(LR : Likelihood Ratio)’검정이 이용된다. 이때 설정되는 귀무가설과 대립가설은 다음 과 같다.
- 귀무가설
H
0: β0= β1= β2= … = βk= 0 - 대립가설H
1:모든 βk가 0이 되는 것은 아니다.가설의 기각여부를 결정하기 위해서 사용되는 검정통계량은 식(11)에 의해서 결정된다.
χ2
0=- 2 [ L( 0) - L( βˆ)] (11)
L( 0)
: 모든 βk가 0인 경우의 로그우도함수 값L( β
ˆ) : 로그우도함수의 최대치에서의 로그우도함수 값위의 식 (11)에 의해서 결정되는 검정통계량은 자유도
K
(모형에서 추정된 계 수의 수)의 χ2분포를 가지게 된다. 여기서 계산된 χ20의 검정통계량이 기각역에 속하게 되어 귀무가설(H
0)이 기각되면 추정된 모형이 전체적으로 믿을 수 있는 것으로 판단하게 된다.위에서 설정된 가설 외에도 다음과 같은 가설설정도 가능하다.
- 귀무가설
H
0:대안특유의 상수를 제외한 나머지 모든 계수가 0이다.- 대립가설
H
1:대안특유의 상수를 제외한 나머지 모든 계수가 0이 되 는 것은 아니다.이러한 가설들을 검정하기 위하여 사용되는 검정통계량은 다음의 식에 의하여 결정된다.
χ2
c=- 2 [ L( c) -L( βˆ)] (12)
L( c)
: 설명변수로서 대안특유의 상수만이 모형에 포함되어 있을 때 의 로그우도함수 값이때의 검정통계량은 자유도 ‘K(추정된 계수의 수)-J(선택대안의 수)+1’의 χ2 분포를 가지게 되고, 여기서 계산된 χ2c의 검정통계량이 기각역에 속하는지의 여부를 검정하고, 만일 기각역에 속하게 되어 귀무가설(
H
0)이 기각된다면 모형 이 전체적으로 믿을 수 있는 것으로 판단하게 된다.③ 모형의 적합도(Goodness of Fit) 측정
모형이 추정되고 나면 추정된 모형이 관측된 자료를 얼마나 잘 설명하는가를 살펴볼 필요가 있다. 확률선택모형에서는 모형의 적합도를 나타내기 위해서 ρ2가 주로 사용된다. 이 ρ2는 다음과 같이 계산된다.
ρ2= 1 -
L( β
ˆ)L( 0 )
(13)
L( β
ˆ) : 로그우도함수의 최대치에서의 로그우도함수값L( 0)
: 모든 계수β0, β1, … , βk의 값이 0일 때의 로그우도함수값ρ2은 회귀분석에서의 결정계수( : Coefficient of Determination)와 비슷한 역 할을 한다. 즉, ρ2는 0과 1사이의 값을 가지며, 1에 가까울수록 좋은 적합도를 나타낸다. ρ2는 일반적으로 결정계수보다 작은 값을 가지게 된다. ρ2가 어느 정도 되어야 모형의 적합도가 좋다고 말할 수 있는 일반적 기준은 없지만, ρ2값 이 0.2와 0.4사이의 값을 가지면 모형의 적합도가 좋다고 평가할 수 있다.
동일한 표본자료에 대해서 효용함수에 새로운 변수가 추가될 때마다 ρ2의 값 은 증가하게 된다. 이러한 ρ2의 결점을 보완하기 위해서 ρ2를 사용한다. 이
ρ2는 회귀분석의 수정결정계수(Adj. : Adjusted Coefficient of Determination) 와 비슷한 역할을 하게 되고, 식(14)에 의해서 결정된다.
ρ2= 1 -
L( β
ˆ)-KL( 0 )
(14)L( β
ˆ) : 로그우도함수의 최대치에서의 로그우도함수값L( 0)
: 모든 계수β0, β1, … , βk의 값이 0일 때의 로그우도함수값K
: 효용함수에서 사용되는 설명변수의 개수(3) 소득별 통행시간가치 분석결과
위와 같이 최우추정법의 정산을 위한 통행자료의 집단을 구축하고, Limdep 프 로그램에서 제공되는 ‘Discrete Choice Model'을 이용하여 정산을 수행하였다.
통행시간가치는 통행시간의 계수와 통행비용의 계수의 비에 의하여 산출된다.
그런데 본 과업에서 도출된 개인 통행효용함수의 통행시간변수는 ‘분’을 단위로 하여 자료가 구축되었기 때문에 1시간에 대한 통행시간가치를 도출하기 위해서 는 이를 ‘시’단위로 환산해 주어야 한다. 즉, 본 과업에서 정산결과에 의거하여 통행시간가치를 도출하는 식은 다음과 같다.
통행시간가치 = 통행시간 변수의 계수
통행비용 변수의 계수 ×60 (원/시간) (15)