• 검색 결과가 없습니다.

지리가중회귀모형과 혼합지리가중회귀모형

본 연구에서는 공간적 종속성 그리고 공간적 이질성을 고려해주기 위 해 총 다섯 가지의 공간계량모형을 적용하였다. 그 중 지리가중회귀모형 은 앞선 최소자승모형과는 다르게 각 수단별 통행량에 대한 독립변인들 간의 상관관계를 지역적으로 도출하기 위해 적용한 방법론으로 이분산성 을 가정하고 있다.

지리가중회귀모형은 본 연구에서 공간 또는 지역의 특성을 대변하는 지역 환경이 종속변인인 각 수단별 통행량에 미치는 영향이 상이할 수 있지 않을까라는 연구 질문 하에 채택하여 본 연구에 적용하게 되었다.

해당 모형이 앞선 공간계량모형들과 다른 점은 공간적 이질성을 추가적 으로 고려해준다는 것으로, 이는 곧 연구 모형의 오차항이 동일한 분산 을 가지지 않을 경우 등분산성을 가정하는 최소자승모형보다는 해당 모 형을 통해 보다 신뢰성을 가질 수 있는 결과 값을 도출할 수 있음을 의 미한다.

두 모형 중 먼저 소개할 지리가중회귀모형은 연구 대상지역 간의 관 계 및 그들 간의 상호작용을 고려하는 모형으로 특정 지역 또는 지점의 경위도와 거리를 원천으로 활용하는 모형이기도 하다.

   

  (6)

   ⋯ 

위의 식 (6)에서 는 연구 지역 내 특정 지역 에서의 해당 독립 변인 에 대한 추정계수를 뜻하며, 해당 값은 와 더불어 지역별로 다를 수 있다. 더불어 는 연구 지역 내 특정 지역 의 공간에서의 좌 표를 뜻한다. 해당 방법론을 통해 도출된 추정계수 값들은 모든 지역에 대해 일정하지 않다. 이는 해당 방법론이 등분산성이 아닌 이분산성을 가정하기 때문이며, 위의 식을 행렬의 개념으로 다시 서술할 경우 이는 다음 수식 (7)과 같이 표현될 수 있다.

 



 

 (7)

수식 (7)에서

는 공간가중행렬(spatial weight matrix)로 특정 지 역 와 다른 모든 연구 지역들 간의 거리를 반영하는 × 대각행렬을 의미한다. 해당 행렬은 특정 지역 와 타 지역 간의 거리()를 기초로 함과 동시에 가중치()를 포함한다.

특정 지역과 그 주변지역들 간에 적용되는 거리기준 가중치에는 선행 연구들에 의해 여러 유형들이 소개되었다. 하지만 본 연구에서는 연구 지역의 분포가 규칙적이지 않음을 고려해 연구 지역들의 분포 형태에 따 라 커널을 달리 설정하는 적응적 커널(adaptive kernel)3) 방식을 채택하 였고, 이에 대한 식은 다음의 수식 (8)과 같다.

    (8)

적응적 커널에 대한 수식에서 는 두 지역(와 ) 간의 거리를 뜻하

3) 연구 대상 지역이 규칙 또는 불규칙적으로 분포하는지에 대한 여부에 따라 고정 된 커널(fixed kernel) 또는 적응적 커널 방식을 채택하게 되는데, 이러한 연구 지역의 지리적 분포를 고려하지 않고 일반적으로 채택하는 고정된 커널 방식을 선택 후 분석할 경우 일부 지역에 있어 왜곡된 결과 값(표준오차 및 추정계수) 을 도출하게 되는 문제가 발생하게 된다(Fotheringham et al, 2003).

며, (bandwidth)는 대역폭4)을 뜻한다. 이렇게 두 지역 간 거리에 기초 한 공간가중행렬에 의해 특정지역 에 보다 가까이 위치한 지역일수록 더 높은 가중치를 부여하게 된다.

기존의 지리가중회귀모형은 연구 모형 내 모든 독립변인들을 국지적 계수로 설정하여 이에 대한 각각의 추정계수를 구해주는 모형이다. 그러 나 경우에 따라 연구 모형 내 모든 독립변인들의 추정계수가 지리적으로 차이를 띄지 않을 수 있다. 이러한 경우 Fotheringham et al(2003)에서는 일부 변인들의 추정계수에 대한 변화의 정도가 무시될 수 있기 때문에, 이를 위해 특정 변인을 전역적 계수로 설정하는 혼합 지리가중회귀모형 의 적용을 추천하였다. 혼합 지리가중회귀모형은 일반적인 지리가중회귀 모형에서 국지적 계수로 설정된 변인들 중 일부를 전역적 계수로 설정하 여 분석하여 주는 방법론으로 이는 다음의 수식 (9)와 같이 표현될 수 있다.

   

    

  (9)

위의 식에서 (   ⋯ )는 국지적 계수를, (   ⋯)는 전 역적 계수를 각각 뜻한다. 위의 식 (9)를 행렬의 개념으로 다시 기술할 경우 이는 다음의 수식 (10)과 같다.

 

   (10)

위의 식에서

는 국지적 계수로 설정된 독립변인들의 행렬이며, 

는 국지적 계수들의 벡터 값을 의미한다. 더불어 위의 식에서의 은 지

4) 대역폭은 가중 함수(weighting function)에서의 거리감쇠(distance-decay)모수를 의미하며, 이를 통해 얻어진 지역별 교정(calibration) 결과가 평탄해진 (smoothed) 정도를 나타낸다(Fotheringham et al, 2003).

리적으로 가중화된 항으로    

으로 표현할 수 있다.

의 값을 안다고 가정했을 때, 기본적인 지리가중회귀모형을 통해  의 값을 추정할 수 있다. 추정된  값은 다음 수식 (11)과 같이 표현될 수 있으며, 수식 (11)에서의

는 다음의 수식 (12)와 같이 표현될 수 있 다.

관련 문서