• 검색 결과가 없습니다.

제7장 상관분석과 공간적 자기상관, 13장 공간계량모델

N/A
N/A
Protected

Academic year: 2021

Share "제7장 상관분석과 공간적 자기상관, 13장 공간계량모델"

Copied!
5
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

통계분석 실습 : by 최상열 textbook : p634~657 제7장 상관분석과 공간적 자기상관, 13장 공간계량모델 Raw data : 고급통계분석론 CD ‘실습10’

Software : GeoDa (ver. 1.4.1, 2013.06) (http://geodacenter.asu.edu/)

[1] 공간회귀모델의 실행단계

1단계. 관심대상이 되는 현상에 대한 공간 데이터(지도)와 속성 데이터(종속변수, 설명변수)를 수집한다.

(GIS data format : 공간데이터와 속성데이터를 연계시킨 데이터)

2단계. 공간 데이터에 각 지역의 인접성을 정의하고 공간가중행렬을 구축한다.

3단계. 종속변수가 공간적 자기상관성을 갖고 있는 가를 검정한다.

4단계. OLS 회귀분석을 실행한다.

5단계. OLS 추정결과 산출된 잔차 분석을 통해 공간적 의존성이 나타나는 가를 다시 확인한다.

6단계. 공간회귀모델 (SAR, SER모델을 실행한다)로 추정한다.

[2] 데이터 작성

(1) 분석 목적 : `08년 말 우리나라 시·군·구별 특허출원건수가 지역별로 유의한가 종속변수 : 지역별 인구 만명당 특허건수

설명변수 : 대학이상 인구비율, 종사자 비율지식기반산업 비중, 지식기반서비스업 상대적 성장률 (2) file 설명 : 다른 프로그램들과 달리 공간 데이터를 분석하기 때문에 표본의 지리적 위치 데이터 필요

shp : 지도 파일 - 공간 데이터 (시·군·구)가 표시된 dbf : 속성 파일 - 지역에 한 종속변수와 설명변수들인 shx : Index 파일 - shp파일과 dbf파일을 연결

(3) 3개 파일은 모두 같은 이름이어야 함. 또, 폴더 경로가 모두 영문어야 함. (한글 폴더 인식 불가)

[3] 단계 구분도

(1) 분위수(Quantile) : 몇 개의 분위로 나눌지 정하여 지도에 단계 구분도 표시 (분위수 / 셈플수)

5/229 = 45.9

(2)

(2) 표준편차(Standard Deviation) : 평균으로 부터 1, 2 표준편차로 구분하여 단계구분도 작성

(3) 단계구분도를 통해서 서울, 경기남부, 대전과 5대 광역시에 특허 수가 집중되고, 서남부권과 강원지역의 특 허 수가 적은 것을 확인할 수 있음. → 특허의 지역 간 격차가 크며 공간패턴은 군집화 되어 있음을 확인

[4] 공간가중행렬 구축

(1) contiguity weight : 지역 간 경계선의 인접 여부 (Rook, Queen)

: 1번 지역이 6개 지역과 인접해 있음 (Rook) (생성된 Text 파일에서 확인 가능)

: 연결성 확인 (6개 섬지역은 인접해 있는 지역이 없음이 확인된다)

(3)

(2) distance weight : 지역의 중심점으로 부터 거리

: 임계거리 최소값 설정 (ex : 48400으로 값 설정 시 행정구역 중심과 중심사이 거리가 48400 이하인 경우 인접으로 인식)

: 1지역과 94지역간의 거리는 31172

(3) K-nearest neighbors : 지역으로 부터 가장 가까운 지점의 수를 연구자가 설정

[5] 공간적 자기 상관성 검정 (1) Moran I 지수

: Moran I 지수가 0.351로 높은편 (-1 index 1)

(2) LISA (GeoDa ver. 1.4.1 에서 제공하지 않음)

[6] 선형 회귀모델

: R-squared 값이 0.54로 낮으나 F- statistic 값이 66.8로 모델 적합함을 확 인

선형 회귀모델에서 설명변수가 갖는 추정계수

(4)

: Multicollinearity condition number (다중 공선성 판단 지표) 값이 30을 넘으면 심각 한 다중 공선성

: Jarque-bera – 오차항이 정규분포 한다는 귀무가설 검정

: Breusch-Pagan, Koenker-Bassett, White검 정은 오차항의 이분산성을 검정

[7] 잔차분석

: Scatter plot - 예측치와 잔차와의 산점도가 등분산이 아닌 메가 폰 형태로 나타남. (예측치가 작을 경우 잔차는 크고, 예측치가 클 경우 잔차는 작음)

: 잔차에 대한 분위 단계구분도 – 종속변수(지역 간 특허 수)는 설명변수 뿐만 아니라 이웃하는 주변지역들의 영향을 받고 있는 것으로 판단되므로 공간회귀모델이 필요함

[8] 공간회귀모델 추정 (1) 일반선형회귀모델 (2) 공간시차모델 (3) 공간오차모델

: Moran-I지수가 0.04며 유의도가 0.235로 적합 공간시차모델 적합도 판단

공간오차모델 적합도 판단

(5)

: 공간시차모델 유의도가 0.0048로 통계적으로 가장 유의한 모델로 판단

: Lagrange Multiplier (SARMA) – 공간 시차모델과 오차모델을 동시에 사용 했을 때 유의한지 보여줌 (두 모델 중 어느 하나만 유의해도 동시 사용 모델도 유의한 것으로 나타난 것으로 잘 사용하지 않음)

[9] 결과 분석

선형 회귀모델(OLS) 공간시차모델

(Spatial lag)

공간오차모델 (Spatial error)

공간효과 ρ(rho) 0.18***

λ (Lamda) 0.09

상수항 0.83*** 0.59*** 0.84***

지역속성 (추정계수)

대학이상인구비율 2.29*** 1.77*** 2.28***

지식산업종사자비중 7.21*** 6.32*** 7.03***

인구대비종사자비율 0.95*** 0.97*** 0.96***

지식기반서비스업

상대적증가율 2.36** 2.47** 2.42**

모델의 설명력 설명계수 0.54 0.56 0.55

모델의 적합성

Log likelihood -242.06 -238.32 -241.63

AIC 494.11 488.65 493.26

SC 511.28 509.25 510.43

정규성 Jarque-Bera 54.94***

등분산성

Breusch-Pagan, 11.50** 11.03** 10.66**

Koenker-Bassett 5.52 White 31.78***

공간적 종속성 Likelihood ratio 7.46*** 0.85

LM-lag 7.94***

Robust LM-lag 8.96***

LM-Error 0.98

Robust LM-Error 1.91

***, **, * : 유의수준 0.01, 0.05, 0.1 에서 유의함

(1) 결정계수 : 일반선형모델 < 공간오차모델 < 공간시차모델

(2) 적합성(Log likelihood, AIC, SC) : 일반선형모델 < 공간오차모델 < 공간시차모델

(3) 추정계수 : 종속변수의 공간적 자기상관성을 통제하지 않고 분석을 한 경우 대학이상 인구비율과 지식산업 종사자비중 영향력은 과대 추정, 인구대비 종사자비율과 지식기반서비스업의 상대적 증가율은 과소 추정 (4) 4개의 추정계수가 모두 (+)의 부호를 보여주기 때문에 설명변수가 전국 평균보다 높은 지역은 특허건수가

높을 것이라는 예측이 가능

(5) 공간시차모델에서 가장 중요한 지표인 ρ(rho) 계수가 0.18로 통계적으로 유의

(6) 이 계수는 특허수에 영향을 미치는 공간적 파급효과를 나타내는 것으로 해당 지역의 특허 수는 이웃하는 주 변지역 평균 특허 수의 약 18% 정도 영향을 받는다고 해석 가능

(7) 즉, 특허를 출원하는데 있어 특허를 많이 출원하는 인접지역에 가까이 할수록 영향을 받아 특허 출원이 많 아진다는 스필오버(spill over)가 일어남을 말해줌

참조

관련 문서

 break 문은 반복 루프를 빠져

– 회원국가의 어느 시민이 자신의 나라에서 특허를 출원하였을 경우 다른 어떤 회원국에서도 똑 같은 특허 보호에 대한 권리를 행사할 수 있다.. –

: 수출업자가 물품선적 후 수입업자를 지급인으로 하는 일람불어음 을 발행하여 선적서류와 함께 거래외국환은행에 추심을 의뢰, 추 심은행은 수입업자에게 대금지급과 상환으로

(예) ‘끊이지 않는 울음’에 대한 기술과 같이 끊임없이 우는 아기를 양 육하는 부모들의 체험에 대한 연구를 통해 그러한 체험을 구성하는 본질적인 요소를

Questions

Ø 또한 이자율의 결정에 있어서도 국내정책의 규제나 민간은 행단체의 협정 등에 의해 규제를 받지 않으며 , 예금의 최저단 위를 국내은행보다 높게 정하고

vector 클래스의 사용 list 클래스의 사용 이터레이터의 이해 이터레이터의 사용 이터레이터의 종류 알고리즘의 이해 알고리즘의

- 여기서 Q=6의 왼쪽에서는 AC가 감소하고 이에 따라 MC는 AC의 아래쪽에 위치하고, 오른쪽에서는 AC가 증가하고 이에 따라 MC는 AC의 위쪽에 위치함.. Q=6에서는