• 검색 결과가 없습니다.

2. 3.상대밀도 분포함수 접근

2. 3. 1.상대밀도 지수 설정

본 절에서는 집적경제 현상 이면에 대한 이론적 설명을 실증적으로 확인하 기 위해,기존연구의 ‘적률’을 활용하는 기법 보다 직관적이면서도 개념적으 로 이론에 부합하는 측도를 제안해 보고자 한다.앞서 언급한 바와 같이 외 부성과 달리 선별 및 정렬은 결과적으로 생산성 분포의 모양과 연관되어 있 다.따라서 이론적 연구결과를 확인하기 위해서는 관찰된 생산성 분포의 모 양을 구별할 수 있는 측도가 요구된다.단순히 생산성 분포의 ‘적률'만으로는 생산성 분포의 관찰된 모양이 내포하고 있는 함의를 충분히 이끌어 내는데 한계를 가질 수밖에 없다.이로 인해 본 연구는 Handcock and Morris (1999)등이 제안한 상대밀도(relativedensity)의 개념을 살펴보고,이를 기반 으로 두 생산성 분포 간 모양의 상대적 차이를 기술(記述)할 수 있는 측도를 제안하고자 한다.

2.3.1.1.상대밀도의 개념

HandcockandMorris(1999)등은 각각 확률밀도함수(또는 누적밀도함수)로 표시된 두 개의 확률분포를 비교하기 위해서 다음과 같이 상대밀도(relative density)분포라는 새로운 확률밀도함수17)를 정의하였다.우선 을 지역 의 가상의 기업 모집단(hypotheticalpopulation)의 총요소생산성(이하 생산성)관 측치에 대한 확률변수(random variable)라 하자.그리고 을 생성한 모집단 을 비교의 기준이 되는 모집단이라는 의미에서 준거 모집단(reference

17)Handcock and Morris (1999)은 상대밀도 분포를 나타내는 확률밀도함수를 정의역() 전 체에서 적분할 경우 1이 된다는 점을 들어 이를 하나의 확률밀도함수로 간주할 수 있다고 하 였다.

population)18)이라 하고, 해당 모집단으로  일 확률을 확률밀도함수 (ProbabilityDensityFunction:PDF)로,이에 대응되는 누적확률밀도함 수(CumulativeDensityFunction:CDF)를 로 기술하자.한편 비교 대상 이 되는 동일 지역의 실제 기업 모집단(comparison population)에서 생성된 생산성 관측치 확률변수를 라 하고, 일 확률을 확률밀도함수 로, 이에 대응하는 누적확률밀도함수(CDF)를 로 나타내자.

이제 지역의 가상의 기업 모집단 생산성 확률변수 을 기준으로 실제 기 업 모집단 생산성 확률변수의 등급변환(gradetransformation)19)을 통해 다 음과 같이 새로운 확률 변수 을 정의하고,HandcockandMorris(1999)을 따라 상대자료(relativedata)라 지칭하자.

(2.1) 이제  은 준거 모집단의 누적확률밀도함수로서, 대신 비교대상이 되 는 모집단의 확률변수 을 대입하여 산출(보다 정확하게는 변환)한 는 을 기준으로 평가한 의 상대적 순위(relativerank)20)를 의미하며,일종의 백분위 수와 같이  구간 내 값을 갖는 확률변수가 된다.확률변수  역시 해당 정 의역에서 확률밀도함수와 누적확률밀도함수를 정의할 수 있게 되며,이들은 이를 구성하는 두 확률변수 와 의 확률밀도함수와 누적확률밀도함수의 조합으로 나타낼 수 있게 된다.우선 앞서 제시된 정의에 따라  보다 적을 확률은 다 음과 같은 누적확률밀도함수로 나타낼 수 있다.21)

     (단, ≤  ≤ )(2.2)

18)이후 하첨자 0는 별다른 언급이 없어도 준거 모집단 또는 준거 모집단과 관련된 변수임을 나타낸다.

19)등급변환과 관련된 자세한 사항은 Cwik and Mielniczuk (1989)을 참고하기 바란다.

20)좀 더 쉽게 표현하자면,  일 때 이 에서 실현될 수 있는 값들 중 어느 정도 위 치(순위)가 되는지를 나타낸 것이라 할 수 있다.

21)Handcock and Morris (1999)은 의 실현치(realization) 을 상대자료(relative data)의 확 률변수로 지칭한 바 있다. 본 연구도 이들의 표현법을 따라 상대자료로 지칭하고자 한다.

여기서     

 ≥ 

이며,은 준거 모집단에 대 한 분위함수(quartilefunction)를 나타내는 것이다.한편  일 확률을 나 타내는 확률밀도함수는 에 대한 도함수(derivativefunction)로서 다 음과 같아지게 된다.

  



(단, ≤  ≤ ) (2.3)

여기서    즉 가상의 준거 기업 모집단에서 번째 분위에 해당하는 생 산성 값을 이라고 한다면,식 (2.3)은 다음과 같게 변환이 가능하게 된다.

  



(단, )(2.4) 결국 식 (2.4)을 통해 의 확률밀도함수가 동일한 생산성 관측치 에 대 한 두 모집단으로부터 생성된 두 확률변수 와 의 확률밀도의 비율임을 알 수 있게 된다.또한 이로 인해 확률밀도함수 은 동일한 생산성에 대 한 준거 모집단에 대비한 비교 대상 모집단의 상대적 (확률)밀도(relative (probability)density;줄여서 상대밀도)라 할 수 있다.22)이제 본 연구의 대 상인 기업 모집단에 적용하게 되면,지역에 설정된 가상의 생산성 분포에 대비된 실제 생산성 분포의 상대적 밀도(즉 상대적 기업비중)의 크기를 나타 내는 새로운 분포로서,만일 두 분포가 일치할 경우 구간 에서 균일분포 (uniform distribution)를,차이가 날 경우 이러한 균일분포에서 이격되는 특 성을 지니고 있다고 할 수 있다.23)

22)함수 이 공통의 정의역을 가지고, 해당 구간에서 연속이라면,  모두 구 에서 연속이 된다.

23)누적밀도함수의 경우  사이에 선이 되게 된다.

2.3.1.2.상대밀도를 활용한 위치 및 모양효과 분리

사실 주어진 두 분포 간의 차이는 위치(location)의 차이와 모양(shape)의 차이로 구성되어져 있다고 할 수 있다.만일 비교대상이 생산성 분포가 단순 히 준거 기업 모집단의 생산성 분포와 위치적으로만 차이가 있는 것이라면, 두 분포 간의 차이를 단순히 이러한 위치상의 차이만으로 요약이 가능하다.

그러나 만일 위치 간의 차이를 조정해 준 이후에도 여전히 분포 간에 차이가 존재하다면,이는 규모(scale)나 왜도(skewness)나 첨도(kurtosis)또는 이외의 다른 분포상의 특징이 포괄적으로 반영된 분포의 모양의 차이에서 기인한 것 이라 해도 무방할 것이다.물론 어느 한 측면에서의 차이만 존재한다면 이를 확인하는 것은 그리 어려운 작업은 아닐 수 있다.그러나 실제 실증 분석 시 관찰되는 분포 간의 차이는 보통 이러한 요소들이 뒤섞여 있는 경우가 보다 일반적이다.이로 인해 이를 분리해 낼 수 있다면 특히 본 연구와 같이 분포 의 위치(외부성 효과)보다 분포의 모양(선별 및 정렬)에 관심을 갖고 있을 경우,유용할 수 있다.다행스럽게도 앞서 제시한 상대밀도의 개념은 이러한 분리에 요긴한 바탕을 제공해준다고 할 수 있다.

상대밀도 분포에서 위치 차이로 인한 효과와 모양의 차이로 인한 효과를 분해 하는 작업은 다음과 같다.우선  은 비교대상 모집단과 동일한 중앙값을 갖도 록 위치를 조정한 준거 모집단의 확률변수24)이라고 하자.만일  가 이렇게 정의 될 수 있다면,앞서 제시한 확률변수 와  사이에 각각 다음과 같이 상대밀도를 구할 수 있게 된다.우선 을 기준으로 한  의 상대자료는

  로 나타낼 수 있게 되며,이때 은 두 분포가 동 일한 위치(중앙값)를 가지고 있을 경우 균일분포를 갖게 된다.반면  을 기준

24)위치 조정한 확률변수  = (단,    

, 은 해당 확률변수의 중앙값)로 정의 한다. 이렇게 정의되면,  의 누적확률밀도함수는     가 되며, 비교대상 모집 단의 위치(중앙값)를 가지고 있으나 모양은 준거 모집단의 것과 같은 또 하나의 가상적인 (hypothetical) 확률분포가 된다.

으로 한 의 상대자료는      로 나타낼 수 있는데,이

는 분포 간 모양,특히 생산성 분포에서 특정 범위 내의 생산성을 보이는 기업 의 비중(또는 밀도)의 차이로 확인될 수 있다.우선 선별의 경우 모든 조건이 일정할 때 지역 간에 생산성이 낮은 기업들의 비중(밀도)이 상대적으로 낮은 경우인 반면,단 방향 정렬의 경우 생산성 높은 기업들의 비중이 높은 경우, 양 방향 정렬은 생산성 높은 기업과 낮은 기업 모두에서의 높은 경우이며,이 들의 강도는 이 비중의 상대적 크기로서 환원될 수 있게 된다.또한 앞서 언급 한 바와 같이 집적경제 현상을 구성하는 이러한 요인들은 일반적으로 혼재되 어 있어,실제 관찰된 자료를 통해서 상호간의 기여정도가 불분명하지만,식 (2.5)~(2.6)과 같이 분해될 수 있다면,순수하게 각 요인 특히 선별 및 정렬과 같이 일반적인 회귀분석 등의 기법으로는 파악하기 어려운 요인의 영향정도를 식별할 수 있게 된다.다만 식(2.5)~(2.6)을 통해서 도출된 결과물은 ‘분포’를 기술한 함수형태인 관계로 이를 직접 자료에 적용,지역 간 특성과 연계시켜 분석하는데 는 어려움이 있다.다음 절에서는 이러한 분포함수를 보다 조작 가 능하도록 적절한 측도에 대해 검토하고자 한다.

2.3.1.3.상대적 중앙값 양극화 지수(medianrelativepolarizationindex) 사실 분포 간 위치의 차이만이 존재할 경우 이를 기술하는 것은 매우 단순 하다.보통 단순하게 해당 분포의 평균이나 중앙값과 같은 중심화 경향지수를 활용하여 그 차이를 표현하는 것으로 충분하기 때문이다.그러나 분포 간 모양 의 차이는 그렇게 단순하지 않다.‘모양(shape)’이라는 용어 자체가 매우 다면 적이면서도 애매모호한 용어인 관계로 이에 대한 표현할 수 있는 포괄적이면 서도 적절한 측도가 무엇인지에 대한 명확한 기준은 없다.다만 연구의 목적이 나 편의를 감안하여 적절한 지수를 선택하게 되며 일반적으로는 분산,왜도, 첨도 등의 2차 이상의 적률을 활용하는 것이 일반적이다.그러나 앞서 언급한 바와 같이 생산성 분포의 모양 중 선별이나 정렬 효과는 이러한 적률로서 기 술하는 데는 분명 한계가 존재한다.오히려 이러한 효과들은 생산성 분포 간의 밀도(기업 비중)의 상대적 차이를 통해 구현하는 것이 보다 직관적이며,이로

인해 위치상의 차이가 제거된 밀도의 상대적 크기를 표현한 식(2.6)의  ′

무게를 주어 반영하게 된다.또한 주어진 스케일링(scaling)으로 0값은 양 분포

수를 기준으로 4등분하여 각 구역별로 분해할 수 있게 된다.

2.3.1.4.실증분석으로의 적용

본 연구는 집적경제 현상의 원천 중 특히 선별 및 정렬현상에 대한 실증적 검증을 위해 앞서 제시한 상대적 양극화 지수,그 중에서도 특히 생산성 분 포를 사분위수를 기준으로 구획하여 각 지수를 산정하여 활용하고자 한다.

이를 위한 보다 구체적인 전략은 다음과 같다.

매우 당연한 것이지만 ,,, 각 사분위 상대 양극

매우 당연한 것이지만 ,,, 각 사분위 상대 양극