• 검색 결과가 없습니다.

Heckman's 2 step - Index - -가 선택편의의 문제

경제학적 관점에서 매칭이나 회귀분석의 가정은 관측되지 않는 변수들 즉, 회귀모형에서의 오차항(U0, U1)에 근거하여 선택이 이루어진다는 것을 배제 하는 것이다 매칭이나 회귀분석의 가정은 또한 참가자와 비참가자의 관측되지. 않는 변수들에서의 차이 즉, (

U

1-

U

0)와 참가선택 사이의 관련을 배제하 는 것이다.

만일 관측되지 않는 변수들이 성과나 참가에 영향을 미치지 않는다면 혹은, 설명변수들을 동일한 조건으로 하는 조정에 의해 관측되지 않는 변수들의 평 균적 차이들이 제거된다면 이는 매칭의 방법을 옹호하는 통계학자들이 가정하( 는 것이다42)),선택편의의 문제는 사라진다 그러나 현실적으로도 직업훈련 프. 로그램의 선택에 영향을 미치고 아울러 훈련 이후 성과에도 영향을 미치는 관,

42)Heckman은 매칭에의 의존은 신념활동이라고 표현한다(Heckman, 2001a).

측되지 않는 변수들이 있음은 분명하다 예컨대 적극성이라는 관측되지 않는. , 변수가 있다고 하자 인적 특성이 거의 유사한. A, B의 두 사람이 사양산업의 동일한 기업에서 실직을 하였다고 하자 는 매사에 매우 적극적인 사람이고. A 반면에 는 소극적인 사람이라고 하자 실직후 두 사람은 직업탐색을 통해 취B . 업을 하는 것이 쉽지 않았다고 하자 이 때 적극적인 는 새로운 직업능력을. A 획득하기 위해 성장 산업 부문을 위한 실업자 재취직 훈련에 적극적으로 참가 하여 훈련 이수 뒤 취직을 하였다고 하자 반면에 는 소극적인 직업 탐색 끝, . B 에 우연히 취직을 하였다고 하자 두 사람의 취직 이후 성과를 비교하여 의. A 성과가 좋다면 이를 실업자 재취직 직업훈련에 참가하였기 때문이라고 할 수, 있을까 물론 그럴 수도 있지만 그렇지 않을 수도 있다 의 경우 좋은 성과? , . A 는 실업자 훈련에 참가한 덕분이 아니라 적극적으로 구직활동을 하여 좋은 직, 장을 잡고 취직 후에도 적극적인 자세로 새로운 직장에서 열심히 일하여 성과, 가 좋게 나타난 것일 수도 있다 이렇게 관측되지 않는 적극적인 자세가 직업. 훈련 참가의 효과와는 별도로 나타날 수 있고 이를 통제하지 않는다면 그 효, 과는 직업훈련 참가 효과에 포함되어 버릴 것이다 이것이 관측되지 않는 변수. 에 기인하는 선택에 따른 편의이고 이를 통제해야 직업훈련참가의 참효과를, 추정할 수 있다.

나 . Heckman's 2 step 모형 - 인덱스 모형 - 구조와 추정

43)

인덱스 모형은 관측되지 않는 변수들에 입각한 선택을 고려하여 그것을 참, 가함수를 설정하여 직접적으로 다루는 것이다. Heckman s 2 step모형 표본선( 택 모형, sample selection model)은 인덱스 모형의 대표적 예라고 할 수 있다. 의 표본선택 모형은 여성들의 노동시장 임금을 분석하는 모형 Heckman(1979)

이다 여성들은 요구임금보다 시장임금이 높은 경우에 노동시장에 참가를 하게. 되며 요구임금보다 시장임금이 낮은 경우에는 노동시장에 참가를 하지 않게, 되어 아예 시장임금에 대한 자료가 결측이 되어 버린다 이 경우 노동시장 참, .

43) 이 부분은Heckman et al.(1999)를 참조하였다.

가의 조건이 임금함수 회귀식의 오차항을 규정하게 된다 오차항을 정규분포로. 가정하고 모형을 식별하여 관측치가 샘플에 들어갈 확률의 단조감소 함수인, 변수 통상( Inverse Mill's Ratio라고 부름 이는 관측되지 않는 요인들을 대표. 하는 변수의 역할을 한다 를 임금함수 회귀식에 넣어서 참가에서의 관측되지.) 않는 변수들과 성과함수 회귀식의 오차항의 관련을 통제하는 것이 표본선택모 형이다 참가함수 회귀식의 추정과 성과함수 회귀식의 추정의 단계로 이루어. 2 지기 때문에 2 step 추정이라고 한다.

통상적인 계량경제적 접근은 관측되는 변수들 X 를 분리된 집합 (Q,Z)으 로 분리해서 넣고 배제 제약을 고려하는 것이다 여기서. Q 는 성과함수에 들어 가는 설명변수들, Z는 참가함수에 들어가는 설명변수들이며 배제 제약은 참, 가함수에 나타나는 어떤 변수들은 성과함수에는 없다는 것을 가정하는 것이며, 참가자의 자기선택의 존재를 식별하기 위한 것이다.

인덱스 모형은 IN=H(Z)-V 로 구성되어 훈련참가에 영향을 미치는, 관측되는 변수 Z의 함수 H(Z)과 오차항 V 로 구성된다 그리고. V 는 Z에 독립이라 가정한다 그러면 훈련참가 지표. D 는 IN>0이면 그렇지 않으면1,

이 된다 통상적인 계량경제학 선택편의 모형은

0 . D 와 불관측변수들 사이의

의존성은 V 를 통해서만 나타나고, Q,Z 는 U0,U1에 독립이라는 가정을 더 한다 이들 가정에 따라서 비참가자와 참가자의 성과함수에서의 오차항은 다음. 과 같게 된다.

E(U0 Z,Q,D= 0)=E(U0 V H(Z)) E(U1 Z,Q,D= 1)=E(U1 V<H(Z))

그러면 편의는 다음과 같이 를 통한 참가확률Z P(Z)의 함수로 나타난다.

B(P(Z))=E(U0 Q,P(Z),D= 1)-E(U0 Q,P(Z),D= 0)

위의 식들 중에서 오차항들의 조건부 평균인 E(U1 Q,P(Z),D= 1)과 E(U0 Q,P(Z),D= 0)는 관측되지 않는 변수들이 선택에 미치는 영향을( 성과함수의 회귀식에서 통제하는데 이용되기 때문에 통제함수라고 불리며) , (U0,V), (U1,V)에 관한 분포의 가정이 이루어지면 구체적으로 식별될 수 있다.

직접적으로 E(U0 Q,P(Z),D= 1)를 추정할 수 없지만 앞에서, U0와 (Q,Z)가 독립이라 가정하였으므로 다음과 같이 쓸 수 있다, .

0 =E(U0 Q,P(Z),D= 1)P(Z) +E(U0 Q,P(Z),D= 0)( 1 -P(Z))

우변의 두 번째항과 P(Z)를 모두 알기 때문에 다음을 알 수 있고 선택편, 의를 통제하면서 훈련참가의 성과를 추정할 수 있다.

E(U0 Q,P(Z),D= 1)=-E(U0 Q,P(Z),D= 0) 1-P(Z) P(Z)

통상적인 Heckman's 2 step 모형은 통제함수를 성과함수에 설명변수로 넣 어서 추정을 하는 것이다.

Yi=Xi + Di+ Hi+ i

여기서 Hi=

(

- (Z(Zi'i')/(1- ()/ (Zi'Z),i' )),i {iDi=1}{Di=0}

)

는 통제함수

이다.

인덱스 모형은 성과함수와 참가함수에 대한 구체적 가정이 필요하다 그리. 고 동시에 오차항의 분포와 성과함수와 참가함수에 들어가는 변수들에 관련되 는 배제제약이 요구된다 그러나 이러한 선택 편의 교정의 효과는 강력한 선별.

과정이 존재한다고 예상되는 경우조차 종종 작은 것으로 나타난다.(Grubb and Ryan, 1999)

도구변수 모형 4.

가 도구변수 추정과 가정 .

선택에 따른 편의를 통제하기 위해 횡단면 자료에서 쓸 수 있는 방법에는 전 술한 인덱스 모형과 함께 도구변수 모형이 있다 인덱스 모형이 관측되지 않는. 변수들을 오차항으로 직접 통제하는 것이라면 도구변수의 방법은 관측되지 않, 는 변수들이 작용하는 선택의 요인을 우회하는 것이다 즉 도구변수 모형은 외. 생적인 도구변수 영역에서의 변이를 이용하여 실험을 흉내내는 것이다.

도구변수가 될 수 있는 것은 직업훈련 선택의 요인은 되지만 직업훈련의 성, 과와는 관련이 없는 변수이다 직업훈련의 선택에 영향을 미치지만 직업훈련의. 성과와는 관련이 없는 변수이기 때문에 이 도구변수로 인해 훈련 선택의 여부, 가 결정되었다면 그렇게 도구변수로 훈련선택이 갈라진 사람들간의 훈련 이후, 성과의 차이는 선택에 관련된 관측되지 않는 변수들의 요인이 훈련성과에 영 향을 미친 것이 아니기 때문에 즉 선택편의의 문제를 우회하여 훈련의 성과를, 파악하는 것이어서 일관된 추정치가 된다.

통상 첫 단계에서 선택 혹은 참가 Di를 설명변수 Xi와 도구변수 Ii에 회 귀분석하고 얻어진 예측치 값, (predicted values)들을 설명변수로 성과함수에 넣어서 추정하는2SLS의 방법으로 손쉽게 사용될 수 있다.

단계

1 : Di=Xi +Ii + i 단계

2 : Yi=Xi + Di+ i

도구변수의 가정은 주어진 설명변수하에서 훈련 참가자의 관측되지 않는 변

수들과 훈련비참가자의 관측되지 않는 변수들의 차이가 도구변수와 독립적이 라는 것이다 또한 훈련 비참가자의 관측되지 않는 변수들이 도구변수와 독립. 이어야 한다 즉 관측되지 않는 변수들에 의한 성과와 도구변수는 관련이 없다. 고 가정하는 것이다.

이렇게 볼 때 집과 훈련센타와의 거리는 도구변수가 되기 어렵다 왜냐하면. 훈련센터에서 먼 사람들은 기대이득이 훈련의 높은 비용을 상회할 정도로 클 때 훈련에 참가하며 가까운 사람들은 훈련의 이득이 크지 않아도 훈련에 참가, 할 가능성이 크다 따라서 집과 훈련센타의 거리는 기대이득의 관측되지 않는. 구성부분과 관련되어 있다 이에 집과 훈련센타와의 거리 변수는 견고한 도구. 변수가 될 수 없다.

나 도구변수 모형 추정의 실례 .

직업훈련 정책의 효과나 프로그램의 효과를 도구변수 모형으로 추정한 실증 연구는 찾아보기 어렵다.

도구변수의 실례를 보기 위해 고전적인 교육과 소득의 관계를 보자 교육이. 라는 변수가 정확하게 파악되지 않기 때문에 통상 학력년수를 교육의 대리변 수로 사용한다 학력년수를 이용한다고 해도 문제는 남는데 학력년수가 소득. , 에 미치는 영향을 보기 위해서는 순수하게 학력년수의 차이남이 소득에 미치 는 영향을 보아야 하기 때문이다 그러나 주지하듯이 학력년수가 소득에 미치. 는 요인은 관측되지 않는 변수들이 학력년수 선택에도 영향을 미치고 소득에, 도 영향을 미치기 때문에 그러한 관측되지 않는 변수들의 영향을 통제해야만 한다.

은 학력년수의 소득에의 영향을 보기 위해 태어 Angrist and Krueger(1991) , 난 계절을 도구변수로 이용하여 추정하고 있다 아이디어를 간단히 보면 미국. 의 법은 노동시장에 진출할 수 있는 연령을 법적으로 제한하고 있기 때문에, 생일이 빠른 학생들은 더 빨리 노동시장에 나갈 수 있으나 반면에 입학의 시, 점은 동일함으로 인해 학교에 머물러 있는 시간이 더 짧을 수 있다 생일이 늦.

은 학생들은 그 반대의 상황이다 즉 생일이 빠르고 늦음은 학생들의 교육년수. 에 영향을 미치고 있는 것이다 그러나 생일의 빠르고 늦음은 학생들의 소득에. 는 영향을 미치지는 못한다 생일의 빠르고 늦음에 따라 능력의 분포가 달라지. 지는 않기 때문이다.

은 먼저

Angrist and Krueger(1991) Si=Xi +Ii + i를 추정한다 여. 기서 Si는 학력년수, Ii는 태어난 계절을 나타내는 더미변수로 도구변수이다.

추정에서 구한 예측치 Si를 임금함수 lnWi=Xi + Si+ i 에 넣어서 의 방법으로 학력년수의 소득효과인

2SLS 를 추정하게 된다 이를 직관적으.

로 보면 Si는 설명변수들과 태어난 계절의 도구변수가 설명하는 학력년수이 고 거기에서 학생의 능력 등 관측되지 않는 변수들에 의한 학력년수의 설명부, 분은 i에 담기게 된다 임금함수에 들어간. Si는 설명변수들과 태어난 계절 이 학력년수를 설명한 부분이지만 임금함수에 설명변수들이 다시 포함되어 통, 제되고 있기 때문에 Si의 계수값인 는 순전히 태어난 계절에 의한 학력년 수 차이만의 소득효과를 말하는 것이 된다.

다 도구변수 추정의 장단점 .

도구변수 모형의 장점은 모형 식별에 쉽게 접근할 수 있다는 점이다 즉 도. 구변수 모형은 참가함수에서의 관측되지 않는 변수들 즉 오차항의 구조나 형, 태를 알 필요가 없으며 또한 참가함수 오차항과 도구변수의 독립성을 가정할, 필요도 없다 그리고 결과의 해석이 간명하다 이렇게 도구변수 모형은 추정이. . 간단하면서도 선택편의를 해결하는 점에서 매력적이다.

그러나 적절한 도구변수를 찾기가 쉽지 않은 것이 단점이다 실제로 도구변. 수를 이용하여 직업훈련 프로그램의 효과를 추정한 실증연구는 거의 없다 도. 구변수를 이용하여 특정 프로그램의 효과를 추정한 실증 연구는 학급 정원의 법칙을 도구변수로 하여 학급 학생수가 성적에 미치는 영향을 추정한 Angrist

관련 문서