제3장 단순회귀분석

(1)

1.단순회귀모형 및 가정 2.회귀계수의 추정

3.OLS 추정량의 특성

4.교란항 및 회귀계수의 분산 추정 5.결정계수

6.가설검정 7.예측

8.회귀모형의 응용 9.최우추정법

10.최소절대편차추정법

(2)

2

1.단순회귀모형 및 가정 (1)단순회귀모형

(참고) 확률적 교란항의 의미

-교란항은 생략되거나 배제된 모든 변수를 대신한다

-아무리 노력해도 설명할 수 없는 고유의 임의성(인간행동의 임의성) -측정오차(measurement error)(예:Freidman의 항상소득가설)

-간결한 모형(parsimonious of model)

(3)

(2)가정

① 독립변수 X는 확률변수가 아닌 확정변수이다

-표본을 반복해서 잡아볼 때 X는 고정된 것으로 해 놓고 Y와 u의 값은 표본에 따라 다름

-X는 오차없이 측정됨

② 교란항의 평균은 0이다

(4)

4

③ 교란항은 모든 X에 대한 동일한 분산을 갖는다(동분산)

(참고)추정을 위해서는 분포에 대한 가정이 반드시 필요하지 않지만, 가설검정을 위해서는 필요함

(5)

④ 모든 u값은 서로 독립이다(비자기상관)

⑤ u와 X는 서로 독립이다(직교조건)

(참고)직교조건의 의미

-경제적 의미 : 관계 있는 모든 설명변수들이 제대로 모형화되어 X가 Y에

미치는 영향과 u가 Y에 미치는 영향이 서로 분리되어 있다는 것을 의미한다.

-통계적 의미 :

ⅰ)관계 있는 변수를 모형에 포함시키지 않으면→OLS추정량=편의 추정량

ⅱ)관계 없는 변수를 모형에 포함시키면→OLS추정량=비효율적 추정량

(6)

6

2.회귀계수의 추정

(1)보통최소자승법(Ordinary Least Squares : OLS

-잔차(=실제치-예측치)의 합계가 최소가 되도록 하는 것이 바람직한데

잔차의 합이 0이 되는 식은 유일하지가 않으므로 잔차의 제곱의 합이 최소가 되게 하는 회귀식을 구하는 추정방법

(7)

(8)

8

(9)

(10)

10

(11)

(2)추정된 회귀선의 특징

① 최소자승법으로 구한 회귀선은 항상 X, Y의 표본평균점을 지난다

(12)

12

(13)

(14)

14

(15)

(16)

16

2 3 4 5

4 6 10

6 X

Y

(17)

(18)

18

3.OLS 추정량의 특징 (1)선형추정량

(2)불편추정량

(19)

(3)최소분산추정량

(20)

20

4.교란항 및 회귀계수의 분산 추정 (1)교란항의 분산

(2)회귀계수의 분산

∴

(21)

(22)

22

5.결정계수(coefficient of determination)

-표본으로부터 추정한 회귀선이 변수의 표본관측에 얼마나 적합한 지를 측정하는 계수로 설명력(explanatory power)이라고도 함

-결정계수는 표본관측이 추정된 회귀식에 가까운 정도를 계수로 나타낸 것으로 종속변수의 전변동과 회귀변동의 비율로 측정

-결정계수의 값은 0과 1 사이로, 큰 값일수록 적합도 또는 설명력이 높다는 것을 의미하고 작은 값일수록 적합도 또는 설명력이 낮다는 것을 의미함

(23)

(24)

24

6.가설검정

-경제적 유의성(economical significance) : 이론적으로 독립변수가 종속변수에 영향을 주는 것

-통계적 유의성(statistical significance) : 실증분석 결과 독립변수가 종속변수에 영향을 주는 것

(25)

(26)

26

7.예측

-모형설정→모형추정→가설검정→예측이라는 단순회귀분석의 절차에 따라 주어진 독립변수의 값에 대한 종속변수의 값을 구하는 예측(forecasting, prediction)이라고 함

-모집단회귀선 위의 한 점을 예측하는 평균예측(mean prediction, slide 3 그 림 참조)과 독립변수의 값에 대응하는 개별 Y의 값을 예측하는 개별예측 (individual prediction)이 있음

-예측에는 주어진 X에 대해 하나의 Y 값을 구하는 점예측(point forecasting) 과 점예측에 대한 신뢰구간을 구하는 구간예측(interval forecasting)이 있음 -구간예측을 위해서는 실제치와 예측치의 차이인 예측오차의 분산을

알아야 함

-일반적으로 개별예측에서 점예측치 및 예측구간대를 구함

(27)

-𝑌_𝑖 = 𝛽₀ + 𝛽₁𝑋_𝑖 + 𝑢_𝑖에서 독립변수 𝑋_𝑖 = 𝑋₀일 때 평균예측과 개별예측은 각각 다음과 같음

(평균예측) 𝐸(𝑌₀|𝑋₀) = 𝛽₀ + 𝛽₁𝑋₀ (개별예측) 𝑌₀ = 𝛽₀ + 𝛽₁𝑋₀ + 𝑢₀

-평균예측과 개별예측의 점 예측치(이는 추정량이 됨)는 모두 동일하며 다음 과 같음

(점예측치) 𝑌₀ = 𝛽₀ + 𝛽₁𝑋₀

-예측오차는 평균예측(또는 개별예측)과 점 예측치(추정량)의 차이 이므로 각각 다음과 같음

(평균예측오차) 𝐸(𝑌₀ 𝑋₀ − 𝑌₀ = 𝛽₀ + 𝛽₁𝑋₀-( 𝛽₀ + 𝛽₁𝑋₀) = ( 𝛽₀ − 𝛽₀) + (𝛽₁ − 𝛽₁)𝑋₀ (개별예측오차) 𝑌₀ − 𝑌₀ = 𝛽₀ + 𝛽₁𝑋₀ + 𝑢₀-( 𝛽₀ + 𝛽₁𝑋₀) = ( 𝛽₀ − 𝛽₀) + (𝛽₁ − 𝛽₁)𝑋₀+𝑢₀

-따라서 예측오차의 분산은 각각 다음과 같음

(평균예측오차분산) var((𝐸(𝑌₀ 𝑋₀ − 𝑌₀) (개별예측오차) var(𝑌₀ − 𝑌₀)

(28)

28

(예측오차 분산에 대한 해석)

①표본의 크기(n)가 커질수록 예측오차의 분산이 작아진다. 즉, 관측자료가 많을수록 좋은 예측을 할 수 있다

②교란항의 분산이 커질수록 예측오차의 분산이 커진다. 즉, 원래 회귀모형 에서 불확실성이 커서 교란항의 분산이 크면 예측이 어려울 수밖에 없다

③독립변수의 표본평균으로부터 멀어질수록 예측오차도 커진다. 즉, 예측에 주어진 독립변수의 값이 평균으로부터 멀어질수록 표본회귀함수의

예측력은 크게 감소한다

(29)

(30)

30

(31)

𝛽₀ 𝛽₁

(32)

32

(33)

8.회귀모형의 응용

(1)회귀함수 형태의 선택기준

①경제이론에 근거한 함수형태를 선택

-생산함수의 경우 →경제이론에 근거하여 Cobb-Douglas 생산함수를 선택

②가능한 한 간단한 함수형태를 선택

-모형의 설명력에 큰 차이가 없다면 경제학의 효율성 원칙에 따라 간단한

함수형태를 선택하는데 이를 간결성원칙(parsimonious principle)이라고 함

③예측력이 좋은 함수형태를 선택

-간결한 모형이 좋기는 하지만 모형의 현실 설명력 즉 예측력이 떨어진다면 모형의 유용성이 크게 떨어질 수밖에 없음

(34)

34

(2)회귀모형의 응용

①선형(linear)함수 모형

(35)

②전대수(double log)함수 모형

③쌍곡선(reciprocal)함수 모형

𝑑(𝑙𝑛𝑦)

𝑑(𝑙𝑛𝑥) = 𝑑𝑦 𝑑𝑥

𝑥

𝑦 = 𝜀_{𝑦 𝑥} = 𝛽₁(경제수학입문(비봉출판사,1985) p.350, pp.362-363 참조)

(36)

36

④반로그(semi-log)함수 모형

(37)

(38)

38

9.최우추정법

(39)

(40)

40

(41)

10.최소절대편차추정법

(42)

42

(참고) 추정량 비교(OLS vs. LAD vs. MLE)

(43)

OLS

LAD

MLE