10주. Multiple Regression
변해원
고급연구방법 및 통계
오늘 수업 시작
다중회귀분석과 단순회귀분석의 본질 적인 차이점
• 회사원의 근무태도(x1)와 근무연수(x2)를 이용하 여 종업원의 결근율(y=개개 종업원의 결근일 수)을 분석하고자 함.
• 설명변수 x1만 있는 단순회귀모형에 또 다른 설명 변수 x2가 추가로 들어갔을 때, 다중회귀모형의 기 본적인 개념은 x1로
설명되지 않는 y의 부분을 x2가 추가됨으로써 얼마 만큼 설명을 하느냐의 문제임.
변수 선택 방법
• 1. 전진선택법(forward selection)
- 반응변수에 영향을 줄 것으로 생각되는 m개의 설명 변수들 중에서 가장 크게 영향을 줄 것으로 판단되는 변수부터 다음 절차에 따라 하나씩 선택하면서 더 이 상 중요한 변수가 없다고 판단될 때 변수의 선택을 중 단하는 방법이다.
- 전진선택법에서 통상적으로 쓰이는 유의수준은
0.10~0.50이나, 변수선택의 기준을 좀 더 완화하려면 유의수준을 크게 하고 강화하려면 유의수준을 작게 하면 된다.
2. 후진제거법(backward elimination)
• 반응변수에 영향을 주리라고 생각되는 m개의 설 명변수들 중에서 가장 작게 영향을 주리라고 여겨 지는 변수부터 하나씩 제거하여 나가면서 더 이상 제거할 변수가 없다고 판단될 때 변수의 제거를 중단하는 방법
• 후진제거법에서 변수제거의 기준을 완화하기 위 해서는 유의수준을 작게 하고 강화하려면 크게 하 면 되는데 통상적으로 쓰이는 유의수준은
0.05~0.10 임.
단계별선택방법(stepwise selection)
• 전진선택법에 후진제거법을 가미한 방법이 단계별회귀방법.
- 즉, 가장 유의한 변수를 넣은 후 두 번째 유의한 변수를 넣고 유의한 경우에 는 Keep. 유의하지 않으면 변수를 뺌.
• 새로운 변수가 추가되면서 이미 선택된 변수가 중요성을 상실 하여 제거될 수있는지를 매 단계별로 검토하는 선택방법임.
• 단계별회귀방법에서 유의수준은 선택과 제거 시 같은 유의수준 을사용하는 경우도 있으나, 대부분 선택 시의 유의수준을 크게 하는 경우가 많음.
Spss 다중회귀분석 실습. 예제. Multi_reg
• 어느 삼림에서 15그루의 원목을 무작위 추출하여 지름, 길이, 부피를 측정한 결과 다음과 같은 데이 터를 얻었다. 이 데이터를 이용하여 다중회귀분석 을 시행해보자.
모형이 유의함
보정 (adjusted)