• 검색 결과가 없습니다.

기초통계분석

N/A
N/A
Protected

Academic year: 2022

Share "기초통계분석"

Copied!
22
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

기초통계분석

chapter10

(2)

수업 개요

다중회귀분석 (multiple regression analysis)

다중회귀분석 모델

다중회귀분석을 이용한 추론

결합가설 검정 (joint hypothesis test)

다중회귀모델의 적합성 (model fit)

(3)

다중회귀분석의 필요성

연구질문: “지위비행에 영향을 주는 요 인은 무엇인가?”

학생1의 가설: “자기통제력이 높을수록 지 위비행을 저지르지 않는다.

학생2의 가설: “부모애착이 강할수록 지위 비행을 저지르지 않는다”

(4)

두 개의 단순회귀분석?

이상적인 자료가 있다고 가정하고 우 리가 할 수 있는 일

단순회귀분석 1: 지위비행(종속변수), 자기 통제력(독립변수)

단순회귀분석 2: 지위비행(종속변수), 부모 애착(독립변수)

이게 다?

(5)

통제 (control)

위의 시나리오에서 우리가 바라는 분 석은 아마도 다음과 같은 것

“같은 자기통제력”의 학생들을 가지고 부 모애착 수준이 지위비행에 미치는 영향

“같은 부모애착”의 학생들을 가지고 자기 통제력의 수준이 지위비행에 미치는 영향

(6)

다중회귀분석 모델

y: 지위비행

X

1

: 자기통제력

X

2

: 부모애착

y

i

= b

0

+ b1x1i + e

i

y

i

= b

0

+ b2x2i + e

i

y

i

= b

0

+ b1x1i + b2x2i + e

i

(7)

다중회귀분석 모델 (자료의 기술)

 Y = b

0

+ b

1*

X

1

+ b

2*

X

2

Y(종속변수)는 X1 X2(독립변수)의 선형 함수 (linear function)

b1: 기울기 (slope; X2 통제한 후 X1 한 단 증가할때 생기는 Y의 변화)

b2: 기울기 (slope; X1 통제한 후 X2 한 단 증가할때 생기는 Y의 변화)

b0: 절편 (intercept or constant; X1=X2=0일 때 Y의 값)

통제의 의미: X1 또는 X2 평균(mean)값으로 고 정시키고 X1 또는 X2가 한 단위(unit) 증가할 때 생기는 Y의 변화

(8)

다중회귀분석의 해석

다중회귀분석에서 한 기울기(slope; 회 귀계수 regression coefficient)는 다른 독 립변수의 효과를 통제하면서 얻은 한 독 립변수의 종속변수에 대한 효과를 의미 한다

결과를 해석할 때 유념할 것

논문에 결과 해석할 때 반드시 언급해야 함

(9)

최소제곱회귀

단순회귀분석의 경우와 마찬가지로 다 중회귀분석은 오차의 제곱의 합을 최 소화하여 회귀계수를 구한다

(10)

다중회귀분석을 이용한 추론

 변수 x

1

, x

2

, … , x

k

와 y의 관계가 모집단 수 준에서 다음과 같다고 하자

y = β0 + β1X1 + β2X2 + … + βkXk + ε

 표본의 크기가 n인 표본을 이용해 다음의 단순회귀분석 식을 만든다

yi= b0 + b1X1i + b2X2i + … + bkXki + ei

 회귀분석의 가장 중요한 목표는 b 0, b 1, b

2

,

…b

k

를 이용해서 β 0, β 1, β

2

, …, β

k

를 추정하

는 것

(11)

추정값으로서의 회귀계수

β1, β2, …, βk가 통계적으로 유의미하게 0와 다른가?

독립변수들이 각각 종속변수에 통계적으 유의미한 영향을 주는가?

회귀모델에 포함된 전체 독립변수들이 공 동으로 종속변수에 유의미한 영향을 주는 ? (결합가설 검정/F-test)

β

0

는 상대적으로 중요하지 않다

(12)

회귀식에서 가설 검정

Ho: βj = 0

Ha: β

j

≠ 0

검정 통계량은 t-값 (자유도 n – (k + 1))

t = bj/se

(se식은 복잡; 통계 소프트웨어가 알 아서 계산해준다)

(13)

회귀식에서 결합가설 검정

일군의 독립변수들이 “집단적으로” 종 속변수에 통계적으로 의미 있는 영향 을 행사하는가?

Ho: β

1

= β

2

= β

3

=,… =,β

k

= 0

Ha: 적어도 하나의 β

j

≠ 0

검정 통계량은 F-값

(14)

R-Squared (모델의 적합성)

R-squared는 단순회귀분석의 경우와 마찬가지 한 회귀식의 설명력을 알려준다

그런데 R-squared는 회귀식에 포함되는 독립변 수의 숫자가 늘어남에 따라 자동적으로 커진

이러한 문제 때문에 Adjusted R-squared를 보고

다중회귀분석에서는 보통 R-squared가 큰 의미 갖지 않는다

(15)

연구질문: 왜 청소년들은 중비행을 저 지르나?

종속변수: 중비행

5 items (q37a06w1~q37a14w1)

1차년도 자료

(16)

독립변수들

독립변수 1: 부모학대(parental abuse)

◦ 2 items (q33a14w1, q33a15w1 )

◦ 5-point Likert scale (1=전혀 그렇지 않다; 5=매우 그렇다)

독립변수 2: 부모애착(parental attachment)

◦ 6 items (q33a01w1~q33a06w1)

◦ 5-point Likert scale (1=전혀 그렇지 않다; 5=매우 그렇다)

독립변수 3: 성별(gender)

◦ 1=male, 2=female

(17)

변수의 요약

(18)

단순회귀분석 1

부모학대

(19)

단순회귀분석 2

부모애착

(20)

단순회귀분석 3

성별

(21)

다중회귀분석

(22)

실습

청소년패널데이터를 SPSS에서 읽어 다 음의 작업을 수행한다

여러 개의 양적 변수 (혹은 순서형 변수)를 선택해서 다중회귀분석을 수행하고 그 결 과를 해석

참조

관련 문서

Electronic properties of graphitic carbons Graphite is a well-known electric conductor in industry. Contacts in

평균,

 Level 1: Limited involvement to minor offenses such as smoking, drinking, having unexcused absences, running away from home, and having sex..  Level 2: Moderate offenses,

이처럼 퇴치 소리에 대한 조류의 반응에 따라 동적으로 퇴치 소리의 재생 순서를 결정하면 현재 보유하고 있는 소리들을 이용하여 최대한 적응을 방지할 수 있을

기존에 연구가 진행된 혈액의 일반타액단백질의 농도 분석을 통해 나타난 결과 정상인에 비해 당뇨 환자의 일반타액단백질의 농도가 높은 것으로 나타났었고, 이번 실험을

[r]

이 연구를 통하여 학생들은 에너지 자원의 유한성에 대해 깨닫고 에너지 자립 운동을 하는 과정에서 전기와 관련된 물리개념, 태양 광 발전 시설과 빗물 재활용

Heme에서 H + 가 Fe 2+ -Heme 결합에 미치는 영향에 대한 개괄적 분석 Heme을 소 혈액으로부터 원심분리-화학적 용혈-단백질 침전의 프로토 콜로 추출한 후, Heme