• 검색 결과가 없습니다.

실험통계학 제8주 강의안내

N/A
N/A
Protected

Academic year: 2022

Share "실험통계학 제8주 강의안내"

Copied!
5
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

실험통계학 제8주 강의안내

직선회귀 (linear regression)

농업실험에서 시비량에 따른 작물의 수량 반응 등, 어떤 처리 수준에 따른 반응을 나타 낼 때 회귀분석을 한다. 시비량 등 처리는 독립변량이 되며, 이에 따라 변하는 수량 등은 반 응변량 혹은 종속변량이라 한다. 처리에 대한 반응은 직선 혹은 곡선회귀가 있을 수 있으나 여기에서는 직선회귀만 취급한다. 독립변량 (independent variable), 종속변량 (dependent variable)

1. 직선회귀 모형

Y = α + βX, Y = α + βX + ε (모집단)

=

a

+

b

X (표본에서 추정한 회귀식) 절편 (intercept)

a

, 기울기 (slope)

b

직선회귀모형의 전제조건

관측치에서 최소자승법에 의한

a, b

값의 측정 정의식

b

= ∑(X-

)(Y-

)/∑(X-

)2 = ∑

xy

/∑

x

2

계산식

b

= {∑XY-∑X∑Y/n)/{∑X2-(∑X)2/n) = CPxy/SSx

a

= 

-

b

(예제 9-1)의 실행 연습

계산기의 모드 설정과 자료의 입력 MODE > 1(STAT) > 1(LINE) 0 STO 423 M+

(x,y) (DATA) 5 STO 544 (DATA)

:

15 STO 715 (DATA)

a : RCL a b : RCL b

2. 회귀분석과 유의성 검정 H0: β=0, H1: β≠0

1) 회귀식에 대한 분산분석

요인(SV) 자유도

(df) 자승합(SS) 평균자승합

(MS) Fs

회귀(Due to Reg) 1 SSR=bCP MSR MSR/MSE

잔차(Residual) n-2 SSY-SSR MSE

전체(Total) n-1 SSY

SS(회귀로 인한) = SSR ={∑(X-

)(Y-

)}2/∑(X-

)2

=∑(X-

)(Y-

) * ∑(X-

)(Y-

)/∑(X-

)2 = CP * b =bCP SS(잔차) = SSE = SSY-SSR = SSY - bCP

Fs = MSR/MSE

(2)

결정계수(Coefficient of determination), R2= SSR/SSY,

Y 전체의 SS 중 회귀로 인한 SS의 비율, 즉, Y 전체의 변이 중 회귀로 설명할 수 있 는 변이의 비율이므로 결정계수가 높으면 회귀식에 잘 맞는다는 뜻이 된다.

Y 전체의 SS 중 잔차로 인한 SS의 비율, 즉 SSE/SSY은 원인을 알 수 없는 Y의 변이 로서 1-R2가 된다.

2) t 검정에 의한 회귀계수의 유의성 검정 Sb = √(MSE/SSx) (회귀계수의 표준오차) t =

b

/Sb, df=n-2

회귀계수의 신뢰한계 L =

b

±ta(n-2)․Sb

에서 표본평균 

에 대한 표준오차 계산 Sy=√(MSE/n) 3. 다중회귀분석 (multiple regression analysis)

4. 상관 (correlation) 1) 공분산

Cov (X, Y) = CPxy/df 2) 상관계수의 계산

∑(X-

)(Y-

) ∑XY-∑X∑Y/n

상관계수 r= --- = ---

√{∑(X-

)2․∑(Y-

)2} √[{∑X2-(∑X)2/n}․{∑Y2-(∑Y)2/n}]

= CPxy/√(SSx)(SSy)

3) 상관계수의 유의성 검정 Sr=√[(1-r2)/(n-2)]

ts=r/Sr, df=n-2

부표 9를 이용하여 곧 바로 검정할 수 있다.

4) 회귀와 상관과의 관계

r2 = SSR/TSS, r = by.x * (Sx/Sy)=회귀계수*표준편차의 비율 두 변량의 표준편차가 같으면 r=b

5. 순위상관

rs=1 - 6∑Di2/{n(n2-1)}

df=n-2

예제 10-3) 두 과목 성적 순위의 상관

시비량과 벼의 수량

1) 회귀계수, 회귀직선 방정식, H0: β=0, H1: β≠0에 대한 가설검정 (t, F) 2) 상관계수, H0: r=0, H1: r≠0에 대한 가설 검정 (t, 부표 df=n-2)

시비량(Kg/10a) 0 10 20 30 40

수량지수 100 115 135 145 142

(3)
(4)

SHARP 509W, 509X 사용법(더욱 자세한 것은 사용설명서 참조) 예시자료

발아 후 일수에 따른 나팔꽃의 덩굴 길이(cm)

X (일수) 1 2 3 4 5

Y (길이, cm) 8 11 15 19 21

SAS PROGRAM FOR REGRESSION AND CORRELATION DATA A;/*LINEAR REGRESSION*/

INPUT X Y @@;

CARDS;

- - - -

;

PROC REG;

MODEL Y=X; /*Y는 반응변량, X는 독립변량*/

PLOT Y*X;

RUN;

키 누르기 예시, 비고, 화면

계산기 켜기 ON/C

계산기 꺼기 2ndF ON/C

모드 설정-통계(Stat 0) MODE-1(STAT)-0(SD) 일반 통계분석에 사용 -1차함수 MODE-1(STAT)-1(LINE) 회귀, 상관 분석에서 사용

지우기 ON/C

모두지우기 2ndF CA(MODE) 입력자료 모두 소거

자료 입력

X수치-STO-Y수치-M+

(x,y) (DATA)

1 STO 8 M+

2 STO 11 M+

...

5 STO 21 M+

a (절편 구하기) RCL a 4.6

b (회귀계수, 기울기) RCL b 3.4

회귀직선방정식 Y=4.6 + 3.4X

X 값의 Y 기대값 X 2nF y’ 14.8

∑X

∑X2 SSX

∑Y

∑Y2 SSY

CP ∑(X-

)(Y-

)

=∑XY-∑X∑Y/n X와 Y의 공분산 COVxy =

∑(X-

)(Y-

)/(n-1)

(5)

PROC REG;

MODEL Y=X;

PLOT Y*X P.*X/OVERLAY;/*P. means predicted*/

TITLE 'PREDICTED VS ACTUAL';

RUN;

DATA B; /*FOR MULTIPLE REGRESSION*/

INPUT X1 X2 . . . Y;

CARDS;

- - -

;

PROC REG;

MODEL Y= X1 X2 ... ; RUN;

PROC CORR;

VAR X1 X2 . . . Y;

RUN;

참조

관련 문서

또한 중합 방법에 따른 특성 을 비교하기 위해 두 가지 중합 방법으로 하이드로젤을 제조 하였는데, 첫번째는 중합할 때 공용매에 알파 리포익산을 용 해시킨 후 오븐에 넣고

인듐 스크랩 분말의 조성에 따른 고유 특성을 이용하여 여러 가지 선별방법을 통해 얻어진 분말의 회 수량 및 순도를 분석함으로서

■ 내년 2월 시행 예정인 자본시장통합법(이하 자통법)은 중소형사의 신규진출, 비금융회사의 영 향력, 외국계증권사의 업무 확대 등 시장참가자 측면과 이에 따른 경영성과 측면

참가 외국학생 수에 따른 반 개설 수 대비 신청인원이 많을 경우 신청 선착순으로 수강 제한 다.. 친구와 같은 반 배정 신청 및 반 배정에

이에 따른 도시의 복합화 는 인구의 도시집중과 제한된 건축부지의 효율적 이용, 기존의 복잡 한 도심의 역할을 분산시켜 수직적 확장․분화의 필요성 등 사회적, 경제적 요구에

또한 무분별한 복지확대에 따른 급격한 세부담 증대는 현재 급속히 하락하고 있는 성장잠재력을 더욱 훼손시켜 경제성장 둔화와 이에 따른 중 장기적

막분리법과 비교하였을 때 멤브레인의 포아사이즈에 따른 화울링 등의 눈메움 현상에 의한 세척 , 등의 번거로움이 없고 이에 따른 멤브레인 교체 비용이 없다 , .... 이한

유스넷 뉴스 (usenet news) 관심 분야에 대한 자신의 의사를 나타