• 검색 결과가 없습니다.

적합도 척도

문서에서 저작자표시 (페이지 64-67)

Ⅲ. 소프트웨어 신뢰성

3.4.3. 적합도 척도

실제 데이터를 각 모형의 평균값함수



에 적합하여 Matlab을 이용해 최소 제 곱 추정(Least squares estimation; LSE) 방법으로 모수 추정값을 얻을 수 있다.

모형의 적합도를 비교하기 위해서는 모수 추정값을 다시 평균값함수에 대입하여 척도를 계산한다. 자주 사용되는 척도로 평균 제곱 오차(Mean squared error;

MSE), 예측비위험(Predictive ratio risk; PRR), 예측력(Predictive power; PP),

등이 있다(Pham 2000, Pham 2006a, Pham 2006b, Pham 2014a, Akaike 1974, Pillai 외 1997).

첫 번째, 평균제곱오차(MSE)는 다음과 같다.

  

  

  



 

여기서

은 데이터의 관측 수,

은 모형의 모수 수를 나타내고,

 

는 모수 추 정치를 대입한 평균값함수에서

일 때 예측값,

에서의 실제 데이터 값을 의 미한다. 즉, MSE는 데이터의 관측 수와 모형의 모수 수를 고려하여 모형의 추정치 와 실제 데이터의 거리를 측정하는 척도이다. 일반적으로 모수의 수가 클수록 적합 도가 더 우수한 경향을 보이는데 MSE는 모수의 수에 대한 페널티를 부여하므로 모수의 수가 서로 다른 모형의 적합도를 비교하는데 합리적이다.

두 번째, 예측비위험(PRR)은 다음과 같다.

  

  

 

 

49

-모형 예측값을 고려하여 -모형 예측값과 실제 데이터 값의 거리를 측정한다.

세 번째, 예측력(PP)은 다음과 같다.

 

  

 

 

실제 데이터 값을 고려하여 모형 예측값과 실제 데이터 값의 거리를 측정한다.

네 번째, 결정계수

(R-squared)은 회귀직선의 적합도를 평가하는데 많이 쓰 이며 다음과 같이 주어진다.

   

  

  

  

  

 

여기서



는 실제 데이터 세트의 전체 평균을 의미한다.

다섯 번째, Akaike의 정보 기준(Akaike’s information criteria; AIC)은 다음과 같 이 정의한다.

  ln     

여기서

은 자유도이며 우도 함수

ln 

은 다음과 같이 주어진다.

  

  

 

 

  

  

 

  

    

ln  

  



 

  

ln 

  

  



  

  

 ln

 

 



여섯 번째, 절대 오차 합(Sum of absolute error; SAE)은 예측값과 실제 데이터 값의 절대 거리를 측정하며 다음과 같이 표현한다.

  

  



 

일곱 번째, 변동(Variation)은 예측 편향의 표준편차로 다음과 같이 주어진다.

   

  

 

   



여기서 편향(Bias)은 다음과 같다.

   

  

 

 

여덟 번째, 평균 제곱 오차의 근(Root mean square prediction error; RMSPE) 은 다음과 같다.

    

  

결정계수

은 1에 가까울수록 모형이 우수함을 나타내며 나머지 척도의 값은 작을수록 모형이 우수함을 나타낸다.

앞서 언급한 여덟 개의 척도는 모형의 적합도를 비교하는 척도이며 예측력을 판 단하는 척도로



,



,



을 사용하기도 한다(Li 외, 2019). 전체 데이터 중 일부만 사용하여 평균값함수의 모수를 추정하며, 나머지 데 이터는 예측력을 비교하는 데 사용한다. 예를 들면



은 다음과 같다.

  

    

  



 

전체 데이터 세트

   ⋯ 

에 대하여

   ⋯  

까지의 데이터는 평 균값함수의 모수를 추정하는 데 사용하고, 나머지인

  ⋯ 

까지의 데이터는 평균값함수



에 의한 예측값

 

를 추정하여 실제 데이터와의 거리를 측정하 는 척도를 계산한다. 여기서

  

 

이며

은 평균값함수의 모수 수를 나타낸 다. 마찬가지로







도 같은 방법으로 척도를 계산한다.

51

문서에서 저작자표시 (페이지 64-67)

관련 문서