적합도 척도 - 소프트웨어 신뢰성

Ⅲ. 소프트웨어 신뢰성

3.4.3. 적합도 척도

실제 데이터를 각 모형의 평균값함수



에 적합하여 Matlab을 이용해 최소 제 곱 추정(Least squares estimation; LSE) 방법으로 모수 추정값을 얻을 수 있다.

모형의 적합도를 비교하기 위해서는 모수 추정값을 다시 평균값함수에 대입하여 척도를 계산한다. 자주 사용되는 척도로 평균 제곱 오차(Mean squared error;

MSE), 예측비위험(Predictive ratio risk; PRR), 예측력(Predictive power; PP),



^ 등이 있다(Pham 2000, Pham 2006a, Pham 2006b, Pham 2014a, Akaike 1974, Pillai 외 1997).

첫 번째, 평균제곱오차(MSE)는 다음과 같다.

 _{ }

  

  





 ^ ^



 

_



^



여기서



은 데이터의 관측 수,



은 모형의 모수 수를 나타내고,

 

_



는 모수 추 정치를 대입한 평균값함수에서



_일 때 예측값,



_는



_에서의 실제 데이터 값을 의 미한다. 즉, MSE는 데이터의 관측 수와 모형의 모수 수를 고려하여 모형의 추정치 와 실제 데이터의 거리를 측정하는 척도이다. 일반적으로 모수의 수가 클수록 적합 도가 더 우수한 경향을 보이는데 MSE는 모수의 수에 대한 페널티를 부여하므로 모수의 수가 서로 다른 모형의 적합도를 비교하는데 합리적이다.

두 번째, 예측비위험(PRR)은 다음과 같다.

  

_{  }^

^ _

 ^ ^ ^ ^ ^

^

^{ }

^

^

^

^ ^ 





-모형 예측값을 고려하여 -모형 예측값과 실제 데이터 값의 거리를 측정한다.

세 번째, 예측력(PP)은 다음과 같다.

 

_{  }



^

 ^ ^



 

_

 

_



^

^

실제 데이터 값을 고려하여 모형 예측값과 실제 데이터 값의 거리를 측정한다.

네 번째, 결정계수



^(R-squared)은 회귀직선의 적합도를 평가하는데 많이 쓰 이며 다음과 같이 주어진다.



^

_{   }

  





 ^



  

^

  





 ^



  

_

 

^



여기서



는 실제 데이터 세트의 전체 평균을 의미한다.

다섯 번째, Akaike의 정보 기준(Akaike’s information criteria; AIC)은 다음과 같 이 정의한다.

  ln     

여기서



은 자유도이며 우도 함수



과

ln 

은 다음과 같이 주어진다.

  

_{  }^

^ ^ ^

^

^ _

_

^ _{ }

^{ }_{ }

_ ^

_ _{ }



^{ }^^^{  }^^{ }^



ln  

_{  }



^

^ ^

^

^{ }

^{  }

^ln ^ ^ ^

^

^{ } ^

^{  }

^ ^ ^ ^ ^ ^

^

^{ } ^

^{  }

^ ^ ^{ ln}

^

^{ }

^{ }

^ ^ ^

여섯 번째, 절대 오차 합(Sum of absolute error; SAE)은 예측값과 실제 데이터 값의 절대 거리를 측정하며 다음과 같이 표현한다.

  

_{  }^

^ ^ ^

^

^{ }

^

^ ^

일곱 번째, 변동(Variation)은 예측 편향의 표준편차로 다음과 같이 주어진다.

    ^ ^

^{  }

^

^

^ ^ ^

^

^{ } _{ }

^

^ ^ ^ ^ ^

^

^

여기서 편향(Bias)은 다음과 같다.

   

_{  }^

 ^ 

 

_

 

_

 ^

여덟 번째, 평균 제곱 오차의 근(Root mean square prediction error; RMSPE) 은 다음과 같다.

   ^  

^

  

^



결정계수



^은 1에 가까울수록 모형이 우수함을 나타내며 나머지 척도의 값은 작을수록 모형이 우수함을 나타낸다.

앞서 언급한 여덟 개의 척도는 모형의 적합도를 비교하는 척도이며 예측력을 판 단하는 척도로



_{},



_{},



_{}을 사용하기도 한다(Li 외, 2019). 전체 데이터 중 일부만 사용하여 평균값함수의 모수를 추정하며, 나머지 데 이터는 예측력을 비교하는 데 사용한다. 예를 들면



_{}은 다음과 같다.

 _{ }

    



_{  }



^

^ ^ ^

^

^{ }

^

^

^

^

전체 데이터 세트



_

   ⋯ 

에 대하여



_

   ⋯  

까지의 데이터는 평 균값함수의 모수를 추정하는 데 사용하고, 나머지인



_

  ⋯ 

까지의 데이터는 평균값함수



에 의한 예측값

 

_



를 추정하여 실제 데이터와의 거리를 측정하 는 척도를 계산한다. 여기서



_{  }

 

_이며



은 평균값함수의 모수 수를 나타낸 다. 마찬가지로



_{}과



_{}도 같은 방법으로 척도를 계산한다.

문서에서 저작자표시 (페이지 64-67)

적합도 척도

Ⅲ. 소프트웨어 신뢰성

3.4.3. 적합도 척도





  

  



  

 









 









  

 

     

 



  



 



  

 

 









   



 

  



 

  

 





  ln     





ln 

  

  

 

  

 





ln  



 

 

ln   

  

     

  

   ln

 

  

  

  

 

 

     



  

   

    



   

  

 

 _{ }

 ^ ^

^ _

 ^ ^ ^ ^ ^

^{ }

^

^ ^ 

 ^ ^

^

_{   }

 ^

 ^

^ ^ ^

^ _

^ _{ }

_ ^

^ ^

^{ }

^ln ^ ^ ^

^{ } ^

^ ^ ^ ^ ^ ^

^{ } ^

^ ^ ^{ ln}

^{ }

^ ^ ^

^ ^ ^

^{ }

^ ^

    ^ ^

^

^ ^ ^

^{ } _{ }

^ ^ ^ ^ ^

^

 ^ 

 ^

   ^  

 _{ }

^ ^ ^

^{ }

^

^