Ⅲ. 소프트웨어 신뢰성
3.4.3. 적합도 척도
실제 데이터를 각 모형의 평균값함수
에 적합하여 Matlab을 이용해 최소 제 곱 추정(Least squares estimation; LSE) 방법으로 모수 추정값을 얻을 수 있다.모형의 적합도를 비교하기 위해서는 모수 추정값을 다시 평균값함수에 대입하여 척도를 계산한다. 자주 사용되는 척도로 평균 제곱 오차(Mean squared error;
MSE), 예측비위험(Predictive ratio risk; PRR), 예측력(Predictive power; PP),
등이 있다(Pham 2000, Pham 2006a, Pham 2006b, Pham 2014a, Akaike 1974, Pillai 외 1997).첫 번째, 평균제곱오차(MSE)는 다음과 같다.
여기서
은 데이터의 관측 수,
은 모형의 모수 수를 나타내고,
는 모수 추 정치를 대입한 평균값함수에서
일 때 예측값,
는
에서의 실제 데이터 값을 의 미한다. 즉, MSE는 데이터의 관측 수와 모형의 모수 수를 고려하여 모형의 추정치 와 실제 데이터의 거리를 측정하는 척도이다. 일반적으로 모수의 수가 클수록 적합 도가 더 우수한 경향을 보이는데 MSE는 모수의 수에 대한 페널티를 부여하므로 모수의 수가 서로 다른 모형의 적합도를 비교하는데 합리적이다.두 번째, 예측비위험(PRR)은 다음과 같다.
49
-모형 예측값을 고려하여 -모형 예측값과 실제 데이터 값의 거리를 측정한다.
세 번째, 예측력(PP)은 다음과 같다.
실제 데이터 값을 고려하여 모형 예측값과 실제 데이터 값의 거리를 측정한다.
네 번째, 결정계수
(R-squared)은 회귀직선의 적합도를 평가하는데 많이 쓰 이며 다음과 같이 주어진다.
여기서
는 실제 데이터 세트의 전체 평균을 의미한다.다섯 번째, Akaike의 정보 기준(Akaike’s information criteria; AIC)은 다음과 같 이 정의한다.
ln
여기서
은 자유도이며 우도 함수
과ln
은 다음과 같이 주어진다.
ln
ln
ln
여섯 번째, 절대 오차 합(Sum of absolute error; SAE)은 예측값과 실제 데이터 값의 절대 거리를 측정하며 다음과 같이 표현한다.
일곱 번째, 변동(Variation)은 예측 편향의 표준편차로 다음과 같이 주어진다.
여기서 편향(Bias)은 다음과 같다.
여덟 번째, 평균 제곱 오차의 근(Root mean square prediction error; RMSPE) 은 다음과 같다.
결정계수
은 1에 가까울수록 모형이 우수함을 나타내며 나머지 척도의 값은 작을수록 모형이 우수함을 나타낸다.앞서 언급한 여덟 개의 척도는 모형의 적합도를 비교하는 척도이며 예측력을 판 단하는 척도로
,
,
을 사용하기도 한다(Li 외, 2019). 전체 데이터 중 일부만 사용하여 평균값함수의 모수를 추정하며, 나머지 데 이터는 예측력을 비교하는 데 사용한다. 예를 들면
은 다음과 같다.
전체 데이터 세트
⋯
에 대하여
⋯
까지의 데이터는 평 균값함수의 모수를 추정하는 데 사용하고, 나머지인
⋯
까지의 데이터는 평균값함수
에 의한 예측값
를 추정하여 실제 데이터와의 거리를 측정하 는 척도를 계산한다. 여기서
이며
은 평균값함수의 모수 수를 나타낸 다. 마찬가지로
과
도 같은 방법으로 척도를 계산한다.51