감퇴지수 예측모델 구축

의 학습 결과와 테스트 결과를 나타낸 것으로 RMSE는 각각 0.234, 0.3236이다. 입 력 데이터에 생산량 데이터를 추가할수록 RMSE가 감소하지만 그 수치가 매우 작 아 예측성능에 큰 영향이 있다고 볼 수 없다.

Figure 3.33 Training and Test result of



prediction Model 1, Case 1.

Figure 3.34 Training and Test result of



prediction Model 1, Case 2.

Figure 3.35 Training and Test result of



prediction Model 1, Case 3.

Figure 3.36 Training and Test result of



prediction Model 1, Case 4.

랜덤포레스트 모델을 통해 예측한 결과를 사용하여 구한 P10, P50, P90은 모델을 통해 예측된 값이 실제 값보다 크게 나타날 확률이 최소 10%, 50%, 90%라는 것을 의미하며, 대푯값으로는 P50 혹은



_ 값을 사용한다. 이 연구에서는 학습된 랜 덤 포레스트 모델을 통해 예측한 결과의 P10, P50, P90을 구하였으며 P10과 P90사 이의 차이인 신뢰구간(불확실성구간)을 구하였다. 대푯값으로는 P50을 사용하였고 이를 실제 값과 비교하여 상대오차를 계산하였다.



_Pred1 모델의 예측 결과를 Table 3.21에 나타내었다. 학습된 5개의 랜덤 포레 스트 모델의 결과를 Case 별로 분석하였다. 신뢰구간은 P10과 P90의 차이를 의미 하며 100개의 테스트 데이터에 대해 계산한 각각의 신뢰구간의 평균을 사용하였다.

신뢰구간이 작을수록 불확실성이 감소하여 모델의 예측성능이 더 향상된 것이라고 할 수 있다. Table 3.21를 통해



_Pred1 모델의 Case 별 불확실성구간을 분석한 결 과 입력 데이터에 생산량 데이터가 추가되더라도 불확실성구간의 감소 수치가 매 우 작거나 오히려 증가하는 모델을 확인할 수 있다. P50과 실제 값 사이의 상대오 차는 100개의 테스트 데이터에 대해 계산한 값의 평균을 사용하였다. 상대오차를 분석한 결과 신뢰구간 분석과 마찬가지로 입력 데이터에 생산량 데이터가 추가되 더라도 상대오차의 감소수치가 매우 작거나 증가하는 모델을 확인할 수 있었다. 신 뢰구간 내에 포함되는 실제 값의 비율은 최소 80%에서 최대 88%의 범위를 보였 다. Figure 3.37과 Figure 3.38은 5개의



_Pred1 모델 중 Model 1의 예측 결과의 P10, P50, P90을 나타낸 그래프이다. Figure 3.37은 Case 1과 Case 2를, Figure 3.38은 Case 3과 Case 4를 나타내었다. 신뢰구간, 상대오차 등의 분석을 통해 궁극 가채량과 감퇴율 예측모델과 달리 감퇴지수 예측모델은 입력 데이터에 생산량 데 이터를 추가하더라도 예측성능에 큰 영향을 주지 않는다는 것을 확인할 수 있다.

Table 3.21 Summary of



prediction model (



_{_Pred1).}



Pred1

Case 1 Case 2 Case 3 Case 4

Rate of data within the confidence interval(%)

Confidence interval¹⁾

Relative Error²⁾ (%)

Rate of data within the confidence interval(%)

Confidence interval

Relative Error

(%)

Rate of data within the confidence interval(%)

Confidence interval

Relative Error

(%)

Rate of data within the confidence interval(%)

Confidence interval

Relative Error

(%)

Model 1

87 1.091 16.4 88 1.11 15.7 84 1.07 15.3 85 1.071 14.6

Model 2

83 1.11 17.6 80 1.11 17.5 84 1.09 16.2 85 1.09 16.5

Model 3

76 1.048 20.6 78 1.063 19.6 80 1.046 18.9 78 1.055 18.6

Model 4

78 1.063 21.5 77 1.055 20.2 81 1.048 19.2 80 1.044 19.5

Model 5

81 1.046 20 81 1.046 20.3 82 1.003 19.2 79 0.992 19.5

Mean

³⁾ 81 1.072 19.2 80.8 1.077 18.7 82.2 1.051 17.8 81.4 1.05 17.7

1) Confidence Interval : Interval between P90 and P10.

2) Relative Error(%) : Relative error between P50 and Real value.

3) Mean : Average of 5 Models.

Figure 3.37 Confidence interval of test data (



_Pred1 Model1), (a) Case 1 (b) Case 2.

Figure 3.38 Confidence interval of test data (



_Pred1 Model1), (a) Case 3 (b) Case 4.

문서에서 저작자표시 (페이지 85-92)