앞 절에서 선택된 최적모형을 이용하여 2015년 5월 한 달 동안의 test data(총 109개의 경기)에 적용하였을 때의 예측률을 비교하였다.
1마리 예측 모형은 단승식의 경우에 해당하고, 2마리, 3마리 예측 모형은 각각 복승식, 삼복승식에 해당하므로 배팅 방식에 따른 배당률을 이용하여 얻을 수 있는 배당 금액을 계산하였다. Table 3.7을 통해 전체적인 결과를 살펴보면 다음과 같은 사실을 발견할 수 있다.
단승식의 경우에는 기록을 기반으로 한 선형회귀모형의 예측률이 가장 높고, 복승식의 경우에는 기록을 기반으로 한 랜덤포레스트 모형의 예측률이 가장 높았다. 그러나 삼복승식의 경우에는 순위를 기반으로 한 BIC-로지스틱 모형의 예측률이 가장 높은 결과를 보였다.
Table 3.7. Prediction accuracy of each model
Table 3.8. Prots of each model (단위: 원)
Table 3.9. Prots of Model by distance (단위: 원)
다음으로 배당률 정보를 이용하여 각 경기당 10,000원씩 배팅하였을 때의 총 이윤금액을 계산해보았다. 우승마를 맞췄을 경우에는 10,000원 (배당률 1), 맞추지 못했을 경우에는 10,000원으로 한 것을 합하여 한 달간 총 이윤 금액을 계산하였다.
세금을 공제하기 전의 이윤 금액은 Table 3.8과 같다. 이윤 금액은 예측률 결과와 같이 단승식에서는 기록을 기반으로 한 선형회귀모형이, 복승식에서는 기록 기반 랜덤 포레스트 모형이, 삼복승식에서는 BIC-로지스틱 모형이 가장 높았다.
이윤 금액의 함이 가장 큰 모형은 기록을 기반으로 한 랜덤 포레스트 모형인 것을 확인할 수 있다. Table 3.9를 통해 거리별 이윤 금액을 자세히 살펴보면 1000m에서의 이윤 금액이 다른 거리에 비해 월등히 크다는 것을 알 수 있다.
이는 33번째 경기(2015.5.10, 1000m)의 배당률이 각각 233.2(단승식), 731(복승식), 2221(삼복승식)으로 매우 높기 때문에 이 경기를 맞춤으로써 높은 이윤 금액을 얻게 된 것이다. 따라서 실제 이윤 금액에 큰 영향을 미치는 것은 이러한 배당률이 높은 경기를 맞출 수 있는지 여부이다.