Scaling 전 기록의 종속변수와 52가지의 확장된 독립변수로 단계적 회귀분석을 실시하여 얻은 예측모형으로 검증을 진행하고 도출된 성능지표는 아래와 같다. Test data인 총 755 경주에서 1등할 것이라 예측한 경주마가 실제 경기에서 1등 혹은 2등을 한 경우는 총 304건(1등: 181건, 2등: 123건)으로 약 40.26%의 정확도를 보였으며, 2등으로 예측한 경주마가 실제 경기에서 1등 혹은 2등을 한 경우는 총 259건(1등: 144건, 2등 115건)으로 약 34.30%의 정확도를 보인다. 본 모형의 성능지표는 값은 0.7457로 나왔다.
표 4.3 종속변수 Scaling 전 확장모형 결과분석
Scaling 후 기록의 종속변수와 52가지의 확장된 독립변수로 단계적 회귀분석을 실시하여 얻은 예측모형으로 검증을 진행하고 도출된 성능지표는 아래와 같다. Test data인 총 755 경주에서 1등할 것이라 예측한 경주마가 실제 경기에서 1등 혹은 2등을 한 경우는 총 322건(1등: 204건, 2등: 118건)으로 약 42.65%의 정확도를 보였으며, 2등으로 예측한 경주마가 실제 경기에서 1등 혹은 2등을 한 경우는 총 275건(1등: 148건, 2등 127건)으로 약 36.42%의 정확도를 보인다. 본 모형의 성능지표는 값은 0.7918로 나왔다.
표 4.4 종속변수 Scaling 후 확장모형 결과분석
예측모형들의 검증결과로 Scaling 후 기록의 종속변수와 55가지의 확장 된 독립변수로 단계적 회귀분석을 실시하여 얻은 예측모형의 성능지표 값이 0.7918로 가능 높게 나왔으며, 최적의 예측모형이라고 할 수 있다. 즉, 경마경주는 경주마 군, 경주 거리, 날씨, 주로상태, 주로습도, 마번, 경주마 연령, 경주마 부담중량, 경주마 체중, 경주마 체중변화, 경주마의 1등 횟수, 경주마의 2등 횟수, 경주마의 3등 횟수, 경주마 승군점수, 감독의 전체 경주수, 감독의 3등 횟수, 감독의 1등 승률, 감독의 최근 1년 승률, 감독의 최근 1년 복승률, 기수의 1등 횟수, 기수의 승률, 기수의 복승률, 기수의 최근 1년 1등 횟수, 기수의 최근 1년 승률의 상태에 따라 경주마의 기록이 변화하고 이 경마경주의 정보들이 경주마 기록에 영향을 끼치는 변수라고 할 수 있다.