2010년 1월 ~ 2013년 7월까지 서울경마경주결과 자료를 통해 각 경주별 발생할 수 있는 21개의 정보를 수집하였다. 수집된 정보는 경주일, 요일, 경주마의 군, 경주거리(M), 날씨, 경주로 상태, 경주로 습도, 경주별 경주마의 순위, 경주마번호, 경주마명, 경주마 산지, 경주마 성별, 경주마 연령, 경주일 기준 기수의 체중, 기수명, 감독명, 마주명, 경주마 체중, 경주마 체중 변화, 경주기록(초) 이다.
추가로 12 가지 경주마의 정보, 20가지 기수의 정보, 20 가지 경주마감독의 정보를 수집하였다. 각각 수집된 정보의 유형과 내용은 표3.2 ~ 표3.5와 같다.
표 3.2 경마경주 데이터 변수 설명
표 3.3 경주마의 정보 데이터 설명
표 3.4 기수의 정보 데이터 설명
표 3.5 경주마 감독의 정보 데이터 설명
♣ 종속변수
종속변수는 어떠한 자극에 대한 반응이나 결과를 나타내는 변수로 영향을 받는 변수라고 할 수 있다. 결과변수라고도 하며 독립변수의 변화에 따라 변화하게 된다. 본 연구에서는 실질적인 경주의 결과를 나타내는 변수인 각 경주별 경주마의 기록을 종속변수로 설정하였다.
♣ 독립변수
독립변수는 실험에서 자극을 주는 변수로 어떤 것의 원인이 되는 변수로서 원인변수라고도하며 영향을 주는 변수이다. 본 연구는 경마순위 예측에 대한 연구로 종속변수인 경주 기록에 영향을 미치는 나머지 모든 변수를 독립변수로 설정하였다. 표3.6은 본 연구에서 설정한 15 가지의 기본 모형의 독립변수이다.
표 3.6 기본모형의 독립변수
표3.7은 본 연구에서 설정한 52가지의 확장 모형의 독립변수이다.
표 3.7 확장모형의 독립변수