论文部分内容阅读
足球赔率是博彩公司根据其利用几年乃至数十年所积累的大量的、丰富的与足球比赛相关的各种数据数据,利用科学的、严谨的数学理论以及投注人心理研究等模型,通过计算得出的对于一场足球比赛产生某种结果的概率并加以转换得到的一组数据。没有经过博彩公司加工的赔率数据是可以真实反映比赛结果发生的可能性的。博彩公司为了获得最大的收益,不会把纯净的概率数据公布给投注人,而是会对计算得出的比赛结果的概率做一些调整。调整的数据即博彩公司公布的比赛赔率。调整的过程也是在经过精密的计算得出的概率基础之上通过某种模型变化而得到的。经过调整的赔率与原始的纯净的概率之间必然存在某种隐藏的联系和规律。
本文介绍了足球比赛赔率计算的基本方法和通用的数学模型,利用脚本语言编写Apriori算法,实现对足球比赛赔率数据的数据挖掘工作。在数据收集的阶段,根据实际的比赛赔率的数据特点,进行数据表结构的设计和数据的录入。在数据预处理阶段,经过对数据特点及算法特点的分析,设计适合Apriori算法实现并且方便进行数据挖掘的数据结构,编写脚本程序,完成数据清洗和数据转换工作。利用脚本对数据进行数据清洗,发现错误数据,对错误数据进行人工修正;利用脚本程序把数据表中的数据转换成不容易引起误会并且方便脚本程序使用的数据项,生成挖掘使用的数据项表及原始数据与挖掘数据的对应表,完成数据转换。
在利用Apriori算法实现对现有的数据进行数据挖掘阶段,运行脚本程序生成频繁K项集,利用原始数据与挖掘数据对应表进行转换得出关联规则。对于挖掘得出的结果进行分析,发现典型、有趣的规则。
为了达到研究的最佳效果,利用Microsoft SQL Server2008使用关联规则算法对足球比赛赔率数据进行更为细致和全面的反复挖掘,对得到的结果进行比较、筛选,选取最优的结果进行分析。