论文部分内容阅读
为了提高运动成绩,必须进行合理的、系统的、科学的运动训练。近年来,科学的训练方法已越来越多的应用到竞技体育当中来,并且取得了显著的成效。在众多的体育项目中,击剑项目是2004雅典和2008北京奥运会上重要的夺牌项目,为了协助国家击剑队教练更科学的指导运动员训练,提高比赛成绩,我们与国家击剑队合作,研究一套“击剑训练负荷计算机分析系统”。该分析系统的一个重要研究内容是采用数据挖掘和知识发现的方法对运动员的身体机能和运动负荷量进行科学的评价,帮助教练员更合理的安排训练计划。 目前,我们依据运动员的血液指标测试记录,采用神经网络技术已经实现了运动员身体机能评价和预测。但是,对于血液指标的选择随意性比较强,这势必会影响到网络的性能和准确度。因此,利用神经网络训练之前必须选取合理的血液指标。本文的研究目的在于如何对血液指标进行优化。通过运用数据挖掘中的重要方法关联规则,我们找出了血液指标之间的相互联系,实现了血液指标的优化。 关联规则的形式为X(?)Y,它说明数据库中的某一条记录如果包含了X,那么也倾向于包含Y。关联规则的发现可分为两步。第一步是迭代识别所有的频繁项目集,要求频繁项目集的支持率不低于用户设定的最低值;第二步是从频繁项目集中构造可信度不低于用户设定的最低值的规则。识别或发现所有频繁项目集是关联规则发现算法的核心,也是计算量最大的部分。最为著名的关联规则发现方法是R.Agrawal提出的Apriori算法。算法使用一种称作逐层搜索的迭代方法,k-项集用于探索(k+1)-项集。Apriori算法可能会产生大量的候选项集和重复的扫描数据库,势必会影响算法执行的效率。关联规则发现的另外一个常用的算法频繁模式增长算法(FP-Growth)是一种不产生候选集挖掘频繁项集的算法,在执行效率上有了很大的提高。 由于我们采用了SQL Server关系数据库存储数据,而提取关联规则的算法是基于事务数据库的,因此我们对提取关联规则的Apriori和FP-Growth算法进行了改进,给出了在关系数据库中提取关联规则的实现方法。 本文首先对数据挖掘以及关联规则的提取进行了研究,而后给出了关系数据