论文部分内容阅读
数据挖掘技术是信息化技术发展到一定程度的必然结果,它是一类全新的相关数据分析技术,它是在数据海洋中找出有用知识为人类服务的一种技术。关联规则挖掘方法是数据挖掘方法中很重要的方法之一。而最经典的关联规则算法便是Apriori算法,该算法在许多领域(像金融领域、商业领域,等等)都已有了相应的应用,并取得了不错的效果。高校的核心任务是教学,提高教学质量是根本,然而学生的成绩则是衡量教学质量水平的一项重要指标。因此,对学生成绩数据进行相关的数据挖掘处理有着重要的现实意义。利用数据挖掘技术挖掘学生成绩数据,可以挖掘出像课程与课程之间的相互关系、影响学生成绩的各方面因素等有用的知识,这些知识可为教学及相关管理工作提供有力地决策支持,同时也为更好的开展教学工作和提高教学质量提供科学依据。本文主要对基于关联规则技术的挖掘方法作了深入的探究,重点分析了经典的关联规则算法——Apriori算法,指出该算法存在的优缺点,并针对其缺点提出了一种基于事务标记符的优化Apriori算法。在分析基于事务标记符的优化Apriori算法的执行效率之后,针对该优化算法中仍存在的不足,又提出了一种更进一步的优化Apriori算法――Apriori33算法。Apriori33算法主要提出了三大优化改进:一是关于数据存储的优化;二是项集在连接之前的优化,三是项集在连接之时的优化。最后,将Apriori33算法应用于学生成绩数据挖掘当中去。本文使用MS SQL SERVER 2008作为后台数据库,Visual Studio 2010作为开发工具,对学生成绩数据库中存储的成绩数据进行了关联规则挖掘,收获了一定成效。由测试结果可知,课程与课程之间存在一定的关联关系,一门或某几门课程学习的好坏有可能会直接影响到其它后继课程的学习,当然开课的顺序也有可能会对学生的成绩造成影响,这些知识可为教学及相关管理工作提供有力地决策支持,同时也为更好的开展教学工作和提高教学质量提供科学依据。