论文部分内容阅读
数据挖掘是一个多学科领域,这些学科包括数据库技术、人工智能、机器学习等。数据挖掘是致力于数据分析和理解、揭示数据内部蕴藏知识的技术。由于数据库中存在着大量数据,因此从数据库中发现有用的信息显得十分重要。数据挖掘技术就是为解决这个问题而产生的。对数据挖掘技术的研究,国内外已经取得了许多令人瞩目的成就,并成功地应用到了许多领域,但在教育领域中的应用并不广泛。 分类是数据挖掘的重要组成部分,它根据类标号已知的数据建立模型,进而使用该模型来预测类标号未知的数据所属的类。常用的分类方法有决策树分类、贝叶斯分类、神经网络分类等,其中决策树方法在可理解度、易训练性、易实施性和通用性等方面优于其他的分类方法。本文选择将决策树分类法应用到高校教学研究中。 本文分析了数据挖掘技术在高职教学研究中应用的可行性之后,拟提出一种能提高教学质量的教学方案。本文以学生成绩分析为例,完整地实现了数据分类挖掘的全过程,包括:确定数据挖掘对象及目标;以网上在线调查的方式为主采集数据;采用数据集成、数据清理、数据转换、数据消减等数据预处理技术;使用C4.5决策树算法生成决策树,并利用事后修剪法对决策树进行修剪;最后由决策树产生分类规则。完成了成绩分析决策树模型的建立。 本文对数据挖掘的概念、算法、实际的挖掘过程进行了论述,特别对C4.5决策树算法及实际应用进行了详尽的分析,详细调查了安徽职业技术学院学生英语学习的各种情况,找出其中潜在的规则为学校教学决策做理论的支持。