论文部分内容阅读
随着数据库技术的迅速发展以及数据库管理系统的广泛应用,人们采集数据的能力得到了极大的提高,从而积累了大量的数据。这些数据的背后隐藏着许多重要的、有价值的信息,人们为了对这些数据进行更高层次的分析,获取这些潜在的信息以指导今后的工作、生活,由此产生了数据挖掘技术。数据挖掘,是指从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。近十几年来,数据挖掘技术已得到广泛的研究,并在商业、金融、医疗等领域得到成功地应用,但在教学方面的应用比较少。由于高校连年扩招,造成了在校生人数规模剧增,给高校的教学工作带来了许多影响教学质量的问题。本论文以笔者所工作的学校为例,提出了一种应用决策树技术来挖掘隐藏在学生成绩背后有价值信息的研究方案,目的是对教师今后的教学工作提供重要的决策依据。决策树技术是数据挖掘分类和预测的主要技术,是通过一组无次序、无规则的实例中推理出决策树表现形式的分类规则。决策树方法与其它分类方法相比具有可理解性、易训练、易实施和通用性等优点,所以本论文选择将决策树技术应用到学生成绩分析研究中。基于数据挖掘的研究现状,笔者将把决策树技术应用到学生成绩的分析研究中,以提高教学质量。本文主要进行了以下几个方面的研究工作:1、数据挖掘基本知识的深入研究及探讨。在介绍数据挖掘基本概念的基础上,对数据挖掘的对象、可发现的模式进行了详细的分类、归纳和总结,并对数据挖掘常用技术进行了分析。2、决策树技术的分析与研究。通过第三章,详细分析了应用决策树技术挖掘数据信息的具体步骤,并对决策树的主要算法及其基本思想进行了归纳、分析和研究,对各种算法之间的差别进行了客观地比较。3、分析了现有对学生成绩分析的不足。针对对学生成绩分析的重要性和作用,提出将数据挖掘技术应用于成绩分析中的重要意义。4、完整地介绍了决策树技术在学生成绩分析挖掘中的全过程。第五章所讨论的内容是论文的核心。采用调查表等方式收集数据,并对数据进行了预处理操作,利用C4.5算法生成了学生成绩分析决策树模型,并由此产生了分类规则。