论文部分内容阅读
人类已经进入“数据爆炸”时代,得到数据不再是问题,利用好大量历史数据正日益成为人们关注的焦点。出于充分利用教学数据的研究动机,本文在大量阅读文献的基础上,提出目前数据挖掘技术应用在教学管理中的三点不足,围绕这三点不足,分别在文章的重要章节展开深入的研究与分析。数据挖掘技术逐渐成为现代多个行业领域中广泛应用的重要的数据分析与知识发现技术。而且数据挖掘研究的重点逐渐从方法创新转移到技术应用。一方面数据挖掘技术在教学中应用的成功案例较少,另一方面高校中存储的历年学生信息丰富而庞大,在这样的研究背景与现状下,本文作者选择以学生相关数据为数据源对教学相关问题进行数据挖掘与知识发现,试图寻找大量学生信息中隐藏的知识规则,突破目前研究中存在的不足。第二章全面分析与论述了数据分析技术:第三章以物院学生历年的数据为源数据,运用关联规则算法寻找学科成绩之间的相互关系,具体研究同学们是否通过大学英语四、六级与大学期间四个学期英语成绩之间的关系;并对通常经验认识的课程之间的关系进行明示,给予数据支持;第四章从概念模型的设计到物理模型的设计逐步建立起学生信息的数据仓库,为联机分析(OLAP)和数据挖掘结构的建立做好数据源准备;第五章为实质的联机分析和数据挖掘阶段,对相关信息的分布情况进行展示并采用朴素贝叶斯分类算法预测了学生是否毕业与其学制、学科类别、年龄和所在院系等属性之间的关系,通过他们来分类预测学生最后是否取得毕业证;并对比贝叶斯、决策树和神经网络模型的总体正确率,运用几种分类预测算法建立模型并进行对比。其中,尤以贝叶斯分类模型准确率最高,与实际值很接近,结果可将教学中需要重点关怀的学生对象提供给教师,为学生提供正常毕业的学前预警,促使教学相长。研究结果证明,数据挖掘技术在教学管理中的应用研究在理论上是可行的,在技术上是可实现的,而且该领域的研究和应用具有深远的影响意义。