论文部分内容阅读
随着大数据成为网络信息行业的重点词汇,在教育领域应用数据挖掘技术来为教育革命提供动力成为可能。数据挖掘技术对于中小学生以及高等院校学生的学习行为各类表现、学习的成绩以及毕业后的职业规划都可以提供有价值的信息,比如可以改善学生的学习方法、帮助学生发现在作业或考试中存在的一些经常被忽略但却很重要信息、为学生具体学科的学习提供个性化服务、及时发现学生潜在的辍学风险等。教育数据挖掘EDM是一个新兴领域,是为备满足日益增长的教育普遍评价的需要。EDM侧重于收集、归档和分析学生学习相关的数据并进行评估.在学校对学生的教育中存在很多较为明显的数据,比如学生的入学率、报到率、上课考勤率、辍学率、奖学金分布比率等,当然最重要的是学生各科成绩分数的数据。进一步具体到课堂中也存在类似的数据,比如学生回答问题的准确率、提交的作业的正确率、课堂发言次数、师生互动时间、学生回答问题的平均时长等,这些数据按照数据挖掘技术的流程经过专业的收集、预处理、统计、分类和分析后,可以成为对学生多方位表现预测的依据。本文设计的成绩分析系统主要是利用数据挖掘算法设计模型来分析教育数据,所要实现的目标有三点:第一,预测新入学学生是否能在第一学期考试通过。如果预测说一个学生倾向于在考试中失败,那么可以建议学生在考试之前采取额外的努力,提高自己成绩并帮助他通过考试。分类方法包括类似决策树、贝叶斯网络可以实现,本文采用的是CART和C4.5,ID3决策树算法。第二,利用数据挖掘技术选择有重修风险的学生。对于高校学生来说,当考试分数低于重修分数的时候需要在下学期开学初参加重修辅导班,并重新考试。这不仅增加了老师的教学负担,也给了学生带来不必要的负担,在数据挖掘技术的帮助下,我们能够更准确的选择有针对性的学生。在本文中,将采用一个基于数据挖掘的方法选择该类的学生。方法的关键是采用基于得分的关联规则技术,该方法具有非常不错的效果,优于传统方法。第三,通过学生的成绩分析学生之间关系、课程之间关系和影响。在教育中,学生的分数是一个非常重要的定量评价指示器,可以客观地反映教育的影响,是一个重要的科学决策依据。因此,分析和研究学生的分数是非常重要的。学生成绩数据库中的数据呈指数级增长。传统的查询和简单的统计分析无法满足分析的需要,不能为教学捕捉有用的信息。本文利用聚类算法和决策树挖掘学生的分数,通过分析学生-课程-成绩之间的关系可以获得一些教学和管理有价值的信息。本文的系统测试采用SAS Enterprise Miner平台,它设计为被初学者和有经验的用户使用,它的GUI界面是数据流驱动的,且它易于理解和使用。它允许一个分析者通过构造一个使用链接连接数据结点和处理结点的可视数据流图建造一个模型。另外,此界面允许把处理结点直接插入到数据流中。本文最后利用SAS Enterprise Miner平台对本文设计的数据挖掘模型进行测试,包括输入数据源、数据分区点检查、变量缺失值替代、交互分组、决策树模型、聚类分析模型等,测试效果表明成绩分析功能能够实现。