论文部分内容阅读
目前中国的高等教育已从精英教育转为大众化教育,办学的规模大,在校学生的数量多。高校经过多年使用综合教务信息管理系统,积累了大量的学生数据。本文将数据挖掘技术运用到高校全国大学生英语四级考试(以下简称CET-4)成绩分析中,挖掘出隐藏在成绩数据中的有用信息,为改进教学设计与教学管理提供依据。主要研究内容如下:1.使用决策树算法对大学生CET-4成绩进行挖掘分析。采用C4.5算法建立预测学生是否通过CET-4的决策树,使用事后剪枝的方法对建好的决策树进行剪枝,之后提取分类规则,依据分类规则建立大学生CET-4成绩预测模型;对分类规则中各个影响因素进行分析,分析出各因素对CET-4成绩的影响程度,为改进英语教学设计与教学管理提供科学依据,提高学生的英语水平及CET-4考试通过率。2.采用k均值算法的变种k-modes算法对CET-4成绩合格者与不合格者分别进行聚类分析。针对k值难以确定的缺点,给出一种确定k值的方法,该方法先选择比较大的k值进行聚类,聚类后计算各个聚类间的距离,若距离低于一定阈值则认为两个聚类过于相似进行合并,合并后按照新k值继续进行聚类。聚类后,分析每个簇的特征,并对决策树模型获得的分类规则进行验证。可根据不同簇的特征对学生进行分班分类教学,从而做到因人施教、因材施教,提高教学质量,提高学生的CET-4考试通过率。3.设计实现了大学生成绩管理分析系统。该系统管理学生的入学成绩、在校期间各科成绩、CET-4成绩等各种学习成绩,并可对学生信息和成绩进行挖掘分析。本文采集某地方综合性大学独立学院学生的相关数据,按照上述方法进行了CET-4成绩的挖掘分析,其实验结果验证了研究内容对CET-4具有指导作用。