论文部分内容阅读
随着教育信息化的不断发展,高校教学管理数据迅速增加。利用科学方法从中得到有价值的知识与信息,可以为高校教师教学提供更好地服务。通过学生的日常学习数据,运用数据挖掘技术对数据进行分析并建立相关模型,探索学生分类情况及其影响因素,并对学生建立课程画像,教师可以据此及时准确地掌握学生的课程学习效果,还能对课程掌握程度不同的学生群体开展差异化教学,提高教学质量。论文的主要工作如下:(1)学生数据的收集及处理。收集学生在《大学计算机基础》课程中的教学数据,采取数据预处理等方法对缺失值等异常数据进行筛选、填充,对各知识点成绩采用归一化方法统一量纲;之后根据XGBoost模型输出的各指标权重值确定影响学生分类的主要因素,为用户画像中虚拟指标的确定提供依据。(2)建立Stacking模型对高校学生进行分类预测。本研究在单分类器模型的基础上根据集成思想提出了一种基于XGBoost模型、随机森林模型及LR模型融合后的Stacking分类模型,以此模型进行学生分类情况的预测;Stacking模型在预测较差学生和预测优秀学生实验中的准确度分别达到了 85.92%和83.23%,通过与其他分类模型的对比,发现基于Stacking算法的学生分类模型比其他分类模型准确度更高,性能更好,更适合用于学生分类预测实验;最后通过2019级部分学生数据验证了该模型的准确性。(3)建立学生的课程画像。通过数据统计分析、建模分析及可视化展示等方法构建了学生的课程画像,通过基本属性、原有基础、模块掌握水平、学习投入水平4个指标来了解学生的基本信息、学习习惯、模块优劣、努力程度等,帮助教师全面的了解学生;最后通过对比验证了画像的准确性及有效性。通过本文的研究,发现基于《大学计算机基础》课程成绩的Stacking分类算法能够准确反映学生分类的结果,建立的学生画像能够帮助教师清晰地了解学生的学习特点,对今后的教学研究有着重要意义。