论文部分内容阅读
随着互联网技术的快速发展,学习方式也发生了巨大的变化,由传统学习方式逐渐转变为在线学习方式。传统学习方式是现场师生面对面的模式,其课程中的学习效果和学习状态可以通过现场提问等方法来评估。在线学习是一种跨越时空的学习方式,其学习效果和学习状态方法无法采用传统的方法评估,因此如何对在线学习效果和学习状态评估就尤为关键。学习者在学习的过程中产生了大量的学习行为数据并被记录,通过探究这些数据中蕴藏的规律,为在线学习平台中不同学习者提供个性化的环境和学习指导,分析和研究学习者的学习行为数据是很有价值的。本文在对MOOC学习行为归纳和分析的基础上,采用分类的数据挖掘方法,提出采用集成学习的方法构建集成式学习成绩分类预测模型,并比较C4.5决策树算法和支持向量机算法构建的单一分类模型和随机森林集成分类模型的性能。通过构建成绩预测模型,成功实现了MOOC学习者的学习成绩预测。本论文主要的研究工作有:(1)基于MOOC平台学习者学习行为数据,对学习者学习行为数据的基本信息、学习者类型、影响成绩的因素等三个方面进行了深入地分析和探索,并得到了一些相关结论。通过单因素方差(ANOVA)分析不同类型学习者的学习行为之间是否存在显著性差异,例如不同学历水平学习者仅在活跃天数和论坛发帖数两个学习行为上存在显著性差异(P(27)05.0),而在学习事件数、学习章节数和模块完成比例四个方面均不存在显著性差异(P(29)05.0);不同年龄段的学习者在活跃天数、论坛发帖数、学习章节数以及模块完成比例四个行为上都存在显著性差异(P(27)05.0),而在学习事件数上不存在显著性差异(P(29)05.0)等。另外学习者的学习事件数、活跃天数、学习章节数、论坛发帖数和模块完成比例五个学习行为特征对学习成绩都有不同程度的正相关性(P(27)01.0)。(2)本文利用分类方法中的决策树和支持向量机算法构建单一分类器,以及随机森林构建的集成分类器对MOOC学习者的学习成绩进行预测。其中C4.5决策树构建的学习成绩预测模型的精度为0.812,支持向量机构建的学习成绩预测模型的精度为0.804,随机森林集成分类器构建的学习成绩预测模型为0.854。在学习成绩预测模型的精度上,随机森林集成分类器构建的模型是最佳的分类模型,虽然C4.5决策树算法和支持向量机算法构建的模型的精度比较低,但两者的精度也达到了0.8以上,也是很可观的。本文通过对实验结果的分析,了解MOOC学习行为与学习成绩之间的关联,从而进一步找到哪些学习行为或者哪些学习行为的组合对学习成绩影响更大。MOOC平台的教育工作者,可以深入了解学习者的自主学习情况和学习特征,从而更好的指导教学改革,优化教学方案,为学生学习提供更好的服务;对于MOOC的学习者,可以充分了解自己的学习行为,提高学习效率,形成更有效的学习方式。