论文部分内容阅读
随着“互联网+教育”的普及,在线教育的发展催生了许多新的教育模式与理念。自2012年兴起以来,慕课(大规模在线开放课程)凭借着教育大数据与人工智能的技术支持,在全球范围内得到迅速发展。慕课以其丰富的课程资源和优质的课程服务吸引了世界各地数以千万计的学习者,但居高不下的辍学率严重制约着慕课的进一步发展,成为最亟待解决的问题。充分利用学习者的学习行为,构建有效的慕课辍学率预测模型,能够为慕课平台管理者提供决策依据,以减少此类现象的发生率。因此,本文选择慕课辍学率预测这一关键问题进行研究。近年来,尽管中外学者对慕课辍学率预测问题进行了模型构建与理论研究,但辍学率预测仍存在诸多不足有待解决。传统慕课辍学率预测模型主要采用人工方式从点击流数据中提取特征,此过程有诸多弊端,且忽略了学习者信息与课程信息对慕课辍学率的影响。深度学习具有极强的特征表达能力,并且可以从原始数据中自动提取特征,被广泛应用到各个领域。因此,本文利用深度学习相关理论,构建了基于深度神经网络的慕课辍学率预测模型,为提高慕课学习者辍学率预测性能提出了新思路。首先,本文通过构建慕课研究热点知识图谱、慕课研究作者与机构的知识图谱,揭示慕课与慕课辍学率预测问题的最新研究现状和研究动态。分别使用ANOVA分析法和Apriori算法对学习者信息与学习行为之间、慕课课程之间进行相关性分析,从而探究学习者信息与课程信息对慕课辍学率的影响,总结慕课学习者的辍学原因,为慕课辍学率预测模型的构建提供理论依据。其次,针对传统慕课辍学率预测方法存在的依赖于特征工程手工提取特征的弊端、特征提取策略不具有普适性等问题,本文将卷积神经网络(Convolutional Neural Network,CNN)与门控循环单元(Gated Recurrent Unit,GRU)相结合,提出了CNNGRU慕课辍学率预测模型。该模型借助卷积神经网络从原始慕课数据中自动提取局部特征的能力,同时基于学习者的学习行为与时序有关,模型引入了门控循环单元GRU,使模型具有良好的时序信息抽取能力。在慕课数据集上的实验结果表明,CNNGRU慕课辍学率预测模型能有效对慕课辍学率进行预测,且总体上优于对比的其他传统慕课辍学率预测方法。进一步,针对传统慕课辍学率预测方法通过包含学习者慕课论坛数据、课程问答数据、课程视频观看数据及课程作业数据等在内的点击流数据对辍学率进行预测,忽略与辍学率相关性很高的学习者信息与课程信息的问题,本文引入注意力机制(Attention Mechanism)将学习者信息与课程信息结合到预测模型中,提高预测模型的泛化能力,构建了基于注意力机制的ATT-CNNGRU慕课辍学率预测模型。最后,本文采用指数线性单元(Exponential Linear Unit,ELU)作为预测模型中GRU网络结构的激活函数,构建ATT-CNNGRU-ELU慕课辍学率预测模型。ELU函数能有效解决梯度消失问题且具有软饱和性,从而能进一步增强模型鲁棒性与预测性能。实验结果表明,本文提出的ATT-CNNGRU-ELU慕课辍学率预测模型与ATT-CNNGRU模型和CNNGRU模型相比,F1值与AUC值有显著提升,且也高于对比的传统慕课辍学率预测模型,预测性能得到有效提高。