面向行为数据的MOOCs学习者辍学预测模型研究

来源 :华中师范大学 | 被引量 : 1次 | 上传用户:zikao0606
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大规模公开在线课程(Massive Open Online Courses,MOOCs)—经面世便深受全球教育者的青睐并得到大力的推广,但在MOOCs发展过程中突出的一个问题就是其表现出来的高辍学率和低完成率。为了改变这一现状,相关研究者将目光投入到学习者辍学预测的研究中,期望能通过准确预测出具有辍学风险的学习者,并提前对其采取干预措施以使其能坚持学习下去,从而提高课程的完成率。对MOOCs学习者进行辍学预测也就成为了 MOOCs、教育大数据和教育数据挖掘研究中关注的热点。MOOCs学习者辍学预测的研究虽然取得了一定的进展,但在实际应用中辍学预测的有效性有待进一步提高。影响MOOCs学习者辍学预测有效性的关键因素主要有:(1)数据及其特征的有效性,它是辍学预测模型有效性的前提;(2)模型的预测能力,它是辍学预测模型是否实用的基本保障。因此,本文以MOOCs平台中被广泛研究证明有效的学习者行为数据为基础,结合集成学习的思想和深度学习的相关方法,重点在有效特征的提取和模型预测能力的提高上对MOOCs学习者辍学预测展开研究。本文主要的研究内容和创新点如下:(1)针对现有的MOOCs学习者辍学预测研究主要依赖领域专家来提取相关特征进行预测的难点,本文提出了一种基于特征选择的整合框架来预测MOOCs中的学习者辍学问题,该框架包含特征生成、特征选择以及辍学预测。具体来讲,该框架应用以天为单位的细粒度特征生成方法来生成特征,然后使用集成的特征选择方法来选择有效的特征并送入逻辑回归模型进行预测。在公共数据集上进行的实验表明,该框架可以使用较少的特征达到与其他辍学预测方法在精确率、召回率、F1值和AUC值上相当的结果,证明了其提取特征的有效性。最后通过对选择的有效特征进行分析,提出了 MOOCs建设的参考建议。(2)卷积神经网络的广泛应用证明了其强大的特征提取能力,因此,本文尝试将卷积神经网络用来对MOOCs学习者的学习行为数据进行有效特征的提取,提出了一种基于卷积神经网络的端到端辍学预测模型。该模型将特征提取和分类整合到一个框架中,通过它们的协同学习来提高模型的预测能力。该模型首先根据不同的时间窗口转换带有原始时间戳的学习行为数据,然后使用卷积神经网络自动提取转换后数据的有效特征以获得更好的分类特征表示,最后将提取的特征送入分类器进行分类。对实验结果的非参数统计证明了该方法的有效性,特别是在大数据量的情况下要明显优于现有流行方法。(3)针对基于卷积神经网络的端到端辍学预测模型对时序特征考虑的不足,引入在时序数据挖掘中表现优异的循环神经网络,结合卷积神经网络提取局部特征,提出了一种基于神经网络融合的MOOCs学习者辍学预测模型。该模型整合了两种神经网络结构的优点,相比前面提出的模型能更加有效处理行为数据中的时序特征。与前面基于卷积神经网络的端到端辍学预测模型的实验对比结果表明了其有效性和优异性,进一步扩展了辍学预测的方法,提高辍学预测的效果。(4)现有MOOCs学习者辍学预测模型的研究主要以历史数据研究为主,对于新开课程预测时机的探讨不多,但在实际应用中这是必须要面对的问题。为了探讨这个问题,本文首先将真实的MOOCs学习者行为数据集划分为历史课程和新开课程两部分,利用已有标记的历史数据训练提出的多个模型,然后使用新开课程不同时间长度下的行为数据进行辍学预测。通过对实验结果的分析找到新开课程不同时序长度的行为数据和预测精确率、召回率、F1值以及AUC值之间的变化关系,为实际应用选取一个合适的应用时机提供一定的参考。综上所述,本文针对面向行为数据的MOOCs学习者辍学预测问题,从数据预处理、有效特征提取以及模型预测能力提高等几个方面提出了相应的解决方案,并通过实验验证了它们的有效性。本文工作可以为今后的MOOCs学习者辍学预测研究提供一定的帮助。
其他文献
目的探讨pentacam检查角膜后表面高度对屈光手术方式选择的指导意义。方法选取行pentacam检查的患者1886例(3772眼)分析其检查结果,并选择适宜的屈光手术方式。结果对188例角膜
患者,男性,46岁,因间断心悸、气短9年,欲行射频消融术入院。心悸呈突发突止状态,持续数小时,自行缓解,无黑矇及晕厥。体表心电图正常。采用GE多导心脏电生理仪行心内电生理检
不放弃,坚持、坚持、再坚持女排精神,是20世纪80年代中国女排夺得五连冠之后的经验总结,其内涵如中国女排主教练郎平所说:"女排精神,不是赢得冠军,而是有时候知道不会赢,也竭尽
一、"一人一事多案"现象(一)"一人一事多案"的典型案例李某某户口登记信访案。李某某的小女儿李某系超计划生育子女,因无计划生育部门出具的证明,无法在当地派出所办理户口登记。针
对拟高粱在南京分期播种条件下生育进程的变化及其与温度和日长的关系进行了初步的研究。拟高粱播种至成熟全生育期为176~141天,随播期延迟而缩短。播期对播种至分蘖的天数影
为了充分利用优良草坪草资源,将冷季型草坪草菲尔金早熟禾引种到桂西南选点建坪试验。结果表明,菲尔金早熟禾能够安全越夏,耐热耐旱性好,青绿期长,具有较好的建坪效果。
随着检验技术的发展,全自动血细胞分析仪已代替了原来的手工操作,虽有快捷、简便的优点,但也出现了假性血小板减少的结果,现对1例少见的由抗凝剂引起的血小板减少症报导如下:
为防穿孔腐蚀和边部腐蚀,欧洲,日本的钢铁企业和汽车厂家一起开发了一系列汽车用预涂产品,比如以GA为基板,预涂含锌的环氧树脂有机涂层产品,其中采用了颗粒直径为12μm的FeP颜料等
本文试用幼苗根冠淀粉水解法判断4个优良牧草及草坪草搭配品种的多年生黑麦草草伊爱卡,德比,帝王,鳄鱼的抗旱性及耐热性,其结果与田间调查,农艺评定结果相符,即抗旱性及耐热性高低排
一、民事诉讼法律监督的层次解析民事诉讼法律监督的体系化的构筑是建立在监督权力运行的结构价值区位要义基础之上的.属于法律监督权的“顶层设计”.第一层级立法价值设计——