Machine Learning Models and Visualization Research on Online Learning Behavior

来源 :陕西师范大学 | 被引量 : 0次 | 上传用户:mmtt001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来在线学习已经成为学习者获得知识的重要方式,它不仅打破了学习时间和地点的限制,而且可以很好的实现个性化学习,因此在线学习平台以前所未有的规模吸引了数百万学习者参与学习。在线学习平台提供的大型开放式网络课程MOOC(massive open online courses)为学习者提供了丰富多样的学习资源,为学生的在线学习提供了必要保障。与此同时,学生在学习MOOC课程中产生了大量的学习数据,其中包括:学生画像数据,学生学习结果数据,以及学生与课程的交互数据等等,这些多元异构数据反映了学生的学习方式和行为,也给机器学习模型在教育领域的应用提出了挑战。利用大数据分析、机器学习模型和可视化技术,可以采集学习平台学生的学习数据,挖掘有用的学习信息,对数据进行处理、建模,进行学习行为分析与评价,探索数据背后的各种学习行为,然后根据这些技术做出合适的决策来改进学习过程,为不同学习情况的学生提供个性化的管理与教学,提高教育管理效率和学习效率。因此,学习行为分析成为当前教育应用研究的热点问题之一。学习行为的分析挖掘促进了机器学习和深度学习模型的优化,基于机器学习的学习行为分析已有诸多相关研究论文发表,学者们提出了多种模型预测学生学习行为和学习结果,从而提高教育管理和学习效率的分析模型。然而,这些模型在实际应用中仍然存在以下几个问题:(1)大多数早期辍课预测模型无法量化学习者的辍课风险,并对学习者的辍课风险进行可视化分析,从而i不能为最需要帮助的学习者提供个性化的即时帮助。(2)大多数辍课预测模型和学习结果预测都是基于特征工程构建的,采用不同的学习行为特征预测结果可能差别较大,导致预测准确率不高。(3)在线学习数据是多元异构的,目前多数有监督预测模型依赖大量的标注数据,对这些数据进行标注费时费力,成本较高,且存在大量无标注数据未充分利用。(4)机器学习预测模型缺乏可解释性。预测结果以数值表示,无法呈现学习者的学习模式,教师和教学管理人员无法从预测数据了解到哪些视频的哪些片段学生感兴趣,哪些片段是被跳过学生不感兴趣或比较简单的内容。针对上述问题,本文研究了机器模型的优化,提高辍课率和学习结果预测的准确率。除此之外,设计了一个学习行为可视化系统,直观呈现学生的学习模式和过程,辅助分析和解释预测结果,并对学习模式相似的学习者进行聚类分类。本文的主要工作和贡献如下:(1)基于逻辑回归模型和输入输出隐马尔可夫模型,提出了一种早期辍课率预测模型EIARS,该模型基于特征工程,提出了一个提取与辍课率相关重要特征的算法,采用逻辑回归模型,增加L2-正则化转换学习函数平滑连续几周的预测值,减少全局误差,防止模型过拟合,采用输入输出隐马尔可夫模型作为评价模型,根据连续前几周的学习数据预测本周有辍课风险的学生,并结合可视化方法解释、识别有辍课风险和辍课率最高的学生,从而对高危学生进行干预和帮助。实验结果表明该模型较其他传统机器学习辍课率预测模型具有较高的准确率。(2)目前多数辍课预测模型依赖特征工程,需要人工提取特征,成本高、耗时长,难以处理来自不同平台或具有不同特征的不同课程的新数据集。为此提出了一个深度在线预测模型DOP,该模型采用结合LSTM和CNN混合架构的深度神经网络模型,由数据转换算法DT将原始日志按照时间和学生行为转化为一个二维矩阵作为模型的输入数据。由于学习者在给定时间段的学习行为受其历史行为的影响,结合CNN和LSTM模型的混合架构,能够有效捕获原始数据中的时间因素,自动提取重要特征,从而得到较高的辍课预测精度。为了解决类别不平衡问题,定义了基于成本敏感技术的自定义损失函数CLF,根据学习者的活动和实际学习课程的天数推算成本,从而针对不同的类别调整权重,解决不平衡数据对预测结果的影响,提高辍课预测性能。来自不同平台数据集的实验结果表明该方法较其他辍课率预测模型具有较高的准确率。(3)鉴于现有的学习行为分析模型大都无法对学习者的学习模式进行分类,且多数模型无法根据学习者的视频学习细节(如暂停、快进、回退等)分析学习者,提出了一个基于图卷积神经网络的异构图半监督分类模型,简称Res-GCN。该模型构建了一个异构知识图G=(V,S,Xv,Xs,E),表示学习者、课程视频和知识概念之间的关系。模型将学习者的视频学习分为四种模式:“高参与度”、“正常参与度”、“有风险”和“有潜在风险”进行辍课率和学习结果预测。由于已有数据集缺少标记数据,提出了一个能够自动标记输入和输出数据集的标签函数LF,降低了数据标记成本。实验结果表明,与传统机器学习模型和相关工作相比,Res-GCN模型具有更高的分类精度。(4)为了提高机器学习模型的可解释性和透明性,设计了一个可视化分析系统(MOOC-ASV),对学生的视频学习数据进行可视化分析,辅助机器学习模型解释辍课率和学习效果的预测结果,从而优化教学策略,帮助学生提高学习效率。该系统基于图论,构建了学习者-视频二部图GLV,引入Louvain社区发现算法得到学习者节点的结构,引入struc2vec算法捕获学习者结点结构的相似性,采用k-means聚类算法对struc2vec得到的结点向量,将学习行为相似的学生聚在一起,从而识别辍课率风险高的学生类别。此外,该系统提出了使用了利用率UR对学生结果进行评估的指标,能够有效评估学生的学习效果。
其他文献
近年来,挥发性有机物(Volatile Organic Compounds VOCs)的排放日益增长,严重危害环境空气质量以及人类健康。目前已有大量技术应用于VOCs的去除,在众多去除VOCs技术中,催化氧化技术被认为是具有潜在应用价值的技术手段之一。当前已有大量催化剂应用于VOCs的催化氧化,如稀土氧化物、过渡金属氧化物、贵金属催化剂等,而在众多过渡金属氧化物中,Co3O4具有价格低廉、环境友好
学位
作为建构民族国家、面向工农兵,又异于“五四”的文艺形态,延安文艺的复杂化成因除了时代和政治的因素之外,还与其特殊的地理环境有着千丝万缕的联系。在特殊的空间场域内,共时性存在的文学形态与“在地性”的自然和人-地环境联系在一起,同时流动性空间场域又让文学地理从一个核心区域扩展到多个相似区域,形成“同一”的文学空间。在这“同一”的文学空间内,召唤了各地文人奔赴延安,在普遍的文学想象中,形成了知识分子与民
学位
随着世界人口的增长和城市生活污水的大量排放,包括药品、内分泌干扰物和个人护理用品等新兴污染物(Emerging Contaminants,ECs)在环境中被频繁检出,由于具有较强的极性、水溶性以及难挥发性,ECs大量/不间断的使用和排放会造成环境中“假持久”的存在,成为人体健康和生态环境最大的潜在风险,严重可能导致某些生态系统的灭绝。因此,有必要开发先进的技术以除去环境中的新兴污染物。目前已经开发
学位
牟宗三对知识和道德关系的处理体现了“穷智见德”的脉络。“穷智”的目的是凸显认识心的限制性,但这不是最终目的。突出认识心之限制性只是为了逼显道德主体,由认识领域升转到道德领域。然而两个领域并不是截然二分的,它们毋宁只是一个领域,只是对不同的主体而呈现出不同的面相。故此,“穷智见德”须从主体的角度理解。道德领域的涌现不是建立在对知识领域的否定基础上,而是通过主体的转进直接建立在知识领域上,或者说赋予其
学位
革命历史叙事,镌刻着峥嵘的革命岁月,蕴藏着深邃的历史智慧,凝聚着厚重的文化记忆,承载着独特的审美理想,因而其对于开掘民族革命史诗、弘扬民族传统文化、重铸民族精神灵魂、建构民族审美气韵意义重大。1990年代以来,在“后革命”历史氛围中,伴随着世俗消费主义、非理性主义、反思现代性等文化思潮的影响,中国当代革命历史叙事(主要指后革命历史小说、新历史小说)往往立足于个人化、民间化、主观化、感性化的价值立场
学位
金朝是女真族建立的少数民族政权,立国前女真族文化落后,建立金朝后,积极学习吸收汉文化,随着民族融合进程的深入,女真统治者受儒家思想熏染,儒学修养逐渐提升,表现出对儒学的心理认同,为儒学的发展提供了良好的环境。儒学影响下的金代文学,继承儒家诗教观,主张文以明道,追求《诗经》以来形成的风雅传统,并且在具体的文学创作中有所体现。本文主要研究金代儒学对文学产生的影响,包括金代儒学背景的介绍,金代儒学对文人
学位
混沌系统对初始条件具有高度的敏感性。作为一个混沌系统,从相空间中几乎相同的初始点开始,发展到随着时间推移,变得不相关的轨道上。尽管如此。研究表明,同步这类系统,使它们在同一混沌轨道上演化是可能的。对混沌系统同步的研究,已经从两个或多个混沌系统,由于耦合而将其运动的给定特性,调整为共同行为,逐步拓展到复杂网络上混沌系统的同步研究。由于诸多实际系统,均具有复杂网络特征。因此,对其进行深入研究,不仅会改
学位
如今,世界各国(地区)的旅游需求和供给对接紧密,旅游服务贸易已成为世界重要的服务贸易类型。伴随全球国际分工体系发生深刻变化,识别不同国家(地区)旅游服务贸易国际分工角色、演变过程及原因,把握中国参与旅游服务贸易国际分工的角色定位与发展趋势,对于中国旅游业在经济全球化中发挥竞争优势,及提高国际竞争力具有重要的现实意义。因此,构建旅游服务贸易国际分工分析框架,揭示全球旅游服务贸易国际分工格局及形成原因
学位
复合材料是工业革命和科技革命的产物,是科技产业的一项重大突破。自从20世纪50年代金属陶瓷被发现,复合材料的时代被正式开启。结构材料的不断发展,推动着功能材料的不断进步。其中,磁电复合材料作为一种高性能的结构材料和功能材料,无论是在基础领域的研究,还是实际应用方面的探索,磁电复合材料都取得了骄人的成绩,但是满足终端需求的商品化器件尚未问世。如今磁电材料的发展进入了一个瓶颈阶段,在现有的研究基础上怎
学位
纸质档案、图书、古旧字画、古籍善本批量化脱酸为国际前沿课题,我国数量巨大的古籍、古旧字画、档案、图书、报纸酸化严重,亟待脱酸。美、德等国研究出以水、有机溶剂承载的“液相渗透偏碱性缓冲材料中和纸张中酸性物质”为特征的脱酸技术,但存在散页处理、预先分选、脱酸不彻底、效率低、价格昂贵等问题,特别是不符合我国纸质文物、古籍、档案、图书酸碱性纸张混杂装订的实际,更无法对古旧字画进行无损脱酸。本文从国际现有脱
学位