基于集成树模型和深度学习的答题准确率预测研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:imyylam
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着移动互联网的兴起,线上教育平台也开始普及,随之带来的海量教育数据一方面为教育精准化提供了可能,另一方面也向数据分析机器学习提出了挑战。近年来,精准化教育受到了人们的广泛关注。学生学业表现预测正是精准化教育的一个重要方向,它涉及到对学生绩点、答题准确率的预测,它可以有效认识学生的学习情况,提升教育服务的精准性,降低学生学业负担;同时也能为教师优化教学结构,完善教学评价提供参考标准。所以,对答题准确率的预测研究就显得尤为重要。过去的主要研究方向是使用神经网络、随机森林、以及支持向量机的机器学习算法,都取得了不错的效果,但不同算法都有其局限性,且倘若不对不同类型数据赋予不同权重,将导致结果准确率受影响。本文基于海量的在线教育数据,并对不同数据加以不同权重,进一步提升了答题准确率预测的准确性,为精准化教育提供可靠参考。本文使用的数据集采集自在线教育平台,其目的就是构建合适的算法模型,根据教育平台历史数据,在数据驱动下预测未来用户答题的准确率。由于数据集较大,本文首先对数据进行了探索性分析,可视化特征趋势与性质并以此基础进行了特征工程。在进行初步的特征筛选后,本文选择了集成树模型和深度学习模型中的四种算法进行答题准确率的预测。实验结果显示,集成树模型比深度学习模型精度更好,训练时间也更短,这主要是由于深度学习网络往往需要精细的特征工程和调参才能达到比较好的效果。此外,本文对上述四种算法进行了模型集成。模型集成分为打包法和堆叠法,由于数据集较大,本文选择了打包法进行集成。为了确定合适的权重,本文使用了遗传算法进行搜索,在经过加权后,AUC的值提升了 6%,提升了预测的准确性。最后,对本文进行总结,本文主要通过评估不同模型的准确性,提供选择预测模型的依据,同时进行权重综合评估,得出当前最优解决方案,并针对局限性进行了讨论和分析。总的来说,未来的研究可以使用新型的深度学习算法,并量化深度学习特征的重要性,以更好地对比两类算法的实际效果,以推进精准化教育的实操手段。
其他文献
物流业作为国民经济的基础性、先导性行业,是国家“营改增”税制改革的首批试点行业之一。物流行业在“营改增”实施过程出现的运输企业进项抵扣不足、增值税发票虚开虚抵以及国家税收流失严重等问题,是困扰“营改增”税收有序开展以及行业健康发展的瓶颈之一。本文从“营改增”机制的科学设计、“互联网+税务”的有效管理以及“营改增”税收服务系统科学构建等三个方面展开研究,可为道路运输“营改增”税务困境的治理提供新的思
期刊
轻烃处理装置设备众多,导热油供热系统是装置的核心单元之一,导热油炉故障停炉,严重影响了装置的平稳运行,为了提高装置的运行时率,我们选择降低轻烃导热油炉停炉故障率作为研究内容。
期刊
随着人工智能技术的快速发展,网络数据规模呈现爆发式增长,导致用户无法快速地获取自己喜爱的物品,用户体验感差。个性化推荐算法作为能够有效缓解“信息过载”的重要方法,可以帮助用户精准定位到自己所需的物品。近年来深度学习在社会各领域地成功应用,使得基于深度学习的个性化推荐算法受到推荐领域科研人员的青睐。同传统推荐算法相比,基于深度学习的个性化推荐算法具有多层非线性结构,能够更有效地挖掘特征的深层次表达。
学位
随着国家对于创新能力要求的不断提升,STEM教育逐渐受到重视。经历起步和应用两大阶段,我国的STEM教育与中小学生综合能力的发展逐渐地融为一体,教育界对于STEM教育改变学生综合素养寄予厚望。现阶段,STEM教育已经逐渐融入到小学课堂,而在小学生STEM学习过程中,出现了小学生素养得不到提升、课程质量良莠不齐等问题。解决这些问题需要对小学生进行实证研究,虽然已有研究对STEM素养影响因素进行研究,
学位
群文阅读可改善传统阅读教学中学生唯分数的功利化学习情况。它不仅有利于营造良好的课堂氛围,且能使学生更好地适应信息快速膨胀的时代。传统思政课教学中引入群文阅读的教学理念,是满足课堂教学的内外要求和现实需要。在具体策略上,群文阅读教学理念通过红色经典文本切入,以议题设计、问题导向、文本与实际结合,以学生为主体和再现经典等方式,营造宽松课堂氛围,提高学生参与度,使学生在潜移默化中理解红色精神,传承红色文
期刊
随着单细胞测序技术的发展,目前在生物学上出现了一种能够同时测得一个细胞内不同模态数据的技术——单细胞多模态测序技术。单细胞多模态测序技术得到的数据提供了对细胞不同视角的刻画,能够进一步完善对细胞状态和功能的认知。CITE-seq技术是一种能够同时测得一个细胞内转录组数据和蛋白组数据的单细胞多模态测序技术。由于测序难度以及测序成本等因素的限制,目前能够得到的CITE-seq测序数据还比较少。然而单细
学位
装配式建筑是我国建筑行业的重要发展方向,在近些年来装配式建筑施工受到高度关注,应用范围也越来越广。相比于以往传统型的施工方式,装配式建筑在施工过程中涉及诸多的复杂技术,这就导致了装配式建筑工程中存在一些质量与安全管理漏洞,因此,需要工程监理加大对质量与安全的关注。基于此,本文主要分析BIM技术下装配式建筑监理质量与安全的管控措施,为装配式建筑工程发展奠定坚实基础。
期刊
当今时代,高维数据在各个领域出现得越来越频繁,如历史研究、医学、金融、社会发展等方面,给传统的多元分析理论及相关的方法带来了巨大的挑战。在高维数据假设检验的问题中,现有的方法有好的一面,同时也有一定的局限性:一方面,经典的检验统计量多数用正态近似计算p值,有很强的局限性;另一方面,经典的检验统计量在样本数据不同分量上的方差不同的情况下检验效果较差,经典的极限理论也就不再实用。故此基于Welch-S
学位
随着信息科技手段的发展,考试作弊手段层出不穷,即使在“作弊入刑”、无线电干预、高科技安检等多重手段下,铤而走险在大型考试中个人作弊,甚至组织多人作弊的案件时有发生,对教育公平的伤害极大,考试作弊甄别方法也成为考试研究的重点之一。当前,防考试作弊手段主要分为考前警告、考中监督、考后统计分析三层。考后的统计甄别手段中,答案抄袭统计(ACS)方法得到了较好的发展,但一直缺少较好的个人拟合统计(PFS)方
学位
党的十八大以来,以习近平同志为核心的党中央全面加强党对教育工作的领导,坚持立德树人,先后召开全国高校思想政治工作会议、全国教育大会等重要会议,深刻回答了事关高等教育事业发展、高校思想政治工作、办好人民满意的教育等一系列重大问题。实践深刻表明,思想政治理论课是落实立德树人根本任务的关键课程,加强学校思想政治工作,积极推进教育、教学改革势在必行。读原著、学原文、悟原理,是党的理论武装工作的优良传统,高
期刊