基于xgboost算法的学生学习行为分析研究

来源 :北方工业大学 | 被引量 : 1次 | 上传用户:pretter
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着教育信息化的发展,学生的各种学习行为产生了大量的数据。为使数据发挥出应有的作用,运用机器学习算法探索和利用教育数据蕴藏的价值成为研究学者的研究重点。海量数据的出现为教育管理者提供大量潜在的价值,有助于提高管理者的管理效率,教育管理者可以根据学生的数据信息统筹规划,从教学方式管理、教学模式管理入手,提高管理水平,为学业有风险者提供预警。根据毕业生去向的具体情况,考研、就业、创业等不同的毕业去向对其学习行为的具体实施提出建议,为其提供符合其个性化需求的内容等。本文主要完成工作如下:一是采集学生学习行为数据,对本科生成绩等表、毕业生去向表进行清洗和整合,进行分类统计和分析,提取各种需要的特征,分类正负样本,形成优质毕业生表、确定去向表、考研就业表这三个表。二是在优质毕业生表、确定去向表、考研就业表这三个表上分别运用xgboost算法与knn算法、贝叶斯算法,将准确率、精确率、召回率的性能评价结果进行对比,并作出三维簇状柱形图直观展示对比效果。三是用网格搜索方法对xgboost算法模型在优质毕业生表、确定去向表、考研就业表这三个表上调整最优参数,以提升模型整体性能,并且得出三个表的特征重要程度得分排序,得到影响学生毕业去向的因素,得出xgboost算法在这三个表上建模的准确率、精确率和召回率以及预测毕业生去向。本文中使用xgboost模型算法在优质毕业生表、确定去向表以及考研就业表这三个表上建模,所得到的准确率、精确率和召回率性能评价方面整体上优于knn模型算法和贝叶斯模型算法。基于网格搜索调整xgboost算法最优参数的方法,能够提升模型的准确率、精确率和召回率。本文根据xgboost算法的特征重要程度得分属性,对比各组实验结果,对各组的重要程度得分进行分析,最终得出了以下结论:1.高考成绩、公共必修、专业必修、第一次四级成绩对毕业生去向有着重要的影响。2.年龄对毕业去向影响程度小,毕业去向和年龄关系很弱。3.毕业生去向预测准确率在70%左右,有的召回率达到90%,根据毕业生成绩和其他学习行为数据可以为毕业去向预测提供重要参考。
其他文献
量子模拟是量子信息科学的主要研究内容之一,它不仅可以研究传统的厄米量子力学系统,还可以研究新奇的非厄米量子系统及其相关现象。非厄米量子系统近年来因其新奇的特性和潜在应用价值受到广泛关注,如何模拟非厄米系统是一个重要的科学问题,已有对宇称-时间反演对称系统、宇称-时间反演反对称系统、赝厄米对称系统等典型的非厄米系统的量子模拟的理论研究,然而赝厄米反对称系统的量子模拟理论方案尚未被提出。本论文对赝厄米
学位
保险经济学现存的一个主要难题是人们常常为自己投保太少,窄框架保险研究属于保险设计领域比较新的课题,可以帮助我们更好地解释保险市场中的低保险需求现象,也可以为保险公司的管理者提供一些管理启示。本文研究了固定保费限制下窄框架对投保决策和最优保险设计的影响,以及模糊结构下的最优保险设计。本文首先针对保险行业长期以来投保少的现状,研究了窄框架对投保需求的影响,先介绍了窄框架背景下的固定保费的经典保险模型,
学位
大数据时代已经来临,传统行业向互联网转型不再是一个时髦的口号,积极主动地拥抱“互联网+”,不仅能提升自身的竞争优势,而且能赢得更多发展机会。对于广告行业,掌握了互联网和大数据技术,对在线广告不同场景下的转化率进行预测,并对其进行精准投放,一方面可以提升用户的平台使用体验,快速找到使用意愿最强的产品;另一方面可以提升广告主的投入产出比,挖掘其潜在客户。然而想要准确预测在线广告的转化率并非易事,主要原
学位
图像修复是将图像退化的过程加以估计,并补偿退化过程造成的失真,以便获得未经干扰和退化的原始图像的一种方法。有很多因素会导致图像的退化降质,比如成像过程中的各种模糊、噪声、摩尔纹、雾、雨等等。由于成本和技术工艺的限制,依靠提高成像设备的精度不断提升成像质量几乎是不可能的,那么利用软件技术来实现图像修复就变得尤为重要。超分辨率重建作为图像修复的主要工具,可以应对多种退化模式,提升退化图像主观效果和客观
学位
在分析真实世界的数据时,一项非常重要的工作就是去找出显著区别于其他样本的样本,这就是异常检测。现如今,随着实际问题愈发复杂、数据量级不断增长,异常数据不断出现新的形式,且类型已知或未知的异常点已经是不可避免的了。因此,异常检测在现代数据分析中已经占据了非常重要的地位。从早期的基于统计方法的异常值检测,到如今的基于深度学习的异常检测算法,诸多学者已经从不同角度对异常检测进行了研究,但异常检测领域中仍
学位
呼吸运动是人和动物维持生命的重要生理过程,是由神经系统控制的简单的节律性运动。位于腹外侧髓质的pre-B(?)tzinger复合体对于呼吸节律的产生起着关键作用。细胞内的离子浓度和外部刺激均会使神经元的放电活动发生变化,甚至会产生病态的呼吸节律。因此研究细胞内离子浓度和外部激励参数对呼吸节律的影响及转迁机制有重要意义。本文主要探究了pre-B(?)tzinger复合体神经元模型中离子浓度和外激励对
学位
随机偏微分方程(简称SPDE)的随机粘性解在近20年提出并受到关注.本文考虑的随机偏微分方程有两类:一类是非线性随机偏微分方程,另一类是多值随机偏微分方程.对于一般的非线性随机偏微分方程,本文在Buckdahn和Ma等人的研究基础上,考虑了系数在两种非Lipchitz条件下随机粘性解的存在性.对于多值随机偏微分方程,本文给出了这类方程随机粘性解的定义,并结合N’Zi等人的研究方法,证明了这类方程随
学位
随着信息技术,特别是计算机网络技术的迅速发展,数据信息呈现出多元化的特点,越来越多的数据也呈现出了函数型的特征。因此,函数型数据成为研究者们关注的焦点。函数型数据分析也被证实在生物学、医学、计量学等领域有很大的应用价值。针对响应变量是标量型、预测变量既有标量型又有函数型的回归情形,提出了一种广义部分函数型线性回归模型。采用函数型主成分分析法,对函数型数据进行降维;通过广义自协方差算子,建立了估计函
学位
机动车保有量的急剧增加导致城市道路空间资源分配失衡,从而引发了一系列的交通问题。信号交叉口作为城市道路的重要节点,其运行效率很大程度上决定了城市交通的整体运行状态。交通信号灯用来从时间上分离相互冲突的交通流,确保交叉口的交通安全。然而,随时间变化的交通需求和不当的信号配时往往容易导致交叉口排队长度和延误的增加,进而出现一些极端的拥堵现象,比如排队溢出和网络锁死。对于一些偏僻的路口或者固定检测器损坏
学位
目标跟踪在物流仓储、机器人自动化以及无人驾驶等诸多领域有着广泛的应用前景,而多目标跟踪是其中最具挑战性的研究方向之一。目前主流的多目标跟踪算法主要有两种研究思路,分别是将目标检测与数据关联相结合的TBD(tracking by detection)方法以及将单目标跟踪方法扩展到多目标场景的SOT(single object tracking)扩展方法。后者依托发展较为成熟的单目标跟踪技术,在跟踪鲁
学位