基于机器学习的学生学业成绩预测研究与分析

来源 :南昌航空大学 | 被引量 : 0次 | 上传用户:leizi525
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着科技时代的飞速发展,我国教育的现代化和信息化水平越来越高。现代化教学改革不仅带来了教学方式和方法的改进,也同时提供了大量的教育教学数据。为探究影响学生成绩的因素,更好地为学生学习、教师教育和教育管理提供有用信息,本文探索的是基于机器学习算法对学生成绩的预测与研究。运用机器学习算法对影响学生成绩的各种信息进行分析,并利用深度神经网络实现对学生成绩的准确预测。本文研究了基于因子分析法、分类决策树算法(CART,Classification And Regression Tree)、多层感知机算法三种机器学习方法的学生成绩预测和影响因素分析方法。首先采用因子分析算法来研究各因素之间的相互关系,通过主因子分析法来提取出主要因子,并创建原始数据载荷矩阵,最后利用最大协方差正交旋转,可以得到,旋转载荷矩阵。通过分析载荷矩阵来筛选出与各项成绩相关的因素,在此基础上提取综合表达数据的公因子属性,可初步达到预测学生影响因素的目的。其次采用CART决策树作为各项成绩的预测模型,分别讨论分类与回归两种预测情况,将提取到的公因子作为输入生成决策树,从而降低生成树的复杂程度,同时有效提高决策树的预测准确率。最终通过使用神经网络综合多种因素来实现学生学业成绩的综合预测。本文在上述研究基础上还探究了间接因素(成绩)缺失情况下的预测方法,通过随机掩码建立候选树的方式,在候选树之间作出预测。在前述的研究基础之上,构建基于多层感知机算法的神经网络模型,将直接因素与间接因素分别采用不同模块进行嵌入提取特征。同时本文沿用决策树中所采用的类似方法,对间接因素采用随机掩码方式进行嵌入,将两种因素的特征通过多层感知机网络学习融合,可以使得训练出来的多层感知机(MLP,Multi-Layer Perceptron)模型自适应的提取出不同的学生综合评价指标,从而能更好的对学生学业水平情况进行预测。本文通过选取两组不同的数据对所提出的算法进行了实验分析与验证,此两组数据在样本数量与样本属性上具有不同的规模,能够更好衡量模型的泛化能力和鲁棒性,使得模型可以达到更好的预测效果。
其他文献
多目标优化问题由多个相互冲突的目标组成;当目标数超过三时,被称为高维多目标优化问题。由于目标之间相互冲突的性质,通常需要一组最优解用于平衡各个目标;进化算法在一次运行中能够生成一组解,被广泛地运用在多目标优化领域,形成多目标进化算法。多目标进化算法的目的是生成一组无限靠近Pareto前沿并且分布均匀的最优解;然而随着目标数目的增加,出现种群的收敛性和多样性失衡、算法普适性下降、无法获得Pareto
学位
近年来,随着遥感技术的不断发展,遥感影像表现出多源、海量和高分辨率等特征,导致遥感数据呈现指数级增长,给影像金字塔构建和存储带来巨大挑战。因此,如何有效对海量遥感影像进行快速处理、存储以及提升查询效率是目前急需解决的问题。本文在使用Spark结合Geotrellis新型框架的基础之上,设计了一种基于Z曲线的Z-Curve瓦片索引,并结合Accumulo数据库完成对瓦片数据的存储和查询。通过实验验证
学位
图像修复是计算机视觉中一个重要研究分支,其目的是预测合理的像素信息来填补图像中的缺失部分,主要应用于对象去除、图像恢复和图像去噪等领域。现有的深度图像修复算法有两种:非盲修复算法和盲修复算法。非盲修复算法以缺损图像和其相对应的掩膜作为输入,该算法根据掩膜来确定缺失区域的位置。但由于图像缺损的多样性,在实际的修复操作中,难以获得精确的掩膜,因此难以满足实际需要。而盲修复算法解决了这个问题,只以缺损图
学位
随着数字化转型升级和图像处理技术的普遍应用,海量非结构化数据的产生为信息存储带来了新的挑战。为应对挑战,信息存储的载体逐渐由纸质载体转变为数字载体。相较于传统的纸质载体,数字载体具有占用空间小、存储时间长、传输速度快等优势。因此,纸质文档数字化已成为必然趋势。然而,在数字化过程中,由于各种误差的存在,使得文档图像通常会出现一定程度的倾斜、偏移或是透视,进而增加后续图像处理的难度。因此,在处理图像前
学位
现阶段,随着数字化管理的快速发展,现实生活中的系统日益复杂化,这些系统可以抽象表示为复杂网络,方便对其进行研究。社区结构作为复杂网络的众多特性之一,对其挖掘为认识复杂网络的拓扑结构和主要功能提供了新的途径。例如掌握犯罪小团体、控制公共舆论、购物平台的个性化推荐等很多问题都能通过识别网络中的潜在社区来解决。本文利用复杂网络的局部信息对网络中的社区结构展开研究,主要工作有:(1)提出了基于边界节点的局
学位
文字作为人类感知世界的重要手段,具有强大的表达能力,越来越多的领域需要利用场景图像中的文字信息。由于自然场景图像背景复杂、文本形状多变、尺度不一,目前的场景文本检测算法存在小文本漏检、长文本错检、相邻文本误检等问题,因此如何准确地检测出自然场景文本实例是一项具有挑战性的研究工作。针对上述问题,通过对文本检测算法进行深入研究分析,提出了一种高效的任意形状场景文本检测器:基于特征感知增强和图注意力的自
学位
向量优化问题是以多目标决策为背景的一类学科,是数学规划中的重要分支,而集值优化问题是向量优化问题的主要研究领域之一.本文主要研究了集值优化问题近似点集的连通性,连通性为两个解之间的连续性移动提供了可能,因此对于近似点集的连通性具有一定的研究意义.本文主要是在Hausdorff拓扑线性空间中研究近似点集的连通性,主要内容分为以下六个部分:第一章为绪论部分,首先对向量优化问题的研究背景以及发展历程进行
学位
随着移动设备的普及及其拍摄像素的不断提升,越来越多的用户通过这些设备采集表格文档图像。然而受拍摄背景、角度、纸张折叠卷曲程度、光照等多种因素的影响,通过移动设备采集的表格文档图像易出现形变、图像质量下降等问题,给信息提取造成极大困难。针对该问题,本文提出一种形变表格结构识别算法,通过将深度学习方法与传统算法有机结合,实现形变表格文档图像的自动识别与还原。本文的具体研究工作包括以下几个方面:(1)表
学位
同步是一个复杂的动态过程,是指系统之间通过调整各自的动态过程,达到某种意义下的协同运动。同步是典型的非线性现象,同时在实际工程中也有着广泛的应用。由于传播速度的有限性,耦合中常存在时滞。时滞通常会降低耦合系统的同步能力,缩小同步区域,甚至破坏系统同步。因此,耦合系统同步中的时滞效应必须考虑。为了提高时滞耦合系统的同步能力,扩大同步区域,本文通过切换策略来改变原来时滞耦合系统的耦合方式,提出了切换时
学位
近年来经常出现的雾霾天气凸显了经济发展过程中的资源环境问题,人们开始注重区域生态效率水平的提升。现有研究都局限于“要么市场,要么政府”的思维模式,而忽略了社会因素的影响。社会资本能否促进区域生态效率水平的提升?如果能,又是通过什么样的路径和机理?针对这些问题,本文基于社会资本的视角对区域生态效率水平的提升机制和策略进行研究,以期为区域经济与资源环境的协调可持续发展研究提供理论支持和实践指导。本文利
学位