基于注意力机制的学生成绩预测研究

来源 :河南师范大学 | 被引量 : 1次 | 上传用户:jimmyzcc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
教育数据挖掘旨在通过机器学习、数据挖掘等技术从教育资源中发现其内在规律,来解决教育教学过程中的一些潜在问题。学生成绩预测是教育数据挖掘领域的重要研究问题之一,其旨在利用与学生行为相关的信息,来预测学生在未来时间的学习表现情况,例如:学生能否顺利通过考试、考试分数、成绩排名等,从而实现对学生的个性化分析和指导。对学生成绩进行及时准确的预测,不仅有利于提升学习者的成绩,提高教师的教学质量以及学校管理者的管理效率,还有助于改善教育教学环境。此前,许多学者利用学生的各个属性特征对学生成绩预测的研究已取得不错效果。但是,目前的工作还存在一些不足,主要表现在以下3个方面:当前工作大多是基于传统机器学习方法的研究,深度学习方法少有涉及,预测准确率还有待于进一步提升;当前工作仅考虑已挑选的属性特征对学生成绩的影响,而忽略了未挑选特征的影响;当前工作假设各个属性特征对所有学生的影响程度是相同的,忽略了学生的个体差异。事实上,不同属性特征对同一学生成绩的影响程度不同,而且不同学生受同一属性特征的影响程度也不同。针对以上问题,论文以提高学生成绩预测模型的准确性与可解释性为主要目标,更全面准确地分析利用这些属性特征对学生成绩进行预测,实现对学生的个性化分析与指导。主要内容包括以下4个方面:(1)提出了一种数据预处理方法。该方法根据属性特征值特点对数据进行预处理,包括对二元数据进行数字编码转换、数值归一化、对成绩进行分组、删除异常数据等。(2)提出了一种基于自注意力机制的成绩预测方法。该方法对影响学生期末成绩的各个属性特征进行建模,通过引入自注意力机制为不同属性特征赋予不同的注意力权重,从而有区别地对待了这些属性特征对成绩的影响程度,提升了成绩预测的准确率。(3)提出了一种基于双路注意力机制的成绩预测方法。该方法不仅有区别地对待了各个属性特征对学生成绩的影响程度,而且充分考虑到了历史成绩与期末成绩的关联关系。该方法通过2次注意力计算分别得到各属性特征在第1阶段成绩和第2阶段成绩上的注意力得分,并考虑了多种特征融合方式,使得各个属性特征得到了更为全面准确地利用,最后基于融合后的特征对学生期末成绩进行更好地预测。(4)分别在两个公开数据集上对模型进行了验证,与支持向量机、逻辑回归、高斯朴素贝叶斯以及决策树等4种传统的机器学习算法在学生成绩预测结果上进行了比较,并进一步根据各属性特征在期末成绩上的概率分布对预测结果进行了可视化分析。结果显示,所构建模型能够更准确地预测出学生成绩,同时还具有良好的可解释性。
其他文献
随着超声医学的不断发展,临床对超声医学专业人才的需求越来越迫切。考评是评判学员是否达到预期教学目标的重要手段,单一的终结性评价已不能满足人才培养的要求。在超声临床教学中应用形成性评价能提高学员操作技能和诊断水平,培养处理问题、自主学习、人际沟通能力及良好的职业素养,为未来独立工作奠定基础。
期刊
图像对比度增强是图像处理的重要组成部分,也是图像工程应用领域研究热点之一。在目标识别系统中,由于光环境异常、成像设备局限性等因素的影响,会导致采集的视频/图像对比度低、细节信息模糊,进而直接影响目标识别结果。而弱小目标成像面积小,其识别精度对图像质量更为敏感,对观测图像进行对比度增强,有效提高图像质量是必不可少的预处理过程,因此,研究能够稳定输出高质量视频,进而提高弱小目标识别精度的增强方法具有重
学位
随着科技发展,人们获取信息的渠道增多,从图像中获取信息成为主流。图像中含有丰富的信息,但在采集、压缩、传输、存储的过程中往往会受到各种噪声的污染,导致人们无法从传播后的图像中获取完整的信息,影响到后续的图像处理研究工作。噪声污染让图像去噪工作在图像处理领域变得尤为重要,图像去噪工作在图像预处理环节成为必不可少的一步。图像去噪的目的是在保持重要的细节特征(如边缘和纹理)的同时,尽可能准确地从含噪声的
学位
<正> 为减轻大气污染,改善环境卫生和节约用煤,上海、北京和杭州等地,狠抓烟道除尘,收到了良好效果。目前,烟道除尘方法大致可分为离心旋风式和重力沉降式两种。重力沉降式除尘室的优点是构造简单、不用钢材、投资少,因而容易上马、收效快。本文主要介绍几个工厂应用重力沉降式除尘室(以下简称除尘室)的情况。一、上海燎原化工厂(图1) 该厂是一个大型化工厂,有四台二十吨锅炉,每天烧煤一百四十吨,以前是黑烟滚滚,
期刊
普氏蹄蝠(Hipposideros pratti),隶属于翼手目(Chiroptera)蹄蝠科(Hipposideridae),在我国主要分布于中南部各省,河南省仅分布于南阳市。普氏蹄蝠是典型的洞穴型蝙蝠,由于其栖息的许多洞穴被开发成旅游景点,严重干扰了该物种的生存,人为捕杀、农药和杀虫剂的使用等因素使得该物种的种群数量正在急剧减少。为了弄清河南省普氏蹄蝠遗传多样性现状,为该物种提供科学的管理和保
学位
棉花(Gossypium hirsutum L.)是世界上最重要的经济作物之一,是天然纤维和食用油的重要来源。我国是棉花种植大国,棉花种植面积高达3169.9千公顷(4754.8万亩),作为关系国民生计的大宗农产品,提高棉花产量是农业生产的重要课题。缩节安(Mepiquat chloride,MC)化控技术是目前棉花种植过程中运用最广泛的化学打顶方法,可有效抑制棉花过度营养生长,打破顶端优势,从而
学位
基于快速搜索密度峰值的聚类算法是一种基于密度的聚类算法,被广泛应用于数据挖掘、模式识别和生物信息学等领域。该算法能够自动发现异常点,且不用考虑簇的形状和它们嵌入空间的维度就可以去识别簇。近年来,已经吸引了无数学者追逐研究。但是,当前的密度峰值聚类算法仍有很多问题需要进一步研究和改进。由此,本文从密度计算方法、簇中心识别方法和点分配方法等方面研究,改进并提升密度峰值聚类算法的聚类性能。通过理论分析与
学位
豫中区作为河南省粮食生产的主要区域之一,冬小麦-夏玉米的种植模式保证了该区粮食的高产。目前该地区存在化肥使用量过多,农田温室气体排放和生产投入高等问题。本研究借助2010年开始的耕作与增施有机肥定位试验,采用二因素区组设计,探究不同耕作与施肥模式对2018-2020麦-玉两周年土壤氮素供应和生态效应的影响。不同处理具体为:深耕+有机肥(DTF)、浅耕+有机肥(STF)、免耕+有机肥(NTF)、深耕
学位
孪生最小二乘支持向量回归(Twin Least Square Support Vector Regression,TLSSVR)是在最小二乘支持向量回归的基础上提出的一种新的机器学习方法。它将孪生支持向量回归(Twin Support Vector Regression,TSVR)中二次规划问题的不等式约束条件修正为等式约束条件,大大降低了计算的时间复杂度。TLSSVR与SVR相比,它的计算效率得
学位
怀牛膝(Achyranthes bidentata Blume)是苋科牛膝属双子叶草本植物,以干燥根入药,具有多种药用成分,是河南省著名的“四大怀药”之一。其中齐墩果酸型三萜皂苷(Oleanolic acid triterpene saponins)和蜕皮甾酮(Ecdysterone)是怀牛膝中的主要活性成分,其主要代谢途径为甲羟戊酸途径(Mevalonate Pathway,MVA),受多种酶基
学位