基于图自编码器模型的学生成绩预测

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:kevinsnower
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统对学生成绩进行预测的方案往往需要手动筛选特征或需要大量的先验知识和专家知识。因此提出使用深度学习的基于图自编码器模型(Graph-AE)的学生成绩预测方案,该模型可以不经人工干预自动提取特征,且不需要大量的先验知识。将Graph-AE模型与13种经典推荐算法进行对比,实验结果表明,Graph-AE模型在学生成绩数据集上的效果比传统解决方法准确度更高,能够更好地刻画学生与课程之间的相关性和差异性。
其他文献
数据挖掘与机器学习技术日益趋向成熟并且被广泛应用于实际问题的处理中,但该领域仍面临着诸多挑战,如不平衡数据集分类问题。利用过采样技术处理这类问题时,通常只考虑数量的不平衡,而不考虑数据分布是否平衡。利用信息熵度量数据集的局部密度信息,从分布上考虑数据集的不平衡程度,并提出了基于熵的危险集的概念和它的三种使用策略,即基于熵的危险集过采样算法、基于熵的安全集过采样算法和基于熵的自适应过采样算法。竞争性的实验结果表明,这些算法可以有效提升经典过采样算法的性能,为进一步利用信息熵理论研究不平衡数据集提供了成功的实
综述了基于机器学习的遥感图像超分辨重建技术的研究和发展。基于机器学习的遥感图像超分辨率重建技术通过学习低分辨图像与高分辨图像之间映射的关系,提升遥感图像的空间分辨率,从而有助于遥感图像的视觉分析。根据数据表达方法的不同将基于机器学习的遥感图像超分辨方法分为两类,包括基于字典学习的方法和基于深度学习的方法;简述了各类方法针对的问题,分析其设计思路和实现原理;对各类方法的优缺点和性能指标进行了对比分析
伴随自然语言处理快速发展,自动问答系统(Question&Answer,QA)受到研究者的广泛关注。基于表格的自动问答(Table QA)实质是在给定自然语言形式的问题文本条件下,利用表格知识库信息进行查询推理得到答案的过程。从语义解析方法角度分析了基于表格知识库的问答模型、算法特点及其相关问题,同时结合人工智能技术的发展,重点探讨了表格自动问答技术的难点以及未来可能的挑战。
基于骨骼的动作识别因不受人体物理特征的影响,简单清晰地传达了人体行为识别的重要信息而受到广泛关注。传统的应用程序骨架建模通常依赖遍历规则的人为设置而导致表达能力有限和推广困难。因此,在近年来热门的时空图卷积网络(ST-GCN)模型基础上提出了一种新的划分骨架关节点的分区策略。该策略相比于原始分区方法加强了身体相对位置之间的关系,从而有利于提高骨架关节点信息在时间和空间上的关联。与此同时,在训练过程
针对高速公路场景下的车辆目标检测问题,提出了一种改进的YOLOv4网络对交通场景下车辆目标进行检测的方法;制作了一个多天候、多时段、多场景的车辆目标数据集,并依据数据集得到检测模型;提出多标签检测方法,并在多标签之间建立约束关系,得到更完善的车辆信息;提出了一个图像拼接检测方法,将多幅图像通过拼接层连接后进行车辆检测,以此提升网络的运行效率。实验结果表明,多样化数据集提高了车辆检测精度,减少了车辆
动态非平衡数据分类是在线学习和类不平衡学习领域重要的研究问题,用于处理类分布非常倾斜的数据流。这类问题在实际场景中普遍存在,如实时控制监控系统的故障诊断和计算机网络中的入侵检测等。由于动态数据流中存在概念漂移现象和不平衡问题,因此数据流分类算法既要处理概念漂移,又要解决类不平衡问题。针对以上问题,提出了在检测概念漂移的同时对非平衡数据进行处理的一种方法。该方法采用Kappa系数检测概念漂移,进而检测平衡率,利用非平衡数据分类方法更新分类器。实验结果表明,在不同的评价指标上,该算法对非平衡数据流具有较好的分
针对P2P(Peer to Peer)借贷项目违约风险预测中财务信息不完全或质量较低、预测准确率不高等问题,提出了一种考虑平台社会网络关系的P2P借贷项目违约风险预测的方法。通过对P2P借贷平台社会网络相关信息进行分析,从社会资本的结构维度、关系维度和认知维度发掘其中具有风险预测价值的关键特征,即社会网络风险特征,并将这些特征作为预测指标用于违约风险预测,依据多种非线性预测方法分别构建基于传统财务指标预测模型和引入社会网络风险特征后的混合指标预测模型,并对模型的预测结果进行了对比分析。实验结果表明,P2P
顾客作为产品满意度测度过程中评价决策的主体,对其进行分类研究,识别不同顾客群体异质评价特征具有重要意义。顾客评价特征存在多元性和冲突性,根本原因是顾客作为决策者的异质性,而顾客的异质性来源于顾客本身属性,包含分类型属性和数值型属性。提出了一种基于惩罚竞争机制的混合属性顾客分类方法,根据数值型和分类型属性值的分布规律,给出了混合数据初始聚类中心的确定方法;建立了统一相似性度量模型,并引入惩罚竞争机制,实现了聚类过程中的基本迭代和自动优化聚类数。以某产品异质顾客分类问题为例验证了所提方法的可行性,继而通过"
针对伪近邻分类算法(LMPNN)对异常点和噪声点仍然敏感的问题,提出了一种基于双向选择的伪近邻算法(BS-PNN)。利用邻近性度量选取k个最近邻,让测试样本和近邻样本通过互近邻定义进行双向选择;通过计算每类中互近邻的个数及其局部均值的加权距离,从而得到测试样本到伪近邻的欧氏距离;利用改进的类可信度作为投票度量方式,对测试样本进行分类。BS-PNN算法在处理复杂的分类任务时,具有能够准确识别噪声点,降低近邻个数k的敏感性,提高分类精度等优势。在UCI和KEEL的15个实际数据集上进行仿真实验,并与KNN、W
从传统网络到物联网,分布式拒绝服务攻击一直是网络安全的隐患。为提高分布式拒绝服务攻击的检测率,提出基于概率图模型与深度神经网络的DDoS攻击检测方案。该检测方案由数据预处理阶段和攻击检测阶段组成,在数据预处理阶段,研究了正常数据包与攻击包的区别,分别从TCP、UDP以及IP数据包包头信息提取出较高维的统计特征,根据随机森林计算的特征重要性因子,保留了前22个特征用于流量检测。22个统计特征通过概率图模型的隐马尔科夫算法进行聚类,然后将聚类结果通过检测阶段的深度神经网络对网络数据进行进一步的检测。在CICD