融合多源异构辅助信息的推荐算法

来源 :江南大学 | 被引量 : 0次 | 上传用户:huoyinghaiyangzhixin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网的飞速发展以及信息采集、分享方式不断丰富促使人们步入大数据时代,数据的急剧增加带来严重的“信息过载”问题,推荐系统便是针对这一问题所提出的,推荐系统分析用户的行为记录,挖掘用户的个性化需求,帮助用户找到他们感兴趣但很难被发现的产品。如今网络内容日益丰富,物品数目动辄百千万计,用户交互数据非常稀疏,导致大多关联分析算法效果一般;由于新用户、新物品可供分析利用的信息较少,很难给出精准的推荐,从而导致冷启动问题;同时,可帮助推荐的辅助数据例如:社交关系数据、物品评论、物品标签等,通常具有来源广泛、数据结构多样的特性,不便于分析利用,除此之外,推荐系统还面临着提升推荐结果的可解释性、提升系统的可扩展性等多方面的挑战。对于以上现状和挑战,本文采用深度学习技术,融合用户及物品的辅助信息来增强推荐性能,对于不同的辅助数据,采用不同的深度学习算法分析提取,构建更加精准的用户和物品特征表示;同时,挖掘用户的短期偏好,分析用户的社交关系,构建更加全面的用户画像,为用户提供更精准的推荐服务。本文主要针对多源异构辅助数据的分析和融合问题,提出了两种不同的推荐方法,论文的主要研究工作如下:1.针对数据稀疏和物品冷启动问题,提出的方法(MKASR、MSAKR)使用物品属性、标签、文本等辅助信息组织构建知识图谱,采用知识图谱技术深入挖掘分析物品和物品的语义关联关系,从物品辅助信息的语义关联角度构建精准且全面的物品特征表示,从而提升推荐结果的准确性和发散性。同时,在知识图谱表示学习模块和推荐模块融合方面,采用基于软约束的多任务学习方法,同时训练两个模块,使两个任务之间能够互相补充、互相学习、互相促进,以提升整体模型的准确性和泛化性。针对用户兴趣偏好难以捕捉的问题,提出的方法(MKASR)采用基于注意力机制的双向GRU网络分析用户近期的物品交互序列,挖掘用户的短期偏好;提出的方法(MKASR)通过Ripple Net算法提取用户到物品到知识图谱实体的关系对,并存储为三元组的形式,采用知识图谱相关技术分析挖掘这些关系对,从用户和物品辅助信息关联的角度挖掘用户的偏好。2.针对数据稀疏和用户冷启动问题,提出的模型(MSAKR)分析用户社交关系这类图结构数据,挖掘用户之间的信任关系。模型采用图卷积神经网络提取社交关系,创新的使用图中心性作为概率对邻居节点采样来过滤邻居,采用word2vec思想生成虚拟邻居来缓解社交数据的稀疏性,采用基于注意力机制的方式聚集节点邻居,通过分析用户之间的社交记录,构建蕴含信任关系和社交关联的用户特征向量,从而提升推荐结果的准确度。在真实的数据集上进行实验验证,提出的两个推荐算法在点击率预测和top-K推荐上均优于其他基准模型,证明提出的模块可以有效的融合多源异构辅助信息来缓解数据稀疏和冷启动问题,从而提升推荐性能。
其他文献
极限学习机(ELM)原理是利用一种基于单隐层前馈网络的学习算法,采用随机的方法确定输入层和隐含层之间的权值和偏置,通过分析的方法则可以进一步确定了输出层的权值,ELM克服了存在于基于梯度网络算法上的很多不足,如陷入局部极值、不合适的学习速率、学习速度较慢等,但ELM也存在着过拟合的隐患且单个算法稳定性相对较差。本文对此的研究工作如下:针对上述问题,本文提出了多样性正则化极限学习机的集成模型(DRE
学位
技术可以从一篇或多篇文档集合中得到总结文章主旨信息的简短摘要,并要求在遵循事实的前提下保持一定的流畅性。基于深度学习的自动摘要方法更接近人们总结摘要的思想,但其研究深度还远远不够,有待进一步深化。本文主要研究基于深度学习的单文档生成式自动摘要,并完成以下工作:(1)应用文本主题信息的短文本摘要研究。提出一种基于注意力机制和双向长短记忆神经网络的主题信息增强的自动摘要模型,并导入指针机制以避免OOV
学位
文本语义表示是自然语言处理的核心内容,也是文本理解、处理和搜索任务中最基本的工作之一。传统的文本表示方法通常无法充分建模文本的上下文信息,导致文本结构信息缺失、文本语义获取不充分。基于神经网络的方法虽然能获得相对较好的结果,但是其可解释性较差,严重影响了它的应用范围。考虑到知识在人类大脑中通常是以联想记忆的形式存在,论文从人脑联想记忆视角出发深入探究知识体系的内在结构,以探索一种新的文本语义建模技
学位
阿尔茨海默病(Alzheimer’s Disease,AD)是导致老年人死亡的最主要原因之一。其早期阶段为轻度认知障碍(Mild Cognitive Impairment,MCI),主要表现为记忆减退,判断能力下降等。发展到AD阶段则表现为记忆严重受损,情感变得急躁等,甚至日常生活不能自理。该病危害严重,不仅给患者带来巨大痛苦,也给家庭和社会医疗带来巨大负担。目前AD尚无法治愈,对该病的预防和早期
学位
频谱分析在信号处理中起着关键性的作用,其数学理论是正交函数系。地图曲线作为一类典型的几何信号,具有形态结构复杂、应用领域广泛的特点。本学位论文通过引入一类新颖的完备正交系——V-系统,展开对以地图曲线为代表的复杂几何对象的频谱分析。主要研究内容包括:本文第一、二部分:主要以地图曲线为例,实现基于频域滤波的线状要素化简方法和群组地图曲线的多尺度表达。首先,介绍了V-系统的基本理论和构造方法,并利用其
学位
本文在制度分析理论和科学社会学理论的指导下,对当前期刊论文撤销制度进行了梳理,在参考已有研究的基础上建立了期刊论文撤销制度学术净化效果的影响因素模型,以Web of Science中1951年至2021年的9089篇撤销论文基本文献数据、引用数据及其对应的撤销声明数据为主要数据来源,进行了变量的选取和操作化,将撤销后被引比例作为期刊论文撤销制度学术净化效果的衡量因素,在控制作者数量、参考文献数量、
学位
机器学习尤其是深度学习技术促进着现代医学的发展,在很多疾病的诊断过程中起到了重要作用。传统机器学习方法需要大量的数据来训练算法模型,而在智慧医疗领域,由于数据的来源涉及患者隐私,很难获取海量的生物医学数据进行公开研究,这给机器学习技术在该领域的应用带来了诸多挑战。在该背景下,本文主要结合EEG脑电癫痫信号和新冠肺炎肺部CT图像这两种生物医学数据的自动诊断问题,开展面向生物医学数据的小样本分类方法研
学位
点云的特征检测是点云数据处理中最基础也是最重要的一个环节,数据处理中的多数算法都与点云特征提取有一定的关联,例如:点云的配准、分割、曲面重建、重采样等。其中,点云配准技术在计算机视觉中起着举足轻重的作用,并且广泛应用于三维重建、目标识别与跟踪、智能机器人等领域,具有重要的研究价值。传统的基于点特征的点云配准技术,无法保证对应关系的准确性和效率。随着对测绘成果的要求不断提高,对配准技术的要求也随之提
学位
环状RNA(circ RNAs)-RNA结合蛋白(RBPs)结合位点在许多生物过程中起着重要作用。因此,研究RBPs在circ RNA上的结合位点是至关重要的。虽然基于传统机器学习和深度学习的方法已被用于预测circ RNA与RBPs之间的相互作用,但对已有算法还未能充分学习circ RNA的相关特征,也未能进行高效的协作学习。针对上述问题,本文研究两种用于circ RNA-RBP结合位点的识别方
学位
服装解析由于其在时尚合成、姿态估计等领域的广泛应用而受到越来越多的关注。随着卷积神经网络的快速发展,现有的服装解析方法在卷积神经网络技术的帮助下也取得了优异的性能,极大地推进了服装解析任务技术的研究和应用。但是由于人体形态多变、服装类别多样、目标对象尺寸差别大以及对象边缘模糊等特点,现有的服装图像解析方法很容易产生错误解析结果,特别是在一些相似和细小的服装类别上。同时卷积神经网络自身也存在重复的下
学位