基于图神经网络表示学习的协同过滤推荐算法研究

来源 :江南大学 | 被引量 : 0次 | 上传用户:jwpvinson
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
推荐系统作为一种高效的信息过滤工具,可以有效地缓解“信息过载”问题。协同过滤是推荐系统中使用最广泛的算法,它通过用户的历史行为分析用户偏好,建模用户特征,为用户推荐感兴趣的项目。由于协同过滤需要使用用户的历史行为数据,而这类数据相对于项目数量往往很少,因此协同过滤容推荐面临着严重的数据稀疏问题。最近,由于用户与项目的关联可以构成天然的二分图,基于图神经网络的推荐越来越受到关注。通过用户-项目二分图和图卷积的方法可以有效地丰富目标节点的信息,缓解数据稀疏。但基于图网络推荐仍存在问题:一是图卷积模型过于复杂,在推荐任务中并不能充分发挥其特征变换与非线性激活的作用来挖掘潜在关联;二是在聚合节点信息时,平等地看待各类关系,将他们不加处理直接与目标节点信息进行融合,导致了最终目标特征表达的不合理;三是目前图卷积的消息聚合方式为显式的加和或拼接,这导致了模型训练效率受到影响,在数据集较大时训练变得非常缓慢。另一种缓解数据稀疏的方式是引入辅助信息,如用户的行为信息、时间戳或者用户评论、物品简介等,但是目前使用行为信息的推荐模型仅挖掘了不同行为间的联系而忽略了用户间行为的联系,导致了行为信息不能充分刻画用户兴趣,基于图网络的模型也受制于显式的消息传递算法,模型训练效率不高。针对目前基于神经网络的协同过滤推荐算法中存在的问题,本文的研究内容如下:(1)传统的协同过滤算法使用one-hot编码生成的特征向量信息量稀少,对异构行为数据仅挖掘不同行为间的联系而忽略用户间行为的联系。针对上述问题,文中提出基于异构邻域聚合的协同过滤推荐算法。首先,使用图对用户和项目的异构交互进行建模,并利用图的连通特性构建邻域。然后,使用轻量级图卷积方法整合邻域信息,融入目标用户和目标项目的特征向量。最后,将融合邻域信息的用户与项目的特征向量输入多任务异构网络进行训练,通过丰富特征向量信息的方法缓解数据稀疏问题。在数据集上的实验证实本算法的性能较优。(2)基于图卷积的推荐算法采用的消息传递机制效率不高,导致模型花费大量的时间训练以及传统推荐模型通常仅使用一种用户行为数据训练模型,而单类用户行为无法充分表达用户兴趣。针对上述问题,本文提出了一种融合隐式邻域关联与异构特征的协同过滤推荐算法。首先,通过图对用户与项目的异构交互进行建模,并通过图的连通特性构建邻域;其次,通过隐式邻域聚合算法使得目标特征向量中能够融合更高阶邻域的有效信息,并减少模型训练的开销;然后,通过隐式项目交互为不同的交互关系分配权重,更精确地描述不同关联对用户或项目的重要性;最后,将异构特征输入多任务异构网络,通过融合基于全采样的多任务损失与隐式邻域关联损失优化整个模型。在Movielen-1m,Beibei,Taobao三个数据集上进行实验,使用HR与NDCG指标对模型进行评价,本模型得到的结果对比同类型的其他推荐模型在性能与训练效率上有一定提升。
其他文献
文本情感分析是自然语言理解的热门研究方向,是对含有情感信息的文本数据进行分析、处理和总结。传统的文本情感分析方法需要人工构造特征,耗费大量的人力和时间,比如传统情感词典分析方法。而机器学习算法对文本进行情感分析时,出现发掘信息不完整,获取文本数据特征稀疏的情况,例如循环神经网络。近些年,深度学习技术在自然语言理解领域取得了显著成绩,一定程度上能有效克服传统方法和机器学习的缺点,因此本文基于深度学习
学位
在弱光环境下拍摄的照片中,由于光照条件不充足,通常会导致生成的图像产生大量的噪声、颜色退化、低对比度和曝光不足等严重的问题,这不仅使得图像的可视效果难以接受,同时也丢失了许多细节信息。这种情况也对其他计算机视觉任务产生了严重影响,如目标检测、人脸识别、水下图像成像以及视频监控等。针对这些问题本文主要从缺失信息的恢复和光照场景的自适应两个角度进行了下列研究:1)由于低照度图像中通常含有严重的噪声,导
学位
在欣赏书画艺术作品时,观赏者可以从作品的静态笔触中感受到暗示性的运动,并且大脑中会对其感受到的运动进行无意识的运动模拟。这一心理现象在各种艺术文献中有着广泛的记载,并被归类为“具身美学”的重要感知模式之一。在实验美学中对这类审美现象有相关研究,但这些研究仍停留在审美偏好和脑神经活动方面,过去的研究和实践既没有尝试从大脑中获取想象的笔触运动的“数据”,也没有尝试在此基础上以新的形式重新创作艺术品。目
学位
文本情感分析研究人们在文本中表达的情感、观点、态度。细粒度情感分析是其中的一个细分领域,相比于研究文本整体情感的粗粒度情感分析,细粒度情感分析直接对文本中的实体进行情感分析,具备更多的实用价值。细粒度情感分析的目标是提取出文本中实体,并对根据句中观点对每个实体的情感倾向进行分类。按提取的项目不同,其可以分为方面项抽取、观点项抽取及方面情感分类三个子任务。本文主要研究方面情感分类和结合三个子任务的方
学位
近年来,癌症患者越来越多,并且癌症的死亡率也在不断增加。对于大多数癌症患者来说,传统的物理和化学治疗方法不仅昂贵而且效率不高。此外,一些抗癌药物在杀死癌细胞的同时也会损害正常细胞,患者长时间服用这些药物会使癌细胞产生耐药性。因此,迫切的需要开发新的更加有效的药物。而多肽作为一种高特异性、选择性和对人体伤害小的安全可靠的治疗候选药物,近年来备受研究者的青睐。随着多肽药物数据的增加以及机器学习算法的快
学位
由于小目标具有尺寸小、分辨率低的特点,一直以来是目标检测任务的难题。小目标的识别不能单纯使用一个尺度的特征图预测,需要针对小目标的特点设计合适的检测模型,利用全局语义信息和多尺度特征图进行识别。本文从特征增强的角度出发,提出了新颖的特征融合模块、注意力模块、特征金字塔模块,并将这些模块应用到经典的检测模型中,以提升小目标检测的精度。如下为本文针对提升小目标检测精度做的三个主要工作:1)第一个工作是
学位
曲线拟合与重构是计算机辅助几何设计领域中一个重要的基础研究课题,其相关技术有着广泛的应用。B样条具有优秀的形状表达能力、良好的局部控制能力和连续性,是在曲线拟合中最常见的方法。由于曲线拟合问题中基函数的选取有着重要的影响,因此根据具体问题和约束的不同,学者们也会提出不同于B样条的基函数应用其中。而正交函数系作为一类有着诸多优势的函数却很少被用于曲线拟合,其中一个重要的原因是传统的连续正交函数系基函
学位
近年来,人工智能在医学领域大放异彩,特别是在图像分割领域,取得了很大的进展,现代医学中,医生往往根据不同的医学图像诊断病情,并作出相应的治疗计划。医学图像多种多样,每种图像都有其各自的特点以及擅长的地方。如计算机断层扫描(CT)、超声成像、磁共振成像(MRI)等。借助机器学习算法,我们使用计算机程序处理不同模态的医学图像,帮助医生提高诊断效率。在癌症的治疗中,放疗是最重要的手段之一,对绝大多数癌症
学位
纺织品瑕疵检测是纺织品质量监控的关键环节。视觉显著性可以模拟人类的视觉机制,快速定位具有显著性特征的目标,因此基于视觉显著性的纺织品瑕疵检测很有研究价值。本文研究对象为图案具有复杂周期性变化的纺织品,根据纺织品图像具有周期性的特点,利用图像的自相关性取得最佳分块模板,解决传统算法提取图像周期波动较大的问题。针对原上下文视觉显著性算法仅考虑局部显著差异性的不足,同时计算相邻像素块的全局和局部显著差异
学位
在精准医疗时代,从多组学水平对癌症进行亚型分型成了研究的热点。基于多组学数据进行癌症亚型研究可以利用不同组学上的信息融合,在分子层面更准确的识别癌症亚型。本文将机器学习的方法应用在多个癌症数据集的多组学数据上,通过提出不同的算法对癌症亚型进行研究,发掘不同癌症亚型中的生物标志物,为推动精准个性化医疗作出贡献,主要从以下三个方面开展研究工作:1.CSNF聚类算法及肿瘤亚型研究。基于CCA算法和SNF
学位