基于聚类和图卷积网络的推荐算法

来源 :重庆大学 | 被引量 : 0次 | 上传用户:jldxxys
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着越来越多的图卷积网络(GCN)成功应用于推荐任务,人们发现训练大规模GCN十分困难。由于随着图卷积网络层数增加,嵌入学习需要聚合的邻居数量出现指数级增长,造成的结果是基于小批量梯度下降算法的图卷积网络模型计算成本高昂。为了解决以上问题,本文提出了基于聚类图卷积网络的推荐算法(Clustering Graph Convolutional Network for Recommendation,Rec-cluster GCN)。Rec-cluster GCN将用户-项目交互二部图聚类为多个子图,限制每个节点只聚合来自同一个子图中相邻节点的信息,而不是聚合完整图中的所有邻居信息。Rec-cluster GCN不仅减少大量的计算时间成本,并且能在不牺牲太多准确性的情况下训练更大的图。通过应用节点增强技术,Rec-cluster GCN的性能得到了进一步提高。实验结果表明,Rec-cluster GCN优于大多数基准算法。LightGCN和LR-GCCF是缓解过度平滑问题的先进模型,但是在探索高阶图卷积网络时这些模型会导致不同偏好的用户变得相似、项目变得同质化,甚至引入了负信息等问题。本文认为所有节点的唯一性丢失是导致高阶图卷积网络中过度平滑问题的主要原因。为了解决以上问题,本文提出基于高阶聚类图卷积网络的推荐算法(High-order Clustering Graph Convolutional Network for Recommendation,HC-GCN)。通过在高阶图卷积网络中进行聚类,HC-GCN不仅一定程度上保持节点的唯一性,从而缓解过度平滑问题,而且将具有相似兴趣爱好的用户和具有某些相似特征的项目分成一类,限制信息的传播仅限于相似的用户、项目,减少负信息的引入。实验结果证实,HC-GCN总体优于基准算法,实现了先进的性能。此外,根据本文的研究发现HC-GCN存在两点问题,一方面算法没有将各个子图信息结合来综合考虑各个子图中节点的信息,另一方面当用户对于流行性项目存在偏好时,算法应该采取分配不同的权重的策略,而不是简单使用对称正则化。为了解决以上问题,本文提出结合子图信息与流行性的HC-GCN扩展模型,并针对Gowalla、Yelp2018、Amazon-Kindle Store等数据集进行了实验。相较于LightGCN,HC-GCN扩展模型的recall在三个数据集上分别提升了3%、3.4%、12%。与最近提出的IMP-GCN相比,HC-GCN扩展模型的recall分别提高了2.2%、1.3%、8.8%,从而验证了HC-GCN扩展模型能够有效解决当前发现的问题。
其他文献
随着物联网技术的持续发展,卷积神经网络的边缘端部署逐渐成为了新的技术发展趋势。如何在存算资源受限的边端实现高效的神经网络部署,也成为了目前学术界与工业界研究的热点。深度可分离卷积技术能在保证计算精确度的同时,有效降低网络模型复杂度,能满足边端网络部署轻量化和准确率的需求。研究面向深度可分离卷积神经网络(Depthwise Separable Convolutional Neural Network
学位
由于互联网的快速普及,越来越多的网络用户在互联网上发表自己的观点评论,这些观点评论中包含了大量的情感信息,利用这些情感信息可以有效的促进社会的经济发展,维护社会的稳定。因此,文本的细粒度情感分析逐渐成为自然语言处理的热点问题。本文主要针对基于方面类别的情感分析任务(ACSA)展开研究,提出了基于多示例学习的方面情感联合分析模型(ACSA-MIJLN)和基于双注意力的联合方面情感分类模型(AS-DA
学位
近来,目标跟踪技术应用愈发广泛,尤其是在许多工业应用中起着不可替代的作用。为了适应复杂多变的跟踪环境,热红外摄像机也被运用到视频图像采集中。热红外图像可以补充解决可见光下的光照条件敏感问题,可见光图像又可以助力解决热红外图像中的热交叉问题。可见光摄像机采集RGB数据,热红外摄像机采集T数据,这两种模态数据提供了强大的互补信息,将“RGB+T”数据联合完成跟踪,从数据的角度来说也被称为RGB-T跟踪
学位
随着科学技术的发展,互联网的崛起为人们带来了方便快捷的实时通讯,非结构化形式的网络文本数据呈指数级别增长。信息来源不同、用户用语习惯不同导致文本数据多变且无特定规则,这阻碍了计算机理解文本含义以及分析出精准有效的信息。实体链接就是解决这一问题的关键任务。作为自然语言处理领域的基础性工作,实体链接旨在将文本中有歧义的实体指称项映射到给定的大型知识库中从而消除实体指称项的歧义。本文通过调研实体链接国内
学位
在日常生活中,优化问题无处不在。科学技术的迅速发展逐步加剧了生活中实际面临优化问题的复杂度。对于求解复杂的优化问题,群智能优化算法有着效率高、适应性广的优势。粒子群优化(Particle swarm optimization,PSO)算法是一种常用的智能优化算法,它具有参数少、收敛速度快、易于编程等优点,将PSO算法应用在实际问题中,能够获得良好的性能。但由于存在过早收敛和全局搜索能力的薄弱的缺点
学位
现代化发展中城市的扩张与人口的增长使得相关的交通问题愈发严重,尤其是道路利用率低下和交通堵塞的问题。交通流预测旨在根据城市交通网络中的路网结构和历史交通流数据等信息对未来时刻的交通状态进行预测,有利于广大用户提前做好出行规划和政府合理规划城市交通,是目前解决上述交通问题的重要手段之一。然而,交通信息中存在由复杂的道路网络和动态的交通条件所带来的复杂时空依赖性,且时空特征之间相互关联和相互影响。因此
学位
随着移动互联网技术的发展,社交网络已成为人们日常生活的重要组成部分。大量有价值的信息在社交网络中传播,这些信息的分享为人们生活提供便利的同时也给用户带来了极大的隐私威胁。社交网络合成图作为一种既能表示原始社交网络属性又不泄露真实数据的生成图数据,可以供数据收集者分析出准确的网络属性特征。本文以差分隐私模型为基础,研究如何将本地化隐私保护的数据收集机制和社交网络图合成机制有效地结合,从而保护社交网络
学位
传感器技术是当代信息产业的重要支柱之一,随着物联网技术的不断发展,传感器越来越多地应用到了人们生产生活的各个领域,与之如何有效分析这些数据,充分挖掘传感数据所隐含信息是一个重要的研究课题。基于机器学习和深度学习的时序传感数据分类算法已经得到广泛应用,相比传统方法能更好地提取数据深层次的特征,可以达到更好的识别效果。然而,此类方法往往依赖于大量有标签的训练样本,而这在许多实际情况下是难以获得的。迁移
学位
表情识别是研究和判别人类情绪的一种重要途径,随着社会的不断进步,情绪的价值和表达也越来越受到关注和重视。本文通过调研发现,在虚拟现实(Virtual Reality,VR)情境下,特别是沉浸式VR情境下,参与者的情绪会由于VR高度的沉浸感和真实感得到更充分自然的引发和调动。此时参与者的情绪状况可通过愤怒、轻蔑、恶心、恐惧、高兴、悲伤以及惊讶七种表情进行识别和监测。然而使用沉浸式VR的头戴式显示器(
学位
根据第七次全国人口普查主要数据显示,我国正逐渐步入老龄化社会,老年人的健康看护问题需要重视。通过步态来检测独居老人的异常情况并预警,可以给予其及时的帮助。因此,本文提出了基于震动信号的异常步态识别方法,主要的创新性工作有:(1)设计开发了震动信号采集系统。该系统以智能硬件为基础,针对多传感器协作采集数据时,各传感器采集到的数据不一致甚至不同步的问题,提出了基于二阶矩的信号分割方法用于从采集数据中识
学位