基于深度协同交叉网络的推荐系统

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:langjitianya198411
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在当今信息大爆炸的时代,各式各样的信息令人目不暇接。这不可避免地导致信息过载,使得人们在检索自己感兴趣的信息时存在一定困难。因此个性化推荐系统的重要性不言而喻。现有的推荐算法大多数都基于协同过滤,而协同过滤算法的主要不足之处在于其难以应对数据稀疏性问题。此外,协同过滤算法仅利用用户与物品的交互信息进行建模,其所挖掘的隐式信息仍不够充分。大多数相关方法仅关注显式或隐式信息中的一种,导致推荐的准确度并不高。
  针对上述问题,提出了一种基于数据集成和深度协同交叉网络的推荐算法。首先利用用户对物品的评分以及物品的标签信息计算用户对于标签的偏好,据此预测用户对物品基于偏好的印象分。然后从已有数据中挖掘出用户的社交关系信息,具体做法是先计算用户相似度,随后为每个用户定义可信用户集,通过计算第三方评分者与该可信用户集的相似度,预测出用户对物品基于社交关系的印象分。最后将上述两种印象分进行加权平均,得出社交偏好综合分,实现数据集成。
  在网络结构方面,将现有的协同交叉网络与基于深度矩阵分解的神经网络进行融合。融合后的网络通过任务关系矩阵实现两个基础网络之间的知识迁移和共享,并以完全相同的用户集和互不相交的物品集作为两个基础网络桥接的工具。最终,在推荐结果不重复的前提下,两个基础网络在训练时能够相互协作。
  在推荐系统常用数据集MovieLens和Book-Crossing上进行实验,评估了算法在Top-K推荐中的命中率以及推荐列表排序质量。此外还评价了评分预测的效果,并验证所提出的方法在关于推荐的各项常用评价指标上均优于当下前沿的推荐算法。最后对方法中涉及的超参数进行了敏感性分析,并得出使方法能够发挥最佳性能的超参数的取值。
其他文献
随着RDF(ResourceDescriptionFramework,资源描述框架)数据的逐渐增多和SPARQL(SPARQL Protocol and RDF Query Language)查询处理场景的日益丰富,查询计划的生成面临很多挑战。一方面,现有的RDF查询处理系统在生成查询计划时比较耗时。另一方面,这些系统在生成查询计划时对代价的估计不够准确,且较少考虑查询执行的并行技术,使得查询执行
深度学习作为最强大的数据挖掘技术,在各个领域都有着广泛的应用前景。然而在基于云计算的服务模式下,如果用户数据中存在隐私敏感信息,那么将存在潜在的隐私泄露风险。同时,深度学习算法提取到的中间特征不具有抗隐私分析能力,也存在对应的隐私泄露风险。  针对深度学习应用在推理阶段面临的用户数据隐私泄露风险,模型分割部署模式基于深度神经网络层级连接的特点,将神经网络从中间层一分为二,分别部署在客户端与服务器端
学位
近年来,图规模和图数据量的快速增长使得分布式图计算吸引了越来越多研究者的注意。拥塞模型是分布式算法设计中最常使用的模型之一,然而带宽的限制使得一些复杂的图计算问题在时间复杂度(在分布式算法中多用轮数复杂度表示时间复杂度)上往往难以令人满意。分布式图性质测试是一种可以有效降低算法轮数复杂度的方法:根据给定图具备或者ε-远离目标性质,图性质测试算法会相应地以一定概率(通常为2/3)输出肯定或否定结果。
深度学习训练过程中,训练数据的传输路径一般为从磁盘到DRAM,然后再到GPU内存。该路径的效率很大程度上受限于磁盘I/O的性能。非易失性随机访问内存(Non-volatile Random Access Memory , NVRAM )提供了一种新的解决思路。NVRAM容量大,读取速度快,但写入速度相对较慢,因而通常和DRAM组合成混合内存系统,以改善系统性能。然而,目前绝大多数深度学习系统尚未挖
学位
随着社会公共安全需求的不断增长,高清监控设备已经遍布城市的各个角落,人们的一言一行都以图像序列的形式保存下来,传统的基于人眼分辨的模式不论是在成本还是效率方面都显得力不从心。行人重识别(Re-ID)的任务就是解决跨摄像设备下的行人匹配问题,通常被认为是目标检索的子任务,主要是利用行人步态动作、身体特征等更为全面的信息来识别人物,基于深度学习的行人重识别算法已经是当下一个热门的研究方向。  对比学习
学位
在分布式深度学习训练中,梯度和参数的同步通常会带来巨大的网络通信开销。现有的通信优化方法主要包括通过量化或稀疏的方式进行梯度压缩和一些通信模式的优化。然而,现有的方法一般对所有层和所有网络采用同样的压缩方法,忽视了网络中不同层的不同特性及不同网络的差异性,导致优化效果不理想。  针对现有优化方法的不足,提出一种基于模型结构特性的混合通信优化方法——Hylo。采用两种不同的策略对两种不同类型的层(卷
信息时代飞速发展,给人们生活带来便利的同时也带来了信息过载。推荐系统作为一种重要的工具在各种在线平台上为消费者带来了极大的便利。神经网络和注意力机制在自然语言处理等序列任务上有着突出的表现,因此也被迅速应用到了推荐系统中。神经网络相关的推荐算法主要是通过多层感知机来获取用户的总体偏好,而注意力机制相关的方法则主要利用其能够获取序列重点的特性来实现用户序列推荐。这些方法在隐式反馈推荐上分别取得了很好
学位
信息化时代,人们可以接触到大量信息,但相应地也给人们选择感兴趣的信息带来巨大挑战。伴随着信息爆炸,推荐算法得到了学术界和工业界的广泛关注。现代推荐系统的两个核心:一是学习用户和项目的嵌入(即将用户和项目转换为矢量化表示),二是对交互建模,其基于嵌入重建历史交互。作为现代推荐系统的核心之一,研究更好的学习用户和项目的潜在嵌入表示的方法非常有意义。  为了更好的学习用户和项目的潜在特征表示,设计和实现
学位
无服务计算,又被称为“函数即服务”,是云计算领域正兴起的一个事件驱动服务模型。在无服务模型中,应用由被单独执行和管理的函数组成,由用户请求触发并动态执行。目前,云服务提供商普遍采用容器或虚拟机来执行这些函数,在无服务模型中的函数通常执行时间很短(毫秒级)的情况下,容器和虚拟机的启动用时给响应用户请求带来了较高的延迟。同时,不同函数间的通信基本上依靠网络设备和共享内存完成,导致了很高的性能开销。  
学位
基于语义的用户意图识别问题属于自然语言处理问题的范畴,其本质上为一个多分类问题。随着互联网发展,人机对话系统的发展也越来越迅速,需求越来越明确,近年来得到学术界和工业界的重视。而人机对话系统中用户意图识别是很重要的模块,其准确性的提高对于系统生成合理回答有重要的意义。  目前意图识别的大部分方法都是基于语义,通过分析文本内容然后应用深度学习算法得到多分类结果。比如使用循环神经网络、长短期记忆网络以