【摘 要】
:
随着互联网的发展,信息过载成为人们获取感兴趣内容的一个重大挑战。推荐系统作为信息过滤系统的一个子集,能够根据用户本身的属性信息以及商品的历史交互记录来挖掘用户潜在的兴趣爱好与需求,大大减少了用户筛选信息的时间,对于提升用户体验、缓解信息过载问题有很大的帮助。传统的推荐算法通常只考虑了用户和商品的直接交互这种规则的欧几里得数据而往往忽略了实际场景中用户和用户关联,商品和商品关联等等构成的错综复杂的图
论文部分内容阅读
随着互联网的发展,信息过载成为人们获取感兴趣内容的一个重大挑战。推荐系统作为信息过滤系统的一个子集,能够根据用户本身的属性信息以及商品的历史交互记录来挖掘用户潜在的兴趣爱好与需求,大大减少了用户筛选信息的时间,对于提升用户体验、缓解信息过载问题有很大的帮助。传统的推荐算法通常只考虑了用户和商品的直接交互这种规则的欧几里得数据而往往忽略了实际场景中用户和用户关联,商品和商品关联等等构成的错综复杂的图结构,同时也经常忽略交互的顺序信息。而图神经网络通过聚集近邻节点的信息,直接在图结构上执行卷积,可以应用于像图这样的非欧几里得领域,有效捕获数据之间的依赖关系和高阶表示,因此近几年广泛地应用于推荐场景。基于此,本文提出了一系列基于图神经网络的推荐算法,利用图神经网络学习更加丰富的用户和商品表示进行推荐,包括两个研究工作和一个实际应用。具体而言,本文首先研究了异质图神经网络推荐算法,提出了融合长短期兴趣建模的图神经新闻推荐算法GNewsRec。其次,本文研究在异质图神经网络推荐场景下融合时序信息进行推荐,提出了时序感知的异质图协同过滤算法SHCF。最后,本文在微信“看一看”推荐场景下,应用工业界真实数据集,研究了基于包的推荐问题,并提出了包内与包间注意力推荐算法IPRec,以验证图神经网络推荐算法在真实工业推荐场景中的有效性。在真实应用场景中,我们面对的图结构通常是包含多种类型的节点和边的,即为异质信息网络(也称为异质图)。传统的新闻推荐算法包括基于用户-商品直接交互的协同过滤方法和基于用户历史交互的基于内容的方法大多都难以捕获交互的高阶信息,而通过异质图神经网络建模网络的复杂拓扑结构,保留异质信息网络的属性异质性,能够挖掘更加丰富的语义信息和结构信息,更好地建模用户和新闻的表示,提升推荐效果。因此,本文首次将新闻推荐建模成用户-新闻-主题的异质图,提出了一个新颖的融合用户长短期兴趣建模的异质图神经网络推荐算法(Graph Neural News Recommendation Model with Long-term and Short-term User Interest Modeling,简称 GNewsRec)。在真实新闻推荐数据集上的实验结果表明,我们提出的算法明显优于最新方法。更进一步,传统的基于异质信息网络的推荐算法或时序推荐算法都只考虑异质交互中的协同信号,或者仅基于自己的商品交互序列建模用户表示,前者难以捕捉用户的动态偏好,后者则面临常见的数据稀疏问题。在本文中,我们提出了一种新的时序感知异质图神经协同过滤模型(Sequence-aware Heterogeneous Graph Neural Collaborative Filtering,简称SHCF),该模型通过融合高阶异质协同信号和序列信息来解决上述问题。具体来说,我们首先通过添加属性信息丰富用户-商品二部图来构建异质信息网络,然后设计新的消息传递层来学习丰富的用户和商品表示。在用户嵌入方面,我们考虑使用位置感知的自注意机制来捕获用户随时间变化的动态兴趣,以及使用逐元素注意力机制来捕获用户对一个商品不同方面的细粒度静态偏好。在商品嵌入方面,我们对不同类型的属性信息设计了双重注意力机制,融合丰富语义信息以缓解数据稀疏性问题。在三个真实世界的数据集上的大量实验表明,与最先进的方法相比,我们的模型可以显著提高推荐性能。最后,为了验证基于图神经网络的推荐在真实应用场景中的有效性,本文在微信“看一看”的推荐场景下,研究了基于包的推荐问题,并提出了包内与包间注意力推荐算法(Intra-and Inter-package Attention Network for Package Recommendation,简称 IPRec)。具体而言,在包建模方面,本文提出了一个包内注意力网络来捕获用户与包交互的对象级意图,而包间注意力网络则作为包级信息编码器来捕获相邻包的协同特征。此外,为了建模用户兴趣偏好,本文提出了一个用户偏好学习器,该学习器配有细粒度的特征聚合网络和粗粒度的包聚合网络。在三个真实世界的数据集上进行的大量实验表明,IPRec的性能显著优于目前方法。此外,附加的模型分析表明了我们的IPRec具有可解释性和挖掘用户行为特征的能力。
其他文献
随着网络信息技术的协同式发展,网络及社交媒体上每时每刻都涌现出大量的图像及文本数据。其中,图像作为一种重要的信息承载媒介,往往呈现出数据量大、内容多且覆盖广等诸多特点。面对网络中海量且持续的视觉信息,单靠人工标注工作量大、成本高、差异多,且不利于提升图片分类及索引的效率。图像生成描述系统允许用户输入图像,并自动返回与之内容匹配的自然语言描述。该模式有助于节约时间和人力成本,实现机器对图像视觉信息的
随着第五代移动通信(The fifth Generation,5G)的大规模商业部署和工业4.0的极速发展,物联网(Internet of Things,IoT)应用从传统的机器类型通信向关键任务通信转变,并对通信的可靠性、延迟和IoT设备电池寿命等提出了多样化的需求。作为5G的三大关键场景之一,高可靠低时延通信(Ultra Reliable and Low Latency Com-municat
随着人工智能技术与大数据技术的飞速发展,医疗行业中数据的信息化也在不断地建设。随着医疗数据的建设和完善,人工智能技术开始辅助医疗的研究和发展。无痛分娩,在医学上被称为“分娩镇痛”,在这里具体指的是硬膜外镇痛。这种方式可以使孕妇在分娩时的疼痛感得到极大缓解,让分娩更加顺利,但是也会对孕妇和婴儿产生的不良影响一直备受争议。对于这个人工分析较为困难的问题,人工智能技术及大数据技术可以在研究和辅助分析方面
媒体内容作为一种可以携带丰富信息的传输载体,在社交网络中扮演着重要的角色。随着移动互联网的飞速发展,人们不再满足于信息接收者的角色,而是更倾向于制造内容和分享内容。通信技术也使得人们记录生活的方式由传统的博客转向媒体平台,图片、视频载体越来越受到人们的欢迎,因此人们也对媒体服务提出了新的需求。一方面为了提高视频的编码效率,并适应多样化的设备和复杂的网络环境,可伸缩视频编码(Scalable Vid
企业创新对当前我国经济实现结构转型,解决部分核心关键技术领域卡脖子问题具有重要意义。但需清醒明白的是,当前我国创新水平与创新能力建设已取得较大成就,但在研发投入水平等方面同国外发达国家相比还有较大差距。因此细化研究影响微观个体及企业创新动能的因素,不断提升企业的创新动力与能力具有较大的现实意义。本论文以融资约束的角度切入对企业创新的研究,创新性地引入了行业资源丰度和行业环境动态性的行业环境指标。本
随着APT组织的兴起,针对国家或者大型公司的APT攻击也逐渐被安全研究人员关注,其中APT攻击手法隐蔽,且通常使用Oday或者较新的Nday,难以防范,因此针对漏洞利用行为的检测在当前环境下是十分有必要的。本文提出了一种基于控制流完整性的漏洞利用检测技术,该技术通过处理器硬件跟踪能力对程序执行的汇编指令序列进行提取和恢复,从而准确透明无感知的获取到程序完整的运行时汇编指令序列,其中可能包含漏洞利用
信息隐藏技术是一种将秘密信息隐藏在自然载体中而不改变载体感知特性的科学。图像、视频、语音、文本等多种数字媒体都可以作为信息隐藏的载体,而音频隐写技术是以音频为载体进行隐写的技术。现有的音频隐写方法主要是人工设计的方法,在算法设计时需要大量的对应的专业知识,门槛高,还面临很多挑战。此外,在大数据时代,媒体形式丰富多样,若信息隐藏模型只能针对单一类型的载体进行嵌入和提取,其安全性是不够的。我们希望无论
随着互联网的发展,JavaScript作为一种功能完备的脚本语言,被广泛地应用于Web网站开发,但是由于这种程序语言具有动态执行、不依赖于平台等特性,在给开发工作带来便利的同时,也造成了严重的安全隐患,比如黑客们极易利用浏览器及插件的漏洞进行恶意代码的编写与执行。网络攻击技术的快速更新和迭代泛滥已经严重危害到广大用户的安全,因此面对严峻的网络空间安全现状,我们亟需对JavaScript的代码安全进
随着移动互联网的快速发展,移动应用程序逐渐改变了人们的日常生活方式。在应用市场中的应用数量指数级增长的同时,应用安全设计缺陷和恶意程序的增长也带来了严重的安全威胁,对当前移动应用自动化测试技术提出了挑战。当前,国内Android应用市场中应用功能日益丰富,不仅限于社交类应用,用户与应用之间、用户与用户之间的关联越来越紧密。国内多数应用都涉及了用户账号的注册和登录功能,部分应用核心功能与用户账号紧密
语义分割是智能驾驶领域目前仍具挑战性的重要研究问题之一,使用深度学模型处理语义分割任务已为学术以及应用界的主流。对于语义分割任务,在图像建模过程中考察图像的二维序列关系可以显著地提高深度学习模型的性能,在此基础上,非局部模块以及其他形式的注意力模块得以提出。本文的研究内容重点关注了基于注意力机制的图像序列关系建模以及损失函数的设计及改良,主要内容如下:1.针对图像序列关系建模问题引入注意力机制,利