面向推荐任务的用户行为序列建模技术研究

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:yuyuallen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
用户行为序列是按时间排列的用户行为数据,反映了用户随时间变化的偏好特征。序列推荐系统通过序列化地建模用户的行为序列学习用户不断进化的兴趣,关注的核心问题是:(1)如何为用户精准提供感兴趣的商品,(2)在怎样的适宜时间点推荐。对于第一个精准推荐的问题,图神经网络模型由于能够建模序列中复杂的转移关系,在序列推荐领域具有很好的表现。但是此类方法面临两个挑战,首先是将序列转为图时,物品的顺序信息缺失;其次由于图神经网络存在的过平滑问题,物品间的长期依赖关系缺失。对于第二个什么时间推荐的问题,大部分序列推荐系统重点关注下一个推荐什么,而忽略了什么时候推荐。在不恰当的时间对用户进行推荐不仅会使用户受到广告的打扰,而且会给服务商带来资源的浪费。适时序列推荐任务同时关注推荐的物品和时间。由于用户的交互行为可以类比为一个事件,点过程方法天然地适应适时序列推荐任务进行下一个物品和时间的预测。然而在具有海量物品的推荐场景下,点过程模型具有较高的训练复杂度以及不准确的时间预测的问题。针对以上的问题,本文从序列推荐任务出发,深入研究现有序列推荐方法的问题,通过设计新颖的模型以解决这些问题。本文主要研究以下内容:(1)我们提出了一个顺序感知的基于图的序列推荐模型(OAG-LC,Order-Aware Graph Neural Network with Long-range Connections)。为了有效地捕捉序列的长期依赖关系,我们利用序列中节点间的可达性关系将序列建模为图,并且为具有不同上下文信息的重复节点学到不同的表示;为了解决基于图神经网络方法中全局顺序信息丢失的问题,我们递归地更新节点表示,并且设计了新颖的门控机制保留序列的顺序信息和结构信息。相比于最新的基准模型,我们的模型在四个公开数据集上均有3%以上提升。(2)我们设计了一个时序点过程框架(SaNCE-TSR,a Temporal Point Process framework with Self-Adversarial Noise Contrastive Estimation for Right-in-Time Sequential Recommendation)在连续时间空间内进行适时序列推荐任务。为了解决在海量物品场景下,点过程模型的时间复杂度过高的问题,我们设计了噪音对比估计方法,通过区分正样本和噪音样本训练模型,并且设计了自对抗式采样方法适应性地采样噪音样本;为了解决点过程模型的时间预测不准确的问题,我们给两个常用的序列编码器增加了迭代式时间预测模块,使用自回归的方式预测时间。我们在五个公开数据集上进行了实验,相比于点过程和推荐两类模型,我们提出的方法在下一个物品预测任务上具有3%以上提升,在下一个时间预测任务上也达到了最好的效果。
其他文献
鸭坦布苏病毒(Duck Tembusu virus,DTMUV)为黄病毒科黄病毒属成员,是严重危害当前养鸭业的重要病原,造成重大的经济损失。DTMUV引起的疾病肆虐流行,主要引起鸭体重减轻、食欲不振、产蛋率下降甚至死亡等特征,其免疫逃逸和致病机制目前仍不清楚。本研究首次克隆了鸭的MAVS基因并分析了其在鸭天然免疫反应中的作用,积累了鸭天然免疫信号通路的研究方法和技术手段,也完善了鸭天然免疫研究平台
学位
深度强化学习是一种极具前景的技术,可用于解决现实场景中的各种复杂控制问题。然而,强化学习系统具有的三个特性使得验证工作变得十分困难,其中这三个特性分别是:(1)系统通常具有连续的状态空间;(2)系统的状态转移方程一般是非线性的;(3)部署在系统中的深度神经网络是不可解释的。因此,在缺乏有效的验证方法来确保可靠性的前提下,强化学习在安全攸关领域中的应用受到了一定的限制。为了缓解该现状,本文提出了一种
学位
长久以来,序列推荐一直是推荐系统领域的研究热点。大多数序列推荐模型仅关注用户行为序列的顺序建模,忽略了有效利用序列中的时间信息、深入挖掘其中蕴含的语义知识,因此推荐性能受到制约。时间信息建模对于序列推荐意义深远。一方面,用户交互行为的时间戳包含丰富语义,各类待利用的时间信息对于理解用户真实意图进而实现精准推荐十分关键;另一方面,时间信息具有容易获取的独特优势,序列推荐能够利用时间信息有效缓解数据稀
学位
强化学习是目前机器学习领域的热门方向,在游戏博弈,推荐系统等领域都有许多成功应用。强化学习通过与环境进行大量的交互获得反馈进行学习,根据与环境交互的行为策略与学习到的目标策略是否相同可分为on-policy和offpolicy方法,而后者是提高强化学习的样本利用效率的重要方法。本文研究off-policy强化学习算法如何根据行为策略收集的样本数据集学习一个新的具有良好表现性能的目标策略的问题。在以
学位
近年来,移动互联网的发展带来了诸多基于群组通信的应用,如在线会议,社交网络等,为人类日常生活及工作提供了极大的便利。群组通信安全也日益受到人类社会的关注,成为了当下研究的一个热点问题。利用群密钥管理技术可以实现群组间安全通信信道的建立。由于应用场景的复杂多变性,群密钥管理技术也亟临诸多挑战。本文主要讨论了群密钥管理技术在移动自组织网络、分布式在线社交网络两个场景中的应用。移动自组织网络、分布式在线
学位
伴随着互联网的快速普及与发展,全球上网人数不断增加,数据的生成量级也迎来爆炸性的增长,如何充分利用好海量的数据为人们提供智能化的信息服务一直以来都是计算机从业者所追求的目标。然而海量无结构的数据所提供的信息量是有限的或者说对于下游应用任务来说是不方便处理的,因此从无结构化的数据之中抽取出结构化的知识这一需求也日益迫切。关系抽取正是解决这一需求的重要任务,从纵向发展来看关系抽取是自然语言处理(信息抽
学位
G蛋白参与的信号转导途径是真核生物体内高度保守的信号通路,参与调控生物体内多种重要的生命活动。目前对于G蛋白的研究大多集中在动物中,植物中这一重要的信号通路的研究相对较少。水稻体内的异源三聚体G蛋白参与水稻体内多种重要的生物学功能,是水稻粒形调控的重要信号通路之一。已有的研究表明水稻异源三聚体G蛋白的三个典型亚基Gα(RGA1)、Gβ(RGB1)、Gγ(GS3和DEP1)均参与水稻体内的信号转导途
学位
高端民营医疗作为社会医疗体系的重要补充,有效填补了部分患者追求效率、舒适环境、人性化关怀、定制化服务流程等的需求空白。高端民营医疗的性质决定了其市场化特性和公司化治理模式。因此,管理者目标是通过建立高度信任的关系,来“拥有”客户,从而实现客户的终生价值,这就要求管理者需要不断改进经营管理模式来增加患者忠诚度。因此,本研究探讨影响高端民营医院患者品牌态度忠诚的因素和影响机制。本文首先对现有感知风险、
学位
微生物极广泛地分布在地球上,微生物不仅仅在自然界中,同时也在人类生产活动中扮演着极其重要的角色,然而我们目前为止所认识的微生物仅仅为其中很小一部分。分离培养及多相分类学鉴定自然环境中的各种微生物,可以丰富微生物资源库,对实际应用有很重要的意义。这对实际应用有很重要的意义。功能性微生态系统作为一种分解剂具有很高的效率,有助于解决环境问题。如果我们能够准确地理解微生物的价值,并根据需要使用它们,我们就
学位
随着区块链2.0平台的出现,智能合约成为了区块链的核心,区块链系统需要管理供智能合约访问的状态数据。这使得区块链系统的每个节点完整保留一份数据副本的全复制存储方式受到了巨大的挑战,尤其在吞吐率较高的许可链场景中这一问题显得尤为重要。近来,也有研究人员对离线区块数据采用拜占庭容错的分片存储来缓解这一问题。而状态数据,由于受到防篡改数据结构的约束,很难直接分片存储。本文主要解决区块链系统中的状态分片问
学位