论文部分内容阅读
随着近年来信息技术的发展,互联网上的各类内容和信息与日俱增,信息过载现象越来越明显。个性化推荐系统作为缓解信息过载问题的主要方法之一,越来越受到各大互联网平台的重视。推荐系统的核心思想是根据物品和用户的特征以及用户的历史行为记录等信息,推测用户的个性化偏好并自动地给用户推荐其感兴趣的物品。其中用户的历史行为记录最能直接地反映用户对物品的喜好,也是推荐系统建模中最核心的部分。不同于传统的静态推荐方法只能建模用户的一般化兴趣,序列推荐(Sequential Recommendation)方法通过分析和建模用户的最近历史行为序列,能够捕获用户的动态兴趣和用户行为的序列相关性。尽管已有大量的工作研究了各种场景下的序列推荐问题,致力于通过一些强大的序列模型建模用户行为序列。但是这些典型的序列推荐方法都受限于对用户的单一行为序列建模,而忽略了群体的动态兴趣和用户不同行为序列的不同特点。在很多复杂的推荐场景中,不能简单地将交互行为记录概括为单个行为序列,而需要为不同的交互行为构建不同的行为序列。例如在序列群推荐问题中,需要融合建模群体中的每个成员的行为序列并捕捉群体共同的动态兴趣;在多频道场景的序列推荐问题中,为了细化考虑不同频道下交互行为的特质,需要对用户在不同频道下的行为序列进行融合建模并捕捉用户在当前频道中的动态兴趣;在稀疏目标行为(例如购买、分享行为等)序列推荐问题中,目标行为的稀疏性导致历史行为序列中的信息不足,因此需要引入具有丰富记录的行为(例如浏览,点击行为等)作为辅助信息,融合建模目标行为序列和辅助行为序列并捕捉用户基于目标行为的动态兴趣。为此,本文研究以上几个需要融合建模多个用户行为序列的的非典型序列推荐问题,所研究的问题和实验数据均来源于真实应用场景,具有科研和应用价值。本文的主要研究内容和贡献可概括如下:一,序列群推荐。序列推荐和群推荐是推荐系统领域中的两个重要分支,但是已有的群推荐方法忽略了群行为的序列性以及群的动态兴趣。本文首先融合序列推荐和群推荐,提出一个新颖的序列群推荐问题。该问题的主要挑战是怎么通过每个群成员的行为序列建模群的动态兴趣表示。为了解决该挑战,本文提出一种群感知的长短期图表示学习方法(GLS-GRL)。具体来说,该方法首先为每个群构建一个群感知的长期图和短期图,分别编码每个群成员的长期历史记录和短期历史记录,以及物品之间的全局共现关系。而后利用图表示学习分别建模每个成员在该群中的的长短期兴趣,并进一步自适应地融合着长短期兴趣以获得每个成员的动态兴趣表示。最后通过一个受约束的群成员交互注意力机制和池化聚合操作获得群整体的动态兴趣表示,该表示融合了每个群成员的动态兴趣以及群成员之间的关联信息。二,多频道序列推荐。为了显式地区分不同类型的物品,很多平台会将差异较大的物品归类为不同的频道。多频道序列推荐即基于用户在多个频道中的交互记录,推荐用户当前所在频道中的物品。该问题需要考虑用户在不同频道中的交互记录,融合建模用户在多个频道中的行为序列,并捕捉用户在当前频道中的兴趣偏好。为此,本文提出一个序列多融合网络模型(SMFN)来解决该问题。该模型首先利用两个门控循环单元(GRUs)分别对用户在当前频道和其他频道中的行为序列建模,得到用户在当前频道和其他频道中的行为序列表示。然后通过一个简单有效的融合单元(Fusion Unit)将一个行为序列中每个物品与另一个行为序列的整体表示进行融合,来表示这两个类别的行为之间的隐式交互。最后通过加和池化操作分别得到两个融合后的序列表示作为用户在当前频道中的兴趣表示。三,稀疏目标行为序列推荐。目标行为序列推荐旨在预测特定类型的交互行为(例如点击、购买、分享等行为)构成行为序列中的下一个物品。而当目标行为比较稀疏时(例如购买、分享等行为),仅利用目标行为的历史行为序列来预测下一个物品是比较困难的,而另外引入具有丰富记录的行为序列作为辅助信息能有效地缓解数据稀疏问题。因此在该问题中,主要挑战在于怎么融合建模多个类型的行为序列并缓解数据稀疏问题,以准确地预测用户基于目标行为的兴趣偏好。针对该挑战,本文首先基于所有用户的所有行为序列构建一个全局物品多关系图记录物品之前的全局关系,并递进式地提出了两个模型来解决该问题。(1)为了融合多个类型的行为序列以及物品与物品之间的全局关系,本文首先提出一个多关系图神经网络模型(MRGNN)。该模型利用图神经网络(GNN)建模全局物品多关系图中物品与物品的多种全局关系,并分别获得目标行为序列和辅助行为序列表示。接着通过一个简单而有效的门控机制自适应地融合不同类型行为序列的表示,获得用户在目标行为上的兴趣表示。(2)为了促进模型的训练并进一步提升推荐的性能,本文继续提出一个基于链接预测任务增强的多关系图神经网络模型(LP-MRGNN),该模型基于MRGNN模型进行了几点重要改进:(a)基于课程学习的思想,通过引入链接预测任务当成简单课程来学习以帮助推荐任务的早期训练;(b)为节点表示增加一个线性变换层以提升节点的表达能力;(c)通过边权选取更重要的邻居节点。并且通过全面的扩展实验,验证了 LP-MRGNN模型基于MRGNN的提升和每个改进点的贡献。