论文部分内容阅读
在信息过载的时代,推荐系统在各种在线服务中发挥着举足轻重的作用,其目的是将用户的兴趣点与资源进行匹配。传统的推荐方法,如矩阵分解,主要是利用历史的用户-商品的交互记录来建模用户对商品的偏好。如今,各种各样的辅助数据在推荐系统中变得容易获取,并且这些信息可以用来提高推荐性能。近年来,由多种节点或边组成的异质信息网络(HIN)作为一种融合复杂信息的强大建模方法被提出,并成功地应用于许多数据挖掘任务中。由于异质信息网络在建模数据异质性方面的灵活性,近年来在推荐系统中也被用来表征丰富的辅助数据,这种设定下的推荐算法被称为基于异质信息网络的推荐方法。现有的基于异质信息网络的推荐方法主要依赖于基于元路径的相似性,并通常学习一种线性加权机制将路径相似性或隐层因子结合起来进行推荐。这些方法无法有效地提取和利用异质信息网络中丰富的辅助信息进行推荐。与此同时,以学习每个节点的低维表示向量为目标的网络表示学习在结构特征提取中显示出一定的潜力,并已成功应用于许多数据挖掘任务中。在现有的网络表示学习方法中,大部分都侧重于同质网络,不能直接应用于异质信息网络。因此,人们的注意力正日益转向异质信息网络的表示学习的研究,其目的是学习包含语义的网络表示来捕获复杂的结构和丰富的关系。虽然这些基于异质信息网络的表示学习方法在一些任务中已经显示出了有效性,但是它们通常只关注一般的节点表示,很少考虑针对推荐任务的具体表示。针对以上问题,本文提出了一系列基于异质信息网络的推荐工作,利用异构信息网络的表示学习进行推荐,包括三个研究工作和一个实际应用。我们从不同的层面来有效建模异质信息网络,即节点的表示层面,基于元路径的上下文层面以及局部和全局信息的融合表示层面。具体地,这些工作包括:(1)用户和商品的表示。本文提出了一种新的基于异质信息网络表示学习的推荐方法,称为HERec,用于充分挖掘异质信息网络中用户和商品的潜在结构特征。本文设计了一种基于元路径的随机游走策略来生成有意义的节点序列进行网络表示学习。学习到的节点表示首先由一组融合函数转换,然后集成到一个扩展矩阵分解模型中。最后将扩展矩阵分解模型与融合函数相结合对评分预测任务进行优化。(2)基于元路径的上下文的表示。本文提出了一种新的深度神经网络模型,该模型具有协同注意力机制,可以利用基于元路径的丰富上下文来进行排序推荐,称为MCRec。MCRec通过显式表示基于元路径的上下文,精心设计了一个三元神经交互模型。为了构建基于元路径的上下文,本文提出使用基于优先级的采样技术来选择高质量的路径实例。协同注意力机制以一种相互增强的方式改进了基于元路径的上下文、用户和商品的表示。(3)局部和全局信息的融合表示。本文提出了一个统一的模型LGRec来融合局部和全局信息,用于异质信息网络中的排序推荐。LGRec利用协同注意力机制对最具信息量的局部邻居信息进行建模,并通过优化多标签分类问题,学习有效的关系表示来获取HIN中的丰富信息。最后,我们将这两部分合并成一个统一的模型,用于排序推荐。(4)应用。在蚂蚁金服的蚂蚁花呗的真实数据集上,本文首先研究了套现用户检测和推荐问题,提出了一种基于层次注意力机制的套现用户检测和推荐模型HACUD。具体地说,本文利用属性异质信息网络在信用支付服务场景中,对不同类型的对象及其丰富的属性和交互关系进行建模。HACUD模型利用属性异质信息网络中结构信息的不同方面,通过基于元路径的邻居增强对象的特征表示。此外,HACUD还包含了一个层次注意机制来模拟用户对属性和元路径的偏好。