论文部分内容阅读
大数据时代的到来,给我们的工作和生活带来了诸多的便利,也带来了“信息过载”问题。为了解决互联网大环境中日益严重的“信息过载”问题,个性化推荐技术受到了学术界和工业界的广泛关注。个性化推荐的基础是用户的交互数据,核心是用户动态偏好的表征。围绕这个核心,基于个性化推荐中最受关注的序列数据和会话数据,本文提出了三个具体的研究问题。(1)基于序列数据构建推荐模型时,如何更准确地表征用户的交互意图和动态偏好?(2)基于会话数据构建推荐模型时,如何将用户的交互序列准确地转换成用户真实的交互模式?(3)如何准确地识别交互会话中用户不同的交互目的?现有的序列推荐模型大都以循环神经网络为主体,并采用统一的建模框架:以单个交互行为作为输入单元,对用户的交互意图进行建模,将循环神经网络的最后一个隐状态作为用户的动态偏好表征,生成推荐结果。实际上,用户的交互意图往往是由多个交互项以会话的形式共同表征的。因此,如何构建更合理的输入单元使其可以更好地表征用户的交互意图是促进推荐的一个重要因素。此外,仅使用循环神经网络的最后隐状态来捕捉用户偏好是不够的,因为循环神经网络的存储单元很难保留全局序列模式。因此,如何有效保留全局序列模式以促进用户动态偏好表征是增强推荐效果的另一个重要因素。针对以上问题,本文提出了一种新的分层的基于时间的定向注意力(HTDA)网络框架,该框架包括用户意图表征层和用户动态偏好表征层。具体来说,为了解决交互序列与用户真实交互意图之间的匹配偏差,本文提出了一种细粒度的用户意图表征方法。首先,通过引入时间阈值,对用户的原始的交互记录进行划分,以获得粗粒度的用户意图表征。然后,通过在粗粒度的用户意图表征上应用多维自注意力机制,以捕获交互项的交互特征之间的转换模式,进而获得细粒度的用户意图表征。为了捕捉交互的全局序列性,本文构建了一种新的基于时间的定向注意力机制。它通过引入时间因子使得注意力机制可以感知交互项的时间属性,通过引入掩码矩阵使得注意力机制可以捕捉输入单元之间的方向性。实验分析论证了本文提出的HTDA框架的有效性。相较于序列推荐,会话推荐中无法直接获取匿名用户的历史交互记录,交互数据更加稀疏,因此其对模型准确捕捉用户偏好的能力要求更高。现有的会话推荐模型大都是在如下的基本假设下进行构建的,即,交互会话中用户的交互项之间的序列关系与用户真实的交互模式之间是一一对应的,也就是说会话中相邻交互项之间的前后顺序关系是严格的不可逆的。实际上,会话中交互项之间严格的顺序关系并不能完全等价于用户真实的交互模式。因为会话中用户真实的交互模式并不是只有序列模式,往往还存在共现模式,是多种模式的交替存在。共现模式是指两个交互项总是成对出现在交互列表中,但两者之间并不存在明显的顺序关系。因此,如何将会话中交互项之间的序列关系准确地转换为用户真实的交互模式,将有助于以此为基础拓展推荐模型,并进一步增强推荐效果。针对以上问题,本文提出了一个增强的图神经网络(E-GNN)用于会话推荐。在E-GNN中,本文关注的是如何基于会话中交互项之间的序列关系识别用户真实的交互模式。为了识别会话中用户真实的交互模式,E-GNN综合考虑了所有用户的全局交互行为和目标用户在当前会话中的交互行为。具体来说,为了显式地建模当前会话中各种交互模式之间的耦合关系,本文首先基于所有用户的历史交互会话构造了一个加权全局项目图(WGIG)。WGIG中任意两个相邻节点之间的有向边的权重都由同一方向上的边的数量与两个节点之间所有边数之和的比率确定。WGIG中的权重值代表其对应的交互项之间的序列性和共现性的强弱,权重值越接近1代表序列性越强,越接近0.5代表共现性越强。然后基于当前会话中交互项之间的序列关系构造局部会话图(LSG)。LSG中每个节点代表会话中一个非重复出现的交互项,节点之间的有向边与会话中交互项之间的顺序关系相对应。最后利用本文提出的融合算法将LSG与WGIG中对应边的权重值进行整合,以获得代表用户真实交互模式的增强图E-GNN。该E-GNN通过门控循环单元学习图中各节点的表征向量,并利用注意力机制生成整个会话图的表征。实验分析论证了本文提出的E-GNN框架的有效性。会话推荐中如何根据有限的交互记录更加准确地捕捉用户当前的偏好一直是研究热点。前文已经探究了会话中用户交互序列与实际的交互模式之间的转换关系,并提出了一个新的基于图神经网络的框架。除了上述提到的用户交互模式的识别问题,交互会话中用户的交互目的识别也是一个非常重要的研究问题。会话中用户交互目的的识别会直接影响后续会话整体表征与用户真实偏好之间的距离。现有会话推荐通常利用注意力机制聚合会话中各交互项的表征向量以生成会话的整体表征,并以此代表用户偏好。以上研究范式的一个基本假设为一个会话中所有交互项都代表相同或相近的用户交互目的。实际上,一个会话中用户的交互目的往往是多样的,并且之间通常存在较大的差异。因此,如何准确地识别用户在会话中的交互目的以增强会话整体表征是增强会话推荐的一个重要因素。针对以上问题,本文提出了一个新的目的感知会话推荐模型(PASR)。在PASR框架中,首先基于用户当前交互序列构建交互会话图,以此来捕捉相邻交互项之间丰富的关联信息,从而获得具有强表达力的交互项表征向量。根据交互项之间的相似度,提出了一种交互目的识别算法(IPRA),对原始的用户交互会话进行划分,所得子会话分别代表用户不同的交互目的。然后,针对不同的交互子会话分别生成代表用户不同交互目的的表征向量。最后,利用线性变换将用户目的表征向量、短期偏好表征向量和长期偏好表征向量映射到统一的向量空间,并与候选集中的项目表征进行匹配以获得最终的推荐列表。实验分析论证了本文提出的PASR框架的有效性。