论文部分内容阅读
随着互联网基础设施的日益完善和云计算技术的逐渐成熟,信息技术已经广泛应用在各行各业。面对规模庞大的数据,如何高效检索出所需的信息变得越来越困难,这就是所谓的“信息过载”问题。推荐系统能通过分析用户的历史行为数据,主动地从大规模的数据中提取用户感兴趣的信息呈现给用户,已经成为缓解“信息过载”的有效途径之一。然而,推荐系统仍面临着诸多挑战:(1)数据稀疏问题:用户和物品的交互记录以矩阵进行存储,往往每个用户仅跟少量物品产生过交互,这导致的矩阵稀疏问题将会增大推荐系统对用户建模的难度;(2)冷启动问题:对于一个新的用户(或物品),交互记录矩阵将新增一行(或一列)。由于新用户(或物品)可用于建模的信息不足,将产生不准确的推荐结果;(3)可解释性问题:目前很少推荐算法能给出推荐结果的推荐理由,极大地影响用户的使用体验。如何提高推荐结果的可解释性,是一个值得探讨的问题。针对上述问题,本文结合自然语言处理的深度学习技术,基于评论文本数据展开了推荐算法的研究,主要的工作如下:(1)针对数据稀疏和冷启动问题,提出了融合评论文本和评分矩阵的推荐模型。近年的相关研究都仅使用评分数据或评论数据,为了同时利用这两种数据,本文首先基于目前最新的预训练模型BERT来提取评论的通用语义信息,再以注意力机制度量每条评论的贡献以获取用户和物品特征;其次,等价变换出传统因子分解机模型的神经网络形式,能以一、二阶特征向量的形式,使评论数据和评分数据更好地融入到深度学习神经网络模型。实验表明该模型的评分预测性能取得更优的效果。(2)针对可解释性问题,提出了多维交互可解释的推荐模型。由于上述所提模型及相关工作都忽略了动态编码问题(即用户偏好应随不同的物品而发生改变),为此引入4种交互注意力机制来实现评论数据的动态编码。为了充分挖掘用户偏好,设计出汇聚注意力将4种交互结果汇聚为一条特征向量。随后,针对相关工作中仅能从单方面解释推荐结果的问题,依次设计了评论级别和方面级别的注意力机制来提高推荐结果的可解释性。实验表明,该模型既能保证评分预测性能,又能提供多层次的可解释推荐结果。