论文部分内容阅读
随着在线信息的爆炸性增长,推荐系统成为了应对信息过载(information overload)的有效方法。推荐系统通过从用户历史行为中推断出用户兴趣,个性化地过滤有效信息。经典的协同过滤方法简单有效,却常常受限于评分数据稀疏和冷启动问题。因此,引入用户评论等额外信息成为提升推荐系统性能的重要方法。近年来,用户评论在推荐系统中扮演了越来越重要的作用,有效缓解了协同过滤方法的局限性。电商等网络平台鼓励用户撰写评论并从中挖掘多种信息用于用户-物品画像建模,改善推荐性能。随着深度学习在自然语言处理和推荐系统等领域的快速发展,用户评论文本得到了更有效的利用,D-ATT、Deep Co NN、NARRE等深度模型在用户-物品画像建模上取得了良好的效果。然而,这些深度方法中普遍存在几个问题:(1)只用物品特征代表用户兴趣,却没有考虑用户对物品特征表达的情感;缺少适应变长短语的能力,无法在准确完整地抽取物品特征和情感短语。(2)由于数据稀疏,从推荐任务中难以推断出细粒度的、领域相关的情感词语义;使用情感分类任务辅助提升推荐性能,但是推荐任务和情感分类任务的关系模糊不清。(3)过滤短语时,只考虑单词的局部上下文(单词组合)却忽略了全局上下文的影响(物品整体性质);只扫描一次评论文本,忽视了多轮迭代细化的作用。针对以上问题,本文依次展开以下三个工作:首先,本文提出了“基于双层自注意力评论建模的推荐模型”(Review Modeling at Multi-level for Recommendation)。该模型将用户-物品画像的建模划分为四个层次:(1)“短语抽取层”,建模单词长距离内的上下文,灵活地抽取变长的短语。(2)“短语关联层”,将“情感短语”和“物品特征短语”相关联,得到用户对物品特定方面的兴趣强弱。(3)“评论层”,独立建模每个评论,区分用户不同方面的兴趣。(4)“交互层”,将用户和候选物品进行匹配,计算预测评分。然后,本文提出了“基于情感分类辅助任务的推荐模型”(Sentiment Analysis Oriented Multi-task Learning for Recommendation)。该模型借助“情感分类辅助任务”引入额外监督信息来降低“推荐任务”的学习难度,通过在两个任务间共享短语的表示,使推荐任务更好地理解情感短语的语义。此外,模型通过注意力机制从共享表示中选择任务相关的短语,清晰地反映了两类任务的区别与联系。最后,本文提出了“基于物品画像迭代细化的推荐模型”(Iterative Refined Product Profile Modeling for Recommendation)。该模型使用多轮注意力迭代细化物品画像,第一轮只从局部上下文判断短语的重要性,构建物品的“粗画像”作为全局上下文(物品整体性质)。第二轮参考“粗画像”重新筛选短语生成“细画像”,达到消除部分噪声、丰富画像细节的目的。我们在来自Amazon不同领域的多个数据集上进行了全面的实验,结果显示基于均方误差模型整体上超过了最先进的方法,包括MF、D-ATT、Deep Co NN和NARRE。