基于评论文本的评分预测推荐算法研究

来源 :中国民航大学 | 被引量 : 0次 | 上传用户:napone
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网基础设施的日益完善和云计算技术的逐渐成熟,信息技术已经广泛应用在各行各业。面对规模庞大的数据,如何高效检索出所需的信息变得越来越困难,这就是所谓的“信息过载”问题。推荐系统能通过分析用户的历史行为数据,主动地从大规模的数据中提取用户感兴趣的信息呈现给用户,已经成为缓解“信息过载”的有效途径之一。然而,推荐系统仍面临着诸多挑战:(1)数据稀疏问题:用户和物品的交互记录以矩阵进行存储,往往每个用户仅跟少量物品产生过交互,这导致的矩阵稀疏问题将会增大推荐系统对用户建模的难度;(2)冷启动问题:对于一个新的用户(或物品),交互记录矩阵将新增一行(或一列)。由于新用户(或物品)可用于建模的信息不足,将产生不准确的推荐结果;(3)可解释性问题:目前很少推荐算法能给出推荐结果的推荐理由,极大地影响用户的使用体验。如何提高推荐结果的可解释性,是一个值得探讨的问题。针对上述问题,本文结合自然语言处理的深度学习技术,基于评论文本数据展开了推荐算法的研究,主要的工作如下:(1)针对数据稀疏和冷启动问题,提出了融合评论文本和评分矩阵的推荐模型。近年的相关研究都仅使用评分数据或评论数据,为了同时利用这两种数据,本文首先基于目前最新的预训练模型BERT来提取评论的通用语义信息,再以注意力机制度量每条评论的贡献以获取用户和物品特征;其次,等价变换出传统因子分解机模型的神经网络形式,能以一、二阶特征向量的形式,使评论数据和评分数据更好地融入到深度学习神经网络模型。实验表明该模型的评分预测性能取得更优的效果。(2)针对可解释性问题,提出了多维交互可解释的推荐模型。由于上述所提模型及相关工作都忽略了动态编码问题(即用户偏好应随不同的物品而发生改变),为此引入4种交互注意力机制来实现评论数据的动态编码。为了充分挖掘用户偏好,设计出汇聚注意力将4种交互结果汇聚为一条特征向量。随后,针对相关工作中仅能从单方面解释推荐结果的问题,依次设计了评论级别和方面级别的注意力机制来提高推荐结果的可解释性。实验表明,该模型既能保证评分预测性能,又能提供多层次的可解释推荐结果。
其他文献
期刊
一直较稳定的生丝生产,进入九十年代中后期,价格不断下滑,质量不断下降,产量不断减少,以致全国丝绸行业80%以上缫丝企业处于亏损状态,许多老牌大中型企业纷纷破产、转向。就万县商检辖
可控硅是一种半导体器件,可控硅主要作为可控开关来使用.络筒过程中防止重叠现象是通过电气控制线路中的间歇开关实现的,可控硅是一种良好的无触点间歇开关,它的性能大大优于
针对不同领域中广泛存在的多目标优化问题,设计具有普适性和高性能的优化算法尤为迫切。相比于传统的优化方法,多目标演化算法不仅具有优秀的全局搜索能力、良好的并行性和鲁
在人地关系日渐紧张的城市环境中,城市湿地公园景观提升是城市环境修复的重要组成部分,本文以沙颍河湿地公园景观提升项目为例,深入探讨在生态修复目标指引下,如何利用低影响
萧红是民国四大才女之一,她独特的成长经历与所处的时代背景使她能从女性意识出发,把唤醒人类的愚昧和改造国民的灵魂作为自己的艺术追求,在她的作品中能读出超乎性别的沉重
"具身认知"观视角下的手语教学以第二代认知科学为理论背景,强调语言学习过程的涉身性、体验性及环境的嵌入性。运用网络多媒体、手语虚拟演播室、手语虚拟现实技术,在"通用
目的探讨能谱CT在鉴别门静脉栓子性质方面的价值。方法回顾检测分析18例门脉癌栓和15例门脉血栓GE宝石CTGSI(Gemstone Spectral Imaging)图像的(40keV-140keV,间隔5keV)单能
会议
目的:评价多排CT与DSA在原发性肝癌伴门脉癌栓诊断中的作用及各自的影像学表现。方法:2009年1月至2010年4月,泰顺县人民医院和温州市人民医院收治的60例原发性肝癌患者,在B超
会议