论文部分内容阅读
近年来,科技快速地发展使信息量出现爆炸式增长,导致用户很难找到自己想要的信息而出现“信息过载”的问题。推荐系统作为信息过滤的常用方法,是解决“信息过载”的一种有效方式。推荐系统的核心是推荐算法,它决定推荐系统的性能。协同过滤技术作为一种推荐算法现已应用于推荐系统中。但这类算法的有效性有限,只能学到用户和项目的浅层次特征,而无法学到深层次的特征表示,因此制约推荐算法的性能。此外,数据量太大会出现数据稀疏性问题,这也会影响推荐精度。深度学习技术应用于图像与语音等方面取得突破,原因是该方法能够通过深层次的非线性结构学习交互数据信息,这样就得到数据深层次表示特征。因此许多专家和学者提出一些利用深度学习的方法应用于推荐中。这样就能有效处理协同过滤算法及其扩展算法存在的缺陷,从而获得较好的推荐精度。但这些方法还存在挖掘隐含信息能力不足和数据稀疏性问题导致推荐结果并不是令人很满意。因此,本文对国内外的评分推荐的算法进行相关研究,在协同过滤的评分推荐算法研究上,重点对基于深度学习的评分推荐算法进行深入研究,包括挖掘隐含信息能力、信息利用、数据稀疏性和推荐精度等若干问题。本文的主要工作包括:1.本文对推荐系统、协同过滤及深度学习等理论基础知识进行了阐述,并且调研了国内外相关评分推荐算法研究现状和存在的不足。其次,详细地介绍基于协同过滤评分推荐以及基于深度学习评分推荐算法。最后针对当前评分推荐算法推荐精度不高和信息获取能力等不足问题上,利用相关评分推荐算法框架并提出深度混合评分推荐算法和基于自我注意力的双重学习评分推荐算法。2.现有的Wide and Deep推荐算法应用于APP推荐具有较好效果,而直接应用在评分推荐上却面临着推荐精度较低、模型无法共享输入和信息挖掘能力不足问题。针对这些问题,本论文首先利用用户-项目评分历史记录构建共享输入数据。其次,在Wide的模型基础上将其修改为能挖掘隐藏用户信息能力模型而不只是利用用户的记忆能力。为此,我们提出了基于Wide and Deep模型的深度混合评分推荐算法(DeepHM)。在真实的MovieLens 100K和Movielens 1M数据集上的对比实验表明,即使数据存在稀疏性问题,DeepHM算法推荐精度也有一定的提升。3.当前基于深度学习评分推荐算法包括DeepHM等研究主要集中在提升推荐的精度与信息挖掘能力。但它们只用到用户与项目直接的交互信息,而不考虑用户-用户和项目-项目之间等隐含的交互信息。鉴于此,本章通过双重学习机制来学习用户-项目和项目-用户的信息。其次,结合用户自我注意力机制、项目自我注意力机制和交互式自我注意力机制,这样就可以学到特定用户的对不同项目权重。在此基础上,我们提出了基于自我注意力的双重学习评分推荐算法(DLSA)。在MovieLens 100K和MovieLens 1M数据集上除了不加入文本信息对比算法外,我们还比较了加入文本信息的对比算法。实验表明,我们提出的DLSA算法在MAE和RMSE两个指标下均能够获得较好的推荐效果。