论文部分内容阅读
随着信息技术的快速发展,以及数据量的爆炸式增长,“信息过载”已成为信息时代不可避免的问题。在解决“信息过载”问题上,个性化推荐系统正起着越来越重要的作用。推荐系统的目的是预测用户是否喜欢一个特定的物品(评分预测问题)或者为用户推荐N个感兴趣的物品(Top-N推荐问题)。协同过滤是一类只用到用户评分数据的推荐算法。本文针对推荐系统的Top-N推荐问题,主要研究在视频数据集上基于协同过滤的Top-N推荐算法。本文首先对推荐系统的研究背景、发展现状、相关概念做了详细说明。介绍了常用推荐算法的分类和它们的优缺点,以及推荐算法的准确率评测指标。对协同过滤算法不同的算法原理(基于近邻、基于矩阵因子分解、基于神经网络)作了详尽的说明。其次,本文研究了协同过滤中的矩阵因子分解推荐算法的原理和特点。针对基于矩阵因子分解的协同过滤算法SVD++和ASVD的评分规则在两阶段(训练和预测)的不一致问题,以及列表级矩阵因子分解推荐算法ListRank-MF的Top-1排序概率在大量视频评分一样时概率相同的问题,提出一种基于视频流行度的列表级矩阵因子分解算法。该算法引入视频流行度对Top-1概率计算公式进行改进,使得评分相同的视频仍可按流行度进行排序,从而提高推荐的准确率。实验结果表明,算法在MovieLens视频数据集上的Top-N推荐准确率提升程度在5%-12%;算法在Netflix视频数据集上的Top-N推荐准确率提升程度在1%-4%。最后,本文研究了协同过滤中的近年来兴起的基于神经网络的推荐算法。AutoRec和CDAE是文献中提出的基于神经网络中的自动编码器的推荐算法。针对视频分类标签一定程度上反映了用户的喜好,提出一种基于视频分类标签的自动编码器推荐算法模型。该模型基于Gluon深度学习框架实现。在MovieLens视频数据集上的结果表明,该模型的Top-N推荐准确率在引入视频分类标签后提高了3-6个百分点。