论文部分内容阅读
互联网信息的爆炸式增长,造成了严重的“信息过载”的问题,人们很难找到自己感兴趣的信息,推荐系统应运而生,推荐系统通过给用户推荐他不了解但可能会感兴趣的内容来帮助用户获取信息。现今,推荐系统已经广泛应用在电子商务、新闻资讯、社交网站与视频音乐等领域。目前主流的推荐算法分为:基于协同过滤的推荐,基于内容的推荐和混合算法推荐等。其中协同过滤因为其不需要领域知识与推荐自动化程度高等优点成为了工业界使用最广泛的推荐算法,它通过应用一组与目标用户兴趣相似的近邻,来给目标用户进行评分的预测。在现实世界中,用户在给物品做出评分时可能会受到三种因素的影响:物品本身质量、用户自己的记忆作用和用户信任的社交好友对用户评分的影响。为了剔除这种影响,分析用户的真实偏好,找到与目标用户兴趣更加相似的近邻,从而提高推荐的准确度,本文提出了一种基于用户评分修正的协同过滤推荐算法。首先对比分析了现有物品质量评估方法的不足,提出了基于贝叶斯估计的物品质量评估方法。通过这种方法,我们不需要直接计算有限数量的估计值,取而代之的是计算出已知值的概率分布,然后利用这个概率分布来获取估计值,有效缓解了因评分数据不足而导致评估物品质量的偏颇问题。其次,研究了用户评分时存在的记忆作用,用户在评分时可能会受到记忆作用的影响,在特定的时间段内,会连续的给出相似的评分。通过实验分析了用户记忆作用的存在,提出了一种测度用户记忆作用的算法。然后,根据用户信任矩阵,构建信任网络模型。在用户信任网络中,用户之间的信任度越高,则用户之间更加相似,用户对信任他的用户的评分做出的影响就越大。在信任网络中,用户间不仅存在直接信任,还存在间接信任,本文提出一种在信任网络模型中,计算用户之间信任度的方法。最后,基于以上研究,本文提出了一种基于用户评分修正的协同过滤推荐算法(FixCF)。算法首先给出一种评分修正策略来消除物品质量,用户记忆作用和用户信任的社交好友这三个因素对用户评分的影响,将用户的评分进行修正。然后将修正后的评分重新应用到协同过滤算法中计算相似度,筛选与目标用户兴趣更加相似的最近邻,预测目标用户评分,并进行Top-N推荐。利用Movielens、Epinions和Flixster等数据集,将数据集划分成5个代表性的子集,分别进行实验论证,对比了FixCF和经典的协同过滤算法、现有的基于矩阵分解的算法和基于信任网络的推荐算法。实验结果证明,FixCF在多种条件下,准确率和覆盖率上都有着不同程度的提升。