论文部分内容阅读
随着互联网的不断普及,人们进入了信息社会和网络经济时代,从互联网上可以获取的信息量不计其数,但是有效的信息却是冰山一角。推荐系统的应运而生将用户与信息联系在一起,实现了从海量数据里为用户挖掘有意义的信息的功能。协同过滤作为主流的推荐算法,能够从用户对项目的评分记录中确定最近邻居集合,并按照最近邻居的评分记录分析出用户对项目的喜好。然而随着推荐系统中项目数量的不断增加,用户评价、浏览过的项目数量相对于项目总数而言微乎其微,导致推荐系统的数据稀疏性较高以致影响推荐性能。本文介绍了推荐系统的相关知识,阐述了协同过滤算法的推荐过程,并针对由于数据稀疏导致的协同过滤推荐结果精确度低、覆盖率低的问题展开了深入的研究,提出了两种方案加以改进。主要研究工作如下:1、本文提出了缓解数据稀疏问题的协同过滤混合填充算法(HFCF)。首先从物品角度出发,若用户对某一物品暂无评分,依照用户对其最近邻物品的评分预测可能评价给该物品的分值,并填充到稀疏矩阵中。同时从用户角度出发,利用填充后的矩阵确定目标用户的邻近用户,选取邻近用户共同评价过的数量最多的物品,结合邻近用户对这部分物品的评分与用户间相似度计算评分值从而进一步填充矩阵。该方法在不需要其他复杂信息的条件下,显著地缓解了数据稀疏问题,通过实验验证了该方法能有效地提高推荐的精确度。2、本文提出了基于约简后邻近用户信息填充的协同过滤算法(RNFCF)。首先,分析目标用户喜爱的物品所包含的属性,选取其中一部分属性,将同时具有这些属性的物品构成论域。其次,分析其他用户对论域中物品的喜爱程度,每个用户喜爱的全部物品组成一个子集,子集的集合构成论域上的一个覆盖,按照覆盖约简算法从邻近用户集中移除冗余用户。最后,根据保留下的邻近用户中相似度较高的部分用户的评分信息为目标用户预测评分,并填充到矩阵中。填充后进行协同过滤推荐,能够有效地降低数据稀疏等级。实验表明RNFCF有效地提高了推荐的覆盖率与准确度。