论文部分内容阅读
作为被当前推荐系统最普遍采用并取得较大成功的推荐技术,协同过滤推荐技术根据目标用户(或项目)的访问数据或评价信息找到与其相似度较高的用户(或项目)作为最近邻居,然后根据这些最近邻居的评分来预测目标用户(或项目)的评分并为用户推荐项目。然而在实际应用中,协同过滤推荐面临着评分数据稀疏,冷启动和算法扩展性差等诸多问题。本文重点研究了协同过滤推荐算法,对于该算法存在的问题从不同的角度提出两种改进算法,一方面利用用户背景信息并结合了模糊聚类技术对用户聚类,改进项目相似度计算方法;另一方面充分利用用户评分信息,并突出了用户共同评分的特殊作用。论文具体研究内容主要包括以下三个方面:(1)由于在高维稀疏评分矩阵中,项目相似度的计算不仅不准确而且时间复杂度较高,因此,本文利用用户背景信息对用户进行模糊聚类,从群体的角度考虑项目在各用户群体上的相似性,并为对两个项目有较多用户评分的群体赋予较高的项目相似性权重,提出一种基于加权项目相似性的模糊聚类推荐算法,利用该算法可以在数据极其稀疏并且用户维数较高条件下,提高搜索项目最近邻准确性,并提高协同过滤算法的推荐质量。(2)用户评分信息反映了用户喜好,但由于评分矩阵极端稀疏,如何充分利用用户评分对于发现用户兴趣并做出推荐就显得尤为重要。本文将用户评分划分为两种类型,而在评分矩阵中,用户共同评分数在一定程度上反映了用户间的相似性,因此本文将用户共同评分影响因子引入到相似性计算中,根据共同评分影响因子大小动态选择相似度计算方法,提出一种融入共同评分影响因子的协同过滤推荐算法,该算法充分利用了评分数据,并采用基于奇异值分解的评分填充方法改善数据稀疏性,提高了推荐质量。(3)针对本文提出的算法,在所选数据集上分别与一些传统的协同过滤算法进行了对比实验。实验结果表明,本文提出的算法,在用户评分矩阵高度稀疏的情况下能够有效提高推荐质量。