论文部分内容阅读
互联网技术的快速发展所产生的海量信息易造成信息过载问题,导致人们无法从这些海量信息中快速找到所需的信息。解决信息过载问题以帮助人们快速获得所需信息已引起研究者的广泛关注,各种推荐系统应运而生。推荐系统是一种为用户提供个性化信息服务的系统,其核心是推荐算法,而协同过滤算法作为目前应用最成功的推荐算法之一,成为推荐系统领域的一个重要研究方向。虽然在协同过滤算法的基础上衍生出了许多改进算法,但仍存在推荐质量不高的问题。本文在协同过滤算法及其改进算法的基础上,对Item-based协同过滤算法的项目相似性度量方法及评分预测方法进行修正,以更准确地预测用户对未知项目的评分,从而提高推荐质量。论文的主要工作包括:①对推荐系统的发展历程、组成结构、评价指标以及相关技术进行了介绍,重点对协同过滤推荐技术的原理、分类及存在的问题进行了分析与总结。②传统Item-based协同过滤算法在预测目标用户对未知项目的评分时,忽略了目标用户的评分习惯对推荐效果的影响,导致评分预测准确性差。本文将目标用户的评分习惯引入到评分预测阶段,提出了一种改进的评分预测方法。③提出了自适应用户的Item-based协同过滤算法。由于传统Item-based协同过滤算法计算项目间相似性时,将每个共同评分用户(对两个项目都评过分的用户)对项目的评分视为同等重要,忽略了共同评分用户与目标用户的相似性对项目间相似性的影响,导致与目标项目相似性很高的项目在目标用户看来并不相似。本文所提算法将共同评分用户与目标用户的相似性作为共同评分用户的评分重要性权重,以自适应地度量项目间相似性。④在MovieLens站点提供的数据集上,利用Matlab编写算法进行仿真实验,通过与传统Item-based协同过滤算法和其它类似改进算法相比较,验证本文算法的有效性。实验结果表明,相比传统Item-based协同过滤算法和其它类似改进算法,本文算法在评分预测方面有更高的准确率,从而提高了推荐质量。