论文部分内容阅读
随着信息技术和互联网的迅猛发展,人们进入了信息超载的时代,用户难以在海量的信息中快速找到自己所需的产品。因此,个性化推荐系统应运而生,它是一个解决信息超载问题的有效工具。其中协同过滤是推荐系统中采用最为广泛也是最为成功的推荐技术,协同过滤推荐技术根据目标用户(或项目)的访问数据或评价信息找到与其相似度较高的用户(或项目)作为最近邻居,然后根据这些最近邻居的评分来预测目标用户(或项目)的评分并为用户推荐项目。然而,这在实际运用过程中,仍然存在着诸多问题亟待解决,譬如:用户对商品评价数据的稀疏性问题;随着用户和项目数的增多,推荐系统的性能将会随之降低等。本文针对当前存在的这些问题,将对传统的协同过滤推荐算法进行改进。本文的主要工作总结如下: 第一,研究了推荐系统产生的背景和国内外研究的现状,较详细地分析了各种推荐技术、推荐系统的分类;对推荐系统的主流技术——协同过滤技术做了较详细的研究。 第二,较详细的研究了协同过滤技术中的基于用户(User-based)与基于项目(Item-based)方法,分析了其存在的稀疏性问题和扩展性问题。 第三,基于降维的推荐策略,介绍了当前比较出名的SVD算法和SVD的改进算法。 第四,针对存在的问题,提出了近似SVD算法来解决推荐系统所面临的稀疏性问题,并重点提出了改进算法:ApproSVD算法。从数学证明上详细分析了ApproSVD算法的预测精度。使用MovieLens数据集和Flixster数据集,通过实验验证了ApproSVD算法在预测准确度上的有效性。 第五,提出了基于SVD的增量技术来解决推荐系统所面临的扩展性问题,并重点提出了改进算法:增量ApproSVD算法。从数学证明上详细分析了增量ApproSVD算法的预测精度。使用MovieLens数据集和Flixster数据集,通过实验验证了增量ApproSVD算法在预测准确度和计算效率上的有效性。