论文部分内容阅读
随着互联网的兴起,信息过载越来越困绕着人们,如何从大量的信息中寻找到自己需要的内容成为了大家关注的焦点,在此情况之下,推荐系统应运而生。 本文主要介绍了目前最为流行的集中推荐系统算法。包括协同过滤算法,奇异值分解算法和kNN算法,并对它们进行了相应的改进和提高。 对于协同过滤算法,我们更新了传统的相似度度量,提出了一种混合的相似度度量,从而改进了原始算法中的单一度量;进一步地,我们还提出了使用K--means对用户进行聚类的协同过滤算法,降低了算法的复杂度。针对奇异值分解算法,我们提出了结合人口统计学信息的特征值分解算法;此外我们还引入了局部结构化的奇异值分解方法,对原有的模型进行了进一步的优化;同时,我们在奇异值分解中也介绍了一种虽然效果较差但是算法复杂度更低、实现速度更快的算法—分块的SVD方法。针对kNN算法,我们进一步更新了行相似度的算法,除了协同过滤算法中能考虑的内容,我们增加了用户的人口统计学信息,通过用户群体之间的差别和用户个体之间的差别综合地描述用户相似度;进一步地,我们提出了结合用户和商品偏移的kNN算法,在描述近邻的评分时考虑不同用户和商品之间本身可能存在的评分偏差对算法进行修正,使得算法结果有了很大的提升。