论文部分内容阅读
随着互联网和电子商务的发展,信息过载现象越发的严重,导致人们在寻找自己所需的信息时要耗费越来越多的时间与精力,有时候还可能迷失在众多信息之中,忘记自己真正需要的信息是什么。虽然搜索引擎可以在一定程度上帮助用户过滤信息,但是这仅仅是针对那些明确知道自己所需的信息或者商品是什么的用户,对于那些需求比较模糊的用户其帮助程度就可能就不那么明显了。在这种情况下,个性化推荐系统就应运而生了。因为它不仅可以帮助人们过滤信息或物品,而且可以主动为用户推荐他们可能感兴趣的信息或物品。但随着用户数量和信息种类的快速增加,当前的个性化推荐系统也面临着一些挑战。本文重点就是针对当前个性化推荐系统中的协同过滤算法的冷启动和稀疏性进行相应的优化改进。首先,对个性化推荐系统的相关基本理论知识进行详细的介绍和整理。然后,对协同过滤算法的基本思想与其常用的算法进行分析与总结,随后对当前协同过滤算法存在不足进行整理,进一步分析其产生的原因。根据分析的结果,提出一种添加项目属性类别的协同过滤算法,该算法对其传统的相似性度量方法了进行优化,即在计算项目之间的相似度时增加了一个项目属性类别的参数。这样就弥补了传统的度量方法在计算项目之间的相似性时,把不同类别的项目之间进行比较,从而导致其项目的最近邻居不准确。该算法的基本思想是先利用项目自身属性对其进行分类,然后根据分类的情况在类内进行其相似性的计算,计算是采用改进后的公式,即添加项目属性参数的公式来进行项目之间的相似性计算,其次根据其相似性的计算结果生成目标项目的最近邻居集,然后根据其最近邻居在类内对其评分进行预测,把评分较高的前N项作为Top-N输出。最后,利用Movielens网站提供的开源数据包对改进后的算法进行相关的验证,选取平均绝对误差(MAE)作为衡量其算法准确度的标准。通过对比改进前后算法的MAE,可以直观的看出改进后的算法在一定程度上降低了冷启动和稀疏性对推荐算法精确度的影响,提高了推荐系统的推荐效果。