论文部分内容阅读
随着电子商务平台的不断扩大,作为个性化推荐中运用最普遍的技术之一,传统的协同过滤推荐算法面临着一系列严峻的挑战,比如评分矩阵的极度稀疏、冷启动等问题。本论文针对这些问题提出了一些改进方法,论文的主要工作如下:(1)提出了一种基于项目属性特征预处理的协同过滤推荐算法。该算法通过引入项目的属性特征信息,获取项目间属性特征相似度,以此来预测用户对评分缺省项的打分值,并将该值填入到数据矩阵中对应的位置,从而使得评分矩阵近乎饱和。接着再对稀疏数据集中的未评分项目进行混合填充预处理,有效避免了传统均值填充法中的用户对项目的评分完全相同的问题以及众数填充法所面临的“多众数”和“无众数”问题。最后,对经过混合填充预处理后的“用户-项目”评分矩阵进行相似度计算,然后依据相似度计算的结果来搜索并生成最近邻,最终通过这些最近邻居为用户做出推荐。结合实验,验证了改进算法能够有效的改善推荐系统数据稀疏性以及冷启动问题。(2)提出了一种综合项目评分及属性的协同过滤推荐算法。传统的协同过滤算法在获取项目间相似度时往往只依赖于项目的历史得分数据,这种在生成项目间相似度时只考虑评分的做法显得很片面,而且无法有效的缓解推荐系统所面临的冷启动问题,造成新项目或者评分次数太少的项目无法得到推荐,从而对推荐系统挖掘长尾项目的能力造成影响。因此,在获取及生成项目间相似度时,还需要把项目属性特征这些较为容易获取和稳定的因素包含在内。针对这个问题,本章在传统协同过滤算法的基础之上进行了一些改善,在生成项目间相似度时,综合项目评分和项目的属性特征,从而提高推荐系统发掘长尾项目、缓解系统冷启动的能力。(3)在MovieLens数据集上对改进算法进行了实验,相关实验结果表明本论文提出的改进算法可以有效的缓解传统的协同过滤推荐算法面临的数据稀疏性和冷启动问题,提高系统的推荐精度和推荐覆盖率。