论文部分内容阅读
互联网的快速发展使人们从当初的信息匮乏时代迈入了信息过载的时代。在电影为代表的互联网视频资源信息平台中,传统的搜索引擎通过关键字来获取信息,如果关键字的准确度高则可能得到自己想要的答案,如果准确度不高,那么搜索结果就会出现大量选项信息,用户不仅会花费大量时间,而且不一定能得到自己需要的信息,因此,通过输入关键字搜索技术已满足不了用户个性化的需求。个性化网络时代是希望系统能从用户的数据中分析用户的行为,发掘用户的兴趣偏好,为用户找出符合其需求的信息资源。推荐系统的出现满足了用户的这一需求。首先,本文分析了国内外相关文献资料,了解到早期的推荐技术是通过用户对物品的评分,得到评分矩阵建立相似性来划分近邻,依据与他相邻的用户喜好也类似的思想,完成推荐。然而,随着电影数量不断的增加,用户仅对少量电影进行评分,建立的评分矩阵较稀疏,导致推荐算法的准确度下降。因此,本文通过组合策略的思想来对电影推荐进行研究。然后,文章介绍了目前广泛应用的几种推荐技术。讲述了这几种推荐技术研究的内容及应用现状,针对稀疏数据推荐效果不佳问题,利用GroupLens提供的MovieLens 20m数据集,设计了改进的基于内容和协同过滤组合推荐算法模型。该算法的思想是利用电影的特征信息和用户的评分信息,得出每个用户对电影不同特征的评分数值,通过每个用户喜欢的项目特征情况,将喜好相同的特征用户聚类。给出推荐时,第一步通过数据分析确定用户喜欢的特征类型,并将相同用户聚为一类,之后计算用户与类中其他用户的相似性,最后,根据近邻来完成推荐。最后,介绍了基于SVD的协同过滤推荐,通过奇异值分解,将评分矩阵分解成两个正交矩阵和一个对角矩阵的乘积,利用奇异值分解后的数据集来表示原始数据集,去掉那些线性相关的冗余数据,从而在数据处理过程中减少不必要的属性和特征,然后,借助基于用户的协同过滤思想完成推荐。最终,通过RMSE(均方根误差)、MSE(均方误差)、MAE(绝对值均方误差)的比较,表明论文的组合算法策略优于传统的推荐算法。