论文部分内容阅读
随着互联网技术的迅猛发展,互联网中的资源呈现出爆炸式增长的态势。如何从海量的资源中准确定位到适合用户的资源逐渐成为工业界和学术界的研究热点。推荐系统在这样的背景下应运而生。 协同过滤推荐是推荐系统中应用最广泛也是最成功的技术,但因存在数据稀疏性和精确度不够等问题,影响了协同过滤推荐系统的发展。本文在分析总结基于内容推荐和协同过滤推荐的优缺点的基础上,引入社区划分思想,将社区划分与协同过滤推荐算法相结合,提出一种基于社区划分的协同过滤推荐算法,旨在解决协同过滤推荐中数据稀疏性和推荐准确率问题。本文主要研究内容如下: (1)针对传统协同过滤推荐算法的数据稀疏性问题,提出一种基于项目类别的社区划分解决方案。使用项目的类别提取出能表达用户偏好的特征向量,利用该特征向量对用户进行社区划分,缩小待推荐用户的最近邻用户的范围,缓解数据稀疏性。 (2)为提高推荐准确性,提出一种融合用户评分和用户标签的相似性计算方法。根据用户的标签和评分信息提取出用户基于标签的相似性和用户基于评分的相似性,使用平衡因子衡量二者的比例综合得到用户相似性,以能更全面准确地反映用户的相似性。 (3)基于社区划分和改进的相似性计算方法,提出一种基于社区划分的协同过滤推荐算法。从划分的社区中使用改进的相似性搜索最近邻用户集合,根据最近邻用户集合的用户评分预测待推荐用户的评分并进行推荐。以MoviesLens数据集为实验数据,实验结果表明,所提算法能显著提高评分预测的准确性和推荐结果的质量,并验证了社区划分以及用户标签信息对推荐系统的重要性。