论文部分内容阅读
随着Internet的发展和Internet用户群的壮大,获取信息的方式变得非常方便,消费各种信息也成为生活中不可或缺的一部分。但信息过载与冗余给人们的日常生活和商务活动造成了诸多不便,为用户提供有效、准确、方便快捷、满足个性化需要的推荐服务成为当前的产业应用和学术研究的热点。协同过滤算法是其中应用最为成功的个性化推荐技术。但是,Internet上的信息数量和种类的急速增长,协同过滤推荐算法面临诸多挑战:数据稀疏性、冷启动、可扩展性等等。协同过滤需要建立在大量的用户数据的基础上。进入web2.0时代以来,整个互联网的结构和功能发生了深刻的变化。Web2.0作为一个平台,为用户提供自由协作、互动、创造的支持。分众分类就是用户整体用自由标签创造的分类体系,其可以充分表现用户的个性偏好,是推荐系统很好的数据来源。这使我们考虑利用越来越多的用户创造内容来对传统的协同过滤方法进行改进。
本文提出一种新算法——基于分众分类的协同过滤推荐算法。首先将分众分类标签转化成隐含用户偏好的权重矩阵,再在得到的用户-标签矩阵和项目-标签矩阵上分别计算用户相似度和项目相似度,最后结合评分相似度产生评分预测。这样不仅改善了评分数据的稀疏性,而且提高了用户及项目相似性计算的精确度,提高了推荐准确度。
实验采用MovieLens的数据集,并与传统的协同过滤算法和基于项目的协同过滤算法的实验结果相比较,来验证所提出的算法的有效性。实验结果表明,新算法可行、有效,能够解决数据稀疏问题和改进推荐质量。