基于分众分类的协同过滤推荐系统研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:guomeixiang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet的发展和Internet用户群的壮大,获取信息的方式变得非常方便,消费各种信息也成为生活中不可或缺的一部分。但信息过载与冗余给人们的日常生活和商务活动造成了诸多不便,为用户提供有效、准确、方便快捷、满足个性化需要的推荐服务成为当前的产业应用和学术研究的热点。协同过滤算法是其中应用最为成功的个性化推荐技术。但是,Internet上的信息数量和种类的急速增长,协同过滤推荐算法面临诸多挑战:数据稀疏性、冷启动、可扩展性等等。协同过滤需要建立在大量的用户数据的基础上。进入web2.0时代以来,整个互联网的结构和功能发生了深刻的变化。Web2.0作为一个平台,为用户提供自由协作、互动、创造的支持。分众分类就是用户整体用自由标签创造的分类体系,其可以充分表现用户的个性偏好,是推荐系统很好的数据来源。这使我们考虑利用越来越多的用户创造内容来对传统的协同过滤方法进行改进。   本文提出一种新算法——基于分众分类的协同过滤推荐算法。首先将分众分类标签转化成隐含用户偏好的权重矩阵,再在得到的用户-标签矩阵和项目-标签矩阵上分别计算用户相似度和项目相似度,最后结合评分相似度产生评分预测。这样不仅改善了评分数据的稀疏性,而且提高了用户及项目相似性计算的精确度,提高了推荐准确度。   实验采用MovieLens的数据集,并与传统的协同过滤算法和基于项目的协同过滤算法的实验结果相比较,来验证所提出的算法的有效性。实验结果表明,新算法可行、有效,能够解决数据稀疏问题和改进推荐质量。
其他文献
随着科学技术的不断进步、消费者需求的不断变化、市场竞争的日趋激烈和经济全球化步伐的加快,供应链管理在企业生存和发展中的地位越来越重要,库存管理又是供应链管理的重要环节。传统的库存管理方法只关注于个体企业的库存决策问题,尽一切可能大力推进的是公司内部全面范围内成本的持续降低。这种只局限于改善自身的状况,降低生产成本的幅度己经接近了实际可能的极限。现代企业的竞争已演变成包含上游、下游各节点企业的整个供