基于用户排名的聚类协同过滤技术研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:worldfly
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Web爆发式地增长,推荐系统已经广泛的被用户所接受。大量的互联网用户增加到形形色色的电子商务网站中去,这就使得推荐系统得到了得天独厚的发展空间。随着系统规模的不断扩大,如何快速有效的对不同的用户做出个性化的推荐已经成为每个推荐系统的首要目标。协同过滤是推荐系统中最流行的技术,然而现有的大多数协同过滤算法都存在着“冷启动”、“数据稀疏性”等问题。与此同时,目前大多数推荐系统往往忽略了用户自身的权重,所有用户的权重都被看成是相同的,这会严重影响推荐系统的推荐质量。综上,如何在数据稀疏的情况下,通过利用用户的权重值来提高推荐系统的推荐质量成为本文主要的研究问题。本文通过分析传统的基于项目的协同过滤算法中存在的问题,提出了一种基于用户排名的聚类协同过滤技术的改进算法,该算法综合考虑了用户权重和用户评分矩阵稀疏性的影响。首先利用PageRank排名算法建立用户排名计算模型,根据这个模型计算每个用户的排名。然后将用户排名加入到传统的项目相似性和差异性的计算方法中,根据改进的项目相似性计算方法对项目进行聚类,找出目标项目的最近邻居候选集,根据改进的项目差异性计算方法对目标项目进行预测评分并推荐项目。最后通过实验证明此推荐结果同基于项目聚类的推荐结果相比有更好的推荐质量。用户的排名在很大程度上决定着用户在推荐系统中的地位。针对用户评分数据稀疏性问题,本文提出了一种基于改进的项目相似性计算方法的聚类方法。该方法在计算项目相似性时加入用户权重,通过该方法计算出项目间的相似性,然后利用K-means聚类方法将系统中的项目聚类。本文提出的基于用户排名的聚类协同过滤算法可以有效提高推荐质量和系统的实时性,为用户提供更准确更快速的推荐功能。
其他文献
粗糙集理论是一种新的处理不确定性知识的数学工具。近年来,粗糙集理论在知识发现中的应用已取得了很大的进展,基于粗糙集理论的方法逐渐成为数据挖掘主流方法之一,而在数据挖掘
安全匿名的网上投票协议的研究计算机软件与理论专业研究生陈娟指导教师袁丁随着网络的迅速发展,电子选举作为电子政务的一个重要方面逐渐被应用到现实选举中。与传统的人工选
随着信息化浪潮的席卷全球,数据量的爆炸式增长。海量数据的复杂性和非结构性给信息的处理带来了巨大的挑战。而文本资源以其占据资源量少、容易上传和下载等优点占据了整体
随着计算机技术的发展和应用的不断深入,各种平台系统层出不穷。人们在轻松地选择最符合需求的平台软件的同时受到了平台迁移等的困扰。一些平台依赖性过高的传统软件,在迁移
在应用三维可视化技术之前,地质资料的分析解释都局限于二维、静态的表达方式,它给人们直接、完整、准确的理解与感受地下地质情况造成了困难。三维地质建模运用科学计算可视化
在基于内容的多媒体信息检索中,人们利用特征提取算法从多媒体对象中提取出特征矢量,然后利用特征矢量之间的距离衡量多媒体对象之间的相似度。相似性检索的实现就是通过计算查
随着网络技术的飞速发展,计算机网络所面临的严峻网络安全形势。本文分析了对几种主流网络安全技术进行了分析,指出了这些技术中存在的不足,重点介绍了目前一些入侵检测的方法,并
随着以电子期刊和在线文档形式存在的科技文献的不断增加,对科研教学人员来讲,如何充分利用现有的网络信息资源,从庞杂的电子文档中及时、准确地获知与自己研究领域相关的最新科
随着网络技术的发展和互联网的广泛应用,人们对网络的研究也在逐步的深入。Internet拓扑图为大范围开发、利用Internet提供了一个有力的工具。网络研究者可以利用拓扑生成器
随着WWW的迅猛发展,对网页进行分类成为处理和组织大量文档数据的关键技术。由于最大熵模型可以综合观察到的各种相关或不相关的概率知识,对许多问题的处理都可以达到较好