协同过滤推荐系统中关键问题研究与实现

来源 :黑龙江大学 | 被引量 : 0次 | 上传用户:zq0453
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet和信息技术的飞速发展,信息过载变得越来越严重,由此推荐系统应运而生。在推荐系统所采用的技术中,协同过滤是最为成功的技术。但是伴随着应用范围的扩大和应用环境的变化,协同过滤技术的一些缺点逐渐暴露出来,例如数据稀疏性问题、冷启动问题、推荐准确率低等。为此,本文提出了两种协同过滤算法来缓解上述问题。1.结合专家意见的协同过滤算法该算法通过引入专家意见和用户的属性来缓解数据稀疏性,最终达到提高推荐准确率的目的。首先利用用户属性提出一种新颖的相似度计算方法,突出了用户的背景知识,再将专家的专业评分和用户评分相结合,使得预测结果在专家的专业意见和兴趣相似、背景相似的用户意见之间得到很好的调节,然后通过基于SVD协同过滤算法平滑预测结果。理论分析和实验结果表明,该算法有效提高推荐准确率。2.基于时间划分的协同过滤算法该算法通过提出并使用项目类别喜好度缓解了数据稀疏性,最终达到提高推荐准确率和缓解项目冷启动的目的。首先借助于项目的上架时间和当前时间将项目分为新项目、正常项目和旧项目;再根据用户对项目的评价时间得到用户对这三种类型项目的喜好度,并扩充了用户-项目矩阵。预测评分时,根据项目的时间类型的不同采用不同的方法。理论分析和实验结果表明,该算法有效提高推荐准确率和缓解项目冷启动问题。最后在本文提出的算法基础上,设计并实现了电影推荐原型系统,对系统的各部分作了充分的总结和说明,为今后的进一步理论和实践研究奠定基础。
其他文献
随着互联网的更加普及和信息科技的快速发展,我们已经迈入到信息过载的时代,游戏行业产生的数据同样成指数级别增长。游戏中提供的道具信息量快速增加,用户经常会迷失在大量
近二十年是互联网技术和计算机技术飞速发展的阶段,社会信息化的程度也在这段时间越来越高,对各行各业来说,既是挑战也是机遇,大学作为高等教育的学府,也不能避免社会信息化
随着互联网和信息化技术的不断发展,企业及其他各种组织积累了大量的数据,人们面临着从大量不同类型、不同来源的数据中获取有用知识的问题。数据挖掘技术融合了人工智能、数
半导体制造工艺的发展带来了晶体管单片集成度的增加,电路设计能力的提升推进了集成电路功能和复杂度的提高。这样,集成电路规模便与日俱增,测试数据量和测试难度也自然加大
随着计算机技术和网络技术的发展,存储技术已从本地存储发展到网络存储。目前,磁盘存储阵列(简称存储阵列)是网络存储器的主要形式之一,它从磁盘上存取数据的速度,往往成为用
随着多核处理器在计算领域的广泛使用,面向多核处理器的程序性能优化成为重要的研究问题。当今主流多核处理器都采用共享Cache结构,然而共享Cache所带来的Cache伪共享、Cache
任务调度问题是网格环境下完成大规模计算任务的关键环节,也是网格应用的必要基础。高效的网格任务调度策略及其算法,能够充分地利用网格系统的资源,提高网格应用的整体性能
随着计算机和互联网的越来越普及,在电子政务网和企业内部网中,许多文件都以电子文档进行分发和存储,PDF因其具有以下两个优点成为首选的电子文档格式:一、格式和操作平台无
游客在大型景点旅游时,在没有导游的情况下,景点的文化可能会得不到全面的解说,游客遇到的困难也可能无法得到有效的帮助。基于此,本课题根据手机已有的GPS技术功能,同时在现
本文针对在智能电网数据集成中出现的由于数据异构原因产生的“信息孤岛”问题,将XML和本体技术结合起来应用在电力系统中,采用基于B/S的三层体系结构,以中间件的方式来解决电力系统的异构数据集成,从而实现对各个分布式数据源的透明访问和集中管理。首先,通过运用电力系统实例分析了现有的基于关系数据库构建本体方法在概念提取方面的不足之处,并对其加以改进,然后通过数据验证了改进后方法的可行性和高效性,并在一定