协同过滤算法在个性化推荐系统中的研究

来源 :兰州交通大学 | 被引量 : 1次 | 上传用户:samdragon
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网和电子商务的发展,信息过载现象越发的严重,导致人们在寻找自己所需的信息时要耗费越来越多的时间与精力,有时候还可能迷失在众多信息之中,忘记自己真正需要的信息是什么。虽然搜索引擎可以在一定程度上帮助用户过滤信息,但是这仅仅是针对那些明确知道自己所需的信息或者商品是什么的用户,对于那些需求比较模糊的用户其帮助程度就可能就不那么明显了。在这种情况下,个性化推荐系统就应运而生了。因为它不仅可以帮助人们过滤信息或物品,而且可以主动为用户推荐他们可能感兴趣的信息或物品。但随着用户数量和信息种类的快速增加,当前的个性化推荐系统也面临着一些挑战。本文重点就是针对当前个性化推荐系统中的协同过滤算法的冷启动和稀疏性进行相应的优化改进。首先,对个性化推荐系统的相关基本理论知识进行详细的介绍和整理。然后,对协同过滤算法的基本思想与其常用的算法进行分析与总结,随后对当前协同过滤算法存在不足进行整理,进一步分析其产生的原因。根据分析的结果,提出一种添加项目属性类别的协同过滤算法,该算法对其传统的相似性度量方法了进行优化,即在计算项目之间的相似度时增加了一个项目属性类别的参数。这样就弥补了传统的度量方法在计算项目之间的相似性时,把不同类别的项目之间进行比较,从而导致其项目的最近邻居不准确。该算法的基本思想是先利用项目自身属性对其进行分类,然后根据分类的情况在类内进行其相似性的计算,计算是采用改进后的公式,即添加项目属性参数的公式来进行项目之间的相似性计算,其次根据其相似性的计算结果生成目标项目的最近邻居集,然后根据其最近邻居在类内对其评分进行预测,把评分较高的前N项作为Top-N输出。最后,利用Movielens网站提供的开源数据包对改进后的算法进行相关的验证,选取平均绝对误差(MAE)作为衡量其算法准确度的标准。通过对比改进前后算法的MAE,可以直观的看出改进后的算法在一定程度上降低了冷启动和稀疏性对推荐算法精确度的影响,提高了推荐系统的推荐效果。
其他文献
随着中国移动产品、服务的增多,受理渠道的多样化,网络业务平台也越来越复杂,业务流程的不完善性越来越明显,由于数据不一致情况造成业务、计费及服务的问题日趋严重,由此带来的客
人物检索是互联网用户最重要的活动之一。人物搜索引擎、社会网络构建等与人物相关的网络应用成为研究的热点。人物属性抽取是这些研究的一个重要基础。本文基于维基百科的人
我国是一个农业大国,农业生产在我国的经济生产中占据很重要的位置,随着农业的进一步发展,发展智能农业已经成为了研究热点。智能农业的发展对于计算机的应用提出了更高的要
在现代飞速发展的信息通信领域中,Internet和移动通信的未来发展是两个引人瞩目的方向。随着以IPv6协议为基础的下一代互联网(CNGI)以及3G移动通信网络的部署和应用,以单机移
基于视频图像序列的人体运动跟踪技术是计算机视觉领域中的研究热点之一。人体运动跟踪的目标是从视频图像序列中检测、跟踪运动人体,获得人体运动参数,编辑并利用已经获取的
高速铁路车载单元采用无线通讯协议,和轨旁的无线闭塞中心,或其它与之相关的安全设备交互信息。而这些安全设备之间需要通过认证密钥进行通信,因此需要有专门的密钥管理识别系统
渗透测试是指借助于值得信任的组织试图对信息系统中的漏洞进行探测和开发的安全实践活动。渗透测试已经从不同系统开发阶段的应用测试发展到生产系统中的网络安全测试。同时
数据挖掘在最近几年里已被广泛的研究和应用,而频繁项集挖掘则是诸如关联规则挖掘、序列模式挖掘等数据挖掘问题中的关键步骤,因此对它的研究具有重要的理论和实际价值。本文的
海洋对全球气候变化具有重大影响。对不同海域的海洋环境数据进行关联分析,使得我们可以从海洋环境数据中发现海洋气候异常变化规律,从而为全球气候变化预测提供智力支持。本
数据文件的安全是信息安全领域里研究的重要内容,防止文件泄密的有效手段是对文件进行加密存储,而传统的用户层加密软件由于改变了用户的使用习惯而给用户的普遍使用带来了不便