Mahout平台下协同过滤推荐算法的研究

来源 :西安理工大学 | 被引量 : 0次 | 上传用户:liu_da_shi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速发展,各种各样的商品充斥在购物网站上,用户很难找到他们感兴趣的商品。在此背景下,推荐系统应运而生。推荐系统将用户感兴趣的信息推荐给用户,帮助用户快速地挖掘对自己有价值的信息,其应用前景广泛,受到学术界和商业界的高度关注。协同过滤推荐算法是当前推荐系统中应用最广泛和最成功的推荐算法,但是随着电子商务网站的规模不断扩大,传统的协同过滤推荐算法也面临着严峻挑战。本文以推荐系统的协同过滤推荐算法为研究对象,旨在解决协同过滤推荐算法在应用中所遇到的数据稀疏性问题。针对协同过滤推荐算法,本文在以下几个方面作了相应的研究和探索:1、针对推荐系统和推荐算法的总体发展进行了详细介绍,概述了现有的推荐算法并指出其各自的特点并对各种算法的优缺点进行对比;深入研究了协同过滤推荐算法并对其面临的问题和解决方案做出总结,为下一步的研究奠定理论基础。2、分析了传统的协同过滤推荐算法的不足,针对传统的协同过滤推荐算法在数据稀疏时导致推荐精度不高的问题上,提出了一种新的组合协同过滤推荐算法,采用层叠和矩阵填充的方法将基于用户和基于项目的协同过滤推荐算法进行组合。首先,提出传统的协同过滤算法在面临数据稀疏时,使得最近邻的选取不合理,利用基于用户协同过滤算法预测评分并填充原始评分矩阵,数据稀疏度明显降低,最近邻居选取更准确;其次,传统的协同过滤算法只是考虑用户或项目之间的相似性,相似性计算不准确,在填充后的评分矩阵的基础上,采用基于项目的协同过滤推荐算法为用户产生推荐,充分结合这两种传统协同过滤算法的优势。通过Mahout平台进行仿真实验表明,本文提出的组合推荐算法,在精度上优于传统的协同过滤推荐算法。通过上述的研究工作,从一定程度上解决了协同过滤推荐算法所面临的数据稀疏性问题,在一定程度上推动协同过滤推荐算法的理论研究和应用研究的进展。
其他文献
视频编码标准H.264/AVC采用了精确的帧内/帧间预测、整数变换和熵编码等技术,到达了很高的压缩率,但是伴随而来的是很高的计算复杂度。在一些运动受限的单视角视频序列和多视
EDGE(Enhanced Data Rate for GSM Evolution)作为GSM(Golbal System of Mobile communication)/GPRS(General Packet Radio Service)网络的升级解决方案直接继承了GSM覆盖范
数字集群通信系统是以数字通信技术为基础,将集群技术、分组数据业务和调度指挥功能相结合的一种专用通信系统,广泛应用于公安、安全、机场、港口以及城市轨道交通运输等行业
随着互联网的日益普及和电子商务的快速发展,电子银行已经成为影响电子商务发展的一个关键组成部分。安全问题越来越突出,尤其是电子银行支付认证过程中的安全性,已经成为了
直接序列扩频通信由于其出色抗干扰能力、频带利用率和保密性,近年来被广泛的应用到军事和民用领域。本论文设计的通信系统,采用大规模可编程逻辑器件(FPGA),所设计与实现的
随着便携式成像设备的普及,高分辨率图像的需求急剧增加,有限的存储空间和传输带宽成为制约人类高质量生活需求的瓶颈。贝尔模板阵列是图像传感器中应用最广的彩色滤波阵列之
随着在线数字图像和视频数据等数字资源的持续增长,图像/视频搜索已经成为一个非常活跃和具有挑战性的研究领域。与以往相比,排序算法不仅要能够处理庞大的数据量,更应该满足