基于大数据的推荐算法研究

被引量 : 0次 | 上传用户:hustyhw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术和互联网的迅猛发展,人们进入了信息超载的时代。推荐系统是一个解决信息超载问题的有效工具,它根据用户的历史行为等记录,对用户的兴趣进行建模,然后利用创建的用户兴趣模型进行个性化推荐,把用户感兴趣的信息、产品等推荐给用户。协同过滤是推荐系统中采用最为广泛也是最为成功的推荐技术。针对协同过滤技术效果依赖于一个精确的相似度测度方法且其可伸缩性较差,不能处理大数据的问题,本文提出基于项目层次结构的推荐算法,并结合Madoop技术实现矩阵分解算法。主要工作如下:1)改进衡量相似度的余弦距离和皮尔逊相关系数的计算公式,避免计算目标用户与所有用户的相似度,从而避免了在整个用户空间中搜索最相近的K个用户。本文引入倒排索引数据结构,使查找目标用户最近邻的计算复杂度大大降低。实验表明,在确保与改进前最近邻结果一致的情况下,改进后的相似度计算公式能大大缩减查找目标用户最近邻的时间,大大提高推荐算法处理大数据的能力。2)提出了一种基于项目层次相似度的协同过滤算法。利用用户给部分项目标注的标签和项目类别进行自动扩展,建立所有项目的层次结构,然后利用建立的项目标签层次结构计算项目之间的相似性。实验表明,与传统的协同过滤算法比较,本文提出的基于项目层次相似度的协同过滤算法能够显著提高推荐系统处理大数据的能力,并且可以获得更优的RMSE效果。3)结合矩阵分解梯度下降算法的近似算法和MapReduce分布式计算框架,设计实现了一种基于MapReduce的矩阵分解推荐算法。实现矩阵分解算法主要需要实现矩阵乘法,本文对矩阵乘法的分布式实现进行了研究,详细分析了内积法、外积法和分块法,通过对比实验得出,矩阵乘法效率需要折中考虑单个工作节点的计算量和需要网络传输的数据量。
其他文献
随着社会经济的发展,经济全球化的速度加快,人才成了束缚企业发展的一大重要因素,对人力资源的管理关系到一个公司的前途和命运。实现对人力资源的有效高效管理,尤其在当下迅
近年我国城镇化率不断提高,大量农民的离土进城为农村土地使用权流转提供了平台。土地信托是土地流转中的一项制度创新,是深化农村土地经营机制的必然需求,也是促进土地使用
外贸产业是浙江省生产总值的重要组成部分,是拉动浙江省经济发展的“发动机”。而在浙江,民营企业在外贸经济中更是占据了一半以上,对外贸行业的健康发展起着关键的作用。伴
随着能源和环境问题的日益凸显,世界上许多国家都将发展生物能源作为解决问题的突破口,从而推动了生物能源产业的快速发展。其中,甘蔗燃料乙醇产业的不断发展强化了甘蔗的能
目前,各级财政部门人力资源基本都实现了工资、考勤、人事等信息化管理,由于前期缺乏统一规划,人力资源系统的主要要素和数据分散在不同部门、不同技术平台的软件系统中,表现
高等职业教育是高等教育的一种类型。高等职业院校的人事分配制度改革与全国其他高等院校一样在国家政策的大背景下有条不紊地推进,近年来的改革是以实施规范岗位设置管理为
本文将我国副省级城市作为考察对象,通过一系列子指标,系统性构建副省级城市经济发展水平、发展动力机制、社会发展水平和可持续发展能力4个重要指标,并以此为基础比较我国副
近年来,随着我国国民经济的快速发展,建设工程领域各项工程建设规模也在逐步扩大,建筑业已成为我国国民经济的重要支柱产业,但其从业人员素质低、施工流动大、作业环境恶劣这
随着我国经济的快速发展,人们的生活水平不断的提高,社会各界对学前教育的关注程度不断提升,人们已经意识到学前教育的好坏将直接关系到其后代一生的成长状况,也关系到其后代