基于Hadoop的推荐系统的设计与实现

被引量 : 0次 | 上传用户:zxw2yanzi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
进入二十一世纪之后,人类互联网的大数据时代,我们面临着一个严重的问题就是信息过载。在互联网时代有许多探索解决信息过载的方法,信息分类网站和搜索引擎就已经在解决信息过载问题上取得了成功。通过信息分类来解决信息过载的网站有雅虎和新浪,而谷歌和百度则是通过搜索来解决信息过载的。推荐系统被认为是一种更加优秀的解决方法,相比前两者,推荐系统更加智能和主动。面对着整个用互联网的时候用户许多时候是不知道自己的需求是什么,而信息分类和搜索引擎是建立在用户通过关键字或者信息所属类目去查找的。推荐引擎是主动发送推荐的信息给用户。它运用集体智慧来帮助用户对海量信息作出选择。集体智慧是是一种共享的或者群体的智能,以及集结众人的意见进而转化为决策的一种过程,许多个体通过合作和竞争所显现出来的智慧。推荐引擎依托海量数据,分析用户的行为、特征以及爱好,并为用户找出符合其兴趣的物品。本论文先阐述研究背景、国内外相关研究,并深入研究了推荐系统的发展,推荐算法及其应用,同时还探讨了大数据处理框架Hadoop的原理。本文通过对推荐系统理论的研究和应用以及对Hadoop的研究,确定了推荐系统的架构,并详细设计了推荐系统,同时还阐述了推荐系统的主要部分的实现。本文的主要贡献有以下几点:1)设计了一个水平扩展推荐算法的推荐系统框架,可以动态添加和修改推荐引擎,并根据主流的协同重点分析和设计了基于协同过滤的引擎。2)使用基于用户动态反馈的权值计算方法来综合各个推荐结果,从而组成一个推荐引擎组合,提高了整个推荐系统的测评指标。3)使用Hadoop大数据平台实现推荐系统来应对推荐系统海量数据的计算,从而提升了计算效率,减少了系统的反应时间。
其他文献
目的促进实习护生职业防护行为。方法运用PDCA管理理论模式对128名临床实习护生进行了促进职业防护行为的研究,分别于实践前、后期用调查表问卷方式、现场执行情况对护生职业
进入本世纪以来房地产行业倍受关注,房地产市场跌宕起伏,市场竞争环境非常严峻,逐步进入专业细分化。战略布局,特色价值链的设计近年凸显,专业人才的需求与流失,成本与薪酬的
2015年2月28日上午,前央视著名记者柴静发布的一段时长103分钟的雾霾调查纪录片《穹顶之下》,在其发布后48小时内网络点击量过2亿,在互联以及各种自媒体上展开了一场辩论。在
<正>PREFACE/前言商誉是企业自身经营形成的结果,作为企业整体价值的构成部分而不能单独存在。对于商誉会计研究是财务会计比较热烈、前沿的话题,理论界意见分歧较大,目前在
当前我国建筑工程规模随着国经济的不断发展,日益扩大,超大体积混凝土结构的使用也越来越普遍。施工过程中,超大体积混凝土施工质量问题也成为人们关注的焦点,寻求质量优异价
随着我省改革开放程度的不断深入,以及在国际上的知名度的提升,我省也面临来自国际社会越来越多国家媒体的关注,主要包括亚洲媒体、欧洲媒体、美国媒体、东南亚媒体等全球媒
随着人们对室内环境空气质量的越来越重视,各类空气净化剂也应运而生。这些产品的出现从某种程度上迎合了人们的需求,各生产商、经销商趁机对其效果大肆宣扬,正面效果的鼓吹远远
大功率锂电池目前应用在UPS(uninterruptible power supply)即不间断电源、二次回路操作电源、煤矿井下救生舱、电动自行车、电动汽车等方面。目前在电动汽车上,已经开始大规
在当今高科技高速发展的时代,临床医生不仅要有扎实的基础理论知识和细致的临床观察能力,而且要不断更新知识、学习和应用现代科学技术。医学发展愈来愈显示出其对科学技术的依