基于位置的推荐计算:Spark实现

被引量 : 0次 | 上传用户:xiaozhui221
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自1990年第一篇使用协同过滤算法进行推荐的论文诞生以来,推荐系统在工业界和学术界已经有了广泛的发展。传统的推荐系统算法主要使用的基于协同过滤的推荐算法,基于上下文感知的推荐算法以及基于社交网络的推荐算法等,而基于用户地理位置的产品推荐方法并没有广泛流行。但随着移动互联网的蓬勃发展,用户的地理位置数据通过手机端GPS开始被大量获取,开始成为商品推荐的重要特征属性,使得一些基于用户地理位置的商品推荐任务成为可能。本文总结传统的推荐计算方法以及现代的推荐计算方法的发展历程,通过收集基于位置的人口普查数据和产品交易数据,提出一些基于位置的产品推荐计算方法。同时,由于数据规模较大,数据计算和调度的管理变得越加困难,单机计算模式难以处理海量的计算需求,而基于MapReduce的Hadoop平台在面对多轮迭代的机器学习技术时显得有些力不从心。因此,本文使用Oozie来进行数据流调度的管理,并使用Spark来加速机器学习算法的计算效率。经过实验比较和验证之后,证明使用Oozie管理数据流调度能够让系统变得容易扩展和维护,使用Spark在机器学习算法效率上要远好于基于Hadoop的算法效率,且基于位置的推荐算法在测评上有良好的效果。
其他文献
目的探讨婴幼儿泪囊炎泪道冲洗泪道联合探通术治疗的护理方法。方法对我院2010年6月-2014年6月间收治的婴幼儿泪囊炎病例资料进行回顾性分析,总结患儿行泪道冲洗及探通治疗过
<正>1921年胰岛素被发现并运用到临床,最初是经静脉注射,然后演变到今天最常见的皮下注射。由于胰岛素皮下注射使用不方便、许多患者对其使用有恐惧感以及注射部位有
目前我国城市社区普遍存在发育不良、发展滞后,社会工作者队伍远未形成,社区需求不足和供给不足等问题,以至社区活动严重行政化,社区主体单一,资源整合乏力。按照民政部提出
在回顾LIBQUAL读者服务质量调查问卷定量评价方法的基础上,对北京大学图书馆2006年读者服务质量调查问卷从信度和效度等方面进行了定量评价研究。
随着榆次区社会经济以及旅游业的发展,生态庄园旅游提到了重要议事日程。当前如何搞好与深化榆次区生态庄园旅游发展以及破解其发展过程中的困难与问题,对提升与推进榆次区旅
目的研究重组溶葡萄球菌酶对金黄色葡萄球菌生物被膜的体外清除作用。方法使用硅橡胶膜片建立金黄色葡萄球菌生物被膜的体外模型;使用超声震荡—活菌计数法作为金黄色葡萄球
分析了业务提供平台(SDP)的产生背景,全球SDP的发展,详细介绍了爱立信在ISMP实施,SDP的演进。
近年来,“过劳”“过劳死”等词汇频繁出现在报纸、网络等各类媒体报道中,随着我国现代化、工业化和信息化水平的不断提高,“过劳死”这种产生于发达国家的现代疾病已经走进
最近数十年见证了国内机动化水平的大幅提高,也导致了依然严峻的道路交通安全形势。同时,大量交通事故数据被记录下来,成为交通安全研究的宝贵资源。利用回归模型分析事故数
级联全控H桥式多电平变换器取消了传统功率单元级联式多电平变换器输入端体积庞大、接线复杂、价格昂贵的工频移相变压器,并以其高网侧功率因数、低器件耐压、能量双向流动、