基于Spark海量数据的排名系统设计

来源 :计算机与网络 | 被引量 : 0次 | 上传用户:hua1kai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
1引言在信息化的现代社会中,获得的各种数据越来越多,对于这些数据的处理工作也逐渐变多。对于很多数据的常规操作来说,数据量达到了一定的程度,其处理的复杂度便会上升,速度也会下降。对于海量的数据处理而言,即使是最常见的排序操作也会面临许多问题。本项目基于Spark开源框架设计了一个高性能的排名系统,适用于海量、可能存在倾斜问题的数据。
其他文献
无论对于世界上哪个民族而言,文化这一核心要素均是该民族得以实现延续并屹立于世界之林的关键要素所在。刚刚结束的十九大也对"文化自信"加以着重论述。在我国社会主义建设
本文以2009-2017年中国新能源上市公司为样本,以企业得到的政府补贴为研究对象,运用系统GMM估计方法,实证分析了政府补贴对研发投入的影响以及研发投入对企业绩效的影响,以考
手机用久了,容量莫名其妙就不够了。用手机系统自带的垃圾清理功能释放空间,表现往往令人捉急。今天给大家介绍一款非常良心的安卓清理APP。这款《清浊》APP来自国内的个人开
针对隔爆腔内允许使用的镍氢电池单体容量较小,煤矿井下备用防爆电源无法满足长时间供电的问题,采用镍氢电池成组管理和同一隔爆腔内2组镍氢电池组充放电管理等方法,提高备用
目的探讨全机器人心脏手术患者的心理体验。方法采用质性研究方法,通过目的抽样及半结构式深度访谈法收集资料,采用Colaizzi内容分析法,阐述全机器人心脏手术患者的真实心理体验
最近,电视剧《蜗居》的热播,激发了广泛的讨论。引人注目的,不仅是各种联系现实的精辟分析,更在于人们对剧中两位主要角色,贪官“宋思明”和甘当贪官情人的“海藻”的态度 R
为了更详细了解大采高工作面分区尘源粉尘运移分布规律,以补连塔煤矿12511综采工作面为研究对象,利用流体力学CFD软件对8 m大采高综采工作面粉尘运移分布规律进行数值模拟研
瓦斯涌出受诸多因素的影响,为了研究低瓦斯煤层综放工作面高强度开采时瓦斯涌出的时空分布特征及关键影响因素,采用现场实测的方法,分别研究了高强度开采条件下低瓦斯综放工
为了研究上保护层不合理布置导致被保护层开采过程中巷道围岩严重变形破坏的问题,采用现场调研、理论分析、数值模拟和矿压观测等方法,对中兴矿3203工作面上保护层开采后的影