Spark大数据计算平台

来源 :电子世界 | 被引量 : 0次 | 上传用户:guohl_sh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的发展,每时每刻都在产生大量的数据,数据量已成为爆炸性增长的趋势,单机难以存储和分析这些数据。面对难以处理海量数据的单机现状,采用Hadoop分布式计算平台可以有效解决海量数据处理问题。但是Hadoop的MapReduce编程模型不仅操作单一,抽象层次较低难以上手,而且延时高,难以支持交互式数据处理和实时数据处理,加之其中间结果需存入HDFS对于迭代数据处理性能较差。Spark作为一个新兴的大数据梳理的引擎,除了提供了包括MapReduce在内的几十个算子,还提供了一个集群的分布式内存抽象,
其他文献
中国电信公司化改制的顺利完成,标志着中国电信已从真正意义上实现了政企分开。应该说,中国电信各级次企业公司化运作的开始,实质上也是各级次企业内部改革的开始。对于处于
期刊
CDMA作为目前三大移动通信技术之一,有其特殊的关键技术特性。本文主要针对CDMA通信系统的基本原理和软切换等关键技术做简要论述。并最后运用System View软件对其整个通信过
目的:探讨对老年糖尿病患者进行强化健康教育对其治疗效果的影响。方法:选取近期上海市嘉定区迎园医院收治的94例糖尿病患者作为研究对象。根据随机数表法将这些患者平均分为对
本文分析了当前个别技工院校实施计算机应用基础课程教学存在的不足,并就如何改进解决提高教学质量提出笔者观点。即遵循教学规律合理安排教学;结合专业重构教学内容和定制考核
随着计划生育的推进,我国的人口得到了有效的控制,但是因此也出现了新的社会问题,那就是人口老龄化日益严重。农村老年人亟待养老,但是养老的环境和设施都不够完善。而城市老
近年来,网络经济的发展气势如虹,大量的海内外资金涌向 IT 产业。网络经济有着无限商机,但也必须保持清醒的头脑。1、全行业的宏观指导不够,一哄而上,资金、宝贵的人力资源重
期刊
一、两相发酵池结构两相发酵技术所采用的发酵装置,综合了秸秆干发酵和水压池粪便发酵技术的特点。其原理仍根据作物秸秆和粪便原料的不同特性,应用两种不同手段来分别处理,
随着现代社会的发展和高校体制改革的深化,高校决策权随之扩大,决策科学化日渐受到决策人员的重视,成为教育活动成功与否的关键因素。因此本文在了解教育决策科学化的有关内容后
随着我国高速公路的迅猛发展,对沥青砼路面平整度要求越来越高,路面平整度的合格率既反映了行车舒适程度,又反映了施工队伍的水平。近几年来就国内几条高速公路沥青砼路面工
数学是人类社会发展中不可缺少的一种生活工具。但因其抽象、复杂的特点,不少学生从主观上厌恶数学学习。简约教学的实施,可以有效地改变学生厌学的现象。简约而不简单的小数