大数据处理统一引擎Apache Spark研究

来源 :现代制造技术与装备 | 被引量 : 0次 | 上传用户:liyin900101
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Apache Spark是当前流行的大数据处理统一引擎,具有通用、高效、易用等特点。Apache Spark是针对Map Reduce在交互式数据挖掘、迭代式算法、机器学习等应用的低效率而提出的一种可同时进行批处理、交互式计算、流式计算的内存式计算框架。本文介绍了Map Reduce的基本概念与设计思想,并与Spark进行对比分析,着重介绍了Spark的核心技术DAG和RDD,最后给出相关的编程示例。
其他文献
伴随泛资管时代渐行渐近,基金行业内外竞争更趋激烈,各色创新产品一哄而上。作为国内首批沪深300ETF,同时目前最大ETF(交易型开放式指数基金)的掌舵人,嘉实基金结构投资部总
在国有企业集团跨行业、跨区域、跨所有制经营发展形势下,如何加强财务监督,切实维护好公司的合法权益,防止国有资产流失,已经成为国有企业当前面临和需要解决的一项重要课题
在前期研究确定总氮用量180 kg hm–2下,缓释氮肥与常规氮肥7∶3配施比例可获得机插稻高产的基础上,研究缓释氮肥配施和不同株距下机插杂交稻磷素积累、分配与利用特征及其与
高频变压器作为开关电源最重要的一个组成部分,其性能直接影响到开关电源的性能。基于面积乘积法对高频变压器进行设计,该方法利用面积乘积值选择磁芯,根据磁芯对绕组进行设
基于Sen的可行能力福利思想框架,运用Atkinson的广义均值不平等理论,构造了一种测度中国农村社会福利水平的新模型,该模型由物质生活水平、知识技能、健康状况和环境四个功能
目前,我国高校心理辅导进入空前发展的阶段,培育了大量人格健全、社会适应的大学生。与此同时,高校心理咨询中心也存在一些不足,许多高校的心理健康教育工作举步维艰,心理咨
为了探索青贮饲草饲喂奶牛效果,草原站于2014年7月5日~8月4日做了饲喂对比试验,现将试验结果报告如下:1材料和方法1.1供试牛的选择在崆峒区柳湖村何进林饲喂的奶牛,选用体况发育正
期刊
Apache Spark是一个快速通用的集群计算系统,已成为大数据领域最活跃的开源项目之一。文章主要对使用spark和Python来实现数据处理进行了相关应用研究。
<正>~~
大小不同角膜塑形镜是硬镜,直径小于"黑眼球";隐形眼镜是软镜,直径较大,覆盖整个"黑眼球",影响泪液的流通。年龄软镜不适合18岁以下的用户使用,但角膜塑形镜8周岁以上即可配戴。
期刊