MapReduce模型中间数据处理流程的改进

来源 :大科技 | 被引量 : 0次 | 上传用户:brettymate
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的MapReduce编程模型在实际数据处理流程中,在Map阶段处理后的数据,生成的中间结果可能有的偏大,有的偏小,造成数据不均衡现象的出现,这样就会在某些Reduce节点上出现因分配数据过大而引起"累死"的现象,与此同时,有的节点因分配不到任务或者分配的任务较少,而出现"饿死"的情况.针对中间结果的不均衡问题,本文采用狄克逊(Dixon)准则改进MapReduce模型系统架构,实验证明该模型有一定的优化效果.
其他文献
在传统工程造价管理中,存在着造价过程彼此孤立,造价数据无法及时确认等问题.本文主要介绍BIM技术有效解决了传统工程造价管理中存在的问题,并推动着工程造价控制水平的提高.
项目造价管理在工程建设管理工程中有着重要作用,贯穿整个建筑项目的整个过程.本文从建筑工程造价管控的主要内容入手,重点对当前建筑项目造价管理过程中存在的主要问题进行
目前,我国的建设项目由于经济的飞速发展而不断增多,与此同时,随着建筑行业自身的不断发展,对其建设管理的要求也越来越高.在项目建设的成本管理中,很多建设业主由于人手紧缺
新时期,社会经济快速发展,我国建筑行业也取得了很大进步,与此同时,对于建筑性能和施工质量的要求也越来越严格.水泥是混凝土结构的主要原料,能够在很大程度上影响混凝土耐久
本文着重于UPS电池监控系统在实际工作运行中,由于软件系统出现问题需要重装,以及硬盘数据爆满需要清理数据等两种情况之下所要进行的操作.
设计了一个基于Proteus的单片机控制LED系统.通过Proteus构建单片机LED霓虹灯控制系统,Proteus与KeilC联合调试, Proteus建立了完备的电子设计开发环境,在开发环境中使其产生
科学技术的飞速增长,计算机与技术的应用领域日益广泛,给人们生活工作的各个层面带来了深刻的影响.计算机的应用大大提高了人们的工作效率,在现代社会人们的工作和生活中已经
网络优化是一个改善全网质量、确保网络资源有效利用的过程.本文首先谈及了LTE无线网络优化面临的挑战,并结合工作实际,进一步总结LTE无线网络优化整体思路,仅供参考.
随着社会经济的发展以及科学技术的进步,网络工程虚拟仿真实训平台在各个职业学校得到了较为广泛的应用.就当下应用情况来看,网络工程实训平台存在着投资大、易损坏等不利问
随着社会的发展,人们日益关注安全问题,"以人为本,安全发展"的理念深人心,生产企业从安全管理的角度出发,提高员工的安全意识,实现企业安全健康持续发展.