数据本地性感知的MapReduce负载均衡策略

来源 :计算机科学 | 被引量 : 0次 | 上传用户:dfvgbergbeg435
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现有针对MapReduce的负载均衡调度的研究均未考虑中间数据的分布特点及网络传输的开销,导致额外的网络传输代价与系统效率的下降.为解决上述问题,提出了一种数据本地性感知的负载均衡策略.充分利用YARN中资源管理的新特性,在Map阶段对内存数据溢写的同时进行统计以获取数据分布,根据数据分布情况及各节点的计算能力进行任务调度,减少网络传输开销的同时尽量保证各节点的负载平衡.此外,通过引入细粒度分区与分区的自适应分裂策略,进一步提高在数据倾斜时调度策略的性能.对比实验结果表明,提出的负载均衡调度策略能有效提升
其他文献
全面介绍了一个基于可编程控制器的工业用电子加速器控制系统 .它的计算机控制系统采用可编程控制器(PLC)作为核心设备,先进的硬件技术和优化的软件设计使整个系统的可靠性、
提出了一种用IPC工控机结合Internet技术实现控制系统远程监控的通用低成本解决方案.在工控机中利用VB6.0和VC6.0编程进行实时数据的采集、处理及控制,通过RDO对象模型及ODBC
轻便高频可控震源是一种用于工程探测和浅层地震勘探的激震设备,它的主要作用是提供参数得到严格控制的Chirp信号(LFM)。围绕信号的产生和参数的控制,本文重点讨论了计算机控制系统的软硬
测量误差是普遍、客观存在的 ,是不可避免的 ,利用FoxPro数据库管理系统编制的DEMO PRG实用程序对测量数据进行校验和处理 ,则对提高测量数据的精度及可靠性 ,完成预定测量任务有重要的意义。
以网络食品安全信息为研究对象,旨在提出一个能够解决食品安全领域专有名词指代不明的歧义消解算法。文中采用的歧义消解算法是在改进的TF-IDF特征选择算法的基础上,结合了隐含
介绍了无线寻呼发射机自动监控系统的设计方案,该系统将远程数据的采集、传送、延时和寻呼编解码等溶为一体,解决了当利用寻呼链路和主发频率作为传递参数的上、下行通道时,对系
基于嵌入式uClinux操作系统,使用Motorola MC68VZ328 CPU,设计并实现了一种数字存储示波器.利用两组FIFO构成双体交叉存储器将采集速度提高一倍.在uClinux平台上实现多任务程
针对大数据离线分析类和交互式查询类负载,首先对这些负载的一些共性进行分析,提取出公共操作集,并对它们进行分组整理;然后在大数据平台上测试这些负载运行过程中的微体系结构特
首先基于改进的Hash和位运算设计了快速等价类与正区域算法,将其作为求核基础;然后设计基于全局正区域不一致性的快速求核算法.区别于现有算法在求核过程中需要反复多次求正
大规模网络结构复杂,需要有针对性的网络监测方法。测量节点的自动选择必须在测量代价和覆盖范围之间进行权衡。合理地测量节点选择,能在获取全网性能状况的同时,有效减少测