一种周期性MapReduce作业的负载均衡策略

来源 :2012全国高性能计算学术年会 | 被引量 : 0次 | 上传用户：chaba

【摘要】

：

　　MapReduce任务负载均衡主要是通过分区函数来实现的,Hadoop默认的分区函数并不能很好保证reducer的负载均衡。本文针对周期性的业务处理提出了一种基于权重计算的负载均

【作者】

：

Fu Jie 傅杰 Du Zhihui 都志辉

【机构】

：

DepartmentofComputerScienceandTechnology,TsinghuaUniversity,Beijing100084.China清华大学计算机科学与技术系,北京10008

【出处】

：

2012全国高性能计算学术年会

【发表日期】

：

2012年10期

【关键词】

：

计算机网络数据处理负载均衡策略周期性

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

　　MapReduce任务负载均衡主要是通过分区函数来实现的,Hadoop默认的分区函数并不能很好保证reducer的负载均衡。本文针对周期性的业务处理提出了一种基于权重计算的负载均衡策略,周期性任务的数据分布与历史数据相比具有相似性,本策略根据历史数据运行的信息运算出数据权重信息——文中用权重表示每条记录的处理复杂度,再通过Map阶段抽样分析当前这批数据的分布特征来预测待处理数据带权重的整体近似分布情况,从而指导Reduce分区以保证其负载均衡。文章通过简单的例子仿真了整个策略的运作过程,并且对比了与TeraSort思路的不同点。最后通过分析用户访问视频的日志证明了文中提到的策略比默认的策略性能要提高了接近1倍。

其他文献

HHT在原子钟数据消噪与相位跳变检测中的应用

　　原子钟数据噪声的去除和相位跳变的检测非常重要。本文提出了通过EEMD能量比率法消噪和HSA法捕获跳变信息的方法。本文详细地介绍了HHT基本原理，并进行了仿真研究和实际测

会议

原子钟数据噪声相位跳变检测信号处理希尔伯特黄变换方法

人脸特征模板保护方法研究

　　生物特征加密技术由于生物特征认证技术和密码学方法组成。它在为生物认证系统提供精确性和便捷性的同时，也保证了生物模板的隐私性和安全性。本文对人脸特征模板保护技术

会议

生物认证系统人脸特征模板保护技术攻击方法安全性能

基于TMS320C55x DSP芯片的C代码优化

　　随着数字信号处理应用的日趋广泛，对于算法实时性的要求也越来越高。这篇文章着重介绍基于TMS320C55x DSP芯片的C代码的优化。通过使用内联函数、生成双MAC操作、restrict

会议

C语言优化技术执行效率DSP芯片

MELP编码器中过渡帧编解码算法的改进

　　文中介绍了混合线性预测(MELP)过渡帧编解码改进的一种算法。在MELP语音编码中，导致语音质量下降其中一个重要原因是语音帧的突变转换。针对此问题，文章引入清浊音判决(UN

会议

混合线性预测编码器过渡帧编解码算法误差分析语音质量

2FSK正交解调算法的研究

　　2FSK是数字通信应用较广的一种调制方式。文中详细的介绍了2FSK正交调制解调的原理，并给出了通用的正交调制解调框架。同时提出一种新的判决门限方法，该方法通过对相位差分

会议

数字通信2FSK正交解调算法判决门限方法仿真分析

基于FPGA的二维FFT实现

　　对二维数据进行傅立叶变换可以得到其频谱信息，因此二维FFT模块是很多图像处理系统的重要组成部分。在Xilinx一维FFT变换IP核基础上，搭建二维FFT变换的实现架构，利用该模块

会议

图像处理二维FFT变换并行设计运算效率

超大规模并行计算容错恢复的实现和挑战

　　本文介绍和比较当前超大规模并行计算的一些容错与恢复的方法，描述IBM高性能并行计算的Checkpoint/Restart 技术架构。同时探讨了并行计算的容错和恢复在超大规模集群架构

会议

并行计算容错技术容器虚拟化检查点

流水线型异构多核图形处理器的设计与原型实现

　　鉴于图形处理器的应用日趋广泛,多核SoC的研究日益迫切,本文设计了一款异构多核图形处理器HMGPU-9.HMGPU-9将9个具有不同功能和不同结构的微处理器核、大量复杂专用电路

会议

图形处理器结构设计异构系统并行计算

大规模数据并行可视化与交互环境

　　随着超级计算机计算能力的不断提高，依赖于超级计算机的数值模拟等计算所生成的数据规模越来越大.常用的可视化系统已经无法有效处理大规模数据，直接导致相关研究人员无法

会议

大规模数据可视化科学计算可视化并行处理人机交互

HiE-RDP2高性能栅格数据并行处理引擎

　　高性能地学计算已成为计算机科学和地理科学交叉领域的研究热点。然而繁琐的并行编程问题常常妨碍地学专家快速而高效地研发地学算法。本文面向栅格数据处理的并行算法研

会议

栅格数据并行处理引擎地理空间数据高性能计算

一种周期性MapReduce作业的负载均衡策略

与本文相关的学术论文