一种周期性MapReduce作业的负载均衡策略

来源 :2012全国高性能计算学术年会 | 被引量 : 0次 | 上传用户:chaba
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  MapReduce任务负载均衡主要是通过分区函数来实现的,Hadoop默认的分区函数并不能很好保证reducer的负载均衡。本文针对周期性的业务处理提出了一种基于权重计算的负载均衡策略,周期性任务的数据分布与历史数据相比具有相似性,本策略根据历史数据运行的信息运算出数据权重信息——文中用权重表示每条记录的处理复杂度,再通过Map阶段抽样分析当前这批数据的分布特征来预测待处理数据带权重的整体近似分布情况,从而指导Reduce分区以保证其负载均衡。文章通过简单的例子仿真了整个策略的运作过程,并且对比了与TeraSort思路的不同点。最后通过分析用户访问视频的日志证明了文中提到的策略比默认的策略性能要提高了接近1倍。
其他文献
  原子钟数据噪声的去除和相位跳变的检测非常重要。本文提出了通过EEMD能量比率法消噪和HSA法捕获跳变信息的方法。本文详细地介绍了HHT基本原理,并进行了仿真研究和实际测
  生物特征加密技术由于生物特征认证技术和密码学方法组成。它在为生物认证系统提供精确性和便捷性的同时,也保证了生物模板的隐私性和安全性。本文对人脸特征模板保护技术
  随着数字信号处理应用的日趋广泛,对于算法实时性的要求也越来越高。这篇文章着重介绍基于TMS320C55x DSP芯片的C代码的优化。通过使用内联函数、生成双MAC操作、restrict
  文中介绍了混合线性预测(MELP)过渡帧编解码改进的一种算法。在MELP语音编码中,导致语音质量下降其中一个重要原因是语音帧的突变转换。针对此问题,文章引入清浊音判决(UN
  2FSK是数字通信应用较广的一种调制方式。文中详细的介绍了2FSK正交调制解调的原理,并给出了通用的正交调制解调框架。同时提出一种新的判决门限方法,该方法通过对相位差分
  对二维数据进行傅立叶变换可以得到其频谱信息,因此二维FFT模块是很多图像处理系统的重要组成部分。在Xilinx一维FFT变换IP核基础上,搭建二维FFT变换的实现架构,利用该模块
  本文介绍和比较当前超大规模并行计算的一些容错与恢复的方法,描述IBM高性能并行计算的Checkpoint/Restart 技术架构。同时探讨了并行计算的容错和恢复在超大规模集群架构
  鉴于图形处理器的应用日趋广泛,多核SoC的研究日益迫切,本文设计了一款异构多核图形处理器HMGPU-9.HMGPU-9将9个具有不同功能和不同结构的微处理器核、大量复杂专用电路
  随着超级计算机计算能力的不断提高,依赖于超级计算机的数值模拟等计算所生成的数据规模越来越大.常用的可视化系统已经无法有效处理大规模数据,直接导致相关研究人员无法
  高性能地学计算已成为计算机科学和地理科学交叉领域的研究热点。然而繁琐的并行编程问题常常妨碍地学专家快速而高效地研发地学算法。本文面向栅格数据处理的并行算法研