MapReduce中基于检查点的任务恢复策略的研究

来源 :内蒙古大学 | 被引量 : 0次 | 上传用户:dusan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着互联网的发展,数据呈爆炸式增长。为了挖掘数据中的价值,大数据处理技术已经成为计算机领域中不可或缺的重要手段,Google提出的MapReduce计算模型成为大数据时代行之有效的技术之一。但在集群中,失效已经十分常见,如果没有合理的容错手段,MapReduce应用会存在严重性能问题。Hadoop作为MapReduce最为流行的开源框架,能够帮助用户实现MapReduce应用,并提供了基本的容错能力。然而其固有实现中粗放的重新执行策略会因错误恢复而带来大量开销,导致作业执行时间被延长。本文对Hadoop MapReduce容错方案进行了深入分析,从任务运行和失效检测两方面提出了综合性容错方案TRCID(Task Recovery mechanism based on Checkpointing Intermediate Data)。旨在能够减少任务重算的工作量,提前发现失效的任务,以便能在失效发生后能够以最小的代价尽快恢复任务执行,提高整体作业的运行效率。TRCID一方面提出分级检查点的容错方案,针对不同失效类型进行任务恢复。通过以部分中间数据的及时推送替代原有对中间数据的拉取方案,能够保证在大多数失效场景下,避免数据重算,最小化容错开销。另一方面通过Hadoop心跳以多个性能指标对节点进行监测,与原有的超时策略相比,能够更及时的发现失效并进行调度。本文基于Hadoop平台完成实验对本文所提出的方法进行验证与评测,首先通过作业执行时间和硬件指标对TRCID的负载进行评估。然后结合TRCID的运行流程以及故障类型,以多种场景进行覆盖,并在各种场景下,结合作业规模、故障数量等因素设计实验并进行了结果评估与分析。实验表明,TRCID有效减少了失效对整体作业的执行时间的影响,容错能力明显优于原有Hadoop的容错方案。
其他文献
数量柔性契约是供应链协调采用比较广泛的一种契约,是目前供应链契约研究的一个热点问题。数量柔性契约可以提供给零售商一种产品订购量柔性和产品补偿量柔性,使零售商更好地
最近 Laser Interferometer Gravitational-Wave Observatory(LIGO)引力波(gravitational wave,GW)观测组首次探测到三个疑似引力波信号,即GW150914、GW151226和LVT151012。
强场原子分子非次序双电离是强场物理科学中重要的基本过程。由于电离过程中双电子体现强烈的关联性,开展强场非次序双电离研究,对人们深入理解强场过程,进一步认识微观世界
本文首先介绍了多目标优化的概念,对算法的发展历程进行了概括并简要介绍了算法的评价指标。随后介绍了本文主要在多目标进化算法上所做的工作。在本文中首先主要针对算法陷
在网络信息技术发展的热潮下,当前社会进入了信息共享万物互联的时代。在室外定位技术成熟应用的背景下,室内定位技术在生产生活中扮演着越来越重要的角色,然而现阶段室内无
背景 学术期刊的跨学科评价,是国内外研究的热点和难点。目前,学术期刊跨学科评价指标主要有期刊分区(journal Quarti,JIF Quarti)、期刊影响因子百分位(journal impact fact
计算机视觉理论出现于二十世纪五十年代,主要用于二维图像的分析与识别。计算机视觉研究的出发点及核心均在于提取视觉信息,而对视觉信息的合理处理就是解决一切问题关键。本
受人类活动和气候变化影响,我国海岸带盐沼植被面临着严重威胁,其面积、分布以及相应的生态服务功能处于快速变化中。如何快速准确地对海岸带盐沼植被进行精准遥感监测,对维
在神经科学研究领域,通过电极阵列同时记录多个神经元放电活动越来越普遍。分析多个神经元的连接关系是了解产生某种特定脑功能活动神经元如何工作的关键。论文通过记录猴子
行人检测在视频监控、人机交互、无人驾驶、机器人、高级驾驶员辅助系统等方面有着广泛应用。在计算机视觉领域,研究最多的就是行人检测。准确率高、速度快是研究人员追求的