面向高性能计算的YARN平台关键技术与应用研究

被引量 : 0次 | 上传用户:fei5301821
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的来临,各类并行计算框架应运而生。这其中,基于MapReduce架构的Hadoop和Spark等由于具备高容错性、高扩展性和高可靠性等优点,越来越受到人们的关注。随后,研究人员在MRv2中将资源管理和处理组件分开,形成通用的资源处理框架—-YARN,进一步提升了系统的可伸缩性、效率和灵活性。YARN平台非常适合面向互联网的大规模数据处理,但当其应用到高性能计算中时,在资源调度、Shuffle算法等方面,仍然存在可提升性能的地方。本文针对上述问题,进行了深入的研究,取得的主要成果如下:(1)提出并实现了一种基于人工鱼群的YARN平台资源调度器算法,提高了系统的资源利用率。该算法从提高内存利用率和减少job运行时间两个方面进行了改进,使其更加适应高性能计算的需求,并将其抽象为MKP多背包问题,最后应用人工鱼群算法获得最优解。实验证明本文可以有效地提高系统的运行效率和资源利用率。(2)提出并实现了一种面向RDMA的YARN平台Shuffle算法,提高了YARN系统的处理效率。该算法充分利用新一代网络互联设备RDMA的高带宽,将Shuffle操作从Reduce端分裂出来,做成后台进程,同时改进了读写策略,降低了磁盘随机读写的负载,减少了Shuffle过程的时间。实验证明改进的Shuffle算法可以有效地提升系统的处理效率。(3)针对地质高性能计算应用系统—-Kirchhoff叠前时间偏移(PKTM)算法进行了研究,在本文改进的YARN平台上,分别提出和实现了基于Hadoop平台和Spark平台的PKTM系统,并对其性能进行了分析,验证了本文改进算法的有效性,也为地质成像算法在MapReduce架构上的并行化提供了借鉴。
其他文献
<正>在整个小学数学教学中,贯穿着两条主线:一条是明线即数学基础知识的教学,是写进教材的,一直都很受重视;一条是暗线即数学思想方法的教学,较少或没有被直接写进教材,但对
贵州是歌舞的海洋,贵州17个世居民族创造了众多优美的民歌。侗族大歌、苗族飞歌、布依族八音坐唱、土家族高歌等构成了贵州原生态民族音乐的优秀画卷。而2009年9月30日,联合国
对当前国内网络信息服务市场中市场主体的多元竞争格局、各类市场参与者的竞争特征进行全面分析,指出在现有竞争态势下,图书馆应协调好与其他竞争主体的关系,依照合作竞争、
利用系统论的观点将正规化的形式含义与实质含义结合起来,更全面的把握正规化的基本内容与要求,进而明确我国公安队伍正规化建设的现实困惑,才能有的放矢,更好地促进公安队伍
基于云驾岭煤矿原轨道下山架空乘人装置安装使用中所出现的横梁变形、检修拆装不便及安全隐患等诸多问题,采用了新的架空乘人装置安装新工艺,彻底解决了该装置使用中所出现的
苏格拉底之死的原因是历史上的一个难解之谜。然而现有研究很少从苏格拉底之死的历史背景出发来探讨苏格拉底之死的原因,所以本文紧紧抓住苏格拉底之死的历史背景来探究这一
<正>爱国主义是千百年巩固起来的对祖国的深厚感情,是中华民族自强不息的精神支柱。开展爱国主义教育,就是要使青年了解祖国的过去、现在和未来,升华对祖国的深厚感情,认
从提出政府职能转变的要求至今,“职能转变”这一话题一直就是行政管理体制改革重要的主题之一。政府职能作为政府转型核心,决定着政府活动的方向、范围,是研究政府问题的逻
外化问题行为是幼儿常见的问题行为之一,对幼儿的发展有着深远的影响,它不仅会影响幼儿的同伴关系还会影响幼儿以后的社会适应和学业成绩。社会情绪教育作为近几年的热门课题
在分析工程咨询行业特性基础上,借鉴国内外知识管理系统构建研究成果,提出工程咨询企业知识管理系统构建策略。先提出核心知识体系的概念,之后构建工程咨询企业的核心知识体