基于参数调优的Hadoop性能优化

来源 :内蒙古农业大学 | 被引量 : 0次 | 上传用户:psetpsetc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
云计算的出现给信息行业带来了一场前所未有的技术革命,Hadoop集成了云技术的多种内容,成为一个综合性的云计算服务平台,展现了可伸展性、容错性和高效率的特点。不断扩大的Hadoop应用领域提高了人们对Hadoop的性能要求。研究人员在分析Hadoop系统的实现框架、工作机制的基础上,从数据存储策略、调度算法、参数配置等多方面提出了性能优化措施。本文从配置参数、调度算法两方面进行优化策略研究,力求提高Hadoop集群的整体性能。Map Reduce、HDFS两个组件,共同组成了Hadoop,此两个组件的参数配置,对于集群性能来说,可以产生较大的作用。Hadoop平台上运行的作业类型很多,需要根据实际情况给出不同的参数配置方案,才能取得良好的运行效果。本文的研究重点是基于HDFS和Map Reduce的配置参数对高I/O负载和高CPU负载作业的影响,提出相应的优化方法。为了解决HDFS的参数最优问题,将模拟退火方法、遗传算法相结合,提出遗传模拟退火算法,确保遗传算法在全局空间中能够找到最优解。使用遗传模拟退火算法可以为高I/O负载作业选择合适的配置参数,提高作业的执行速度。实验表明,本文提出的基于遗传模拟退火算法的HDFS参数优化方法有效减少了作业的完成时间,为高I/O负载作业在Hadoop集群中的高效执行奠定了基础。针对Map Reduce的参数优化,基于传统PCM算法性能差、对初始矩阵值敏感的问题,本文对粒子群初始化方法进行改进,提出PSO-PCM算法。利用进化状态判定法来优化适应度值,提出双粒子群算法,通过每次迭代后改变聚类中心的值,生成多个聚类结果。最后,将提出的PSO–PCM算法应用于Map Reduce参数优化,通过实验证明基于PSO–PCM算法的Map Reduce参数优化方法能够提高高CPU负载作业在Hadoop集群中的执行效率。大量的研究表明,蜂群算法实现Hadoop作业调度时,比传统的先进先出调度、公平调度、计算能力调度策略具有明显优势,有效解决了云计算系统中的任务调度时间问题。由于蜂群算法具有早熟、收敛缓慢的特点,所以本文提出了一种改进的蜂群算法,将蜂群算法与K-means算法结合起来,提出K-means蜂群算法。实验证明,使用K-means蜂群算法实现作业调度,在减少作业完成时间、均衡负载等层面,体现出的优势较为明显。为了优化Hadoop任务调度中集中式批处理调度模型的任务超时率、系统能耗和自适应能力,本文提出了一种基于分层负载均衡算法的Hadoop任务调度模型。根据服务器的功能类型和性能,将调度系统划分为多个调度层。然后,通过使用最简单的调度策略来优化系统能耗,尽可能减少调度时间。实验证明,与基于模拟退火算法的Hadoop任务调度模型相比,基于分层负载均衡算法的Hadoop任务调度模型在负载均衡、任务超时率、系统能耗和自适应能力等方面具有更好的性能。
其他文献
功图计量是利用抽油机的示功图计算产量的一种软件量油方式,具有成本低、易维护、方便快捷的优点。通过提升功图计量技术、合理修正计量结果、采取多项改进措施,能够保证功图计量的精度,成功替代传统的单井计量方式,从而降低单井建设投资、减少工人劳动强度、提高信息化水平。
期刊
在实施乡村振兴战略重大决策部署的背景下,草原作为中国陆地面积最大的生态系统,在农牧业生产和生态调节等方面都发挥着重要的作用。草原生态补奖政策作为牧区发展最重要的支持政策,对于协调牧区、牧业和牧民的全面发展,促进牧区振兴战略,实现牧区生产、生活与生态和谐发展具有重要意义。目前牧户维持生计以畜牧业生产为主,因此,如何客观认识草原牧区畜牧业发展水平,研究如何在保护草原生态的同时实现牧区牧户畜牧业生产的可
学位
人类经济社会可持续、高质量发展正面临着全球气候变化的严峻挑战。以全球变暖为主要特征的气候变化正威胁着自然生态系统和社会经济系统的方方面面。中国处于气候变化的敏感区,更易受其影响。特别是对西部生态脆弱、敏感且经济发展速度相对较迟缓的农村牧区而言,无论是生态安全保障的自然资源还是为国民经济的稳定发展提供重要保障的农业,又极易受到气候变化的影响。内蒙古作为中国北方重要的生态安全屏障和畜牧业生产基地,其脆
学位
“十四五”时期是草原畜牧业改革发展的战略机遇期和关键转型期,发展机遇和挑战并存,草原畜牧业的发展要聚焦新要求、应对新挑战。在全面推行乡村振兴的时代背景下,适度规模经营的提出为新时期中国草原畜牧业的发展明确了方向和要求。立足当前中国的基本国情,适度规模经营是保证草原畜牧业持续健康发展和实现牧民增收的重要模式,是优化现阶段畜牧业经营格局、加快草场流转的有效途径,是促进草场、劳动力与资本等生产要素优化配
学位
高加索三叶草(Trifolium ambiguum)是一种多年生根蘖型豆科牧草,具有适应性强、抗逆性突出等优良性状。但是,结瘤固氮能力弱限制了其推广种植。以高加索三叶草为试验材料,通过分析根瘤内细菌多样性,探究其结瘤固氮机理,旨在找到可以高效结瘤固氮的菌株,提高其接种后的固氮能力,为高加索三叶草的推广应用突破固氮壁垒。本研究对高加索三叶草根瘤细菌进行分离纯化,对分离后的菌株进行表型多样性测定和遗传
学位
全球变化正深刻影响着陆地生态系统和人类可持续性发展。极端降水事件频发和氮沉降增加,导致生物多样性丧失、生态系统稳定性降低等严重问题,进而影响草原生态系统为人类提供的食物产品、生态屏障功能以及生态系统对气候变化的反馈调节作用。荒漠草原是亚洲中部独有的地带性植被类型,处于草原向荒漠的过渡区,也是全球变化影响的敏感区。但是,在全球变化背景下荒漠草原植物、土壤和微生物三个要素的系统性评估、与环境因子的关系
学位
干旱是制约牧草生长发育和产量的主要逆境因素之一。研究牧草响应干旱胁迫的形态、生理反应以及分子机制,挖掘干旱应答基因,对牧草抗旱品种培育具有重要意义。扁蓿豆(Medicago ruthenica L.)属于一种抗寒、耐旱且适应性强的多年生豆科牧草,是研究豆科植物抗旱机制和挖掘抗旱基因的理想材料,同时也具备开发为优良牧草资源的潜力。本研究以土默特扁蓿豆为供试材料,02982和03056扁蓿豆种质为对照
学位
草地生态系统中植物、土壤及其微生物互相之间存在密不可分的联系。放牧对草地生态系统的影响是复杂的,家畜一方面通过采食影响植物的群落特征,另一方面通过践踏和粪尿返还影响土壤的理化性质,进而影响土壤微生物的群落结构和功能,而微生物群落结构和功能的改变会进一步调控土壤的养分循环过程,直接影响植物的养分吸收。氮素是荒漠草原植物健康生长的重要限制因子之一。因此,为了系统的阐释植物的氮素吸收特性及生长特性对载畜
学位
内蒙古荒漠草原生态系统脆弱,放牧是该类草地的主要利用方式,然而由于长期的过度放牧造成大规模的草原退化,诱发了一系列土壤环境问题,特别是土壤有机碳损失及其组分的改变表现尤为突出。基于此,本研究依托内蒙古农业大学荒漠草原长期不同放牧强度控制实验平台(2004年建立,设置未放牧、轻度、中度和重度放牧,4个放牧处理),通过野外取样结合室内分析,测定土壤环境指标、土壤有机碳及其组分含量,利用扩增子测序和基因
学位
科学是一个发展的过程,学习化学相关的科学史,能让学生跟着知识的认知结构,让学生理解和认识到事物的本质,较为贴近学生的元认知,助学生建构科学严谨的化学观点和知识架构、思维结构。
期刊