大数据环境下Hadoop作业调度算法的研究

被引量 : 9次 | 上传用户:abc1234Shi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动互联网、云计算、物联网等新技术浪潮的兴起,数据的体量、类型、速度和价值,在很短时间内达到前所未有的程度。传统数据已完成了质变,大数据时代正式到来。Hadoop是一个开源的能够对大数据进行分析和处理的分布式计算平台,它具有高可靠性、高扩展性等很多优点,成为各大企业存储和处理海量数据的首选工具,在工业界和学术界备受关注。Hadoop2.0推出了通用的资源管理系统YARN,它的主要功能是对Hadoop平台的资源和提交到平台的作业进行管理和调度,其中,作业调度算法的优劣会直接影响Hadoop平台资源利用率的高低进而影响到Hadoop平台的性能。因此对作业调度算法的研究有重要意义。负载均衡在集群系统中十分重要,如何合理的分配平台中的计算资源、平衡节点负载是Hadoop集群中需要解决的一个重要问题。现有的作业调度算法是基于同构环境设计的只追求作业最短完成时间,没有考虑节点的负载能力,这在异构环境下很容易导致集群节点负载不均衡,出现一些计算节点负载过大而同时另一些计算节点处于闲置状态的现象,严重降低了平台的性能。针对集群负载不均衡的现象,提出了负载均衡度量函数(Load Balancing Measure Function,LBMF)。针对Hadoop调度在异构环境下负载不均衡的问题,提出了基于LBMF的粒子群调度算法(Load Balance Measure Function Particle Swarm Optimization,LBMFPSO)。在LBMFPSO算法中,提交的作业被当作粒子,节点的位置即为搜索空间,将LBMF和作业执行完成时间同时作为适应度函数来指引粒子的更新,粒子探索最优解的过程即为作业调度的过程。并且将LBMF<5%作为LBMFPSO的一个终止准则即作业调度结果一定是符合负载均衡的。搭建Hadoop实验平台,进行实验验证,结果表明,通过LBMFPSO调度产生的结果不但能使作业执行时间较短,而且系统资源的利用率较高,兼顾了作业执行时间最小和节点的负载均衡。
其他文献
信仰隶属于文化,信仰的建立也依赖于文化。传统文化、红色文化、大众文化构成了我国文化的基本生态,多元文化的冲突造成了当代青年学生信仰的迷茫。为了让青年学生摆脱困境,
通过室内加速加载试验研究水泥混凝土桥面薄层环氧抗滑铺装材料的使用性能。设计的加速加载试验可模拟反复行车荷载对薄层环氧抗滑铺装材料产生的表面磨耗、集料松散脱落以及
研究背景冠心病是一种发病率、死亡率和致残率极高的常见病和多发病,严重威胁人类健康,已成为严重的社会公共卫生问题之一。心肌缺血发生时,能够及时、有效地恢复缺血心肌的
针对浮法玻璃生产过程中经常出现的划伤、压伤情况,分析其产生的原因,指出划伤、压伤的特点及处理办法。
目的 探讨茵陈蒿汤治疗黄疸型肝炎的疗效。方法 选择2010年7月-2017年6月在我院诊断治疗的黄疸型肝炎患者100例为研究对象,随机分为观察组和对照组,各50例。两组均给予核苷类
为了对比研究温拌改性剂RH和Sasobit对浇注式沥青混合料路用性能的影响,在油石比为8.5%、9.0%、9.5%的浇注式沥青混合料中分别掺入0、1%、2%、3%的温拌改性剂RH和Sasobit,并
“营改增”是目前我国财政政策的中心工作,本文试图利用可计算一般均衡模型,探讨不同的营改增政策方案对居民福利、经济效率以及产业结构调整可能产生的影响。自1994年分税制
随着移动互联网及智能终端的快速发展,数据流量呈爆发性增长,用户对移动宽带的需求日益增加。根据移动运营数据统计,90%以上的数据流量产生于室内。随着移动“四网协同”战略
在大众创新、万众创业的时代背景下,社会对高质量人才的需求日渐增加,工程管理专业在培养人才方面也面临着与日俱增的压力与动力。如何构建适应未来社会需求的课程体系成为工
根据电子行业对超薄浮法玻璃质量的特殊要求,研究和开发了点状缺陷、微观波纹度、翘曲、毛细划伤等超薄浮法玻璃质量的检验方法,为超薄浮法玻璃的稳定生产和质量控制提供了比