基于任务特征与公平策略的Hadoop作业调度算法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:fengmiaoli
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,Hadoop技术不管是在科研方面还是在应用方面都取得了巨大的发展,作业调度技术作为Hadoop平台的核心技术之一,其目的是调度作业执行的顺序和分配计算资源。作业调度算法的好坏将直接影响到整个平台的计算性能。到现在为止,Hadoop认可的调度算法都有一定的不足,先进先出(FIFO)是针对单用户来设计的,它忽略了不同作业之间存在的差异,计算能力(CapacityScheduler)队列设置和作业选组无法自动进行,计算能力(Fair Scheduler)没有考虑当前系统各节点的负载情况。在现有调度算法不足的基础上提出了基于数据本地性的类时间片轮转算法,该算法考虑作业的优先级和作业与运算节点之间的数据本地性,设定一个避让阀值,来解决数据本地性和优先级之间的先后关系,采用类时间片轮转方式,来确保任务间的并行运行。在保证优先级的前提下尽量满足作业的数据本地性,每次调度都从作业队列中选择对当前节点来说最优作业进行调度。这样既能保证优先级高的作业不会因其他作业的数据本地性而造成响应时间延长,又能保证系统整体较短的响应时间。然后对算法的思想、具体实现、预期目标做了详细的阐述。最后编写代码对提出的算法进行实验测试。实验结果表明,新提出的调度算法与Hadoop现有调度算法相比,可有效的缩短作业的响应时间。
其他文献
无线自组织网络是终端节点自发组织形成的网络,具有分布式运行、拓扑动态变化等特点。移动自组织网络以及无线传感器网络都是被广泛研究的无线自组织网络。由于部署方式灵活,无
目前,重大经济领域内草拟后待颁布政策很多,如何保证这些政策的一致性,作为国民经济和社会发展中迫切需要解决的关键问题,受到了越来越多的关注。在研究政策的一致性时,需要对政策
云计算为数据处理工作带来了新的机遇与挑战。传统的关系型数据库在大数据的需求面前显得力不从心,而分布式非关系型数据库由于其高可靠性、高可用性的特性,能够满足大数据带来
近年来,自然语言处理的相关技术研究中,基于统计的研究方法占据了主导,基于实例和统计的翻译方法为机器翻译技术提供新的研究思路。对于机器翻译领域来说,语料库是机器翻译统计学
情感机器人就是运用人工的方法和技术赋予机器人类似人的情感,使机器人具有自主性,能够在情感机制的作用下调节自身的行为选择。多情感机器人任务分配问题即在传统的任务分配问
人脸表情是进行交往和表达情绪的一种重要手段,不经过特殊训练,人类对其面部表情往往很难掩饰,所以,通过对人脸表情进行分析,可以获得重要的信息。人脸表情识别是人机交互的
自治水下机器人(Autonomous Underwater Vehicles,AUV)是具有一定自主能力的智能化水下设备,能在特定的环境任务信息下执行人类自身所不能进行的高难度、高危险作业任务。随着
目前许多网站与应用仍使用安全性较差﹑易受攻击的验证码,且尚不存在设计验证码和评估其安全性的系统与标准。验证码图像识别涉及到图像处理﹑模式识别等多种领域的相关知识,对其进
就目前现状,建筑信息模型(Building Information Modeling,BIM)理念,即在整个建筑行业中的各个部门(如:施工企业,政府部门,设计机构,建设单位等)之间协同工作的概念已经成为
随着网络的高速发展和硬件水平的提高,互联网感知技术扮演的角色愈发重要。由于网络应用程序复杂化和个人隐私的重视,流量识别作为最典型的网络感知技术,正在从基于端口和深层数