异构环境下Hadoop作业调度算法的研究与实现

来源 :北京邮电大学 | 被引量 : 2次 | 上传用户:down222
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
云计算技术的趋于成熟为企业提供了一种可行的、廉价的处理大数据的解决方案。Hadoop是Apache基金会下一个开源的分布式存储和并行计算平台,由于具有高可靠性、容易扩展和高容错性等优点,目前在大数据处理领域得到了广泛的应用。在云计算应用方面,作业调度和资源分配问题一直都是一个需要重点关注和解决的问题。在云计算平台上同一时刻经常有多个作业需要调度运行,每个作业又被分为若干个子任务单独运行,因此如何协调各个任务的资源分配和调度问题至关重要。Hadoop的资源调度管理框框架YARN提供了三种内置的资源调度器,但是随着应用的延伸,现有的资源调度算法已经不能满足需求,在许多情况下制约了 Hadoop系统性能的提升。因此,对合理地进行资源分配与作业调度的研究,能够提高系统的资源利用率,从而减少作业执行时间,最终使得平台的整体性能得到充分提升。为研究Hadoop作业调度和资源分配以提升系统的性能,本论文的研究内容概述如下:(1)资源调度问题是NP-hard问题,即不能在多项式时间内求得最优解。群智能算法在求解此类问题上有着不俗的表现,如遗传算法,蚁群算法,布谷鸟算法等。布谷鸟算法是一种崭新的、高效的群智能算法,但是它也有一些缺点。针对布谷鸟算法在后期收敛性较弱、求解精度不高的不足,本文提出一种混合遗传布谷鸟优化算法,在布谷鸟算法的基础上,引入遗传算法。保留布谷鸟算法的强全局搜索能力的同时,结合了遗传算法局部收敛性好的特点,加快了算法在后期的收敛速度。(2)本论文对Hadoop YARN的资源管理和分配机制进行深入地分析,对Hadoop资源管理和作业调度过程进行建模,将混合遗传布谷鸟算法应用于YARN资源调度。该算法可以通过YARN的管理机制获取节点CPU速率、内存容量、负载等信息,结合任务的资源申请需求,将各个任务分配到适合的资源节点。同时在调度的过程中,加入了对任务优先级的调整,对资源量需求较大和即将完成的任务,提高其调度优先级,避免资源量需求较大的任务长时间得不到调度以及即将完成的任务陷入长时间等待的困局。研究和测试结果表明,本文提出的混合遗传布谷鸟算法相比布谷鸟算法,在标准函数的最优值求解过程中表现优异。同时,将该算法应用到Hadoop资源调度时,能有效地提高系统资源利用率,缩短集群的作业执行时间。
其他文献
成本管理是企业经营不可或缺的手段。成本管理的成功与否直接关系到企业的收益性、市场竞争力和生命力。成本管理是企业经营规划的重要一环,它必须与企业经营计划直接挂钩、
文中从大数据应用环境下以数据处理、云存储和容错处理等方面与网络进行协同工作的需求为基础,分析了大数据应用下底层数据和网络多方面的问题,为大数据框架中底层数据的传输
<正>全国老龄委最新发布的数据表明,目前我国老年空巢家庭率已达50%,大中城市达70%。从2015年到2035年,我国将进入急速老龄化阶段,老年人口将从2.12亿人增加到4.18亿人,占比
新媒体的技术赋权打破了原先板结的研究结构,一些新兴研究主体和平台不断涌现并呈现出日益发展壮大的态势,使得传媒研究主体更加多元。新进的传媒研究者天然带有新媒介的活性
我国是一个农业大国,农业是国民经济和社会发展的基础,农民是推动社会生产力的重要力量,农村是具有很多不同于城市特点的重要社会区域。我国历来非常注重农业的发展,自新中国
三十多年来,随着经济的发展,中国东中西三大区域的农村劳动力进行着跨区性的转移。国内外学者对于劳动力转移一直有着高度的关注和研究,但是大多数国内外学者的研究主要是针
外语教学的最终目的是促使学生可以灵活的应用所学知识,与外国友人进行有效的沟通和互动,听说能力是外语交际的具体表现,因此,在德语教学中,教师需要将跨文化交际能力融入其
高校校园文化建设是推动学校发展的有力保障,社会转型时期经济结构、文化形态、价值观念等方面发生巨大变化,对校园文化建设提出了严峻考验。从学生工作的视角,以分析社会转
提出了一种在FPGA中实现大矩阵奇异值分解的方法.主要思想是通过有限状态机进行控制,复用流水线CORDIC计算模块.这种方法极大地节省了FPGA的面积资源,并且增加了算法求解的时
互联网业已成为中国最大的社会变量,其释放的天量级解构和重构力量,已在中国社会全方位蔓延开去。互联网带给传媒业的一个重要变化:互联网打破了机构媒体对于舆论话语权的垄断,原
报纸