面向异构集群的基于节点资源动态调整的Hadoop调度优化研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:augsep
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
电子商务、金融以及社交网络等领域的迅猛发展,带来了数据规模前所未有的快速增长。大规模数据的存储和处理成为互联网行业的研究热点。作为GFS和MapReduce模型的开源实现,Hadoop是一个具有高可靠性、高容错性、高扩展性的分布式计算和存储平台。现在很多集群存在异构的情况,传统的调度策略在异构集群下效率很低。通过对Hadoop资源调度技术的分析,并调研国内外最新研究,提出了一种面向异构集群的负载自适应的调度策略。首先,提出了面向异构集群的节点资源动态调整的调度算法。异构集群下各个节点拥有的软硬件资源量存在差异,因而执行任务的能力有所不同。Hadoop资源用slot来描述,每个任务需要一个slot才能运行,传统的固定节点slot的配置方法不适合异构集群。算法将作业分为CPU密集型和I/O密集型,并分别为这两种作业设置不同的slot数目限制。算法通过收集集群作业的实时运行状况,并分析各个节点执行能力的强弱,动态调整各个节点slot资源数量。其次,提出了优化小作业完成时间的调度算法。传统的作业调度算法只有FIFO和FAIR。然而,这两种作业调度策略都没有考虑作业之间的差异。异构节点执行任务有快慢差别,算法通过收集集群作业运行的信息将节点的slot分为fast slot和slow slot,优先将fast slot分配给小作业,并为小作业预留部分slot。这种调度策略能够在不影响大作业完成时间的情况下减少小作业的完成时间。最后,针对不同场景对所提出的调度算法进行了测试分析,包括与Fair Scheduler和Coupling Scheduler的对比测试。结果表明,在异构环境中,改进后的调度算法能够结合作业的特点和集群节点的差异性做出及时的调整,改进后系统上各个节点任务平均执行时间明显减少,集群的吞吐率和资源利用率得到大幅提高。
其他文献
伴随着社会的进步,我国高速公路呈现出“路网”的格局,各省都形成了发达的高速公路网,为公众提供了方便、舒适和快捷的出行方式;同时货物运输也在信息交互、组织协调、集散、
安全协议是一种在不安全的公共网络上为完成某种不可泄漏的信息交换而建立的通信协议.所谓网络的不安全性,是指黑客的存在,他可以监听,阻止和伪造正在网上传输的信息,他们的标准模
在CMP(chip-multiprocessor)系统中,内存系统被多个同时执行的线程共享。在共享的内存系统中,一个线程的访存请求不仅会被其它线程的请求延迟,而且也会破坏其它线程的访存并
随着信息技术的高速发展,计算机领域已进入了以数据为中心的大数据时代,数据规模的快速增长给计算机存储系统带来了机遇和挑战。传统的基于DRAM的计算机内存在面对工艺尺寸缩
伴随着信息时代的飞速发展,在Internet上充满了多种多样的多媒体信息。因为网络的迅速、便捷,越来越多的人选择了网络作为传递信息的途径,因此要求网络具有很好的安全性以保
电信业务网、有线电视网、计算机网是信息产业发展的三大基础网络。随着经济和技术的发展,传统的业务服务已经不能满足人们的需求。由于各网间不能互通,也造成重复投资和网络资
随着信息技术和互联网技术的发展,随着国家信息化进程的加速,网络与信息系统的基础性、全局性作用日益增强。人们在享受互联网给自己带来的方便与快捷的同时,也逐渐发现互联
服务器在空载的情况下依然消耗满载时60%的电能,因此当负载强度较低时服务器的吞吐率与能耗的比值要比负载强度较高时低。也就是说在负载轻时,电能很大部分都浪费了。为了达
学位
当前,网络化制造已成为国际制造业竞争的焦点,积极推广网络化制造技术是迅速提升我国制造业,使其脱离低端地位的重要途径。网络化制造技术的推广离不开人才的培养。因此,通过计算机网络环境构建一个集产、学、研为一体的信息化、自动化、模块化的实验体系结构,成为本课题研究的立足点。本文在对网络化制造体系结构和应用实施方法的介绍中,重点阐述了参考模型视图的构成、面向独立企业的网络化制造体系结构以及网络系统应用工程