【摘 要】
:
随着基于Hadoop平台的大数据技术不断发展和实践的深入,Hadoop YARN(Yet Anouther Resource Negotiator)资源调度策略在异构集群中的不适用性越发明显。一方面,YARN资源调度
论文部分内容阅读
随着基于Hadoop平台的大数据技术不断发展和实践的深入,Hadoop YARN(Yet Anouther Resource Negotiator)资源调度策略在异构集群中的不适用性越发明显。一方面,YARN资源调度器无法根据节点的计算能力动态调整节点承担的任务份额,导致异构集群中优势节点的计算资源浪费、系统性能没有充分发挥;另一方面,现有的资源调度策略始终为作业静态地分配统一规格的资源容器,未考虑作业执行的不同阶段资源需求的差异性,易产生大量资源碎片,从而导致系统资源利用率降低,整体性能下降。基于以上问题,在深入分析YARN架构及其资源调度机制的基础上提出了作业的自适应资源调度策略:首先,监控服务器对集群所有执行节点和提交的作业进行多项性能相关信息的监控;其次,利用采集的实时监控数据建模、量化集群节点的综合计算能力;最后,集群主节点结合实时节点性能监控信息和作业性能监控信息启动基于相似度评估的动态资源调度方案。优化后的系统能够有效识别集群节点的执行能力差异,并根据作业任务的实时需求进行细粒度的动态资源调度,在完善YARN现有调度语义的同时,可作为子级资源调度方案架构在上层调度器下。搭建Hadoop2.0和Ganglia综合实验平台,对上述作业的自适应资源调度策略进行实现,并基于大数据典型CPU密集型作业和I/O密集型作业进行性能测试。实验结果表明,作业的自适应资源调度策略能够有效增加集群并发度、缩短作业执行时间、提升系统资源利用率。
其他文献
随着应用不断深入,在社交网络服务、科学计算仿真等场景中,图数据持续、大量产生,对其进行快速、有效分析具有十分重要的意义。在某些对精确度要求不是很高或者只要求反映部
“网构软件”是一种流行的网络资源整合模式,它由分布式的、具有主体化特征的软件实体组成,能够感知环境并通过动态演化来适应外部环境的变化。SOA是软件架构技术发展史上的
近几年,随着网络规模的不断扩大,网络中海量的资源给传统网络应用带来新的挑战。基于网络资源(包括CPU处理、存储、服务等)的不断增多,其组织、获取、分析、处理等操作也逐渐
为了支持海量数据的存储需求,随着存储系统容量的提升,元数据作为描述数据特性和存储位置的结构化信息,其存储需求也急剧增加。分布式存储系统的设计趋势是明确划分出元数据服务
RPC作为分布式系统中广泛使用的组件,对于其带宽利用率、吞吐率以及网络时延的要求越来越高。传统的基于TCP/UDP套接字实现的RPC组件其性能已面临越发严峻的挑战。目前高速In
随着医学成像技术的发展,很多CT设备采用加大X线剂量的方法,以获得更多、更清晰的医学图像信息。然而随着放射卫生学的发展以及公众自我保护意识的增强,人们越来越注意到X线检查
随着科学技术的飞速发展,计算技术、无线通信技术和微电子技术的日益成熟,无线传感器网络的应用领域也越来越广泛。无线传感器网络在应用中存在着多种威胁,如恶意丢包攻击、S
伴随着信息时代的来临,为了加强对信息资源的综合管理,需要对信息资源进行整合,形成一个更综合的信息资源库,用来提高对局部信息资源的共享与利用,这是未来发展的趋势。当前
Web服务具有开放性、跨平台性、松散耦合性、互操作性及高度动态性的特点,这些特点使得Web服务非常容易受到安全性方面的攻击,因而Web服务的发展空间和应用深度在很大程度上