共享MapReduce环境下多维QoS的作业调度研究

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:jiaolang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
共享MapReduce集群允许集群资源复用且能够降低运维成本,已经被越来越多的公司采用。而在共享MapReduce集群环境中,作业调度器是保证各种作业QoS的关键技术所在。当前各种MapReduce调度器在限时作业和高资源需求作业等方面支持力度远远不够,主要体现在:限时作业难以在现有解决方案中达到期望的QoS,同时,高资源需求作业会抢占共享集群中其他用户的资源,造成严重的不公平。为了解决这些问题,本文研究了共享MapReduce环境中多Qos作业调度机制,提出了一系列限时作业调度和高资源需求作业调度技术,并将这些技术集成到现有调度器中。本文的工作主要体现在以下几个方面:   (1)提出了自适应限时作业调度机制。该技术解决了当前限时调度器未解决的两个问题:自动预测任务执行时间和同时兼顾MapReduce两个阶段的资源分配模型。对于第一个问题,我们提出了基于采样的任务预调度(Task Forward Scheduling,TFS)机制,这种机制能够通过启动特殊的reduce task提前预测reducetask运行时间;对于第二个问题,我们提出了近似均匀最小并行度资源(Approximately Uniform Minimum Degree of parallelism,AUMD)分配模型,该模型能让限时作业使用尽可能少的资源在规定的时间内完成,进而使得系统支持更多的并发限时作业。经测试,该调度技术与现有调度策略比较,在资源利用率和误差率两方面更优,其中,最大误差率至少降低45%,平均误差至少降低30%。   (2)提出了最少节点资源预留调度机制。当前MapReduce调度器要么没有考虑内存资源,要么基于内存的调度策略会严重降低集群资源利用率,为了在MapReduce调度时融入内存资源因素,同时尽可能提升资源利用率,我们提出了最少节点资源预留(Minimum Nodes Reserving Resource,MiNR2)调度机制,该机制相比现有的最多节点资源预留(Maximum Nodes Reserving Resource,MaNR2)调度机制,能明显提高系统资源利用率,进而提高系统整体吞吐率。经测试,MiNR2比MaNR2性能提高约10.1%。   (3)提出了多QoS双层调度框架。该调度框架可以在保证现有MapReduce调度器语义和修改尽可能少的代码前提下,将我们提出的限时作业调度机制和资源预留调度机制集成到现有的MapReduce调度器中。
其他文献
网络广告发展迅速,在广告主品牌非行销部分预算中居所有媒体的第二位,并且有上升趋势。据行业数据,电子商务在中国网络经济规模占比持续扩大。互联网是电子商务的载体,网络广
中科院仪器设备共享管理平台(SAMP)的建设,主要为了解决中科院100多个国家级研究所的仪器设备管理封闭、共享困难和使用效率低等问题。仪器设备共享管理是时下很热门的研究领
随着计算机技术、互联网以及电子商务的飞速发展,网上购物已经成为一种重要的消费方式。但是现有网上商城的展示方式存在单一性的弊端,难以显示丰富的商品信息以满足消费者较
伴随着半导体工艺的不断进步,微处理器的集成度和工作频率迅速提高,微处理器系统的应用也日趋广泛。单个芯片处理能力的不断增强,产生了对IO互连通信带宽的巨大需求,工业界为
近年来,云计算、云存储、云安全在科学研究、企业应用、网络服务等领域成为持续发酵的热点话题,其所涉及的问题核心在于,针对海量数据进行处理、存储和管理。在信息技术广泛应用
3G网络环境下的车载视频监控系统由于能够通过对车辆的远程实时视频监控,直观地了解车辆、道路以及车辆所处环境的现场信息,可以广泛地应用于公交运输、出租汽车、安全防护、
近年来,虚拟化技术发展迅速,利用虚拟化技术可以有效地整合服务器资源,提高服务器资源利用率,并且在虚拟机之间提供很好的隔离性。然而,研究网络攻防原理的网络安全仿真技术,
大规模复杂场景的真实感快速绘制是计算机图形学领域中重要的研究课题,在数字娱乐、虚拟仿真、科普教学、园林规划和数字农林业研究等方面有着广泛的应用。本文以三维几何植
三维运动捕获技术已被广泛应用于创建高质量的人体动画,目前,很多沉浸式虚拟现实应用,如虚拟装配操作训练、虚拟维修训练等,需要实时采集并重建人体运动信息,常用的商业光学
科技项目评审工作是一项复杂的工作,不仅需要很广阔的基础知识,而且还需要非常专业的领域知识,这些都会对评审专家及职能部门人员的工作量以及评估的准确性提出了很大的挑战