云数据中心任务完成时间相关的节能与均衡优化调度算法

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:xukaiboy123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
云计算是一种新的网络技术。从广义上说,云计算是与信息技术、软件和互联网相关的一种服务。得益于虚拟化功能,云数据中心正加速成为一种新的IT资源供应方式。云环境的动态性与复杂性对任务调度策略提出了要求,既要保证服务质量,也要实现云数据中心的低能耗。关于节能与负载均衡的任务调度问题在一般情况下是NP完全问题,鉴于其NP复杂性,仍然需要进一步深入探索。本文重点关注并研究了云数据中心的任务完成时间调度问题,针对总能耗优化和特定场景Spark中的负载均衡进行了深入研究,论文的主要研究工作及成果如下:(1)研究了云数据中心的资源节能调度问题。合理地调度虚拟机任务可以提高任务的执行效率,缩短任务的执行时间,从而减小运行服务器的数量以降低系统总能耗。本文将任务调度问题抽象为虚拟机部署问题,主要关注CPU密集型任务,目的是在满足物理机总容量及运行时间限制的情况下对虚拟机请求进行非抢占式调度以便最小化所有物理机的总能耗(Minimize total energy,Min TE)。针对此问题,论文首先研究了云数据中心的能耗模型,针对任务容量配置可划分(SDC)的特殊情形,从理论上分析了在该条件下物理机总能耗的最优解(下限)。然后针对任务容量配置不可分割的一般情形,提出了一种自适应的节能调度算法SAVE,该方法基于本地信息,利用概率函数对虚拟机的分配和迁移进行决策并能保证充分使用服务器上的可用资源。最后,将SAVE算法应用于仿真和真实环境并将其与DRS和eco Cloud两个调度算法相比,测试结果表明,SAVE算法实现了显著的节能,在仿真环境中相对于两个业界较优算法而言SAVE算法平均节能29.32%,17.76%,并且在真实场景中,SAVE算法比DRS算法节能1.53%。(2)研究了云数据中心的任务完成时间优化调度问题。本文提出了一种基于深度强化学习的解决方案称为Deep RM_Online,通过设置不同的奖励函数以有效地解决调度目标不同的云资源管理问题。该方法首先可视化数据中心的资源使用状态,利用卷积神经网络(Convolutional Neural Networks,CNN)来获取资源管理模型。随后根据事先设定好的专家策略利用模仿学习来减小强化学习的探索步数以缩短最优策略的训练时间。最后进行深度强化学习过程,根据不同的调度目标设定不同的奖励函数,利用强化学习的策略梯度算法(Policy Gradient,PG)求解优化策略。本文设置了两个调度目标并将Deep RM_Online与启发式算法和深度强化学习算法Deep RM进行对比测试,实验结果说明Deep RM_Online和Deep RM在两个调度目标上均优于启发式算法,并且Deep RM_Online与Deep RM相比,在收敛速度方面提升了37.5%,并将任务的延时参数和平均周转时间分别减少了51.85%和11.51%。(3)研究了Spark平台的任务总完工时间优化问题。Spark计算引擎解决了传统Map Reduce编程框架在迭代计算中由于频繁读写驻留磁盘的Map任务输出所引入的性能损耗,但由于源数据的不均匀分布和自带分区算法的不均衡划分方式,数据倾斜现象在Spark中依旧非常突出,导致应用程序总完工时间较大。为此,针对Spark平台在Reduce过程出现的数据倾斜现象,本文提出了一种名为Resplit Reduce的算法对数据进行均匀划分并分配。该算法首先将整群抽样算法应用在Map任务输出的中间数据进行其键值分布情况的预估。其次,改进Spark默认分区函数,使得数据能被均匀地划分为多个分区,促使Reduce阶段的负载均衡,从而更加充分地利用集群资源。同时算法还考虑了集群的异构情况,根据各Executor之间计算能力的不同,Resplit Reduce采用贪心策略将每个任务分配给拥有最高性能因子的Executor。最后,在Spark独立异构集群上,通过Word Count、Sort以及Pagerank基准测试将Resplit Reduce与基准算法进行了比较分析。实验结果表明,本论文所提出的算法在三种基准测试集上平均减少总完工时间47.76%、32.13%、14.47%,在集群的平均资源利用率指标上平均提高了19.67%、30.5%、37.03%。
其他文献
随着近年来量子计算领域的飞速发展,量子计算技术已经深刻地改变了传统的计算模式与信息处理的方式。量子计算利用量子物理特有的量子纠缠、量子叠加等性质能够有效地提升信息处理的效率与能力,并且提供了新型的数据计算与信息处理方式。机器学习利用现有的计算资源对大数据进行分析学习得到规律以对未知数据进行预测,在众多领域有着广泛的应用。量子计算技术应用于机器学习中产生了量子机器学习这一研究方向。量子机器学习一方面
合成孔径雷达(SAR)由于其全天时、全天候的工作特性,已被广泛应用于侦察探测、地质勘探、灾害检测和公共区域安检等领域。作为SAR图像分析和解译的基础问题,SAR目标分类与检测问题的研究具有重要意义。鉴于深度学习方法在计算机视觉领域取得了巨大成功,本文开展基于深度学习的SAR目标分类与检测方法的研究。近年来,基于监督学习的深度网络在SAR目标分类与检测任务中被广泛应用并取得了突出的效果。本文围绕SA
区块链(Blockchain)技术近年来已成为学术界和工业界的研究热点。目前区块链的应用场景也已经扩展到金融、医疗、政府、文化、艺术、物联网、软件工程等领域,因而区块链也常被称为下一代互联网。但是,区块链还存在一系列问题,如共识算法机制、系统性能与运行效率、存储方法、匿名与可信的矛盾以及监管问题等,安全威胁也始终相随相伴。目前针对区块链系统、合约和应用的安全事件频频发生,给个人、企业乃至国家造成了
随着移动互联网通讯和物联网技术的飞速发展,包含众多传感元件的可穿戴设备将成为物联网的重要入口与应用终端,并通过软件支持以及数据云端交互实现众多功能,这将对我们未来的生活、感知带来巨大的改变。可穿戴柔性触觉传感器通过测量人体生理参数、感知周边环境指标,能够及时且低成本地提供人体健康状况的相关重要信息,对人类医疗保健、运动健康具有积极的影响。随着可穿戴设备逐渐呈现出巨大的市场潜力,柔性电子器件特别是柔
数据访问控制技术是网络与信息安全领域用于实现只有授权用户才有权访问共享数据的关键技术之一。以对称加密和传统公钥加密技术为主要手段的访问控制,虽然在一定程度上实现了对数据的授权访问,然而由于其缺乏灵活性和可扩展性,无法实现一对多细粒度访问控制,使其无法真正广泛应用于各种现实场景中。随着对访问控制研究的不断深入,不同的一对多访问控制机制,如身份基广播加密的访问控制机制和属性基加密的访问控制机制,相继被
随着无线感知与通信技术的发展,低功耗物联网被广泛地部署以采集或监测环境数据。多样的应用场景和不断增加的物联网终端设备对低功耗物联网的数据传输性能提出了挑战。一方面,越来越多的物联网终端设备被部署到环境中,爆炸式增长的终端设备与有限的无线资源之间冲突越来越明显,并成为影响低功耗物联网性能的主要瓶颈之一。因此,如何通过高效的资源分配机制,支持大量终端设备的可靠数据传输是低功耗物联网领域非常重要的研究问
随着智能设备的普及和存储技术的发展,客户端进行数据存储和处理的能力得到显著提升。对这些数据的分析挖掘能够带来巨大的经济效益和社会价值。随着各行业数字化建设的深入,来自于各领域的大规模数据已难以进行直观分析和观察。层次聚类算法作为大数据分析挖掘中的一种重要工具,通过分析数据之间的关系,能将数据组织成多层次、多分辨率的结构形态,有助于人们挖掘数据中的潜在知识。但传统层次聚类算法的计算复杂度高,可扩展性
点云曲面重建是利用三维散点的几何信息建立相应的数学模型描述和绘制空间曲面,其被应用于产品设计、文物保护、油气勘探等诸多领域。地下地层曲面重建根据地震勘探获得的地层散点信息,构建层位、断层等地下地层曲面,是建立地下层序模型、油藏模型的基础和支撑。地下地层曲面重建涉及大量信息处理技术,地质规律和区域地质知识,是信息处理领域和油气勘探领域共同关注的前沿问题之一。用于地下地层曲面重建的点云数据具有稀疏性、
伴随互联网技术的成熟,社交网络在社会、政治和经济等层面体现出重要价值和作用,面向社交网络实体的认知算法成为计算机科学领域研究热点。现有研究成果在网络服务、线上营销和公共安全方面发挥着重要作用,但仍存在诸多技术难题尚未攻克,因此本文研究工作具备较高的学术价值和应用价值。围绕社交网络实体认知,本文聚焦于四个具体关键研究点,包括:(1)话题流行时间预测;(2)用户意见预测;(3)基于影响关系的关键用户发
无线通信系统的信道容量提升往往需要新技术的导入,能够直接提升系统信道容量的技术有多入多出技术,宽带高阶信号调制技术以及多带发射机技术等。这些新技术在带来更高信道容量的同时也会为线性化系统带来新挑战。多入多出系统需要集成大量的射频链路和天线,进一步提高天线的集成数量往往需要采用混合波束成形结构。混合波束成形结构中一条射频链路要驱动多个功放,使得数字预失真系统需要同时补偿多个功放的非线性失真,而功放之