云环境中工作流系统任务调度的智能算法研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:yahu911
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,云工作流系统作为一种以市场为导向的分布式系统,一直是商业和学术领域的研究热点.作为基于云计算环境的工作流系统,如何进行合理的调度,特别是任务层的调度,是其中需要特别关注的问题.由于云计算环境需要根据用户的不同需求来获取合理的计算资源,并按照使用量即时的支付费用.借助于有效的调度方案,文中将用户需要处理的任务部署到最合理的计算资源上处理.不仅对于用户而言,需要降低任务执行的成本,同样对于提供计算资源的供应商来说,如何进一步提高执行效率和经济利益也是该领域的主要问题.
  在云环境中,诸多学者都致力于研究如何对工作流任务进行最优的调度,对此首先需要找寻一个合适的调度算法,这也是调度优化的根本.考虑到云计算以市场为导向的商业模式特性,目前研究通常从时间和费用两个较为突出的问题进行优化.除了这两个关键点之外,还有其他诸多用户的个性化需求和约束,所以这是一个典型的多目标优化问题.对于这类NP问题,智能算法一直是该研究领域的首选方案,例如常见的蚁群优化算法以及粒子群优化算法等.结合所使用的云环境中的一些特点,如资源复杂性、用户需求多样化、动态性,等等,然后对这些基础算法加以优化、改进和约束,以规避基础算法的参数简单、作用对象单一等不足和缺陷.在具体研究开始之前,本文对现有调度算法领域的各种算法做出了详细的分析,并具体分析目前算法中存在的不足和可以优化改进的空间.
  在云环境的调度中,用户的个性化任务是通过各种复杂的底层计算资源整合成虚拟机的形式来执行的.这些计算资源可以同时地计算和执行多个互不影响的任务,所以说,虚拟机也就具有并发执行多个任务的特点.在此基础上,本文从分层的角度对云环境下的工作流调度做了具体的分析,然后从时间和费用两个主要优化目标着手,对所采用的智能算法进行进一步分析:在时间优化方面,由于目前存在的研究方案中没有将虚拟机的分时特性考虑到调度算法的优化中,进而无法在调度方案的优化中得到体现.虚拟机是同时处理多个任务而不会相互影响,忽略这一特点,最直接的影响就是不能够有效地降低数据中心内部负责任务调度的处理器的最大完工时间;在费用优化方面,相比较于现有的一些研究,粒子群算法有较为明显的优势,但是,却忽略了该算法本身在云环境中忽略了对局部和全局搜索的平衡,从而易于局部收敛的不足.同时,对于具体的优化效果没能给予一个比较合理的量化评价标准.所以,有效地避免局部收敛并增加评价标准对调度方案的优化有着极为重要的意义.
  考虑到现有调度算法中所存在的问题,本文的主要工作和创新点如下:
  (1)在时间方面,首先提出了一种基于底层虚拟机分时特性的任务层调度算法,然后在考虑用户提出的成本约束等各种条件下,文中基于蚁群优化算法建立了一个最大完工时间的模型.在模拟实验中,不同任务集下新的调度算法都可以进行快速的收敛,且最大完工时间也优于其它没有考虑虚拟机分时特性的算法.随着虚拟机参数(虚拟机允许最大并行数、虚拟机数量、费用约束和有无并行启发式信息)的逐渐变化,该调度算法都可以获得小于其它相比较算法的最大完工时间.
  (2)在费用方面,考虑到目前粒子群优化算法中过早收敛的问题,文中通过惯性权重系数来平衡局部收敛和全局收敛,并利用混纯序列的高随机性和规律性来解决普通粒子群优化算法受参数影响过大的问题.实验结果显示了文中所提出的算法不仅很好地避免了算法陷入局部最优的问题,而且其成本花费也总是优于其他方法,从而证明了本文所提出解决方案的可行性和有效性.
  本文从面向市场的角度,分别在时间和费用两个方面分别对云工作流系统中任务的部署和调度做了更合理的优化,提高任务执行效率的同时,也降低了用户的成本并提高了供应商的实际收益.
其他文献
期刊
期刊
近年来,随着移动互联网技术高速发展和数码产品快速普及,数字图像的数量呈现几何指数式增长,如何对这些图像进行高效地存储、快速地检索正在成为一个研究的热点。不过,现有的检索技术始终需要面对的一个难题就是“语义鸿沟”现象,即计算机技术对于图像高层语义和底层特征之间的理解差异问题。本文从语义鸿沟产生的原因开始分析,开展基于内容的图像检索技术研究。本文的内容包括三个方面:①改进图像显著区提取的方法②采用SI
期刊
随着计算机技术的发展,特别是在计算机日益普及的今天,数据产生了爆炸式的增长。无论是数据的广度,还是数据的精度,与过去相比,都有了质的飞跃。人们可以利用过去数据,指导将来的生产生活。例如,公司可以利用过去的数据,指导产品的制造、运输、销售,以规避商业风险;国家可以利用数据,预测地震、台风等自然灾害的发生,避免人们生命、财产受到损失;医疗上可以根据病人医疗数据,诊断疾病,评估个人患病的风险。可是另一方
期刊
车载自组织网络(Vehicular ad hoc network,简称VANET)是由车辆单元节点和路边基础设施节点组成的一种新型的多跳移动通信无线网络.车载自组织网络作为物联网在智能交通领域中一种重要的具体应用,它是通过车辆与车辆之间、车辆与路边单元节点间的交互通信,实现道路状况信息的共享,提高驾乘人员对未知交通环境的感知能力,预测可能出现的危险,规避实时交通拥堵的路段,从而有效提高行车安全和行
粗糙集理论是波兰学者Z.Pawlak于1982年提出的一种能够有效处理不精确和不确定信息的数学工具。经典粗糙集理论只能处理名义型属性,无法直接处理数值型属性以及名义型属性和数值型属性并存的混合数据。为了解决这个问题,Lin利用邻域关系替代等价关系,提出了邻域粗糙集模型。从粒计算的角度来看,上述的粗糙集模型都是基于单粒度和单层次的,无法从多粒度、多层次的角度对问题进行分析和处理。钱宇华和梁吉业等提出
期刊
期刊