论文部分内容阅读
近年来,云工作流系统作为一种以市场为导向的分布式系统,一直是商业和学术领域的研究热点.作为基于云计算环境的工作流系统,如何进行合理的调度,特别是任务层的调度,是其中需要特别关注的问题.由于云计算环境需要根据用户的不同需求来获取合理的计算资源,并按照使用量即时的支付费用.借助于有效的调度方案,文中将用户需要处理的任务部署到最合理的计算资源上处理.不仅对于用户而言,需要降低任务执行的成本,同样对于提供计算资源的供应商来说,如何进一步提高执行效率和经济利益也是该领域的主要问题.
在云环境中,诸多学者都致力于研究如何对工作流任务进行最优的调度,对此首先需要找寻一个合适的调度算法,这也是调度优化的根本.考虑到云计算以市场为导向的商业模式特性,目前研究通常从时间和费用两个较为突出的问题进行优化.除了这两个关键点之外,还有其他诸多用户的个性化需求和约束,所以这是一个典型的多目标优化问题.对于这类NP问题,智能算法一直是该研究领域的首选方案,例如常见的蚁群优化算法以及粒子群优化算法等.结合所使用的云环境中的一些特点,如资源复杂性、用户需求多样化、动态性,等等,然后对这些基础算法加以优化、改进和约束,以规避基础算法的参数简单、作用对象单一等不足和缺陷.在具体研究开始之前,本文对现有调度算法领域的各种算法做出了详细的分析,并具体分析目前算法中存在的不足和可以优化改进的空间.
在云环境的调度中,用户的个性化任务是通过各种复杂的底层计算资源整合成虚拟机的形式来执行的.这些计算资源可以同时地计算和执行多个互不影响的任务,所以说,虚拟机也就具有并发执行多个任务的特点.在此基础上,本文从分层的角度对云环境下的工作流调度做了具体的分析,然后从时间和费用两个主要优化目标着手,对所采用的智能算法进行进一步分析:在时间优化方面,由于目前存在的研究方案中没有将虚拟机的分时特性考虑到调度算法的优化中,进而无法在调度方案的优化中得到体现.虚拟机是同时处理多个任务而不会相互影响,忽略这一特点,最直接的影响就是不能够有效地降低数据中心内部负责任务调度的处理器的最大完工时间;在费用优化方面,相比较于现有的一些研究,粒子群算法有较为明显的优势,但是,却忽略了该算法本身在云环境中忽略了对局部和全局搜索的平衡,从而易于局部收敛的不足.同时,对于具体的优化效果没能给予一个比较合理的量化评价标准.所以,有效地避免局部收敛并增加评价标准对调度方案的优化有着极为重要的意义.
考虑到现有调度算法中所存在的问题,本文的主要工作和创新点如下:
(1)在时间方面,首先提出了一种基于底层虚拟机分时特性的任务层调度算法,然后在考虑用户提出的成本约束等各种条件下,文中基于蚁群优化算法建立了一个最大完工时间的模型.在模拟实验中,不同任务集下新的调度算法都可以进行快速的收敛,且最大完工时间也优于其它没有考虑虚拟机分时特性的算法.随着虚拟机参数(虚拟机允许最大并行数、虚拟机数量、费用约束和有无并行启发式信息)的逐渐变化,该调度算法都可以获得小于其它相比较算法的最大完工时间.
(2)在费用方面,考虑到目前粒子群优化算法中过早收敛的问题,文中通过惯性权重系数来平衡局部收敛和全局收敛,并利用混纯序列的高随机性和规律性来解决普通粒子群优化算法受参数影响过大的问题.实验结果显示了文中所提出的算法不仅很好地避免了算法陷入局部最优的问题,而且其成本花费也总是优于其他方法,从而证明了本文所提出解决方案的可行性和有效性.
本文从面向市场的角度,分别在时间和费用两个方面分别对云工作流系统中任务的部署和调度做了更合理的优化,提高任务执行效率的同时,也降低了用户的成本并提高了供应商的实际收益.
在云环境中,诸多学者都致力于研究如何对工作流任务进行最优的调度,对此首先需要找寻一个合适的调度算法,这也是调度优化的根本.考虑到云计算以市场为导向的商业模式特性,目前研究通常从时间和费用两个较为突出的问题进行优化.除了这两个关键点之外,还有其他诸多用户的个性化需求和约束,所以这是一个典型的多目标优化问题.对于这类NP问题,智能算法一直是该研究领域的首选方案,例如常见的蚁群优化算法以及粒子群优化算法等.结合所使用的云环境中的一些特点,如资源复杂性、用户需求多样化、动态性,等等,然后对这些基础算法加以优化、改进和约束,以规避基础算法的参数简单、作用对象单一等不足和缺陷.在具体研究开始之前,本文对现有调度算法领域的各种算法做出了详细的分析,并具体分析目前算法中存在的不足和可以优化改进的空间.
在云环境的调度中,用户的个性化任务是通过各种复杂的底层计算资源整合成虚拟机的形式来执行的.这些计算资源可以同时地计算和执行多个互不影响的任务,所以说,虚拟机也就具有并发执行多个任务的特点.在此基础上,本文从分层的角度对云环境下的工作流调度做了具体的分析,然后从时间和费用两个主要优化目标着手,对所采用的智能算法进行进一步分析:在时间优化方面,由于目前存在的研究方案中没有将虚拟机的分时特性考虑到调度算法的优化中,进而无法在调度方案的优化中得到体现.虚拟机是同时处理多个任务而不会相互影响,忽略这一特点,最直接的影响就是不能够有效地降低数据中心内部负责任务调度的处理器的最大完工时间;在费用优化方面,相比较于现有的一些研究,粒子群算法有较为明显的优势,但是,却忽略了该算法本身在云环境中忽略了对局部和全局搜索的平衡,从而易于局部收敛的不足.同时,对于具体的优化效果没能给予一个比较合理的量化评价标准.所以,有效地避免局部收敛并增加评价标准对调度方案的优化有着极为重要的意义.
考虑到现有调度算法中所存在的问题,本文的主要工作和创新点如下:
(1)在时间方面,首先提出了一种基于底层虚拟机分时特性的任务层调度算法,然后在考虑用户提出的成本约束等各种条件下,文中基于蚁群优化算法建立了一个最大完工时间的模型.在模拟实验中,不同任务集下新的调度算法都可以进行快速的收敛,且最大完工时间也优于其它没有考虑虚拟机分时特性的算法.随着虚拟机参数(虚拟机允许最大并行数、虚拟机数量、费用约束和有无并行启发式信息)的逐渐变化,该调度算法都可以获得小于其它相比较算法的最大完工时间.
(2)在费用方面,考虑到目前粒子群优化算法中过早收敛的问题,文中通过惯性权重系数来平衡局部收敛和全局收敛,并利用混纯序列的高随机性和规律性来解决普通粒子群优化算法受参数影响过大的问题.实验结果显示了文中所提出的算法不仅很好地避免了算法陷入局部最优的问题,而且其成本花费也总是优于其他方法,从而证明了本文所提出解决方案的可行性和有效性.
本文从面向市场的角度,分别在时间和费用两个方面分别对云工作流系统中任务的部署和调度做了更合理的优化,提高任务执行效率的同时,也降低了用户的成本并提高了供应商的实际收益.