论文部分内容阅读
云计算的本质是通过对以数据中心为核心的基础设施资源进行共享复用,向用户提供按需计费(pay-as-you-go)的服务。云数据中心横向扩展(sacle-out)、虚拟化和支持多租户等特征,对数据中心网络资源的管理及调度提出了新的要求,如何在云计算环境下提高数据中心网络资源的利用率,降低数据中心网络运维成本是亟待解决的难题。数据中心网络资源的共享暴露出一个严峻的问题是,不同的虚拟机租户为了提高应用的性能,会竞争使用数据中心网络资源,这不仅会干扰其他租户应用的正常运行,还会影响整个数据中心的运营效率。此外,数据中心之间的网络链路也是由多个租户共享,不同的数据中心间网络资源分配及数据传输调度方式也会对数据中心的管理效率和运维成本产生影响。再者,由于数据中心的地理分散性,不同地区的数据中心电力成本和网络带宽接入成本存在差异,如何在保证用户请求响应延时要求的前提下,降低数据中心的运维成本也是需要考虑的问题。因此,需要对数据中心网络资源进行有效的管理及调度,通过业务隔离,带宽分配,请求调度等方式保证数据中心网络服务质量,提高数据中心网络资源使用效率,以及优化数据中心运维成本。针对数据中心网络资源的管理及调度问题,本文以单个数据中心内部网络、多个数据中心之间网络以及用户和数据中心之间的网络等三个角度作为问题研究的切入点,分别研究了单个数据中心网络的带宽分配技术、多个数据中心之间网络带宽分配技术、数据中心之间数据传输调度技术以及用户到数据中心的请求调度技术。具体研究内容如下:(一)研究了基于应用效能的数据中心网络带宽分配方法。云数据中心通过虚拟化技术以按需使用的方式为用户提供计算、存储等资源,然而对数据中心内网络资源的使用和管理还缺乏有效的方法。低效的网络分享机制不仅影响应用的网络性能,对数据中心运行的效率也是一项挑战。为了保障应用的网络性能,提供细粒度的可区分服务,本研究提出一种可区分服务的数据中心网络带宽分配方法。根据不同应用的吞吐量和时延敏感特征,我们分别建立了与之相适应的效能函数。以最大化所有应用的效能为目标,我们将带宽分配问题形式化成一个多目标优化问题。使用非支配排序的遗传算法(Non-Dominated Sorted Genetic Algorithm-Ⅱ, NSGA-Ⅱ)对问题进行求解,并用多属性决策方法对解进行精炼。仿真表明本研究提出的方法可以提供最小带宽保证,细粒度的服务区分以及适用于任意的数据中心网络拓扑结构。(二)研究了跨数据中心的网络带宽分配方法。云服务提供商在全球各地广泛地建设了数据中心,这些数据中心通过高带宽、低时延的光纤等高质量链路相连接。为了减少用户请求响应延时,提高服务的可靠性,云服务提供商通常会将数据副本放置在不同地点的数据中心。本项研究将数据副本从一个数据中心分发到多个数据中心看做是一个多播会话,研究了如何在最大化数据中心之间网络带宽利用率的同时,保证不同多播会话间的公平性。基于最大最小公平性原则,我们设计了一种数据中心间的网络带宽分配算法,并将其命名为Blossom。Blossom利用了完全多项式时间近似算法(Fully Polynomial Time Approximation Scheme, FPTAS)加快带宽分配的计算,并以(1-£)逼近最优解。在网络测量数据基础上的仿真实验表明本研究提出的算法可以进一步提高网络带宽利用率并保证多播会话间的公平性。(三)研究了基于多属性信息的数据中心间数据传输调度方法。云服务提供商在进行跨数据中心的数据传输调度时,不仅需要考虑数据中心的接入带宽利用率,同时对接入带宽的成本以及链路的服务质量也有所要求;又或者对其中的某一项属性要求较高,而对其他属性要求较低。考虑单一属性进行数据传输路径的选择是不全面的。本研究提出了一种基于多属性信息的数据中心间数据传输调度方法。首先,利用层次分析法对不同属性的隶属关系进行分析;然后根据不同属性值的分布差异,通过计算信息熵来获得不同属性的相对权重。最后利用多属性决策给出候选中转数据中心的综合评价。使用时间扩展图模型,将数据中心间的数据传输调度问题形式化成最小代价流问题并进行求解。仿真表明,相比于原始算法和考虑单一属性的方法,本方法可以使用综合评价最优的路径。(四)研究了电力和带宽成本联合优化的数据中心用户请求调度方法。由于数据中心分散在全球各地,这些地区的电力价格存在时间和地理上的差异,因此云服务提供商通过不同的方法调度用户请求来降低数据中心的电力使用成本。作为数据中心另一项重要运维成本构成的网络带宽成本却没有引起足够重视。本研究提出了一种同时减少电力成本和网络带宽成本的数据中心用户请求调度方法。基于真实的带宽价格数据,对数据中心的网络接入成本做了分析,发现网络带宽成本在数据中心的运维成本构成中占重要比例,应当得到足够的重视。在不需要事先知道相关随机模型的条件下,提出了最小化电力成本和带宽成本期望值的近似算法。仿真实验表明,本研究所提出的方法可以在成本优化和用户请求响应延时之间做权衡。