论文部分内容阅读
近年来,随着云平台技术的发展,越来越多的互联网企业选择将自身的在线服务与离线服务部署在公有云平台上。然而随着越来越多类型的负载被部署在数据中心云平台上,云平台本身的缺陷也在逐步地暴漏出来,长尾延迟现象就是一直以来严重困扰着云服务提供商的主要问题之一,为此国际主流云服务提供商不得不对自身云平台的硬件资源利用率作出限制。以CPU为例,由于长尾延迟现象的原因,国际主流云服务提供商的云平台CPU资源利用率一般维持在不到20%的状态。这样低的利用率造成了极大的资源浪费,人们对此提出了许多新的云平台架构,从虚拟云到分区云再到软件定义共享云,为了评价不同架构的云平台在尾延迟方面的性能差别,人们需要不断地对新的云平台架构下尾延迟方面的性能表现进行测评,然而传统的测评方法由于效率等方面存在问题,测评成本过高,企业界急需一种新的尾延迟测评方法。本文以云平台的尾延迟测评工具为研究对象,围绕着短时间内对云平台的尾延迟性能表现进行准确多方面的刻画这一核心问题展开。论文的主要内容和贡献如下:本文提出了对传统尾延迟测评方法进行改进的思路。由以往经验可知在传统的云平台尾延迟测评过程中存在的包括测评成本和测评难度等问题,本文将其归纳为同一问题,即为由于测试环节时间过长带来的不方便,并对此基于新的理论研究成果极大地压缩了测试环节时间,降低了云平台尾延迟测评的整体成本和测评难度,并指出了传统方法在压缩测试环节时间后可能遇到的问题,针对这些可能的问题本文提出了对现有测评方法的改进思路。本文提出了新的测试环节设计思路。通过压缩测试环节时间降低了测评成本,但是新的尾延迟测评方法相比与传统的尾延迟测评方法可能会由于测试环节时间过短导致实验条件过于单一,相比于实际生产环境中的复杂情况,新的尾延迟测评方法难以综合评价在各种情况下云平台的尾延迟性能表现。对此本文提出了新的测试实验设计思路,综合考虑了不同测试条件所针对刻画的云平台不同方面的尾延迟性能表现,并且从理论角度预测了这些实验结果在准确性与稳定性方面的表现。本文提出了一种基于概率的云平台尾延迟测评方法,基于最新的云平台尾延迟理论对导致长尾延迟现象的原因进行了分析,并且以此为基础提出了一种基于概率的云平台尾延迟测评方法,然后从算法逻辑的角度说明了本方法的正确性。同时,为了实际验证本方法的正确性,本文又提出了针对这一测评方法的验证性实验。最后是实验部分,本文依据改进后的实验思路进行了模拟实验,以实验结果为例对测试平台的尾延迟性能进行了刻画,最后依据之前提出的验证实验对本测评方法在结果的准确性与稳定性两方面的性能表现进行了评价分析。