论文部分内容阅读
服务是云平台的重要组成部分,性能是影响用户体验的核心要素。云服务性能管理是指对基础设施层、平台层和软件层等多个层次的服务,在服务开发、部署、运行和运维等阶段实施的一体化云服务全生命周期性能管理。传统的服务性能管理技术无法解决云服务性能管理面临的大规模、多维异构、依赖关系复杂和自适应等挑战。本文围绕云服务监控系统性能模拟评估、统一云服务监控与管理框架、云服务依赖关系发现和管理、负载特征感知的虚拟机操作系统定制化优化等云服务性能管理的四个关键问题展开研究。 模拟仿真技术是在监控机制应用到真实场景之前预估该机制有效性的重要手段。本文针对云服务监控系统规模大、结构复杂等特征造成的数据流向不清晰、监控效果无法预判断等问题,设计并实现了一个云服务监控系统模拟平台SimMon。SimMon涵盖了云服务监控系统在监控数据采集、传输、存储和管理等阶段的性能评估需求。基于SimMon,用户可以模拟目标云数据中心环境、监控系统架构和监控调度算法等,并对比在不同目标场景下,不同监控框架和调度算法的性能差异。评估实验表明,SimMon平台能以较低的资源和时间开销,有效地模拟大规模云服务监控场景。同时,验证实验表明,SimMon可以精确地评估多种调度算法在不同场景下的性能差异。 云服务监控技术是获取全面的服务运行时信息和指导自适应云服务性能管理的必要基础。本文针对传统的服务监控系统存在的监控目标种类单一、不支持服务依赖关系指定、不支持与服务管理平台融合等不足,为云服务性能管理系统提出一体化云服务监控语言HiSML,并基于HiSML实现一个统一云服务监控与管理框架MonValley。MonValley由HiSML、编译器、执行引擎和运行时支撑环境组成。实验验证了HiSML在实现监控功能、简化编程复杂度和辅助自适应云服务性能管理等方面具有较强的优势。同时,实验也验证了MonValley框架具有较好的数据读、写性能和可扩展性。 服务间依赖关系是服务智能化管理的重要参考条件。本文针对云计算环境下服务间依赖关系复杂、动态变化等挑战,提出一种非侵入式的服务依赖关系发现与管理方法CloudScout。CloudScout首先分析服务在资源和网络等相关指标的监控数据上存在的相关性,然后将服务划分为活动态、休眠态和稳定态等三种状态并差异化分析,接着基于信息熵动态地计算各指标的权重,最后得到服务间的距离矩阵。基于距离矩阵,CloudScout采用优化的聚类方法发现相互依赖(从属依赖关系)的服务。实验表明,CloudScout可以有效地发现属于同一个应用的服务,且可以准确地判断应用个数。与传统方法相比,CloudScout消除了需要人为指定判定时段的局限、解决了属于同一类型应用中不同应用间的服务区分问题。基于服务间的依赖关系,CloudScout实现了一种可以同时优化资源利用效率和应用性能的多目标优化问题的解决方案。实验表明,CloudScout可以有效地提升网络应用和分布式应用的性能。 根据负载特征定制化操作系统是提升虚拟机操作系统处理能力的重要途径,也是提升云服务管理平台性能的重要支撑。本文针对虚拟主机上的通用型操作系统在面向资源消耗特征明显的云服务时,因为无法最大化利用按需供给的物理资源而造成的处理性能较低的缺陷,设计一种可以根据负载资源消耗特征自动分类负载,并为每类负载定制化优化虚拟主机操作系统的自适应优化模型vSpec。vSpec首先分析服务在处理负载请求时的监控数据并提出负载分类方法(TSRSVM)将负载分为CPU密集型、内存密集型、存储密集型、网络密集型和混合型,然后针对前四种密集型服务分别设计定制化优化策略,最后根据决策算法选择定制化时机并触发定制化操作。基于Benchmark和真实应用的实验表明,TSRSVM能准确地分类负载,而且可以发现负载在不同时间段和不同配置下的类型变化。实验还表明,vSpec模型可以有效地提升不同资源密集型云服务的性能。