论文部分内容阅读
云平台的监控对保证云平台的高可用性和稳定性起着至关重要的作用。云平台复杂的多层次架构需要更加立体化多维度的监控方案,而用户对云平台计算和存储服务的弹性需求也给监控框架对云平台监控数据的实时分析能力提出更高的要求。综上所述,全面而细粒度的监控需求以及对监控数据的实时分析能力是云平台监控技术面临的挑战。现有的监控方案中监控组件未能实现虚拟机内部监控数据的获取,未建立有效的监控分析模型,监控数据处理流程不能很好的满足监控数据分析处理的实时性需求,有待进一步完善。本文针对以上问题,研究了现有的监控技术和复合事件处理技术,提出了新的监控解决方案,具体工作如下:(1)研究了Openstack云平台架构及其组件的工作流程和通讯机制,重点分析了原生监控框架Ceilometer的组成部件和监控数据的获取流程。深入研究了不同层次、不同来源的监控数据获取方法,在此基础上对原生框架进行二次开发,增添了虚拟机内部监控数据获取插件,完成了对框架配置文件的修改,改变了监控数据流向;(2)建立了面向云平台的立体监控模型。本文设计的立体监控模型中包含了云平台全量监控数据项,它有三个维度,横轴为物理主机,纵轴为具体应用,在竖轴上分为了物理段,虚拟段,应用段和业务段。该立体监控模型能够更为准确、快速的识别和选取不同层次的监控项,并且能够更好的区分部署在相同物理主机上的不同应用的监控项和在不同物理主机上的相同应用的监控项,减轻了监控数据描述混乱对监控数据分析的影响;(3)基于复杂事件处理(CEP,Complex Event Process)引擎实现了监控数据的实时分析功能。在复杂事件处理实时分析引擎esper中建立的分析规则,云平台的监控数据获取后实时传入esper中,根据分析规则实时处理监控数据,识别监控场景;(4)提出了一种面向Openstack的监控实时分析系统方案,该方案包括监控数据获取、实时分析和场景响应等功能。在监控数据获取层设计了云计算监控模型,并根据特定的监控场景选取了分析监控项集合;在实时分析层根据监控场景定义了对分析监控项数据实时处理的分析规则;在场景响应层设计了识别给定监控场景后的监控处理响应方案;最后,基于OpeStack云平台,在其原生监控方案Ceilometer与复杂事件处理引擎(CEP,Complex Event Process)相结合的基础上,编程实现了上述方案,验证了方案的可行性。