论文部分内容阅读
随着云计算技术的不断发展,越来越多的企业和个人将业务系统迁移到云平台上,使得云平台的规模不断增大,给提高云服务可靠性带来了巨大的挑战。虚拟机作为云平台的基础组件,其正常运行是保证云平台提供高质量云服务的重要条件。因此,对云平台中虚拟机进行异常检测是实现云故障监控,从而提高云服务质量的必要手段。本文通过分析云平台中虚拟机的运行特点,对虚拟机的异常检测方法进行了深入的研究,主要研究成果如下:1.云平台中虚拟机的性能指标数据在虚拟机运行不同任务时会呈现出不同的特征,如果单纯采用虚拟机性能指标数据进行异常检测,检测结果会混淆由不同运行任务所造成的性能指标偏离和由虚拟机异常所造成的性能指标偏离,从而产生误报。因此,本文提出了基于上下文聚类的虚拟机异常检测策略,该策略将具有相似上下文运行环境的虚拟机实例聚集到同一个类簇中,在各个类簇内独立地进行异常检测,从而降低异常检测误报率并提高异常检测准确率。2.在上下文聚类的过程中,聚类的迭代速度和聚类结果的质量通常受到初始中心点选取的影响。因此,本文提出了一种新的聚类初始中心点选取策略,该策略使用全局标准距离衡量数据实例处于数据密集区域的可能性大小,并通过估计类簇最小半径的期望,给出初始中心点之间的安全距离,使得选取的初始中心点尽可能地分布于不同类簇的数据密集区域,从而减少了聚类迭代次数并提高了聚类结果的质量。3.在针对各个上下文类簇进行异常检测时,本文对基于影响空间的局部异常因子算法(INFLO)进行了增量式改进。针对每一个上下文类簇,本文利用有向图存储类簇中各虚拟机实例之间的对称邻居关系,构建上下文异常检测模型。在实时采集到的虚拟机实例按照其包含的上下文信息匹配到相应上下文异常检测模型后,按照本文给出的插入、删除算法,相应的上下文异常检测模型能够对新采集的虚拟机实例进行增量式地异常检测,从而提高异常检测效率。