关于KPI异常检测算法的研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:zxc99zxc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在当今的数字经济时代,各个行业的数字化程度越来越高,系统架构越来越复杂,海量数据的出现导致运维工作的难度急剧增加。于是,智能运维的理念开始被提出和实践,而关键性能指标(KPI)异常检测也正是智能运维中的核心。关键性能指标为带有特定含义的时间序列。在实际场景中,时序数据的复杂程度很高,其规模也会随着时间的推移而不断增大。而现有的许多检测算法难以在保证较高精度的同时,还具备良好的可扩展性。本文根据先细分再检测的思想,提出了Cluster-XGBoost的异常检测算法。对于Cluster模块,以K-Means算法为例进行改进,实现时序曲线聚类。为完成相似性度量,这里引入动态时间扭曲算法,并采用公式优化和数据降维提高计算效率,引入峰值识别算法改进曲线匹配效率。基于密度聚类思想优化聚类初始点的选择,构造下界函数提升聚类中曲线划分效率。对于XGBoost模块,根据时序数据集的特点引入了一种多维度的时序特征体系,同时依据特征重要性和相关性完成特征筛选。采用一种数据增广技术,以提升原始数据的多样性使得XGBoost模型的泛化性能得到增强;并依据Bayes理论完成参数调优令模型达到最佳训练效果。此外,本文选取某企业KPI时序数据集进行实证研究,依序完成了数据预处理和异常点检测等过程。根据试验结果,可以发现聚类后的同类数据集训练的机器学习模型对同类测试数据的异常点检测结果,在精确率、召回率和AUC的评价标准中要远好于其他类的模型,表明了本文算法的有效性。
其他文献
新能源、分布式能源为智能电网带来了新的机遇与挑战。智能电表与PMUs(phasor measurement units)等智能量测设备的大量部署,为电力供应商提供了海量数据信息,如何利用先进的数据分析技术保障电力系统的安全高效运行受到广泛的重视。线路拓扑辨识与用户特征提取是智能电网数据分析中的两大重要技术,对于优化运行决策和需求响应至关重要。因此,本文针对智能电表与PMUs量测数据驱动的线路拓扑辨
学位
实例分割是一种最接近人类真实视觉感受的计算机视觉任务。虽然已有许多先进的方法,但是他们无法实现特定场景下的良好分割。其中,行人实例分割就是一个充满挑战的课题。由于密集行人存在大量遮挡,且可能尺度差异大、形变剧烈,设计一种精准、快速的行人实例分割算法尤为困难。Deep Snake是一种轻量化、扩展性强的网络,但是其在行人类别上表现不佳。因此,为了提升分割性能,对相关算法进行了分析和研究,提出了改进的
学位
二阶微分方程在天体力学、分子动力学、量子力学、电子学和流体动力学等领域中具有广泛应用.由于人们一般难以求出其理论解,故通过构造数值算法以获得其高效高精度的数值解具有重要研究意义.本文针对一类二阶非线性时变延迟微分方程的初值问题与边值问题,构造了相应的Runge-Kutta-Nystr(?)m(RKN)方法,并分析了这两类方法的收敛性与非线性稳定性,最后通过数值实验验证了理论结果的正确性以及方法的可
学位
Sine-Gordon方程可以用于描述某些重要的物理模型和现象,例如超导传输系统中横向电磁波的传播模型、耦合的同轴钟摆模型以及水晶错位现象.而空间分数阶sine-Gordon方程具有空间方向上的非局部效应,是经典sine-Gordon方程的推广.另外,通过引入延迟,微分方程能更准确地拟合一些具有历史记忆的模型和自然现象.因此在本文中,我们研究具分布型延迟的空间分数阶sine-Gordon方程.由于
学位
行人重识别作为监控系统中关键的一环具有重要的研究意义,不同数据类型间的行人重识别也具有各自的应用场景。而不依赖标签的无监督场景研究,可以充分发挥数据量优势,并节约人工成本。本文借助无监督问题中常用的对比学习方法,分别对图像、视频和跨图像视频三种场景的行人重识别方式展开了研究。着重解决了现有的无监督行人重识别方法在样本标签去噪、视频信息提取和模态差异减小等方面存在的问题。针对无监督图像行人重识别问题
学位
集群目标在自然界和社会生活中广泛存在,例如:无人机群、导弹群、战斗机群、鸟群和蜂群。因此,以空中集群目标为观测对象的研究对社会生活和军事国防均有重要的意义。但是,由于集群中目标数量多、间距小、表观特征相似等,在光学观测条件下运动轨迹多有交叉或遮挡,采用当前的一些跟踪手段,目标之间往往存在严重的跟踪干扰,其运动轨迹稳定跟踪是亟待突破的难点问题。针对以上问题,本文以开放空间中的蜂群目标为观测对象,对群
学位
我国房价在2022年以前逐年上涨,高额的房价成为了许多年轻人的负担。因此,租房居住成为了现代人的一种越来越常见的生活方式,但我国目前的房屋租赁系统还不够完善,仍然存在许多乱象。在此基础上,分析住房租金的影响因素以及运用机器学习方法来预测租金,对我国当前租赁市场的发展有着较为重要的意义。本文利用python从链家网爬取了武汉市2月28日出租房源数据共9930条。首先对原始数据进行数据预处理,通过各种
学位
在指标理论中,辛流形上量子化与辛约化可交换([Q,R]=0)是研究热点之一,且具有十分重要的理论意义.本文是一篇综述,旨在将紧致无边辛流形[Q,R]=0推广到紧致带边辛流形的情形.在本文中,我们首先介绍了辛流形(M,ω)上的一些基本概念与定义,简单回顾了辛流形上的Spinc-Dirac算子DL及其形变算子DTL和Hamilton群作用及相应的矩映射μ.同时,我们介绍了约化空间(MG,ωG)的一些知
学位
机载成像系统广泛应用于战场侦察、交通监管、安全巡检、灾区搜救等军民领域,机载目标检测识别是场景感知、目标搜索的重要手段。近年来,深度学习检测方法取得比传统检测方法更好的效果。然而,机载探测距离远,目标尺寸小而场景复杂;机载资源受限而实时性需求高,给机载检测带来挑战。本文针对检测模型庞大、小目标精度低、推理时间长的问题开展特征提取结构、空间上下文方法和端到端推理研究。针对特征提取中小目标特征匮乏易丢
学位
Lévy过程是一种具有独立平稳增量的左极限右连续(càdlàg)随机过程,在多个领域都有着相关应用,如应用力学、金融、云计算等领域。目前布朗运动的随机分析的理论研究已经较为成熟,但是因为Lévy过程的跳跃而导致的轨道的不连续,所以布朗运动等有关的一些定理无法运用于Lévy过程之中。在一致意义的拓扑下,连续函数无法一致逼近Lévy过程,所以为了得到在轨道意义下的Lévy过程的光滑逼近的收敛,本文引入
学位