基于分块化模式表示方法的时间序列异常检测研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:oep
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
时间序列作为一种极具代表性的数据类型,具有数据元素按照时间节点先后顺序排列的特点,它们广泛存在于天文、气象、金融、医学、农业以及工业等各个领域。时间序列异常检测研究主要致力于从海量的,物理属性丰富的,表现形式多样的,内部关联结构复杂的,含有各种形式噪声的时间序列中挖掘出隐含在其中由不同产生机制导致的,具有内在差异的数据(异常)。  现有的时间序列异常检测相关研究主要集中于检测算法的设计与优化领域。高水平的数据表达是异常检测的基础,而目前对于数据表达研究探索较少。本文以时间序列异常检测为研究背景,旨在通过结合已有的时间序列表示方法研究成果,建立一个针对时间序列特殊属性和统计模型相结合的模式表达方法,实现基于该表示形式下时间序列数据的相似性度量分析,从而提升时间序列异常检测算法的检测准确性。  基于时间序列值域空间分块化思想,本文提出了一种分段聚合模式表示(Piecewise Aggregate Pattern Representation,PAPR)方法,该方法克服了现有基于时域表示方法(如:Piecewise Aggregate Approximation, PAA)在值域空间中单一化描述形式而导致数据表达信息过于简约的不足,对时间序列值域空间进行分块化处理,实现了数据的多结构、多层次、抽象化模式描述形式。其次,本文基于数据粒度描述思想,构建一个时间序列数据粒化与PAPR表示方法相结合的粒度分段聚合模式表示方法(Granularity-Piecewise Aggregate Pattern Representation,G-PAPR),该G-PAPR表示方法对原数据的值域空间边界进行分析,使表示形式更接近数据本质,在保证时间序列数据降维效果的条件下,进一步提升了时间序列表示结果在异常检测应用中的可靠性和稳定性。  最后,本文基于PAPR和G-PAPR模式表示方法,设计了多变量组合式的相似性度量方式,实现了双表示模式之间的相似性计算。在此基础上,本文进一步提出基于PAPR和G-PAPR表示下的模式串相似性度量方法。根据相似性度量结果,本文引入了随机游走(Random Walk, RW)模式作为分类器,实现了基于PAPR和G-PAPR表示形式下的时间序列异常检测任务。同时,本文提出了基于PAPR和G-PAPR表示方法下的模式串的最大相似度搜索(Max Similarity Search,MSS)异常检测算法。实验结果表明:上述G-PAPR表示方法应用于RW模型或MSS算法都能够有效而准确地检测出时间序列数据的92%以上的异常情况,能够很好地避免异常虚警和漏报情况。
其他文献
目前,LXI总线技术已经被广泛应用到测试仪器中,从而构成网络化、分布式的测试系统。LXI仪器由LXI接口和功能电路两部分组成,为了加快开发效率,研制基于DM642的LXI通用接口板,实现L
粮食安全是保障国家经济可持续发展的基础。然而,由于粮仓中温度、湿度、害虫密度等因素对粮食品质的影响,我国每年在储存过程中损失的粮食就达几千万吨。因此,建立现代化的
生命时钟缘何变快、停转?有资料显示,近百年来,特别是近30年来,一种严重的皮肤癌——黑色素瘤,在人群中出现的逐渐多了起来。患者的年龄以前大都在四五十岁左右,而现在正逐渐
在兵器靶场测试中,弹丸立靶密集度测试是新型武器研制和生产过程中的一个重要环节。近年来,随着CCD器件性能不断提高和成本下降,基于线阵CCD相机的精度靶测试系统被广泛采用。但是这种测试系统在工作过程中必须与触发靶配合,作为精度测量的专用设备结构复杂、触发精度不高,仍有改进的余地。针对上述问题,本文对室内大靶面精度靶图像触发技术进行了系统性研究,主要研究内容如下:1)研究了一种线阵CCD精度靶图像触发
学位
目的 研究腹腔镜联合胆道镜胆总管探查切开取石术治疗胆石症所致急性胆源性胰腺炎患者的临床疗效.方法 将医院在2016年7月~2019年3月收治的60例胆石症所致急性胆源性胰腺炎患
包装机械是现代包装工业的基本设备,是商品生产中必不可少的关键性技术设备。包装机械的设计受传统设计模式的限制,使设计者在设计早期不能很好的考虑装配问题,导致在开发中不能
学位
目的 分析双侧子宫动脉栓塞联合宫腔镜电切术对剖宫产切口瘢痕妊娠患者术后康复的影响.方法 选取医院收治的剖宫产切口瘢痕妊娠患者76例,随机分为试验组和对照组,对照组给予
清乾隆两金川之役后,大批汉族和部分回族移民迁移到大、小金川,他们通过开荒垦殖、开商设户、兴办学校等活动,发展当地的农业、兴办了工商业、培养大批人才,促进了汉、藏、回
LXI总线作为下一代测试总线,使用开放的以太网技术作为通信手段,充分利用当前和未来以太网的能力。本课题主要是以频谱分析仪为载体研究LXI-C接口的实现,并提出了一种基于ARM11处理器和Linux操作系统的LXI频谱分析仪实现方案。文章先介绍自动测试系统及总线技术的发展概况,从而引出新一代的测试总线LXI总线。在详细论述LXI总线特点与优势后,并且提出了本课题的研究任务。论文接着介绍频谱分析技术和