基于非均匀分段趋势信息形式化的多元时间序列异常检测

来源 :重庆大学 | 被引量 : 0次 | 上传用户:zyl123456789zyl12345
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着产生数据的系统越来越庞大,其结构越来越复杂,难以通过单独的某个参数对系统整体状态进行掌握。而其产生的数据多具有时序特性,并因为多层次、多部件之间,以及多种作用机理之间的相互关联影响呈现出“多元”特性。这些时序数据中包含的信息可以反应出系统整体的状态。由此,怎样从大量的多元时间序列中挖掘出更多有价值的信息,成为数据挖掘领域的重要研究问题。传统的数据挖掘关注更多的是时序数据中出现次数较多的频繁模式,对于极少出现的模式或者说异常模式选择忽略或是作为噪声滤除。然而,这些极少出现的模式包含的信息往往更加重要,为进行更进一步的深度数据挖掘提供重要指导和支撑,甚至能够为我们带来启发式的思维影响。基于此,本文主要关注时间序列的异常发现算法,旨在通过时间序列的趋势变化信息、特征表示信息等挖掘出隐藏在海量多元时间序列中的异常信息。并在此基础上提出了具有实际意义和价值的基于非均匀分段趋势信息形式化的多元时间序列异常检测方法。本文主要工作如下:首先根据本文研究的方向和内容对多元时间序列数据在异常检测以及特征表示中面临的难点问题进行了分析。为了更全面的进行问题说明,在分析的基础上,对几种表示方法进行了详细的讲解,主要是对分段线性表示以及符号化表示方法的区别与联系、优势和缺点进行了介绍。为了实现对时间序列局部趋势信息的表示,结合趋势信息的特点,引入分段最值进行非均匀分段,通过拟合斜率对趋势信息进行表示,将拟合斜率进行符号化映射表示。由此,提出了一种基于非均匀分段趋势信息形式化表示方法,并对距离度量方式进行了定义和说明,为后续多元时间序列的异常挖掘工作提供了有力支撑。其次,分析了传统的基于符号化表示的时间序列异常检测算法存在的问题,针对此问题,对算法进行了改进。在降维以及特征表示阶段,将分段的趋势信息作为多元时间序列特征表示的重点,为了避免算法在异常检测过程中进行较多的冗余计算,利用聚类算法对多元时间序列的趋势符号信息特征表示结果进行聚类优化,实现冗余剪枝,从数据处理的源头降低算法检测时的复杂度,减少冗余数据对检测结果和效率的影响。此外,趋势信息的表示可以更好的区分不同特征表示,有利于提高算法检测结果的准确性。最后,将本文中研究的算法应用到不同的时间序列数据集中进行仿真实验,算法表现出了理想的检测效果。通过对比分析,相比于其它基于符号化表示的多元时间序列异常检测算法,经过改进的算法不仅可以有效的检测出异常出现的位置,同时在检测效率方面也有较大的提升。
其他文献
在能源危机日趋凸显的二十一世纪,水力发电具有发电量大、稳定可靠和清洁可再生等天然优势,在全球能源市场中占据着重要席位。从二十世纪初中国建立国内第一座水电站至今,已有百年历史,期间我国十分重视水利资源的开发利用,建立了多个水力发电站,在我国能源系统中发挥了重要作用。水电站的主要功能是通过水力进行电力生产,这就需要为生产过程中设备的正常运作和人员的工作提供适宜的环境,而水力发电站由于自然条件限制,多深
我国是食用番茄和加工番茄的生产、消费大国,在加工番茄中含有大量不饱和脂肪酸的番茄籽油是高营养油料的来源。研究发现硬脂酰酰基载体蛋白去饱和酶(Stearoyl-acyl carrier protein desaturase,SAD)在大豆、拟南芥、水稻等物种中都参与了脂肪酸变化的调控过程,但在番茄中对该酶的研究鲜有报道。本研究通过对番茄SAD家族进行生物学信息和组织表达模式分析,筛选得到了一个在果实
川西藏区地处青藏高原横断山区,冬季气候恶劣且供暖资源匮乏;但该地区太阳能资源丰富,若在建筑设计及使用过程中采取一定的技术措施充分利用太阳能资源,势必可以极大地降低建筑使用能耗。论文以川西藏区某办公建筑为对象,结合川西藏区气候特征、办公建筑的功能特点及使用特性,开展川西藏区适宜的办公建筑外围护结构墙体形式及其结构参数优化研究,研究工作与研究成果具有重要的工程实用价值以及工程指导意义。首先,通过文献查
目前,我国城市发展和房地产业均进入新时期,都面临着转型发展的问题。2020年我国第十九届中央委员会第五次全体会议审议通过的《中共中央关于制定国民经济和社会发展第十四个五年规划和二〇三五年远景目标的建议》(正文简称《十四五规划》)中提出要推动金融、房地产同实体经济均衡发展,可见协调发展已成为我国的发展战略。而城市竞争力是城市优势的集中体现,所以探讨城市竞争力与房地产业之间的耦合协调发展具有重要的现实
脑卒中是一种容易导致患者产生偏瘫等后遗症的疾病。伴随着全球人口老龄化的日趋严重,由脑卒中所导致的偏瘫患者越来越多,传统的理疗师康复疗法面临的康复压力越来越大,而能协助理疗师的康复机器人逐渐成为发展趋势。作为一种要与人体进行密切接触的医疗设备,康复机器人必须确保安全性与舒适性,机器人运动轨迹的合理规划是临床使用之前的关键过程。本文主要针对实验室前期构建的六自由度上肢康复机器人,通过运动轨迹规划和优化
地震勘探技术能够有助于获得地下岩层的基本特征与具体形态,在矿井、石油和天然气勘察等实际工程领域中有着极其广泛的应用。目前国内外的分布式地震勘察系统在数据传输体系方面常用的是有线传输或混合传输,这两种传输方式都需要数据传输电缆。但是数据传输电缆不能输送电能,因此只能额外铺设电能传输线或每个采集节点安装锂电池,导致出现线缆过重、成本增加且锂电池需经常充电等问题。针对这些问题,本文创新地提出了基于电力载
三峡工程蓄水后,因水位周期性涨落而形成的消落带引起国内外高度关注并成为焦点。消落带及其之上的滨水空间构成的整个库岸生态系统是陆地到水体之间的重要生态界面。对于三峡水库这样的大型水库来说,海拔高程145~175m的消落带及175~185m的滨水空间是库岸生态系统的重要组成部分。受周期性水位变动的影响,库岸存在着系列环境问题的胁迫,如周期性水位变动导致的库岸稳定性变差、原有适应于天然河岸的生物种类因蓄
复杂节点在超高层结构中已经得到越来越多应用,但目前国内外对超高层结构中关键复杂节点的研究还不够透彻。现如今实际工程中存在着各种各样类型的节点,在设计这些节点时,可查阅的资料极其有限。主要原因是以往工程节点试验的研究对象和结论的普适性不高,工程复杂节点类的低周交变试验较少,多以承载力试验为主,难以满足工程设计的要求。本文选取实际工程项目中的3处钢管混凝土柱(叠合柱)复杂节点作为研究对象,简化节点模型
随着燃料电池技术的发展,微反应器制氢技术越来越受重视。相对于催化材料技术的突破,微通道结构的设计和制造逐渐成为移动制氢技术的阻碍。对此本文根据甲醇重整制氢的反应需求,设计并制造了一种多尺度微通道反应载体板,以提升催化剂的负载强度与通道传热传质性能,进而改善微通道的制氢性能。主要研究内容如下:(1)本文首先对多尺度微通道中的各尺度结构对微反应器性能的影响进行了基础理论分析,然后根据反应过程对载体结构
“十四五”时期是区域社会经济和生态环境共同高质量发展的重要机遇期,在社会经济高速发展的同时,生态环境需要得到高度关注和重视。重庆作为西南地区典型山地城市,是西南地区社会经济和生态环境共同高质量发展代表区域,重庆主城区是体现整个重庆市生态环境优劣的重要区域,主城区内广泛分布的闭坑矿山对生态环境的负面影响并没有因闭矿而结束。因此,掌握重庆主城区及主城区内的闭坑矿区生态环境质量变化有着重要意义。本文以重