基于时间序列与聚类的数据流异常检测

来源 :北京理工大学 | 被引量 : 0次 | 上传用户:aerostock
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机技术和控制理论不断进步,现代化水平越来越高,导致各领域都产生了规模庞大的数据。这些规模庞大、到达速率极快、且与传统数据特征有很大差异的连续数据,称为数据流。工业生产自动化控制的过程中产生的数据流,是工业控制系统所有的命令下达的基础。异常或者错误的数据会使系统的下达错误的命令,执行错误的操作,轻则可能会影响系统内部和系统之间的相互关联,引发系统发生故障,引起连锁反应,导致整个生产过程不能正常工作,重则甚至可能会危及人们的生命安全,带来严重的环境污染,造成巨大的损失。鉴于此,本文基于时间序列和聚类的两种方法,研究了数据流的异常检测相关问题,具体研究内容如下:首先,本文阐述了数据流以及数据异常检测的背景与意义,介绍了有关异常检测方法及应用的研究进展,为接下来的数据流异常检测研究奠定了基础。然后,本文基于时间序列和聚类两种方法展开研究。对于时间序列异常检测,给出了完整清晰的检测方法和步骤,尤其是提出以置信区间作为检测标准的思想,使该方法的可行性增强。对于聚类异常检测,本文总结了检测的具体步骤,并提出了邻近分布密度作为检测阈值来对聚类结果做判别的新想法。然后将两种异常检测方法应用于田纳西-伊斯曼(ennesse ETae astm n,TE)化工过程的仿真数据流中。运用时间序列异常检测方法,成功检测出阶跃故障(故障01)、随机变量故障(故障11)、慢偏移故障(故障13)及阀门粘住故障(故障14)下仿真数据流的异常点;运用聚类异常检测方法,成功检测了阶跃故障(故障01)、随机变量故障(故障11)、阀门粘住故障(故障14)及阀门位置恒定故障(故障21)下仿真数据流的异常点。两种检测方法结合成功检测出了所有类型故障的异常点。最后,本文基于Django Web框架开发了数据流异常检测平台。该平台集成了时间序列和聚类两种异常检测方法,实现了对数据流异常点的自动化检测。
其他文献
革命历史题材巨片《解放大西北》是成功的,但也存在着严重不足,那就是未能充分展现和强调毛泽东为解放大西北制定的英明战略决策。西北战场的敌人有两大主力:一是蒋介石的嫡系胡
据海外媒体报道,美国五角大偻近日向国会“美中安全评估委员会”提交了一份长达56页的《中国军事力量》报告、这份报告就中美关系、经济贸易及台海局势等5个内容进行了评估,从
目的:研究瑜伽和健美操对动脉硬度的影响。方法:招募非体育专业大学生37名作为志愿者,将其分为瑜伽组,健美操组和对照组。其中瑜伽组和健美操组需进行8周训练,训练时心率为14
研究引入现场模拟实验方法,由3名大学生组成一个团队,共有10个团队。实验将10个团队随机分配于高低队友信息心理模型条件下,检验不同队友信息心理模型水平条件下团队学习行为的
在装配序列规划的基础上,从降低装配难度、缩短装配时间等方面对装配方案作了研究,提出了装配方案选择的约束条件,并结合实例进行了分析.本文提出的方法为面向装配设计中装配
植物抗寒剂的不同使用方式在早稻和晚稻上的应用效果李志高(湖北省洪湖市农科所,433200)THEEFFECTSoFTHECOLD-RESISTERAPPLIEDINEARLY-RICEANDLATE-RICECULTUREWITHDIFFERENTM...
数控车削加工中刀具的圆弧半径对切削力,切屑的断屑,切屑的形状,加工表面质量、加工变形以及已切削表面的残余应力的大小,状态,分布有着很大的影响。本文采用有限元分析方法,利用有
在现代铁路养护管理中,铁路大型养路机械是非常核心的设备,目前,在我国铁路维修养护中得到了有效应用。为了进一步提高大型养路机械的防火安全性,研发出了应用于大型养路机械