论文部分内容阅读
计算机技术和控制理论不断进步,现代化水平越来越高,导致各领域都产生了规模庞大的数据。这些规模庞大、到达速率极快、且与传统数据特征有很大差异的连续数据,称为数据流。工业生产自动化控制的过程中产生的数据流,是工业控制系统所有的命令下达的基础。异常或者错误的数据会使系统的下达错误的命令,执行错误的操作,轻则可能会影响系统内部和系统之间的相互关联,引发系统发生故障,引起连锁反应,导致整个生产过程不能正常工作,重则甚至可能会危及人们的生命安全,带来严重的环境污染,造成巨大的损失。鉴于此,本文基于时间序列和聚类的两种方法,研究了数据流的异常检测相关问题,具体研究内容如下:首先,本文阐述了数据流以及数据异常检测的背景与意义,介绍了有关异常检测方法及应用的研究进展,为接下来的数据流异常检测研究奠定了基础。然后,本文基于时间序列和聚类两种方法展开研究。对于时间序列异常检测,给出了完整清晰的检测方法和步骤,尤其是提出以置信区间作为检测标准的思想,使该方法的可行性增强。对于聚类异常检测,本文总结了检测的具体步骤,并提出了邻近分布密度作为检测阈值来对聚类结果做判别的新想法。然后将两种异常检测方法应用于田纳西-伊斯曼(ennesse ETae astm n,TE)化工过程的仿真数据流中。运用时间序列异常检测方法,成功检测出阶跃故障(故障01)、随机变量故障(故障11)、慢偏移故障(故障13)及阀门粘住故障(故障14)下仿真数据流的异常点;运用聚类异常检测方法,成功检测了阶跃故障(故障01)、随机变量故障(故障11)、阀门粘住故障(故障14)及阀门位置恒定故障(故障21)下仿真数据流的异常点。两种检测方法结合成功检测出了所有类型故障的异常点。最后,本文基于Django Web框架开发了数据流异常检测平台。该平台集成了时间序列和聚类两种异常检测方法,实现了对数据流异常点的自动化检测。