论文部分内容阅读
由于数据采集、计算机技术和万维网技术的迅速发展与应用,企业或组织已建立起来了很多整套的实时监测系统。因此企业或组织收集了大量的生产实绩数据(可以认为是时间序列数据),如何利用这些数据为企业和组织实现实时决策支持成为学术界和业界关注的热点。实时数据仓库的提出为解决这个热点问题开辟了一条道路,主动决策又正是实时数据仓库的直接动机。然而,主动决策面临的主要问题就是如何能够在实时地发现异常的同时,触发报警并分析处理实现下一步预测。这与通常的异常诊断方法存在很多差异,它是一个系统的分析方法,包括异常模式发现、异常模式分析和异常原因分析三个部分。因此,本文在这三部分研究的基础上提出了多相关时间序列上异常模式挖掘框架。这对实际生产、生活都具有相当重要的现实意义。本文以热轧工艺流程中产生的时间序列实绩数据作为时间序列数据库的数据实例,利用统计过程控制(SPC)理论在单个时间序列上发现异常模式;然后,根据已发现的异常模式序列,运用数据挖掘中的序列模式挖掘和关联规则分析技术挖掘已发现的这些异常模式间的关系,进而为异常模式的预测提供依据。因此,本文主要研究了传统基于时间序列的异常诊断和分析方法,结合数据挖掘和统计过程分析技术,给出了一个分析异常模式的过程框架。其中包括基于统计过程分析的单时间序列异常模式发现方法,和利用频繁序列模式以及关联规则发现方法,在多相关时间序列上异常序列模式序列间的频繁模式和模式间关联关系的挖掘发现。实验发现,该框架是可行的,并能够发现异常模式间的关系,异常模式的诊断分析提供了依据。该框架的一个特点就是能够分析和处理多相关的时间序列数据。而它们关注的焦点主要集中在时间序列数据库中找到感兴趣的模式,如异常模式等。同时通过大量感兴趣的模式数据来揭示这些时间序列数据所具有的规律,并能准确地描述数据不断衍变的趋势。在实时数据仓库环境下,该框架可以实现主动决策。