论文部分内容阅读
随着工程机械上不同类型传感器如温度传感器、压力传感器、湿度传感器等的大规模部署,这些传感器产生了大量的多维度时间序列数据。通过对这些传感器采集的时间序列数据关联分析,可用于发现工程机械各部件工作状况的潜在关联关系。这种潜在关系将为工程机械系统的故障预警和分析提供支持。但是,由于工程机械时间序列具有维度高和数据量大的特点,使得传统的Apriori关联算法无法直接运用。因此,本文从实际的工程机械时间序列数据出发,针对工程机械时间序列具体特点,提出一种适用于工程机械领域多维时间序列的关联分析方法。首先,本文设计了多维时间序列关联分析系统的整体框架,该框架分为预处理模块,离散化模块和关联规则提取模块。预处理模块负责数据清洗和规范化,实现每个时间序列的取值范围的规范化,并使每个时间序列符合高斯分布。另外,离散化模块对规范化的时间序列进行表示和离散化,也就是将数值型数据转化成字符型数据。此外,关联规则提取模块利用改进的时间特性关联方法从离散化的时间序列中提取有效的关联规则。接着,本文详细说明了离散化模块所用到的技术。本文先对流行的PAA+SAX离散化方法进行评估,发现PAA+SAX离散化方法有不足之处。PAA表示方法会改变时间序列规范化的结果。并且PAA表示方法会忽略原始时间序列的关键信息。另外,SAX离散化方法只能表示时间序列的大小特性,并且SAX的前提是时间序列符合高斯分布。然而,本文的数据集大部分不是高斯分布。所以本文对SAX离散化方法进行改进,使其也可以处理非高斯分布的时间序列。针对SAX不能保留原始时间序列关键信息的不足,本文推荐了变化特征离散化方法,它可以处理非高斯分布的时间序列并保留原始时间序列的关键信息。最后,本文详细阐述了关联规则提取模块所用到的时间特性关联方法。该方法改进了传统的Apriori算法。因为传统的Apriori算法不考虑项的时间特性,所以需要改进候选项的生成算法,支持度的计算方法和关联规则生成算法。使得改进的时间特性关联方法不仅可以处理单重时间序列,还可以处理多重时间序列。不仅如此,本文使用频率阈值和支持度阈值来获得异常模式。针对本文数据集的周期性特点,本文推荐了可以减少关联算法运行时间的关键时间片段关联方法。