论文部分内容阅读
多变量时间序列数据广泛存在于空气质量预测、股票走势分析、机械结构可靠性评估等各种实际工程中。通过同时对多个影响因素构建预测模型,多变量时间序列预测可有效提高单一变量时间序列的预测效果。然而,传统的多变量时间序列预测方法常忽略变量间的结构化信息,从而限制其预测精度和数值稳定性的提高。时间序列结构化预测的关键在于寻找序列间结构化信息,鉴于此,本文针对空气质量预测和轴承衰退趋势预测的实际问题,从数据分布特点出发,分别采用单步预测和递归预测两种方案,同时引入时间序列聚类算法,充分挖掘变量序列之间的相似度信息,构建两类多变量时间序列结构化预测方法。主要工作和贡献如下:(1)针对空气质量预测应用中多变量时间序列预测方法未考虑序列之间相似性关系、从而影响预测效果的问题,提出一种基于异常序列剔除的多变量时间序列预测算法。该算法利用多维支持向量回归机(Multi-dimensional Support Vector Regression,MSVR)内在的结构化输出特性,选取具有相似性的多个变量序列进行联合预测。首先,对已知序列进行基于模糊熵的层次聚类,实现对相似序列的初步划分;其次,求出类中所有序列的主曲线,根据序列到主曲线的距离计算各个序列的异常因子,从而进一步剔除聚类结果中的异常序列;最后,将选取到的相似变量序列作为输入,利用MSVR进行预测。通过理论分析,证明本文算法在理论上存在模型可靠度下界和信息损失上界,进而说明本文算法的合理性与可行性。将该算法应用于实际的空气质量预测问题,在2002年到2006年澳门气象数据上进行对比实验,结果表明,与现有多个代表性方法相比,本文算法可有效挖掘多变量时间序列的内在结构信息,预测精度更高,数值稳定性更好。(2)在利用时间序列预测方法预测轴承衰退趋势时,由于目标轴承故障走势无法提前获取,而采用递归预测方法需将上一步的预测输出值作为下一步的模型输入,因此极易造成误差快速累积增大。针对该问题,本文提出一种基于PSW度量的多变量序列结构化递归预测方法。该方法通过离线提取具有相似性的轴承故障序列数据,作为包含领域信息的元数据,构建递归预测模型,实现对目标轴承衰退趋势的在线预测。首先,在离线阶段,引入相空间曲变(phase space warping,PSW),将故障数据转化为一系列的跟踪矩阵,对其计算动态时间规整(Dynamic time wraping,DTW)距离度量,进行时间序列层次聚类,得到轴承衰退趋势的相似性划分;其次,构建每一类轴承故障序列的主曲线,提取得到该类序列的元数据;最后,在在线阶段,引入每类序列的元数据作为衰退趋势的先验知识,采用最小二乘支持向量机构建预测模型,实现对目标轴承故障衰退趋势的递归预测。将该方法应用于轴承剩余寿命预测问题,在PHM 2012轴承数据上进行仿真实验,结果表明,所提方法通过利用轴承数据间的内在结构信息,可有效降低对目标轴承衰退趋势的递归预测误差。本文的研究结果从结构化信息表示和预测的角度,为多变量时序数据分析和处理提供了新的解决方案,具有显著的理论与实际工程应用价值。