论文部分内容阅读
时间序列是一类重要的结构化数据形式,在很多领域都有着重要应用。在航空航天领域,航天器在运行期间产生大量的遥测数据,这些数据以时间序列的形式呈现,能够直观反映各部件的工作状态和运行模式。通过采用时间序列数据挖掘和分析技术对遥测时间序列数据进行检测和预测,有助于实时掌握航天器的健康状况并进行健康管理,是保障航天器正常运行和提高效能的有效手段。本文基于深度神经网络的特点,以实际工程中某设备的时间序列数据为研究对象,深入研究时间序列数据异常检测和多步提前预测方法。主要工作如下:在实际工程中,时间序列数据多以类间不平衡的形式存在,即少数类样本数量远远少于多数类样本数量,学习模型无法从少数类中学习足够的特征,导致少数类的检测精度将会受到严重影响。针对这一问题,我们提出一种代价敏感混合网络(Cost-Sensitive Hybrid Network,CSHN)模型用来解决类间严重偏斜的时间序列数据的异常检测问题。该模型由卷积神经网络(Convolutional Neural Network,CNN)、门控递归单元(Gated Recurrent Unit,GRU)网络以及代价敏感损失函数组成。因此,该模型融合了CNN和GRU的特点。前者具有较强的局部特征学习能力,后者具有较好的序列特征学习能力。利用代价敏感损失函数代替一般的交叉熵损失函数,解决了少数类数据分布倾斜导致检测精度不准确的问题。在提出的代价敏感损失函数中,我们使用不同的惩罚因子来惩罚网络模型的错误分类。在航天器某部件的转速数据集、温度数据集和UCR数据集进行仿真实验,实验结果表明,该方法具有良好的检测性能。特别是对于不平衡数据集,该方法的检测精度得到明显地提高。多步提前时间序列预测问题是预测建模的一大难题,尤其是长期时间序列数据预测,预测模型随着预测长度的增加,预测性能会越来越差。针对此问题,我们提出了一种基于堆叠LSTM神经网络的多输出迭代预测模型(MO-LSTMs)。该模型由多个LSTM隐藏层和dropout层堆叠组成,其中每一个隐含层不仅包含不同的神经单元而且每一层细胞的记忆状态被重置,因此,该模型不仅改善了单个LSTM网络的非线性表示能力,而且解决了单个LSTM网络结构在训练过程中难以保持样本间时序特征的问题,同时采用dropout算法也提高了模型的泛化能力和鲁棒性;利用MO-LSTMs模型,我们建立了一种多步提前时间序列数据预测方法。该方法采用多输出迭代预测的策略来减少长期时间序列数据预测的误差累积和误差传播,从而降低了迭代策略的计算复杂度。在航天器某部件的转速和温度数据集进行仿真实验,结果表明,该方法对于预测长时间序列数据具有较好性能。