论文部分内容阅读
时间序列预测是典型的时间序列分析任务,对于辅助决策、资源配置、提前采取止损措施等方面有重要意义,在包括电力、气象、交通、商业等领域有广泛应用。基于深度学习的时间序列预测算法以数据驱动的方式,学习序列特征,建模历史数据和未来数据之间的映射关系。由于深度学习模型在复杂度和序列特征表示方面的优势,近些年时间序列预测算法越来越多地采用深度神经网络进行构建,以捕捉复杂模式。在实际应用中基于深度学习的时间序列预测算法表现优于基于统计的时间序列分析预测算法。其中单变量时间序列预测、多变量时间序列预测、时间序列多步预测等一直是热门研究领域。另外,实时运行的信息系统产生大量时序数据,主要包括系统性能监测数据。预测系统性能的未来趋势可以为现代信息系统的日常运行维护提供重要帮助。随着信息系统的广泛部署,基于深度学习的时间序列预测算法在信息系统运维领域得到越来越多的应用。本文主要研究以下两个问题:(1)多变量时间序列预测算法的局部变量预测精度问题,即多变量预测算法在优化整体预测精度的同时如何保障局部变量的预测精度;(2)数据库管理系统(DBMS)的系统性能预测问题,即如何进行性能分数的趋势预测并挖掘具有前K影响力的关键性能指标(KPI挖掘)。针对多变量预测算法的局部变量预测精度问题,本文设计并实现了一种基于自演化预训练的多变量时间序列预测算法SEPNets。受预训练模型启发,SEPNets首先构建、训练单变量时间序列模型作为后续建模的基准;然后基于时序卷积网络(1维卷积)与长短记忆(LSTM)单元建模变量间复杂的时序依赖关系;通过将前者作为后者的预训练模型进行融合再训练,SEPNets解决了多变量时间序列预测的局部变量预测精度问题。实验结果表明,本文提出的SEPNets算法在获得相对最高的预测精度的同时保障了局部变量的预测精度,在各性能指标上优于现有的多变量时间序列预测算法。针对DBMS的系统性能分数的趋势预测和KPI挖掘问题,我们设计并实现了一种基于多任务神经网络的系统性能预测算法MTSL。从任务相关性出发,MTSL利用小波分析方法捕捉性能分数时间序列的多分辨率信息,结合多个LSTM网络与堆叠式长短记忆网络(Stacked LSTM)捕捉高维KPI时间序列的复杂时序信息,并通过共享两个任务网络隐层向量的方式,进行信息共享与多任务训练。MTSL能够并行地实现系统性能分数序列的多步预测、以及挖掘具有前K影响力的关键性能指标。实验结果表明,MTSL算法在系统性能分数趋势预测和关键性能指标挖掘方面取得了较好的精确度。