论文部分内容阅读
时间序列数据是十分重要的数据类型之一,是代表不同时间测度观测的一组数据。通过对时间序列观测值的研究,可以深入了解生成该序列数据的系统,及其中蕴含的知识和规律,从而对该系统下一步的发展方向进行预测,控制系统内存在的潜在风险。
时间序列模型可以分为两类:基于统计学的时间序列分析模型和基于数据本身特征的时间序列挖掘模型。时间序列分析模型相比更为严谨,但是因为需要数据满足一些前提假设,故其灵活性不够高。时间序列挖掘模型适用面更广,但是模型的参数训练比较困难且模型参数的可解释性较差。可以将两类模型的优点结合起来,使用一种集成模型用于预测时间序列问题。
在集成模型中的时间序列挖掘模型部分,使用的是时钟驱动循环神经网络(CW-RNN)模型,该模型的参数可以使用不同的初始化方法,并使用基于随机梯度下降算法改进的参数学习算法进行参数的训练,也可以再使用随机权重平均算法用于参数微调。在时间序列分析模型部分,为了综合考虑待预测变量的其他相关因素的影响,可以使用VAR模型对时间序列进行拟合,在数据处理过程中可以使用自适应窗口标准化,在对模型参数进行估计时可采用偏最小二乘估计的方法。最后引入集成学习的思想,将CW-RNN与VAR模型采用stacking的方式集成,构造了一个可用于处理多维度时间序列数据的集成模型。最后,利用某上市公司的股票成交均价作为实验数据,仿真建立了该集成CW-RNN模型,并将该模型的实验结果与其他主流深度学习时间序列模型进行比较。
实验结果表明:1)对于单层CW-RNN,标准参数初始化和Adam算法的效果较好,且使用SWA对参数进行微调,可以使模型的预测准确度更高;2)CW-RNN在时间序列预测上的预测 准确度要优于标准RNN和LSTM网络;3)将CW-RNN和VAR模型的预测结果通过stacking的方式集成,更有助于提高模型整体鲁棒性,增强模型的泛化能力。该集成模型可以用于处理多变量的时间序列问题,用于多数据来源、时间维度不同等情况,且有较强的泛化能力,更适用于对时间序列的预测。
时间序列模型可以分为两类:基于统计学的时间序列分析模型和基于数据本身特征的时间序列挖掘模型。时间序列分析模型相比更为严谨,但是因为需要数据满足一些前提假设,故其灵活性不够高。时间序列挖掘模型适用面更广,但是模型的参数训练比较困难且模型参数的可解释性较差。可以将两类模型的优点结合起来,使用一种集成模型用于预测时间序列问题。
在集成模型中的时间序列挖掘模型部分,使用的是时钟驱动循环神经网络(CW-RNN)模型,该模型的参数可以使用不同的初始化方法,并使用基于随机梯度下降算法改进的参数学习算法进行参数的训练,也可以再使用随机权重平均算法用于参数微调。在时间序列分析模型部分,为了综合考虑待预测变量的其他相关因素的影响,可以使用VAR模型对时间序列进行拟合,在数据处理过程中可以使用自适应窗口标准化,在对模型参数进行估计时可采用偏最小二乘估计的方法。最后引入集成学习的思想,将CW-RNN与VAR模型采用stacking的方式集成,构造了一个可用于处理多维度时间序列数据的集成模型。最后,利用某上市公司的股票成交均价作为实验数据,仿真建立了该集成CW-RNN模型,并将该模型的实验结果与其他主流深度学习时间序列模型进行比较。
实验结果表明:1)对于单层CW-RNN,标准参数初始化和Adam算法的效果较好,且使用SWA对参数进行微调,可以使模型的预测准确度更高;2)CW-RNN在时间序列预测上的预测 准确度要优于标准RNN和LSTM网络;3)将CW-RNN和VAR模型的预测结果通过stacking的方式集成,更有助于提高模型整体鲁棒性,增强模型的泛化能力。该集成模型可以用于处理多变量的时间序列问题,用于多数据来源、时间维度不同等情况,且有较强的泛化能力,更适用于对时间序列的预测。