论文部分内容阅读
深度神经网络是近年来机器学习领域取得的重大突破性技术,它在机器学习、图片识别、语音识别等相关领域都取得了很多成果。目前,对于时间序列应用较多的是递归深度神经网络。从原理上讲,作为一种特殊的递归神经网络,LSTM深度神经网络善于发掘时间序列数据间的非线性关系,适用于股市时间序列预测问题。而对股市时间序列能否有效地进行预测,则取决于LSTM神经网络是否从训练样本中学习到隐含的本质规律。从递归神经网络的运行机制分析,训练样本的选择、网络结构以及优化方法都可能会对模型预测精度产生影响。本文基于LSTM深度神经网络对股票涨跌进行建模,对影响模型预测精度的3类因素进行系统地研究,进而提高模型的预测精度。训练样本方面,本文分别考察输入特征的选择、时间序列的序列长度、样本数量对模型预测精度的影响。针对输入特征,本文综合的考虑影响股价涨跌的因素,从中提取出基本交易类指标、技术类指标、大盘指数与财务类指标4类特征,将各类特征及其组合作为网络的输入变量,另外通过主成分分析法进行降维,建立对比模型,以此来研究4类输入特征以及主成分分析对模型预测精度的影响,从而选择最佳输入特征。模型结构方面,对不同隐层神经元数量的模型进行训练并对训练结果进行对比分析,以此来说明模型结构对预测精度的影响。优化方法方面,分别采用SGD、RMSprop以及Adam法对网络训练过程进行优化,以此来研究不同的优化方法对模型精度的影响,并最终选出最适用于LSTM深度神经网络的优化方法。再者,本文对数据进一步细化,将市场状态划分为牛市、熊市,并将不同市场状态的数据分别输入LSTM深度神经网络,比较模型结果,并用dropout与L2正则化技术对模型进行优化。最后本文将BP神经网络、传统RNN与LSTM深度神经网络进行对比分析,以此来说明LSTM深度神经网络的优异性能。本文以沪深300成分股2006-2017年个股数据为样本,基于LSTM深度神经网络进行建模,对影响模型精度的3类因素进行系统地研究,同时运用主成分分析以及dropout、L2正则化对模型进行优化,提高模型的预测精度。本文对LSTM等递归神经网络训练过程中的样本选择、参数选择具有一定参考意义,同时为构建股票涨跌短期预测模型以及深度神经网络在金融市场的应用提供一定的理论和实践价值。