论文部分内容阅读
摘 要:作为A股市场重要的股票指数之一,对沪深300股指的走势进行预测对于投资者进行套期保值和风险转移具有重要的意义。本文利用LSTM网络具备的复杂非线性时序特征提取能力,设计了一个LSTM深度循环神经网络来对沪深300股指的走势进行预测。结果表明,LSTM能够被成功地运用于股票价格指数走势的预测。
关键词:股指期货;神经网络;非线性;时序特征
股票的发展到今天已经有几百年的历史。股票市场的变化可以说是整个社会经济的“晴雨表”,它反映了社会经济的发展状况和公司的运营状况。股票价格指数被当做一种指标,反映了股票市场上所有股票市场价格的总体水平和相应的变化情况。股票指数的变化对于广大投资者和社会经济都有十分重要的影响。研究股指的主要作用是为套期保值者规避和转移风险。人们不断进行股指期货的研究,可是大多数研究者对我国的股指期货研究仅限于交易规则的制定和管理方式方法上。我们需要一种更加有效地方法对股指变化做出预测。
近年来以神经网络为基本构造模块的深度神经网络模型众多领域取得了巨大的成功。股票价格指数数据往往蕴含着大量的高噪声和复杂的非线性,浅层学习方法无法对其进行有效建模。由于深度神经网络能够提取出数据中蕴含的复杂非线性特征,因此本文通过长短期记忆循环神经网络对我国沪深300指数走势进行研究预测,以此来为投资者规避股市风险和实现财富保增值提供预判。
一、长短期记忆循环神经网络
长短期记忆循环神经网络(Long-Short Term Memory,LSTM)是一种改进的循环神经网络,其独特的门控设计使得其可以学习到时间序列中存在的多种长短期依赖信息。LSTM的每个神经元都有4个门控制着信息在单元内的流通,这4个门分别如下:
基于此本文设计了一个隐藏层大小为20的LSTM网络作为模型的第一层来提取股指数据中的高度复杂非线性时序特征,LSTM接收大小为 的一个矩阵,然后输出一个大小为 的向量;然后设计了一个隐藏层大小为1的全连接层作为输出层,其接收LSTM输出 大小的向量,然后输出大小为 的标量作为模型的输出;最后通过误差函数计算全连接层的输出与样本真实值之间的误差,以此误差进行反向传播更新模型参数以完成模型训练。
二、实验
(1)实验数据。本文选2018年1月1日至2018年12月30日共239个交易日的沪深300指数交易数据作为建模数据,将前5个交易日的开盘点位、最低点位、最高点位、成交量、成交金额、收盘点和第6个交易日的收盘点位作为一对训练样本,一共可获得234对训练样本作为训练数据。
(2)实验设置。本实验所设计的LSTM循环神经网络模型,使用python编程语言进行实现,运行在内存为8GB,显存为3GB的Ubuntu18.04操作系统上。模型采用Xavier方法作为各权重矩阵的初始化方式,学习率设定为0.1,模型损失通过MSE均方误差函数实现,优化方法为随机梯度下降法,迭代次数设定为200次。
(3)实验结果。经过200次迭代,模型平均误差从最开始的2.4135逐渐下降收敛到0.0014,說明模型对于训练样本之间的映射关系能够进行良好地学习。训练完成的模型的预测结果与真实值的比较如图1所示,不难发现本文所训练的模型对于沪深300指数前五个交易日的交易数据同第六个交易日的收盘点位之间的复杂关系能够进行良好地建模。
本文通过构建基于LSTM的循环神经网络模型,将其用于沪深300指数的预测。实验表明,LSTM网络能够对于沪深300指数数据自身存在的高度复杂非线性时序特征进行良好的学习建模。
参考文献
[1]Hochreiter S,Schmidhuber J.Long Short-Term Memory[J].Neural Computation,1997.9(08):1735-1780
[2]Xavier Glorot,Y.Bengio.Understanding the difficulty of training deep feedforward neural networks[J].Journal of Machine Learning Research,2010.01(09):249-256
作者简介:任鑫(1995-),男,汉族,四川省南充市,硕士研究生,成都理工大学管理科学学院应用统计专业,研究方向:大数据统计。
韩旭(1994–),男,汉族,黑龙江省绥化市人,硕士研究生,单位:成都理工大学管理科学学院应用统计专业,研究方向:地学数据统计分析。
关键词:股指期货;神经网络;非线性;时序特征
股票的发展到今天已经有几百年的历史。股票市场的变化可以说是整个社会经济的“晴雨表”,它反映了社会经济的发展状况和公司的运营状况。股票价格指数被当做一种指标,反映了股票市场上所有股票市场价格的总体水平和相应的变化情况。股票指数的变化对于广大投资者和社会经济都有十分重要的影响。研究股指的主要作用是为套期保值者规避和转移风险。人们不断进行股指期货的研究,可是大多数研究者对我国的股指期货研究仅限于交易规则的制定和管理方式方法上。我们需要一种更加有效地方法对股指变化做出预测。
近年来以神经网络为基本构造模块的深度神经网络模型众多领域取得了巨大的成功。股票价格指数数据往往蕴含着大量的高噪声和复杂的非线性,浅层学习方法无法对其进行有效建模。由于深度神经网络能够提取出数据中蕴含的复杂非线性特征,因此本文通过长短期记忆循环神经网络对我国沪深300指数走势进行研究预测,以此来为投资者规避股市风险和实现财富保增值提供预判。
一、长短期记忆循环神经网络
长短期记忆循环神经网络(Long-Short Term Memory,LSTM)是一种改进的循环神经网络,其独特的门控设计使得其可以学习到时间序列中存在的多种长短期依赖信息。LSTM的每个神经元都有4个门控制着信息在单元内的流通,这4个门分别如下:
基于此本文设计了一个隐藏层大小为20的LSTM网络作为模型的第一层来提取股指数据中的高度复杂非线性时序特征,LSTM接收大小为 的一个矩阵,然后输出一个大小为 的向量;然后设计了一个隐藏层大小为1的全连接层作为输出层,其接收LSTM输出 大小的向量,然后输出大小为 的标量作为模型的输出;最后通过误差函数计算全连接层的输出与样本真实值之间的误差,以此误差进行反向传播更新模型参数以完成模型训练。
二、实验
(1)实验数据。本文选2018年1月1日至2018年12月30日共239个交易日的沪深300指数交易数据作为建模数据,将前5个交易日的开盘点位、最低点位、最高点位、成交量、成交金额、收盘点和第6个交易日的收盘点位作为一对训练样本,一共可获得234对训练样本作为训练数据。
(2)实验设置。本实验所设计的LSTM循环神经网络模型,使用python编程语言进行实现,运行在内存为8GB,显存为3GB的Ubuntu18.04操作系统上。模型采用Xavier方法作为各权重矩阵的初始化方式,学习率设定为0.1,模型损失通过MSE均方误差函数实现,优化方法为随机梯度下降法,迭代次数设定为200次。
(3)实验结果。经过200次迭代,模型平均误差从最开始的2.4135逐渐下降收敛到0.0014,說明模型对于训练样本之间的映射关系能够进行良好地学习。训练完成的模型的预测结果与真实值的比较如图1所示,不难发现本文所训练的模型对于沪深300指数前五个交易日的交易数据同第六个交易日的收盘点位之间的复杂关系能够进行良好地建模。
本文通过构建基于LSTM的循环神经网络模型,将其用于沪深300指数的预测。实验表明,LSTM网络能够对于沪深300指数数据自身存在的高度复杂非线性时序特征进行良好的学习建模。
参考文献
[1]Hochreiter S,Schmidhuber J.Long Short-Term Memory[J].Neural Computation,1997.9(08):1735-1780
[2]Xavier Glorot,Y.Bengio.Understanding the difficulty of training deep feedforward neural networks[J].Journal of Machine Learning Research,2010.01(09):249-256
作者简介:任鑫(1995-),男,汉族,四川省南充市,硕士研究生,成都理工大学管理科学学院应用统计专业,研究方向:大数据统计。
韩旭(1994–),男,汉族,黑龙江省绥化市人,硕士研究生,单位:成都理工大学管理科学学院应用统计专业,研究方向:地学数据统计分析。