论文部分内容阅读
在实体经济的发展中,股票市场的表现可以很好的反映其发展状况,因此,采用一定的方法对股票的价格进行预测,在一定程度上具有很重要的价值。影响股票价格走势的因素有很多,不同的股票价格可以构成一定的时间序列,且彼此之间具有一定的记忆性。为了更加准确的预测股票价格的走势,合理有效的预测手段是非常重要的。本文的研究及预测对象为标普500指数及其成份股的日收益率。样本数据来源于谷歌网站,是由2019年4月1日到2019年9月1日共计153天、包括交易信息、财务信息、外部宏观指标等三个类别共计约30-40种特征的时间序列数据。预测方法上,本文采用GARCH模型、BP(Back Propagation)神经网络、长短期记忆神经网络(Long Short Term Memory)三种模型进行预测。而在预测偏差函数的选择上,本文采取MSE(Mean Squared Error)均方误差来定义模型的预测能力。最终,通过对比这三种模型的预测能力,本文找出了最优的预测模型并得出以下主要结论:标普500指数及其成分股的每日收益率存在一定可预测性,可以通过适当的预测模型,利用股票的历史信息来对未来收益率进行合理的预测。相比于GARCH模型和BP神经网络模型,LSTM神经网络对于标普500指数及其成分股具有更强的预测性能。而本文所选取的混合了多项外部指标(主要包括财务指标、宏观指标等)作为输入特征的LSTM神经网络的预测效果要优于普通的LSTM神经网络,可见一些外部指标能对模型的预测效果造成一定的提升。但在此模型的基础上,选取当日开盘价指标作为额外的输入特征后,模型的预测偏差反而有所上升,可见预测模型引入新指标作为输入特征时需要仔细斟酌。在对股票收益率进行预测时,数据的选取、处理、特征提取以及模型构建都是十分重要的环节,本文的研究对这些环节的处理具有一定的参考价值。而在股票的投资决策中,本文对标普500指数及其成分股股票的收益率的预测具有一定的现实意义。