基于LSTM神经网络的标普500股票收益率预测研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:hunyuan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在实体经济的发展中,股票市场的表现可以很好的反映其发展状况,因此,采用一定的方法对股票的价格进行预测,在一定程度上具有很重要的价值。影响股票价格走势的因素有很多,不同的股票价格可以构成一定的时间序列,且彼此之间具有一定的记忆性。为了更加准确的预测股票价格的走势,合理有效的预测手段是非常重要的。本文的研究及预测对象为标普500指数及其成份股的日收益率。样本数据来源于谷歌网站,是由2019年4月1日到2019年9月1日共计153天、包括交易信息、财务信息、外部宏观指标等三个类别共计约30-40种特征的时间序列数据。预测方法上,本文采用GARCH模型、BP(Back Propagation)神经网络、长短期记忆神经网络(Long Short Term Memory)三种模型进行预测。而在预测偏差函数的选择上,本文采取MSE(Mean Squared Error)均方误差来定义模型的预测能力。最终,通过对比这三种模型的预测能力,本文找出了最优的预测模型并得出以下主要结论:标普500指数及其成分股的每日收益率存在一定可预测性,可以通过适当的预测模型,利用股票的历史信息来对未来收益率进行合理的预测。相比于GARCH模型和BP神经网络模型,LSTM神经网络对于标普500指数及其成分股具有更强的预测性能。而本文所选取的混合了多项外部指标(主要包括财务指标、宏观指标等)作为输入特征的LSTM神经网络的预测效果要优于普通的LSTM神经网络,可见一些外部指标能对模型的预测效果造成一定的提升。但在此模型的基础上,选取当日开盘价指标作为额外的输入特征后,模型的预测偏差反而有所上升,可见预测模型引入新指标作为输入特征时需要仔细斟酌。在对股票收益率进行预测时,数据的选取、处理、特征提取以及模型构建都是十分重要的环节,本文的研究对这些环节的处理具有一定的参考价值。而在股票的投资决策中,本文对标普500指数及其成分股股票的收益率的预测具有一定的现实意义。
其他文献
随着互联网行业和深度学习技术的快速发展,自然语言处理领域取得了前所未有的进展。自然语言推理在大数据的背景下取得了丰硕的成果,文本相似度分析是自然语言推理中一项基本
感觉运动皮层可通过锥体束及锥体外系对躯体运动进行控制。本实验证明大鼠感觉运动皮层也可通过锥体束对痛觉进行调制。锥体束切断后可明显增强电针“足三里”的镇痛作用。表
通过江淮地区一次梅雨期暴雨的诊断分析,探讨了梅雨锋暴雨的一种可能机制。指出条件性对称不稳定或等M面上的位势不稳定、锋生次级环流以及次天气尺度气旋的发展是形成暴雨的
<正> 脑室和中脑导水管周围灰质(PAG)内注射 P 物质(SP),观察大鼠下丘脑、海马和纹状体内5-羟色胺(5-HT)含量的变化及其与痛阈、电针镇痛的关系,结果如下:(1)脑室注射 SP可使
脉冲星是高度磁化的旋转中子星,具有体积小、密度大等特点。脉冲星的发现在物理和天文学领域都有着重大的意义。随着人工智能技术的发展,基于深度学习的图像识别方法被越来越
本研究选取上海浦江郊野公园内5种典型林分香樟林(Cinnamomum cam phora)、栾树林(Koelreuteria paniculata)、桂花林(Osmanthus fragrans)、无患子林(Sapindus mukorossi Gaertn)、池杉(Taxodium ascendens Brongn)林为对象,结合公园实际特点和操作的可行性,选择调节水量、固碳释氧、保持土壤肥力、
龙椒15号是利用辣椒雄性不育三系育成的一代杂种。不育系16A和恢复系07-23C从韩国金塔辣椒F2代中分离。龙椒15号辣味适中,色素含量高,主要适于加工干制,适于有效积温2 300℃
本文利用1899至1980年1月和7月北半球海平面气压资料,对冬、夏季7个主要大气活动中心的强度和位置变化作了统计分析,得到一些主要结果。
核糖体所催化蛋白质的生物合成是细胞内一切生命活动的基础。核糖体自身的组装也是一个重要的生长调控过程。已知一些核糖体依赖的GTP酶参与核糖体的组装,并且对细胞周期的调