基于长短时记忆网络的股市量化分析

来源 :云南财经大学 | 被引量 : 0次 | 上传用户:wuhu001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网时代的信息互通,人们可以在浏览器上搜索各类消息,而浏览的痕迹也会被“大数据”记录下来,比如在百度上搜索“股票”二字,当日的百度指数就会记录一次搜索量。投资者的心理预期也恰会表现在浏览器搜索行为上,即行为金融学,因此用百度指数的搜索量来间接反映投资者对股市的预期也是合理的。大数据时代机器学习、深度学习等算法热闹非凡,以往的股市量化分析大多基于ARMIA时间序列模型,之后的研究增加了技术分析模型比如神经网络,关于使用长短时记忆网络LSTM用于股票价格走势分析的研究也是近几年出现,长短时记忆网络RNN是建立在循环神经网络上的一种新型深度学习的时间序列模型,它具有高度的自学能力与模拟能力,具有记忆可持续性的特点,且能预测未来的任意步长,比较适合做金融时间序列的预测。本文以A股市场中白酒行业的洋河股份和贵州茅台开盘价预测作为研究。首先,综述行为经济学与投资者关注度的研究,对股市与关键词热搜的过往研究进行了总结,并发现百度指数可以作为关键词热搜的变量。然后,对神经网络模型进行描述,并对RNN循环神经网络和长短时记忆网络模型LSTM进行了对比,发现长短时记忆网络模型LSTM预测股价的误差值比循环神经网络模型RNN要小,因此选择长短时记忆网络模型预测金融时间序列更合适。因此,本文构建了基于长短时记忆网络进行股市的开盘价预测模型,并在影响因素上加上了股票的百度指数,具体的研究内容如下:第一,在变量的选取上,以t-1日的开盘价、收盘价、最高价、最低价、成交量、涨跌幅、振幅和百度指数作为输入变量,即影响因素,要预测的变量是t日的开盘价。在个股的选择上,选取了白酒行业中较有代表性的洋河股份和贵州茅台作为研究对象,并建立股票开盘价的预测模型。第二,为了比较出长短时记忆网络模型在预测开盘价时效果是否优于循环神经网络模型,我们对洋河股份(贵州茅台)的开盘价预测分别建立了长短时记忆网络模型和循环神经网络模型,并以预测的误差值衡量预测效果。同时,为了比较洋河股份(贵州茅台)的百度指数是否会对开盘价预测有影响,把长短时记忆网络模型的输入变量划分为有无百度指数,对循环神经网络模型也做同样处理。至此洋河股份与贵州茅台的股价预测模型分别有4个。第三,以2015年至2018年的时间跨度作为研究,并以2015年至2017年数据作为训练集,2018年数据作为测试。本文发现:1.在开盘价的预测模型选择上,LSTM模型比RNN模型预测效果更好。在使用t-1日的历史数据来预测t日的开盘价时,使用长短时记忆网络模型的误差值RMSE、MSE与MAE都要比循环神经网络预测时的误差值要小,印证了LSTM模型的效果要优于RNN模型。百度指数搜索量能够进行股价预测;2.无论是长短时记忆网络还是循环神经网络模型,当输入变量中含有百度指数时,在开盘价的预测上误差值要低于没有百度指数的预测模型,这反映出了百度指数作为人们对个股关注度的变量,其在预测股价上是具有一定的现实意义。所以,基于长短时记忆网络的股市量化分析具有如下的意义:首先是理论意义:长短时记忆网络模型LSTM在预测白酒行业股价上的误差小,对股市的研究精确性具有一定的价值;同时,我们把百度指数作为模型的输入变量时,发现预测效果更好,可以把百度指数作为一个有效的输入变量。最后,在实践上的意义,通过洋河股份和贵州茅台的实例,我们希望能为白酒行业的股市投资提供一些参考。
其他文献
目的了解所在医院医院感染现患情况,为医院感染防控提供依据。方法采用床旁调查与查阅病历相结合的方法,对2013年7月19日00 00-24 00所有住院患者的医院感染情况进行调查分析
海上风力发电机组基础是海上风电场建设的重要一环。文章介绍了海上风力发电机组的各种基础形式及其各自的特点,为海上风电场建设中海上风机基础形式的选择提供参考。
曹文轩是当代著名儿童文学家,其作品中荡漾于整部作品的悲悯情怀,在人与人之间的关系日趋疏远,情感日趋冷漠的当今世界中,也显得格外珍贵,格外感人。本文通过《草房子》中的
对于整个民用建筑施工来说,建筑地基基础与桩基础的施工技术发挥了重要作用。本文对其施工当中可能面临的问题进行了分析,分别从地基基础和桩基础两方面探讨了如何做好地基基
根据国际糖尿病联盟(IDF)的数据显示,2017年我国罹患2型糖尿病的人群约有1.2亿左右,为全球第一大糖尿病患病国,20-79岁人群中患病率达到9.8%左右。更严峻的是,根据我国2017年《糖尿病防治指南》指出,我国约有63%的糖尿病患者未被明确诊断,且处于糖尿病前期的患者约有4千万。而所谓糖尿病前期主要分为两种类型,分别是糖耐量减低(IGT)和空腹血糖受损(IFG)。糖耐量减低或空腹血糖受损是
雨污分流改造可有效降低城市污水对水体的污染,同时也使污水厂的运行易于控制,提高了污水处理的可靠性。本文针对排水系统存在的几种情况,提出了相对应的雨污分流改造思路。
LED芯片分选机是一种高频工作机械设备,测试机构是分选机的核心部件,其性能直接影响到整个分选机的分选效率和工作稳定性。测试机构的高频往复运动导致测试运动部件振动,机械
目的观察红细胞沉降率(ESR)、C反应蛋白(CRP)、血清淀粉样蛋白A(SAA)在不同类型人工髋关节置换术前后的变化规律,并探讨其临床意义。方法前瞻性纳入2011年4月-2013年5月行人
建筑技术科学研究了如何通过城市规划与建筑设计等措施使城市与建筑具有舒适、健康、适用、安全的环境。本文简述了目前建筑节能的现状与建筑节能的相关因素,并探讨了达到建
废名和朱英诞于上世纪三、四十年代先后在北京大学讲授新诗课程。他们同时也是诗人,诗歌倾向接近卞之琳,都是在日常生活中默想。废名的诗歌追求意境的浑圆和义理的蕴藏,一气