基于一维CNN-LSTM混合神经网络的股价预测研究

来源 :上海财经大学 | 被引量 : 0次 | 上传用户:yangglan2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年来,尤其是2016年谷歌的Alpha Go与韩国李世石的人机围棋比赛,使得深度学习、神经网络等等技术被越来越多的人所熟识。而在图像识别、音视频识别处理、自动驾驶等领域,得益于众多学者不断的研究与探索,深度学习的发展取得了巨大的进步。目前,已有众多研究人员将深度学习、神经网络等技术运用到金融时序数据的预测中,如预测股价涨跌、期货收益等等。这是因为随着全球经济的迅猛成长,经济全球化也是未来发展的必然趋向。金融市场的健康发展对全球经济的成长起着关键性的作用,而全球金融市场中,股票、期货、债券等产品的交易量以及交易数据也随着市场的发展逐年递增。中国的股票市场经过了三十多年的发展,其规模在全球股市中逐渐占据了很大的比重,而伴随着中国股市的不断成长,国内参与股票交易的投资者人数也在逐年增加。因此,股票的涨跌与我国经济的发展有着紧密的联系,而股市的波动也对每一个投资人都有着很大的影响。使用深度学习这一技术来对金融市场进行预测,不仅扩展了该技术的应用场景,同时也有助于投资者规避风险,获取收益。但是,众多股票研究人员更多靠的是自己的经验进行预测。因此,如何找到更高效的深度学习模型运用到金融时序数据的预测场景中,如何提高模型的预测精度与效果,是大部分学者研究的重点,也是需要攻克的难点。本文以中国股市为主要研究对象,并且采用技术分析中常用的交易指标与技术指标数据对股价进行预测,主要研究内容如下:首先,使用同花顺i Fin D金融客户端以及开源财经数据包接口Tushare等工具获取沪深300指数、中证800指数和上证综指的交易行情数据,随后使用TA-Lib开源技术接口生成了17个技术指标特征,加上交易行情指标,共计22个。其次,为了最大限度降低噪声数据对模型效果的不良影响,采用了因子分析法对三只指数的数据进行关键特征的分析和提取,经过数据适用性检验、提取载荷矩阵、旋转因子等步骤,最后每只股票都提取出4个公共因子作为关键特征,组成了新的数据集。再次,本文构建了一维CNN-LSTM混合神经网络模型对三只指数数据的收盘价进行预测。每个指数的数据集A(即原始特征数据集,为描述简便,下文统称为数据集A)和因子分析法提取出关键特征的数据集B均采用w天的特征数据,来预测w+1天的收盘价。关于模型效果的评测,本文采用回归问题中常用的RMSE、MSE、MAE以及R~2得分的值作为评价指标。关于模型优化,本文主要讨论了一维卷积神经网络部分中卷积核个数的多少、在模型中加入Dropout方法以及选取Adam函数作为优化算法等对模型效果的提升。在对三只指数进行训练和预测之后,发现采用数据集B的一维CNN-LSTM模型比数据集A的预测效果要高,具体为:沪深300指数数据集B的R~2得分比数据集A高出了0.0372,RMSE的值则下降了73.4;中证800指数数据集B的R~2得分比数据集A高出了0.0446,RMSE的值则下降了60.18;上证指数数据集B的R~2得分比数据集A高出了0.035,RMSE的值则下降了58.61。最后,本文选取了循环神经网络模型、BP神经网络模型、LSTM网络模型与一维CNN-LSTM网络模型进行对比。在使用同样数据集进行训练与预测之后,根据三个模型在三只指数两种数据集上得出的评价指标结果,发现三个对比模型均没有本文提出的混合神经网络模型在数据集A中获得的效果好。因此,本文提出的一维CNN-LSTM混合神经网络模型对股价预测有效,而结合了因子分析法,本文的模型精度和效果也有了进一步的提升。通过指数数据的预测结果可以发现,本文的混合神经网络模型也可以在期货、债券、基金等其他金融时间序列模型上也能发挥一定的作用,对股票投资者具有参考价值和研究意义。
其他文献
进入二十一世纪,理论界关于无产阶级革命的讨论热度渐消,但是,只要资本主义制度继续存在,无产阶级反对资产阶级的革命、社会主义反对资本主义的斗争就不会消失,相应地,革命理论的研究也就不会过时。在革命理论问题上,葛兰西与马克思的观点存在着明显差异,澄清、把握这些差异,具有多方面的意义:其一,有助于我们清晰、准确地理解马克思的革命观,这是我们以马克思的理论指导现实革命的重要前提。其二,有助于我们把握马克思
学位
中国银行间债券市场在我国债券市场中占有绝对的主导地位,自银行间交易商协会成立以来,银行间债券市场的投资者不断增加、产品不断丰富,但同时市场的复杂性也在增加,所以在市场快速发展的同时,也暴露出了许多问题,尤其是近两年间信用债经常发生集中的大规模违约,极大的影响了市场信用,导致银行间债券市场出现流动性大幅降低的问题,这反映出我国对债券市场的研究探讨尚不充分。因此,有必要对银行间债券市场流动性进行研究,
学位
从发生学和病原学角度,安娜斯将德性与技艺相类比,揭示了技艺和德性背后相同理智结构和结构要素的同时,以德性所具有的发展性作为结构内的动力系统,进而完整地还原了德性的生成过程。由此,安娜斯展示了作为实践智慧的德性的结构及其运行过程,更重要的是,她以此作为理论根据,提出了德性和行动间蕴含的并存关系。简而言之,德性通过行动而生成,行动内必然含有德性的因素,两者彼此紧密相连,不可分离。而这个观点的形成则代表
学位
近几年来舆情反转现象频发,成为了新闻界热议的焦点,同时也引起了学界的关注。本研究结合社会学、传播学、心理学理论,采用定量与定性相结合的方法,选取鲍毓明性侵“女童”事件为个案,对舆论反转过程的舆情演化与情感演变进行分析。本文基于Python语言编写的爬虫爬取了有关鲍毓明性侵“女童”事件2020年4月1日至2020年10月30日的微博文本,最终共获得12670条微博文本数据,除此以外还得到发布微博的时
学位
2020年,新冠疫情在全球爆发。疫情的爆发引发了一场旅游行业的危机,并给中国及世界旅游业造成了巨大的影响。从短期来看,新冠疫情造成了全球人口流动骤减、全球旅游业收入大幅度下降。从长期来看,新冠疫情将旅游行业内的各细分行业原有的发展模式打破,旅游行业内部已发生或将会发生一些永久性、结构性、根本性变化。这一点使得新冠疫情区别于以往任何的旅游危机,如“911”恐怖袭击事件、SARS疫情等,因为后者持续的
学位
随着互联网行业以及信息时代迅速发展,用户产生的数据成倍增加,同时计算机储存技术日益成熟,计算机计算能力大大加强,使得越来越多的数据能够用计算机处理,蕴藏在数据中的价值也越来越多的被人们所关注。目前机器学习理论日趋成熟,大数据技术在各行各业中取得巨大进展,有力地推动了人工智能的发展。企业通过收集数据,基于机器学习理论,研究行为数据,从而提取有用信息为企业所用。基于以上背景,本次研究希望能根据历史数据
学位
《哲学的贫困》是马克思批判蒲鲁东主义的经典著作,也是马克思唯物史观、政治经济学、共产主义思想、科学方法论集中迸发的文本。在该文本中,马克思借助对蒲鲁东的批判将自己从《1844年经济学哲学手稿》到《德意志意识形态》中所取得的理论成果进行整合、论证和深化,不仅解决了之前著作遗留下的问题,也为后续《资本论》的写作提供世界观基础和方法论前提。《哲学的贫困》作为马克思思想发展过程中的重要理论环节,它的产生代
学位
我国为人均水资源缺乏国家,人均水占有量仅为世界平均值的1/4。随着人民生活水平的提高,总水耗持续增加,其中建筑生活用水量占到城市总用水量的60%,建筑节水的重要性愈发显现。当前我国对于建筑水耗进行管控和评估的方法并不多,常用方法是国家和各省市制定的建筑用水定额标准,但随着社会高速发展,用水定额标准的更新往往跟不上用水需求的增加,同时用水定额标准的使用需要建筑有分项计量数据,实际操作难度较高。国外用
学位
马克思的思想体系是直接建立在对现实的理解之上,因此马克思的现实观在马克思的思想体系之中占据着至关重要的位置。但是当下人们对于现实的理解却处于这样一种明显的对立之中:一种是对现实做形而上学的理解,另一种认为现实就是单纯的经验实存,将现实等同于“事实”或“现象”。破除这种对立状态,需要我们真正理解马克思的现实观,同时,对马克思现实观的正确理解本身在理论意义上既能凸显马克思主义哲学关注重大社会现实的精神
学位
“瞪羚企业”的概念最早由美国麻省理工经济学教授戴维.伯奇和詹姆斯.麦道夫于20世纪90年代提出。它是指大量穿越创业死亡谷的,经历完整初创阶段(雏鹰企业),进入快速发展阶段,并有机会进入行业领袖阶段(独角兽企业),继而发展为成熟稳定的地区和细分领域龙头的企业。当经济发展壮大到一定阶段,根植性龙头企业在地方经济中充当稳定器的作用。但从实际工作中看,一般来说,此类企业的存在多数情况下只能靠本地培育,如同
学位