基于LSTM的股票价格预测模型研究

来源 :浙江财经大学 | 被引量 : 0次 | 上传用户:xuxinhuiaishu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
改革开放以来中国经济稳步增长为中国金融市场的进一步发展提供了保障,而股票市场的发展与金融市场紧密相关,这就意味着股票波动与金融市场的繁荣以及国民经济的发展密不可分。股票在市场机制中发挥着提高资源配置效率、拓宽融资渠道等重要作用,因此对股票的研究具有现实意义。多年来国内外学者们从未停止对股票的研究,研究方法与技术也在不断创新,但是股票市场的不确定性、波动性、复杂性等特点使得股票研究富有挑战性,而机器学习和深度学习的出现为学者们提供了更多的技术支持。其中,长短期记忆神经网络(Long Short Term Memory,LSTM)的提出为研究时间序列提供了崭新的思路,它作为改良版的循环神经网络,能够有效地提取序列中的时间特性,从而能够更好地拟合时间序列数据。LSTM预测性能主要取决于股票数据特征的选择、损失函数的选择以及模型参数的设定,故本文基于LSTM模型并结合深度学习相关理论,选用中国银行2007年1月4日至2019年12月31日的股票日度数据,从特征选择、损失函数、优化算法三个角度出发进行建模预测。首先,针对上市公司的相关披露信息、股票历史交易数据等都会影响股票的价格波动,但并非所有信息都是有效特征的问题,本文采用了基于Light GBM(Light Gradient Boosting Machine)的嵌入式特征选择算法。该算法克服了Light GBM模型在选择特征时存在主观性的缺点,通过结合嵌入式特征选择算法,在训练模型的同时巧妙地进行特征选择,最终使得模型不易产生过拟合的情况,同时运算速度上也能提升得相对更快,重要的是大多数情况下都能找到最优的特征子集。利用该算法,删除无效或冗余特征,模型的特征维度从40缩减为5,维度缩减率达87.5%,在充分利用数据信息的同时降低特征维度,进而简化计算,并且在后期建模过程中呈现出良好的表现。所以基于Light GBM的嵌入式特征选择算法,可以提升模型性能、有效降低特征维度,还可以缩短训练时间和提升泛化性能。其次,针对LSTM模型的损失函数,本文在均方误差(Mean Square Error,MSE)的基础上考虑股票涨跌情况来改进,称为涨跌均方误差(Mean Square Error of Highs and Lows,HLMSE)。该损失函数突破常规思路,除考虑真实值与预测值之间的距离外,还考虑到数值波动与预测误差之间的关系,例如股票价格真实涨跌与预测价格涨跌之间对于预测误差的影响,若预测涨跌与真实涨跌一致则减小惩罚,反之增大惩罚。当优化算法是Adam(Adaptive Moment Estimation)时,使用HLMSE损失函数的模型比使用MSE的模型拟合效果更优,MAPE和RMSE分别减小了42.1%和27.1%,R~2提升了4.6%。最后,针对LSTM模型参数训练的优化算法,本文基于Adam算法提出了Nonlinear Acceleration of Adam算法(简称Adam NA),改善了Adam算法在某些情况下会出现无法收敛的情况,也克服了随迭代次数增加历史梯度信息的利用率会逐渐降低的缺点。通过对Adam算法的输出进行非线性加权来改进,可以更好地获取历史信息并提升模型的预测性能。当损失函数是MSE时,使用Adam NA算法的模型比使用Adam的模型拟合效果更优,MAPE和RMSE分别减小了32.0%和23.5%,R~2提升了4.1%。通过对比模型的预测结果,发现使用Adam NA算法和HLMSE损失函数的模型拟合效果最优,MAPE为0.8003、RMSE为0.0457、R~2为0.9633。综上可知,特征选择能够充分降低特征维度,并选出最优的特征子集,为后期建模提供良好的数据基础;损失函数与优化算法的改进可以有效改善模型的预测效果。此外,本文为验证提出的模型是否具有泛化性能,在原始中国银行股票的基础上又加入了中国建设银行股票数据,通过验证得出:模型预测结果较好,具有良好的泛化性能。所以,经过特征选择、损失函数与优化算法改进后的LSTM模型对股票价格预测研究具有一定的实用价值,这也为今后算法与模型的深入优化改进提供了参考。
其他文献
<正>2022年,关于用工问题的讨论始于互联网行业的裁员潮。这并不是互联网行业的第一次大规模裁员,2000年的全球互联网泡沫破裂、2008年的全球金融危机、2018年的互联网寒冬都曾引发裁员潮——对于体量庞大的互联网“大厂”而言,宏观经济下行时,裁员是最直接的降本方式。不过,仅仅关注裁员并不足以描绘互联网企业在经营压力下用工策略的转变。中国个协4月以来针对市场主体用工情况调查显示,互联网企业在迅速
期刊
目的 探讨基于慕课的《健康评估》课程混合式教学模式在护理本科生中的应用效果。方法 对本校2019级护理本科生实施基于慕课的混合式教学,采用《健康评估》课程满意度调查表与学生自主学习能力调查表评估混合式教学的效果。结果 317名护生对课程满意度的各维度评价由高至低分别为教师教学水平(93.7%)、教学资源与教学组织(均为93.4%)、学习效果评价(93.0%)、教学评价(91.8%);自主学习能力调
<正>概述最早为世所知的欧体楷书墓志,是宋人翻刻的隋《姚辩墓志》。清末又有隋《苏慈墓志》出土,也被认为有明显的欧体特征。自一九五八年《窦娘子墓志》出土以来,陆续有不少欧阳询体的小楷、纪年为贞观年间的墓志出土,共有六种(表一、图一)。已经有学者做过字体、书风比较,可以显示这些墓志与已知的著名碑刻《化度寺碑》《九成宫醴泉铭》《温彦博碑》和《皇甫诞碑》书出一脉,
期刊
在全面育人这一核心价值的引领下,“五育并举”需要向“五育融合”提升。“五育并举”是“五育融合”的基础,“五育融合”是对“五育并举”的理论提升。“德美育”的建构是实现从“五育并举”向“五育融合”提升的关键,其原因包括:“德美育”的建构是实现全面育人价值的关键路径;“德美育”是“五育融合”的精神内核;“德美育”的建构有利于实现从“五育并举”到“五育融合”的自然过渡。“德美育”体系的建构可以从三个维度展
<正>2019年,教育部、科技部、工信部等13个部委联合启动“六卓越一拔尖”计划2.0,提出要实现高等教育内涵式发展,全面振兴本科教育,决定全面推进新工科、新医科、新农科、新文科建设。2020年,教育部新文科建设工作组发布《新文科建设宣言》,对新文科建设作出了全面部署,拉开了全国高校新文科建设的序幕。
期刊
《反不正当竞争法》一般条款对于法律中未明确列举的不正当竞争行为的裁判具有灵活性,但作为正当性判定的“商业道德”却是一种不规范、不确定的概念。实践中,法官更倾向于援引行业规则或创设诸如“非公益必要不干扰原则”来认定互联网中的商业道德,这使得案件的审判陷入了道德理性的困境。多元利益衡量方法是将一般条款具体化为裁判规范的法学方法,是判定行为正当性标准的新思路,在弥补法律漏洞的同时,与不正当竞争中“自由竞
在新文科建设的背景下,面对日益纷繁复杂的社会现象和诸多困境,高等艺术教育的现代转型与增权性发展研究应涵盖四个维度,即注重“学术共同体”建设促生高等艺术教育学科深化拓展、“时代新变”趋势下以“学科跨界”创生高等艺术教育新学理、以“科教融合”助推高等艺术教育可持续化发展、走向“自为”建构“一体三维”的中国高等艺术教育信仰空间,这对于高等艺术教育学科深化和学理生成,提质增效教学资源和教育教学实践,培养新
目的 分析食管胃底静脉曲张破裂出血内镜下止血治疗的护理措施。方法 选取2018年8月至2019年8月我院收治的50例食管胃底静脉曲张破裂出血患者作为本次研究的对象,按照抛硬币的方法随机分为观察组和对照组,其中观察组26例,对照组24例。对照组进行常规护理,观察组进行全面优质护理,比较两组止血成功率、再出血发生率及护理效果总满意度。结果 两组患者止血成功率相近,差异无统计学意义(P> 0.05);观