基于深度学习的S&P 500每日收盘价预测

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:a410539939
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
长期以来,股票市场预测一直是投资者,交易员和经济学家的关注重点。经济预测使经济学家可以为政府官员和企业主提出建议,但是当前的模型主要基于通货膨胀,利率,工业生产,消费者信心,工人生产率,零售销售和失业率。本文着重于经济预测的另一个重要方面:股市趋势。在我们的研究中,我们将使用最先进的深度学习算法来预测未来30天标准普尔500指数的价值。本研究并非旨在创建股票市场交易算法。相反,这项研究旨在预测标准普尔500指数中的经济趋势。在我们的研究中,我们使用了其中三种深度学习算法。在相等的基础上对它们进行比较,并尽可能使用相同的数据集和参数。我们的第一个算法是长短期记忆(LSTM)算法。第二个模型是改进的门控循环单元(GRU),第三个模型是双向GRU(Bi-GRU)。在我们的研究中,我们展示了 Bi-GRU算法模型提高的准确性。如论文中所示,随着这些功能从LSTM到GRU再到Bi-GRU的发展,这些模型获得了增强的预测能力,这是我们编程增强的每一步都可以提高模型的可预测性和准确性。股票市场预测的机器学习应用程序中的大多数研究都使用LSTM算法进行预测。我们采用最新的TensorFlow算法结构,并将其应用于标准普尔500指数的历史数据,并尝试使用Yahoo Finance的公开数据集来预测该指数在未来30天的未来收盘价。我们的发现很有希望。近年来,机器学习和人工智能的发展改变了股票市场的预测并使之现代化。在全球范围内,到2025年,人工智能市场的规模预计将达到3,009亿美元。人工智能算法已经发展到这样的程度,即当客户准备好进行购买时,亚马逊就可以高度肯定地知道这一点。客户知道,并且亚马逊拥有一项专利,可以将即将购买的商品在可能进行购买之前运送到最近的加工设施。这些预测不是人类做出的。它们是由机器学习算法制成的。这些算法正在影响我们生活中不断增长的部分,无论是在网络上,还是在无人驾驶汽车行驶的道路上。金融部门还使用机器学习算法来预测市场趋势,而这正是本文所关注的。股市预测被定义为试图确定公司股票或在交易所交易的其他金融工具的未来价值的行为。数据科学家可以使用机器学习算法来预测任意数量的时间序列事件,包括股票市场指数值。近年来,计算能力和深度学习方法开创了预测模型的新潮流。这些新模型是对以前用于股票市场预测的统计方法的巨大改进。在给定可靠的数据集和无数变量(例如公众情绪,Twitter主题标签和历史数据)的情况下,深度学习算法模型对于金融股票市场预测特别有用。成功预测股票的未来价值有可能产生可观的利润。股市预测受多种因素的影响,例如政治,经济,公众舆论和业务绩效。由于这种复杂性,股票市场的波动一直是股票市场预测的历史障碍。如今,深度学习人工智能算法已消除了成功的障碍。本文提出了三种最先进的深度学习算法,以预测未来30天标准普尔500指数的价值。我们为什么要在未来30天学习?这是其他研究中用来测试模型准确性的通用研究指标。从理论上讲,这是一个很好的指标,因为我们可以轻松地对其进行测试而不会太过遥远。这是一个完美的中间立场:度量标准不能太短也不能太长。深度学习是一项人工智能任务,它模拟人脑在处理数据和创建用于决策的模式方面的工作。深度学习是人工智能(AI)中机器学习的一个子集,它具有能够从无结构或无标签数据中学习而无需监督的网络。研究人员可以使用深度学习方法在数据中找到自己无法找到的模式。人工神经网络已在金融领域进行了广泛的研究,并且有许多关于该主题的研究发表。但是,很少有使用我们特定类型的图像分类算法的研究发表。我们的GRU,双向GRU和Dilated CNN算法最常见于图像分类任务,而不是时间序列数据。使用这些模型,我们能够在预测S&P 500的未来价值时实现高达87%的预测准确性。金融是计算量最大的领域之一,但最常用的模型(随机模型,有监督模型和无监督模型,计量经济学模型等)在很大程度上受到过度拟合,启发式和样本结果差的问题的影响。这些不良的预测结果很大程度上是由于复杂的非线性问题。经过验证的深度学习研究可能会有所帮助。深度学习算法非常适合复杂的非线性问题解决和预测,以及形成非线性关系,同时可以自定义拟合以避免过度拟合数据。但是,有一种流行的理论指出,我们不应该能够始终如一地预测市场并表现得比随机模型更好。这就是有效的市场假设。我们的工作将使用这些算法来反驳有效的市场假设。在我们的研究中,我们使用三种机器学习算法。在平等的基础上对它们进行比较,并在适用的情况下使用相同的数据集和参数。我们的第一个算法是长短期记忆(LSTM)算法。第二个是带有修改的门控循环单元(GRU)的LSTM,而我们的第三个模型是双向GRU。正如我们在研究中所见,随着这些功能的加入,模型获得了增强的预测能力。我们发现,在S&P 500预测中,门控循环单位的性能优于LSTM算法。我们还表明,有可能以合理的准确性预测S&P 500指数的未来,并且我们通过将模型暴露于不同的数据集来控制过度拟合,并获得相似的结果。这表明我们的结果是准确的。我们的主要发现是双向GRU优于单向GRU,并且我们推测这是由于Bi-GRU算法模型中神经网络的连通性增加所致。在我们的实验中,我们运行三种单独的机器学习算法,以了解哪种算法可以最准确地预测标准普尔500指数到未来30天的走势。我们利用LSTM模型,GRU模型和Bi-GRU模型。每个模型都有其自身的优点和缺点。GRU和LSTM算法之间的主要区别在于,GRU具有两个门(重置和更新门),而LSTM具有三个门(即输入,输出和忘记门)。LSTM和GRU算法是单向的,它们的堆叠体系结构分别由两个或多个LSTM和GRU的堆叠单向层组成。每个堆叠层的数据序列处理方向相同。它用于执行数据的深入分析并代表时间序列中更复杂模式的不同比例。另一方面,双向体系结构由GRU的两个堆叠层构成,以使用双向数据流处理数据。双向层处理前面和后面的输入序列,以通过利用所有输入数据来获得最佳学习性能。在这项工作中,我们探索了这三种算法的深度学习方法,并研究了它们在金融时间序列预测中的优势。我们使用Yahoo财务网站从标准普尔500指数中收集历史数据。雅虎财经是一种媒体财产,提供财经新闻,数据和评论,包括股票报价,新闻稿,财务报告和原始内容。它被许多金融领域的Python程序员用作重要资源,因为可以轻松地将历史股票数据导出为.csv格式,该格式在Python编程语言中很容易使用。预测标准普尔500指数是一项具有挑战性的研究活动,随着新的可用数据源,市场,金融工具和算法的出现,现在正越来越受到关注。从本质上讲,股票价值的可预测性仍然引发了基本的统计问题。我们的模型表明,至少借助我们的数据和市场条件,可以预测。我们收集了适当的数据,并使用信誉良好的开源库创建了模型,并确保我们的模型是准确的,并且不会过度拟合数据。这项工作特别有用且准确。许多经济学家和投资者都可以从这种预测能力中受益。在标准普尔500指数市场的30天中,其准确度为92.04%。我们的工作表明,这些模型在市场上具有价值,并且我们可以使用此类数据来对冲市场风险。我们研究的实际意义为进一步研究留下了空间。这些模型主要适用于30天范围内的紧密预测,因此不适用于交易或货币洞察。我们研究的一个潜在问题是过拟合。研究表明,准确性接近90%,这表明我们可能对数据过度拟合。我们通过测试来防止过度拟合,以确保图表中没有可见的图案。我们还对其他数据集测试了我们的算法,以确保我们的算法不会过拟合。这应该在进一步研究中加以说明。在结束本摘要时,通过研究,我们研究了最新的深度学习算法,并成功预测了未来30天美国证券交易所标准普尔500指数的收盘价。我们选择30天作为标准指标,因为较短的时间没什么用处,而较长的时间在我们的实现中变得不可预测。尽可能准确地预测模型需要30天。我们从头开始解释了我们的研究结构。我们对人工智能及其领域内的机器学习算法有基本的了解,并对我们的深度学习算法背后的算法结构和数学有更深入的了解。
其他文献
近年来,实践性知识的研究渗透到不同的学科领域,呈现出多样化的特点。基于对国际化人才培养的要求,我国一直都十分注重外语教学质量的提高和外语教师的专业发展。实践性知识
阵列天线具有提升系统增益及灵活的波束控制能力,广泛应用于各种无线电子系统之中。现代无线电子系统发展日新月异,面临的电磁环境日趋复杂,系统对天线阵的性能提出了越来越
美国内部审计专业机构的《2011年度内部审计能力与需要的调查报告》阐述了美国企业内部审计工作的能力与需要的情况。本文介绍了美国企业强化内部审计工作的主要措施:进行一
职业发展与就业指导教育提升大学生职业素养,掌握更多求职知识与技能的重要途径,是贯穿于学生全部的学习和生活中。在职业发展与就业指导中进行思想政治教育,从正确的择业观
<正>2019年第1期最受读者欢迎的五篇参评文章分别是《调研要接地气懂风气重通气》《控制会议时间的"1+3"组合拳》《人,不能有架子,但得有样子》《我在世界经合组织核能署秘书
本文通过分析研究生作者投稿论文中存在的常见问题,解析我国高等院校开设研究生科技论文写作课的必要性以,介绍开设科技论文写作需要做的准备工作,以及研究生论文写作课需要
气动紧急截断阀在长庆油田靖边气田各个集气站已经达到广泛应用,并且取得了显著效果。气动紧急截断阀普遍安装在集气站的进站和外输上,从目前的使用情况来看,有效地提高了集
本文旨在研究“晋谷21”小米加工成方便小米粥并加不同抗氧化剂后,方便小米粥中油脂和蛋白质在贮存过程中的变化。对小米的营养组成、油脂、蛋白及淀粉特性进行分析,采用烘箱法加速氧化,对比不同贮存时间小米、方便小米粥及添加不同抗氧化剂方便小米粥主要化学指标变化规律和其蛋白质亚基的组成变化。最终,对“晋谷21”小米营养成分进行了分析,并总结了贮存过程小米及方便小米粥中油脂和蛋白质两大组分的变化规律,为小米加
济宁市环南阳湖地区是济宁市的重要区域。它是新的城市中心南部扩展地带;它因环湖成为城市中的特殊区域;它是生态资源富饶地区又是生态敏感地带;它穿过了济宁市最贫困的地区
孟子的辩论艺术旗帜鲜明,文采洋溢,情感热烈,为了使其言语具有说服力,孟子几乎运用了一切语言手段,引经据典,巧设比喻,鲜明对比。在《孟子》中辩论技巧被推上了一个极致。《