Stock Price Trend Prediction Based on Neural Network

来源 :华中师范大学 | 被引量 : 0次 | 上传用户：wangcongyu003

【摘要】

：

【作者】

：

冯想飞

【机构】

：

华中师范大学

【出处】

：

华中师范大学

【发表日期】

：

2019年01期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

股票是股份公司发行的所有权凭证,是股份公司为筹集资金而发行给各个股东作为持股凭证并借以取得股息和红利的一种有价证券。每股股票都代表股东对企业拥有一个基本单位的所有权。每家上市公司都会发行股票。这种所有权为一种综合杈利,如参加股东大会、投票表决、参与公司的重大决策、收取股息或分享红利差价等,但也要共同承担公司运作错误所带来的风险。获取经常性收入是投资者购买股票的重要原因之一,分红派息是股票投资者经常性收入的主要来源。股票自诞生以来,便被赋予了特殊的商业价值,预测股票的价格走势,可以帮助股票投资者找到更好的交易时间。如今人工智能的科技成果应用范围广泛,提高了生产力,其核心技术是机器学习,神经网络和深度学习。在历史上有不少科学家曾借助神经网络来对股票进行预测,但是局限于当时的科技条件,无法更高精度的进行预测,如今AI的理论基础有了很大的发展,针算机硬件设施性能也出现飞跃,利用RNN,LSTM等神经网络可以更好地对类似于股票价格的时间序列进行预测。股票虽然只是一种凭证,但由于股票的持有人凭着股票可获得一定的经济利益并享有相应的权利,所以股票是一种有价证券,并具有以下性质:不可偿还性,参与性,收益性,流通性,价格波动性和风险性。预测股票的方法主要有两种:基本面分析和技术分析。基本面从字面上的意思可以理解为共同拥有的属性指标这一方面,按股票的基本面来讲,是指那一些各自都拥有的基本情况的汇总。一般我们所讲的基本面分析是指对宏观经济面、公司主营业务所处行业、公司业务同行业竞争水平和公司内部管理水平包括对管理层的考察这诸多方面的分析,数据在这里充当了最大的分析依据,但往往不能以数据来做最终的投资决策,如果数据可以解决问题,那计算机早就代替人脑完成基本面分析,事实上除了数据还要包括许许多多无法以数据来衡量的东西。技术分析是指以市场行为为研究对象,以判断市场趋势并跟隨趋势的周期性变化来进行股票及一切金融衍生物交易决策的方法的总和。技术分析认为市场行为包容消化一切信息、价格以趋势方式波动、历史会重演。目前人工智能领域所使用的核心算法是机器学习算法,机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域,它主要使用归纳、综合而不是演绎。人工智能领域的神经网络是指由大量的处理单元（神经元）互相连接而形成的复杂网络结构,是对人脑组织结构和运行机制的某种抽象、简化和模拟。人工神经网络以数学模型模拟神经元活动,是基于模仿大脑神经网络结构和功能而建立的一种信息处理系统。MLP（Multi-Layer Perception）,即多层感知机,是一种前向结构的人工神经网络,映射一组输入向量到一组输出向量。MLP可以被看做是一个有向图,由多个节点层组成,每一层全连接到下一层。除了输入节点,每个节点都是一个带有非线性激活函数的神经元（或称处理单元）。一种被称为反向传播算法的监督学习方法常被用来训练MLP。MLP是ANN的推广,克服了感知器无法实现对线性不可分数据识别的缺点。循环神经网络（RNN）是一种节点定向连接成环的人工神经网络。这种网络的内部状态可以展示动态时序行为。不同于前馈神经网络的是,RNN可以利用它内部的记忆来处理任意时序的输入序列,这让它可以更容易处理如不分段的手写识别、语音识别等。LSTM（Long Short-Term Memory）是长短期记忆网络,是一种时间循环神经网络,适合于处理和预测时间序列中间隔和延迟相对较长的重要事件。LSTM区别于RNN的地方,主要就在于它在算法中加入了一个判断信息有用与否的“处理器”,这个处理器作用的结构被称为cell。一个cell当中被放置了三扇门,分别叫做输入门、遗忘门和输出门。一个信息进入LSTM的网络当中,可以根据规则来判断是否有用。只有符合算法认证的信息才会留下,不符的信息则通过遗忘门被遗忘.本文将了解股票市场的基本参数,股票市场的基本趋势,分析股票预测的难点。本文尝试利用神经网络,通过分析历史股票数据来预测未来股票的收盘价,文中介绍了人工神经网络（ANN）,BP神经网络,循环神经网络（RNN）以及长短期记忆序列（LSTM）。深入了解了RNN和LSTM神经网络的实现原理,在分析比较的基础上,理解LSTM相对于RNN的优势的同时,同时使用RNN和LSTM神经网络进行实验,对股票数据集进行模拟预测,并确认训练模型用于预测股票价格后的可行性和预测准确性。通过使用神经网络分析股票的前60天数据,来预测第61天的收盘价,以此来预测股票的走势。在实验中,我获取了上证A股、深证A股和创业板共计超过3000支股票的日线数据,每一支股票都包含了其从上市直至2016年左右,期间若干天的日线数据,每一条数据都包含有开盘价,收盘价,最高价,最低价,换手率,交易量等字段。对于收集到的数据集,首先要进行数据预处理,对缺失的数据进行适当地填补。归一化特征是数据挖掘的一项基础工作,由于不同评价指标往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,为了消除指标之间的量纲影响,需要进行数据标准化处理,以解决数据指标之间的可比性。原始数据经过数据标准化处理后,各指标处于同一数量级,适合进行综合对比评价。实验中我选择使用RNN和LSTM分别进行预测,并且将结果进行对比。Luca Di Persio曾使用神经网络对道琼斯指数进行预测,他的预测方法是使用前30天日线数据预测第31天收盘价,整体正确率维持在60%左右,为了提高预测准确度,我的实验将使用股票数据的前60天日线数据来预测第61天的收盘价,并且为了使该系统更加实用,系统会进行计算,判断预测日的收盘价的涨跌,并使用预测涨跌的正确率作为系统的正确率,在训练和预测的过程中,每一次预测的输入是60天的股票日线数据,输出为第61天的收盘价,并且使用预测值減去前一天收盘价,如果结果为正,记为涨,结果为负记为跌,然后计算正确的预测结果所占百分比,即可得到预测准确率。在分析实验结果时发现,RNN的预测性能稍好于LSTM,尽管预测的准确率起伏波动较大,但是RNN平均预测准确率高于LSTM。通过计算得出,RNN对上证A股个股的平均预测准确率在62.2%左右,对深证A股个股的平均预测准确率约为64.5%,对创业板股票的平均预测准确率为59.3%。LSTM对上证A股个股的平均预测准确率在54.1%左右,对深证A股个股的平均预测准确率约为53.6%,对创业板股票的平均预测准确率为50.4%。本文将了解股票市场的基本参数,股票市场的基本趋势,分析股票预测的难点。本文尝试利用神经网络,通过分析历史股票数据来预测未来股票的收盘价,文中介绍了人工神经网络（ANN）,BP神经网络,循环神经网络（RNN）以及长短期记忆序列（LSTM）。深入了解了RNN和LSTM神经网络的实现原理,在分析比较的基础上,理解LSTM相对于RNN的优势的同时,同时使用RNN和LSTM神经网络进行实验,对股票数据集进行模拟预测,并确认训练模型用于预测股票价格后的可行性和预测准确性。通过使用神经网络分析股票的前60天数据,来预测第61天的收盘价,以此来预测股票的走势。本文的组织结构为:第一章介绍了本文的研究背景和内容、国内外研究现状以及本文的组织结构。第二章阐述了影响股价走势的主要因素、预测方法和难点,介绍了深度学习和神经网络,分析比较了不同神经网络之间的功能差异,比较了不同神经网络的优缺点,选择最合适的神经网络。第三章为实验部分。实验部分包括数据准备、数据处理、神经网络选择、模型构建和训练模型。第四章比较了RNN和LSTM预测的实验结果,分析了两种模型的预测性能和精度,并进行了比较,最后得出结论。第五章为总结与展望。

其他文献

对乙酰氨基酚、氢溴酸右美沙芬在口服液中的原辅料相容性研究

目的制备以对乙酰氨基酚（PA）和氢溴酸右美沙芬（DX）为主成分的复方对乙酰氨基酚口服液，考察PA、DX与辅料间的相容性。方法建立适合口服液中PA、DX含量测定和有关物质检查的高效液相色谱（HPLC）法，将PA和DX分别与辅料（甘油、丙二醇、山梨醇、三氯蔗糖、苯甲酸钠、依地酸二钠、黄原胶、色素、香精）按一定比例混合、加水溶解并调节pH值，制备二元相容性样品，并取制剂、PA阴性制剂、DX阴性制剂，

期刊

对乙酰氨基酚氢溴酸右美沙芬相容性高效液相色谱法有关物质光照高温pH值

市政道路工程排水管道施工管理浅析

从东台经济开发区三年城建项目整体上看，市政道路工程排水管道的建设施工是重点。在施工过程中，承建单位能充分认清排水管道施工常见问题，做到有的放矢，能积极完善准备工作、拆除原有道路、切实落实管基施工、完善管道安装工作等，有效保障该项目市政道路工程排水管道施工的质量和效率，进而为市政工程的建设效果打下坚实的基础。

期刊

市政道路工程排水管道施工技术

中国新职业发展现状及从业者工作满意度研究——基于双维度微观调查数据

新职业是适应时代发展的产物,对缓解我国就业问题、繁荣"双循环"新格局具有重要意义,但受制于数据可得性,有关的实证研究尚不多见。为此,本文首先通过梳理已有文献和相关政策界定了新职业概念并进行了新职业分类,然后借助网络爬虫和问卷调查方法,从企业层面和从业者层面对新职业进行了系统考察。研究结果显示,新职业在城市分布和类型分布上存在集聚现象,新职业主要集中在北京、上海、深圳、广州和成都等一线城市,主要类型

期刊

新时代新经济新职业新动能

基于误差反馈的双缸液压系统同步模糊PID控制系统设计

传统液压机并式同步控制需要更长时间才能达到稳态误差，不能实现液压机的高精度同步控制。为了提高液压机的工作效率，开发了一种液压机双缸同步控制液压系统，并给出活塞杆伸出和缩回两种状态下的控制方案。将同步误差补偿数据传输至液压缸2,使其更快地完成动态响应，从而显著减小液压缸2的位移差，实现同步控制精度的显著提升。通过误差反馈方式实现同步控制，从而达到对双液压缸同步运行过程的精确控制，通过遗传算法整定PI

期刊

液压机双缸液压系统同步控制模糊PID控制误差反馈

地方政府与科研院校产业扶贫合作绩效研究

学位

载体改性对Ni基催化剂分解四氢呋喃的影响

利用等体积浸渍法制备了不同金属改性载体的Ni/MxOy-Al2O3（M:Mg、La、Ce）催化剂，以四氢呋喃（THF）为模型化合物，对Ni/MxOy-Al2O3催化剂催化降解THF制氢活性进行评价。结果表明，添加助剂Ce、La、Mg后，THF转化率分别提高了12.7%、32.8%和31.0%。利用N2物理吸附、X射线衍射（XRD）和氢气程序升温还原（H2-TPR）等方法对不同载体的Ni/MxOy-

期刊

催化剂载体改性Ni基催化剂四氢呋喃废水制氢

MLCT A Multiple Level Contact Tracing Scheme for Strong Privacy

自新冠病毒（COVID-19）在全球大规模爆发以来,各个国家的社会,经济和公民健康都面临巨大挑战。正如联合国秘书长安东尼奥·古特雷斯所指出,COVID-19的危害性超过了二战以来的任何危机。到目前为止,全球感染人数仍在持续上升。这种情况出现的主要原因是COVID-19病毒具备较高的传染性,且病毒感染者在潜伏期就具有传染性。因此,应对COVID-19的传播关键是要尽快识别出和确诊患者接触过的密切接触

学位

新冠病毒匿名凭证接触追踪群签名秘密共享

2019—2020年浙江省湖州市副溶血弧菌临床分离株特征分析

目的了解2019—2020年浙江省湖州市腹泻患者副溶血弧菌分离株的特征。方法对2019—2020年分离自腹泻患者的109株副溶血弧菌进行血清学分型，采用荧光PCR方法检测其毒力基因，采用微量肉汤稀释法检测其耐药性，并利用脉冲场凝胶电泳（PFGE）对其进行分子分型。结果 109株分离株的优势血清型为O3:K6（72株）。所有分离株均携带tlh基因，仅2株菌携带trh基因。108株菌产生72种PF

期刊

副溶血弧菌血清型临床分离株毒力基因脉冲场凝胶电泳

OPC UA技术在信息接口异构机器人控制中的应用

在全力推行“中国制造2025”发展战略的背景下,如何通过信息手段优化异构机器人的控制应用,实现工业机器人与上层客户端间的互联互通已经成为智能制造领域中的主流命题。但是由于不同品牌的工业机器人的通信协议大相径庭,所用到的现场总线互不兼容,导致各大厂商的机器人硬件接口及信息模型异构,不能满足数据实时传输的需求。为解决以上问题,本文以OPC UA（OPC Unified Architecture）这一智

学位

工业机器人OPC UA嵌入式服务器信息模型互联互通

Interpret Handwritten Multi-ring Chemical Structures Using Relation Networks

过去50年来,电子技术的进步和应用产业快速发展,人们经历了从手写纸张传递文字信息到键盘鼠标输入文字信息的转变。但是最近几年,随着计算机和智能手机走入每一个普通家庭,手写输入信息越来越受欢迎。在这样的背景下,手写识别技术能发挥的作用也越来越大,在各行各业都能帮助增加工作效率、降低人力成本。但是手写识别技术应用在手写化学式的识别上还面临着很多难题,特别是多环手写化学式。原因之一在于多环化学式结构非常复

学位

关系网络手写识别目标检测结构解释多环化学结构式

Stock Price Trend Prediction Based on Neural Network

与本文相关的学术论文