基于PCA - BP神经网络综合模型预测股票价格

来源 :电脑知识与技术 | 被引量 : 0次 | 上传用户:ffxcat
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:针对股票价格和涨跌趋势预测准确度问题,构建PCA - BP( Principal Component Analysis-Back Propagation)神经网络综合模型。将主成分分析法与BP神经网络模型组合,测试得到在隐层节点为7时误差最小,能100%预测股票的涨跌。构建PCA - BP神经网络综合模型,综合模型预测股票涨跌准确度为95%,股票价格误差相对减少。最后可知,综合模型比单个PCA - BP神经网络模型更有优势,能更好地给投资者切实可行的建议。
  关键词:BP神经网络模型;主成分分析;股票价格;长短期预测
  中图分类号:TP183 文献标识码:A
  文章编号:1009-3044(2020)33-0004-04
  开放科学(资源服务)标识码(OSID):
  引言
  金融市场中的股票价格变换迅速且高度非线性,如何较短时间内准确的预测股票价格和涨跌趋势,是许多学者和投资者共同关心的内容之一。影响股票价格的影响因素众多,文章通过主成分分析降低输入变量的维度,进而缩短预测时间。利用神经网络准确的预测股票价格,与前期价格比较从而判断股票的涨跌情况。运用PCA - BP模型构造综合模型对比分析股票价格与涨跌情况,应用广泛[1]。
  1 研究现状
  许多学者运用BP神经网络对股票价格进行研究。韩莉运用LM - BP神经网络预测智联招聘股票开盘价,平均相对误差为0.88%,预测精度较高[2];闫冬运用主成分分析和遗传算法优化BP神经网络和综合模型对股票价格预测,主成分分析优化的神经网络模型在股票短期预测上具有良好的改进作用[3];郭盼盼构建GA - BP神经网络预测股票价格,预测收益率,利用模型预测模拟投资,累计收益提高50%以上,模型风险小,收益大实用性强[4];兰太强基于主成分与BP神经网络组合进行股票预测,构建了多样化的量化选股模型。实验表明基于主成分与BP神经网络结合能很好地预测股票下一年同一个季度的涨跌情况[5];刘庆霞基于主成分分析改进的BP神经网络拟合和训练股票数据能得出很好的预测结果[6];梁娜将SOM模型、主成分分析与BP神经网络模型结合,构建股票收盘价的组合模型,证明主成分与BP神经网络模型结合效率与精度均高于其他模型[7];杨小平运用主成分分析减少神经网络的输入维数,将主成分作为BP神经网络的输入变量,最后预测股票价格[8];于卓熙运用主成分分析与GRNN回归模型结合和ARIMA模型三种模型对股票价格进行预测,并得到GRNN模型更优于ARIMA模型[9];孙德山利用主成分分析法与DNN、RNN和BP模型结合,比较三种模型的优劣,结果表明PCA - RNN具有更加良好的效果[10]。
  從研究现状可知,股票预测研究多倾向于优化组合神经网络方面,通过优化模型,可以提高收敛速度,节约时间,提高效率。本文采用PCA - BP神经网络结合的方法,通过主成分可以减少输入维数,从而提高效率和减少误差。
  2 模型介绍
  2.1 主成分分析
  主成分分析( Principal Component Analysis)通过几个不相关的变量用线性组合的方式代替原来大量的变量,并尽可能多的反映原来的变量信息,这几个新的不相关变量称为主成分。确定主成分的个数包括选择特征值大于1和累积方差贡献率高于85%两种方法,本文采用第二种方法选择主成分的个数为3个。具体步骤如下:
  (1)将原始数据进行标准化变换;
  3 实证分析
  3.1模型构建
  根据股票价格的特点,噪声大且重叠信息多共线性强,这里采用主成分分析法,对输入变量分类,分成几个主成分,再将主成分作为神经网络的输入变量,从而降低变量维数,消除共线性性质,从而提升收敛速度。
  3.1.1 PCA - BP模型构建
  用SPSS对贵州茅台的股票数据进行探索性因子分析,共有4379个数据,7个输入变量。采用主成分分析法,因子选择的个数采用累计贡献率超过85%,选择3个因子作为输入数据,采用正交旋转方法最大方差法初步进行因子分析。最终结果显示如下:KMO为0.797,表示很适合进行因子分析;巴特利特球形度值为130925.84,显著性为0.000<0.05,相关矩阵不是单位矩阵,可进行因子分析。
  第一次主成分分析共选用了3个主成分,累计方差贡献是98.214%。进行因子分析后的因子载荷见表2:进行因子分析,输出成分得分系数矩阵,具体数据见表2。
  由表2的每个因子在各个变量上的系数乘对应各个变量的标准化转换数值Z变量,就可以得到该因子的得分函数。
  将保存在数据集中FAC1,FAC2,FAC3变量作为BP神经网络的输入层,当日收盘价作为输出层。将样本数据同时分成两个部分,前2585天(从2001年8月27号到2019年12月3日)作为训练数据,后20天(2019年12月4号到2019年12月31号)数据作为检验。
  本实验利用Matlab软件,通过设置不同节点数得出拟合优度,并比较平均绝对误差,各个节点绝对误差以及拟合优度如表3所示:
  误差越小,方程拟合越好。拟合优度越接近1,方程拟合越好。训练时间越短,效率越高,消耗时间越短。根据表3可以得出隐含层节点数是7、9、10时,误差以及训练时间以及拟合优度都达到非常好的拟合效果。
  3.1.2模型涨落趋势预测
  神经网络模型的隐层神经元个数为7时,预测最后20天的股票数据,与当前20天的股票数据比较大小,后20天股票数据减去对当前数据,若数据大于0,说明20天后股票价格上涨;若数据小于0,说明20天后股票价格下跌,并比较预测上涨与下跌情况与真实的上涨和下跌情况,从而检测模型的可靠性。   根据表4可知,当隐层节点为7时,预测的股票上涨与下跌情况达到100%正确,与真实的涨落情况完全一致,说明BP神经网络可以非常好的预测股票的涨落情况,为投资者提供更为精准的投资方案。
  同理可以得到节点个数为9与10时候的预测与真实的涨跌情况。见表5。
  根据表5可知,当隐层神经元个数为9时,预测的涨跌情况与真实值100%一致,说明预测完全正确;当神经个数为10时,预测的涨跌情况与真实值95%一致,预测效果也非常良好。因为在连续下跌情况下,一天的上涨,几乎不影响购买者买进还是卖出的决定,说明两种情况下都可以为投资者提供良好的决策。
  3.2 综合模型建模
  根据上述分析可知,节点7、节点9、节点10均具有非常良好的预测效果,现为了进一步优化和改进模型,构造综合模型,从而减小股票预测值的误差。综合模型构造采用方差倒数法分别计算节点是7、9、10的权数,计算公式详细见公式(1),计算得到组合模型的权数分别是0.2712、0.5765和0.1523。根据组合模型得到预测结果,股票价格更加接近真实值,并且误差变小,说明组合模型能更好地预测股票的价格,为投资者提供精准投资方案。
  根据表6可以看出,利用综合模型所预测的股票价格与PCA - BP模型在隐层神经元节点为7的比较,综合模型更接近真实值,绝对误差也最小,并且预测20天股票的涨跌情况一致率也高达95%以上。一天数据的上涨,在整体是下跌情况下,几乎不影响投资者的决策,说明综合模型能更好地预测股票价格,为投资者规避风险做出巨大贡献。下面给出真实值与单个模型与综合模型的预测值的对比图。
  通过图2可以看出,综合模型更加接近真实值,说明BP神经网络综合模型能更好地预测股票的真实价格,并能给投资者提供切实可行的投资建议与方案。
  4 总结
  文章通过主成分分析方法减少输入变量,提高了预测效率,其次通过比较BP神经网络隐层节点的各项误差数据,得出在隐层节点为7时,更能准确地预测股票价格和股票涨跌情况。并利用方差倒数方法,构造出PCA - BP神经网络综合模型,综合模型与单个模型相比较,预测误差更小,且能准确的预测股票的涨跌情况。
  参考文献:
  [1]翟静,曹俊.基于时间序列ARIMA与BP神经网络的组合预测模型[J].统计与决策,2016(4):29-32.
  [2]韩莉.基于LM-BP神经网络股票预测研究[D].哈尔滨:东北农业大学,2016.
  [3]闫冬.神经网络技术在股票价格短期预测中的应用研究[D].重庆:重庆交通大学,2013.
  [4]郭盼盼.基于GA-BP神经网络的多日股票价格预测[D].郑州:郑州大学,2019.
  [5]兰强太.基于主成分分析和BP神经网络算法的综合选股实证研究[D].广州:暨南大学,2017.
  [6]刘庆霞.基于主成分分析和BP神经网络的股价预测[D].苏州:苏州大学,2017.
  [7]梁娜.基于神經网络与主成分分析的组合预测研究[D].武汉:武汉理工大学,2007.
  [8]杨小平.基于主成分与BP神经网络的股票价格预测分析[J].统计与决策,2004(12):42-43.
  [9]于卓熙,秦璐,赵志文,等.基于主成分分析与广义回归神经网络的股票价格预测[J].统计与决策,2018(18):168-171.
  [10]孙德山,任靓.基于主成分分析和递归神经网络的短期股票指数预测[J].辽宁师范大学学报(自然科学版),2019,42(3):301-306.
  [11]蔡红,陈荣耀.基于PCA-BP神经网络的股票价格预测研究[J].计算机仿真,2011,28(3):365-368.
  【通联编辑:唐一东】
  作者简介:张如梦(1990-),女,河南周口人,研究生,助教,研究方向:应用统计分析;张华美(1986-),女,河南周口人,研究生,助教,研究方向:金融风险管理。
其他文献
目的研究零切迹椎间融合器(Zero-Profile interbody fusion device,Zero-P)行单节段颈前路减压融合术(anterior cervical decompression and fusion,ACDF)后,胸1倾斜角(T1Slope,T1
有机磷农药中毒(acute organophosphoruspesticide poisoning,AOPP)是临床常见的急危重症之一,有机磷农药毒性大,作用快,中毒后病情凶险.如抢救不及时或不当,可在短时间内致
目的分析产钳助娩术在头位难产中的应用价值。方法对笔者所在医院2007年9月至2009年2月产钳助娩术43例临床资料进行回顾性分析。结果产钳术母体并发症发生16例,发生率37.2%;产钳
<正>社会工作服务是对"人"的服务,强调人与人之间的关系建立,更强调人本身的存在。每个社会工作者都有自己不同的家庭背景及人生经历,而在做服务的过程中,社会工作者自身的心
目的探讨压宁定治疗充血性心力衰竭的临床效果。方法32例充血性心力衰竭患者均采用压宁定进行治疗。初始剂量12.5—25mg,稀释在10~20ml液体中于3min内静脉注射,然后以0.4~0.6mg/min的
5月12日下午14时28分,四川汶川发生8.0级地震,笔者所在医院所在地乐山有强烈震感。地震发生后,医院迅速启动《武警四川总队医院破坏性地震灾害应急预案》,并立即派出多支应急医疗
<正> 一、前言 随着我国国民经济的高速发展和人民文化生活水平的不断提高,对产品外包装的要求也越来越高,特别是那些用单面白纸板作为产品包装用纸的,都逐步转向使用新的升
目的探讨药物氨茶碱对气道反高应性哮喘患者的治疗作用。方法对64例哮喘患者给予氨茶碱药物规范疗程,疗程30d,比较治疗前后患者气道高反应的改善情况。结果治疗后患者Dmin、FEV
摘要:随着我国互联网技术不断发展,如今人们已经步入了大数据时代,但也增加了计算机信息的安全隐患,给用户造成巨大损失。为了能够加强计算机信息保护,必须针对性采取有效应对措施。基于此,该文首先提出大数据时代的含义,分析现有的计算机信息安全风险,进而提出相应的信息保护技术。  关键词:大数据时代;计算机信息;保护技术;安全风险  中图分类号:TP393 文献标识码:A  文章编号:1009-304
摘要:目前,计算机网络通信技术正处于高速发展时期,并且已经融入社会方方面面和人们的日常生活,推动了社会发展的同时,方便了人们的生活,但是其中存在的问题也是不容忽视的。尤其是用户数据无法得到安全保障,这对通信技术的进步和发展产生了极为不利的影响,这是迫切需要解决的问题。在这种情况下,本文分析了计算机网络通信安全中数据加密技术的应用,希望可以提供参考价值。  关键词:计算机网络;通信安全;数据加密技术