基于灰色模型与ARIMA模型的股票价格预测

来源 :计算机时代 | 被引量 : 0次 | 上传用户:yztny
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要: 以三只股票的历史数据作原始序列,建立了GM(1,1)模型与ARIMA自适应过滤组合模型。分析两种模型的应用场景,并以ARIMA模型为基础建立股价反转判断模型。实验证明,所建立的模型在短期内的拟合、预测与反转判断效果较为理想。
  关键词: 股票市场; GM(1,1); ARIMA; 时间序列
  中图分类号:TP391.7          文献标识码:A     文章编号:1006-8228(2021)10-83-03
  Forecasting stock price with Grey model and ARIMA model
  Qi Tianhua
  (College of Computer, Shenyang Aerospace University, Shenyang, Liaoning 110136, China)
  Abstract: Using the historical data of 3 stocks as the original sequence, the GM (1,1) model and the ARIMA adaptive filtering combination model are established. The application scenarios of the two models are analyzed, a stock price reversal judgment model based on the ARIMA model is established as well. The experiment results show that the established models have ideal fit, prediction and reversal judgment effects in a short term.
  Key words: stock market; GM (1,1); ARIMA; time-series
  0 引言
  許多投资者一直在试图找到一种能够确定合适股票交易时机的方法,股票作为经济数据的一部分,通常以时间序列的形式给出。目前对时间序列的预测有灰色理论、移动平均、霍尔特线性趋势预测、移动平均及自回归等方法。由于现代社会数据量庞大,传统方法处理速度较慢,而合理地运用计算机技术可以有效解决此问题。芦晓勇等人运用灰色模型解决了传统永磁电机绕组开路故障诊断误报率高、效率低等缺点[1]。张颖超与孙英隽选取上证指数收盘价作为原始数据,建立ARIMA(4,1,4)模型进行预测与分析,其拟合效果与预测准确度较为理想[2]。因此,本文认为可以利用灰色模型与ARIMA模型对股票价格进行预测。
  1 数据来源与预测模型
  1.1 数据来源
  本文选取3只股票:贵州茅台(600519SH)、许继电气(000400SZ)、光迅科技(002281SZ),采用2016年1月4日至2020年10月30日的数据,涵盖每日开盘价、最高价、最低价、收盘价、成交量和周转率共六项信息,共获得3522个样本数据(数据来源:新浪财经)。考虑到节假日期间休市的现实情况,为避免对算法运行造成不利影响,需要进行预处理。因此类缺失值所占比例极小,故采用线性插值替换缺失值对数据进行预处理即可[3]。
  1.2 GM(1,1)模型
  股票市场作为多因素综合作用的产物,其价格具有不确定性,即灰色性,故认为股票市场可被视为灰色系统,灰色模型(Grey Model)具有计算工作量小、所需样本量少且无需规律性分布、灰色预测准确度高等优势。根据邓聚龙灰色系统理论[4],对以上3只股票价格进行实证,可采用典型的GM(1,1)模型来预测。预测模型公式为:
  [x0t+1=x1t+1+x1t],[t=1,2,…,n]  ⑴
  本文采用后验差检验法对模型进行测试以判断其合理性,计算公式为:
  [C=S2S1]  ⑵
  其中:
  [S21=1nk=1nx0k-x2],[S22=1nk=1nε0k-ε2]  ⑶
  后验差精度等级如表1所列。
  1.3 ARIMA模型
  ARIMA(p,d,q)全称差分整合移动平均自回归模型(Autoregressive Integrated Moving Average model),结合自回归模型、移动平均模型与差分法[5],表达式如下:
  [xt=μ+i=1pγiXt-i+εt+i=1qθiεt-i]  ⑷
  自适应过滤法具有简单易用、可随时间序列变化更新权数的特点。本文将自适应过滤法应用于ARIMA模型,即将ARIMA模型参数估计中的一组参数作为初始权数,利用自适应过滤法对其不断修正,即不断利用历史数据进行预测与验证,基于误差值进行参数调整。
  2 建模及预测
  2.1 GM(1,1)模型的建立
  本文对股票收盘价的变动进行预测。以月份作为横轴,以股票收盘价作为纵轴,使用MATLAB建立GM(1,1)模型对三只股票分别进行数据拟合,如图1。
  结果证明,针对短期数据使用灰色模型拟合的效果较好,使用较长的数据序列预测股票价格将导致拟合度大大降低。数据序列过长,意味着灰色系统受到不稳定因素的干扰持续性更强,因此,更容易降低模型的准确性与稳定性,进而降低预测结果的可信度。
  在对三只股票进行拟合后,预测其后二期的股票价格,结果如表2所列。   2.2 ARIMA模型的建立
  2.2.1 单位根检验
  本文通过ADF检验探明数据的平稳性[5]。首先令p=0,q=0,d=0,此时数据平稳度较差,而一阶差分后差异序列相对平稳,如图2所示,可确定d=1。
  2.2.2 确定模型阶数
  如图3所示,差异序列的自相关函数与偏自相关函数均处于拖尾状态[6]。因此,可验证建立ARIMA
  (p,1,q)模型的可行性。
  通过多次实验,本文确定将p=0,d=1,q=0作为ARIMA模型的参数。
  2.2.3 残差序列检验
  如图4所示,此时建立的ARIMA(0,1,1)模型通过检验,可较好拟合数据。
  2.2.4 数据拟合与预测
  全部数据的拟合过程如图5所示,可见该模型的拟合效果较为理想。
  根据收集到的原始数据,本文通过ARIMA(0,1,1)模型预测许继电气(000400SZ)后六期的股票价格,预测数据如表3所示,其中UCL为预测值的上限,LCL为预测值的下限。可知实际数据均介于预测上限与预测下限之间,并更接近UCL值,预测结果较为理想。
  3 基于ARIMA的股价反转判断模型
  对于股价反转的风险程度,本文在ARIMA模型的基础上使用最大变化率ROC进行计算分析,其计算公式如下:
  [ROC=max (Di-Dj)Di]  ⑸
  其中[Di]为第i期的股价(i>j),[Dj]同理,[max (Di-Dj)]为二者差值的最大值。
  实际上,该模型需要不断计算ROC值并与近期值进行比对进而分析得出股价在未来几期发生反转的可能性。跌幅越大表示股票的風险越高,因此,ROC越小的股票此时有着更大的风险,而通过与前继节点值比对,可得出未来发生反转的可能性数值。
  本文利用许继电气第1000期左右的数据对反转判断模型进行了检验,此时计算所得此时ROC值为0.0728,风险值为中等,但通过比对不排除反转的可能性。实际数据为:15.97840219、14.8833092和15.34125718,结果表明预测与实际情况一致。
  4 结束语
  本文使用线性插值法对缺失数据进行处理,建立了灰色模型与ARIMA(0,1,1)-自适应过滤组合预测模型。通过对比实际值发现,使用GM(1,1)由短期时间序列进行极少量预测精度较好,但该模型仅从时间序列自身寻找数据变化的规律,而股票价格从长期而言呈现出无规律性与任意性,因此,使用灰色模型进行长期预测需结合其他方法。ARIMA模型的预测值与实际值在未来的六个交易日内误差较小,之后误差将会大幅增加,最后本文以该模型为基础,建立了股价反转判断模型,通过精准计算先期与后期股价的关系,获得了较为理想的预测效果,能够更好地防范股市风险,为投资者提供有益参考。
  参考文献(References):
  [1] 芦晓勇,蒋雪峰,李运之等.基于灰色预测模型的永磁同步电机驱动系统绕组开路故障智能诊断策略研究[J].科技通报,2021.37(3):34-39
  [2] 张颖超,孙英隽.基于ARIMA模型的上证指数分析与预测的实证研究[J].经济研究导刊,2019.11:131-135
  [3] 于亚龙,穆远彪.插值算法的研究[J].现代计算机,2014.5:32-35
  [4] 邓聚龙.灰色系统理论教程[M].华中理工大学出版社,1990.
  [5] 王燕.应用时间序列分析[M].中国人民大学出版社,2005.
  [6] 张驰.自相关过程残差控制图及模式分类方法研究[D].天津大学,2010.
其他文献
摘要: 在针对长非编码RNA(lncRNA)进行CRISPR/Cas9基因编辑时,从头设计有效singleguide RNA(sgRNA)并非易事,因此收集了已经发表文章中经实验验证过的sgRNA信息,并基于MTV模式的Django框架,开发出CRISPRlnc网站数据库。该数据库的开发将为科研工作者针对lncRNA进行CRISPR/Cas9基因编辑提供有效的辅助,并促进lncRNA的功能研究和C
摘要: 规划识别是一种属于心理学和人工智能的交叉学科,能从观察到的某一智能体的动作出发,推导出该智能体规划的过程。将该方法运用到股市中去,通过分析数据并且结合投资者的心理,使投资者做出合理的融资行为。文章提出了由三层模型组成的基于规划识别的融资行为分析算法,在第一层中引入马尔科夫链去预测智能体的行为概率,在第二层中构建规划识别图,进一步预测行为概率,在第三层对智能体的行为进行规划。该算法通过实例进
摘要: 针对高校大数据课程教学面临的困难,分析当前教学方式存在的问题,提出以课赛融合的方式推进课程教学改革。通过建立学科竞赛习题库、竞赛知识图谱,优化教学内容,以及教师参与竞赛指导、竞赛参与课程考核等方式,有效地激发学生的学习兴趣,提高其实践动手能力,明显地改善了教学效果。  关键词: 大数据; 课赛融合; 学科竞赛; 教学改革  中图分类号:G642 文献标识码:A 文章编号:1006-8
摘要: 藏文多极情感分类方法是自然语言处理研究中识别用户对某件事或话题的主观情感倾向性识别的研究课题之一。文章分析了藏文多极情感分类方法的特点,对采集的藏文情感语料进行整理校对;提取相关特征,建立情感语料库和情感分类识别模型;再通过大量的实验找出存在的不足,并进行完善,以此提高藏文多极情感数据的准确率。实验表明,优化后的藏文多极情感分类的识别准确率达到84.5%。  关键词: 情感分类; LSTM
摘要: 为保证网络服务质量,对Web系统进行性能测试,成为企业在软件测试工作中重要的环节。从Web体系的架构及特点出发,对Web系统性能测试的要求、场景、指标、流程、策略以及测试用例设计等内容进行分析,研究性能测试的方法,采用测试工具JMeter进行了Web系统的性能测试。结果表明,对Web系统进行性能测试有助于找出系统中存在的问题,为系统进一步优化提供依据。  关键词: 性能测试; Web系统;
大数据量高清视频流在拍摄、传输等过程中可能受到干扰而产生椒盐噪声。由于其具有数据传输速度快的特点,为了确保它的实时性,进一步提高滤波算法的时间效率和计算效率,对现有的自适应中值滤波进行了改进,提出了一种高速自适应中值滤波算法。滤波过程主要分为噪声点检测和噪声去除两个阶段。其中,在噪声点检测阶段,根据椒盐噪声的极值特性,将图像的像素点分为噪声点和信号点;在噪声去除阶段,信号点保持原值,噪声点根据自适
摘要: 在“互联网+”背景之下,以“学科竞赛”为手段,打造电气专业的实践课程“金课”。文章以“电动车智能充电桩”为例,从选题背景、方案设计、方案实施、竞赛过程遇到的困难、赛后感悟等方面介绍了该项目参与“全国大学生节能减排社会实践与科技竞赛”的参赛过程。  关键词: 金课; 学科竞赛; 节能减排大赛; 充电桩  中图分类号:G642 文献标识码:A 文章编号:1006-8228(2021
摘要: 英语多模态平台以网络技术为支撑给英语教学的教与自学提供了全新的空间。文章就如何建设英语网络多模态机辅平台模式提出见解,并解析英语多模态机辅平台中的创新功能及其实现,将由此得来的优质英语资源科学地运用到英语教学,使教师在网络教学体验中提高信息化教学科研的能力。  关键词: 网络技术; 多模态; 机辅平台; 自学  中图分类号:TP311.13 文献标识码:A 文章编号:1006-8
摘要: 以WOS收录的2011-2021年780篇国外自适应学习技术文献为研究对象,利用CiteSpace绘制时空和内容知识图谱,揭示近10年来国外在此领域的研究主题及发展趋势。结果表明,研究主题主要分为以下四类,自适应性学习技术的研究与开发;自适应性学习技术支持的个性化学习研究;智能学习环境的构建研究;自适应性学习技术发展背景下教师适应性学习研究。其中前三个主题的研究已趋于成熟,而自适应学习技术
摘要: 设计了线上线下相融合的“兴趣引领、自学指导;合作探究、展示成果;总结反思、进阶拓展”三阶段教学模式,通过线上和线下两个不同平台,结合“金课”标准和“思政教育”理念,将“C程序设计”课程内容重新设计整合,形成由浅入深的知识框架和思维训练过程。教学实践表明,该教学模式有利于学生高阶思维的培养,有助于学生养成独立思考、协作交流和反思的学习习惯。  关键词: 线上线下融合; 思政教育; C程序设计