论文部分内容阅读
股票在国民经济中扮演着重要角色。对国民经济而言,如何保持股市稳定、避免发生股灾是我国相关人员需要考虑的问题。对投资者而言,如何规避风险,使获利最大化是投资者日夜思考的问题。因此,对股票价格进行预测从而做出最优决定就显得十分必要。我国的股票市场是一个非常复杂的非线性系统,许多研究人员采用神经网络的非线性方法进行股票价格预测并取得了不错的效果。但是使用传统神经网络进行股价预测时存在训练过程复杂等问题。此外,股票价格受多种因素影响,使得股价表现出不同走势,导致单一模型很难满足预测要求。同时,大多股价预测模型缺乏地区行业通用性,即每次对一只股票进行预测必须为该股票建立单独的模型,且该单独模型只包含该只股票的信息,并没有包含与该只股票处于同一地区同一行业的其余股票信息,这使得单独模型不能涵盖影响该只股票价格的所有因素,导致预测精度不高,预测过程繁琐复杂。针对我国目前大多股价预测模型缺乏地区行业通用性及神经网络训练过程复杂的问题,本文使用ESN建立基于上海地区房地产行业的短期股价预测通用模型,简化了训练过程,模型训练好后可预测上海地区房地产行业内任意股票,且与用某只股票建立的单独模型相比,该通用模型的预测精度明显提高。针对短期股票价格预测方法中使用单一非线性模型预测效果不理想,本文在通用模型基础上提出基于KMeans-ESN的短期股价预测上海地区房地产行业通用模型。通过选取不同的聚类指标,本文详细提出了基于数据波动性聚类的KMeans-ESN短期股价预测上海地区房地产行业通用模型和基于数据波动性及变化趋势聚类的KMeans-ESN短期股价预测上海地区房地产行业通用模型,并将三类模型进行了对比。通过聚类和对比实验得出ESN、基于数据波动性聚类的KMeans-ESN、基于数据波动性及变化趋势聚类的KMeans-ESN这三种模型分别适合的数据类型。同时,由于回声状态网络很多初始参数需要预先设定,而这些参数设置需有一定经验的研究人员或通过试凑确定,针对这两种方法需要人工干预、耗时、效率低等存在的不足,本文使用GSA对ESN模型进行优化,使用GSA从单值收缩因子和谱半径优化、多值收缩因子和谱半径优化两个角度对ESN参数进行寻优,并探讨每个角度下GSA适应值函数的选取。结果表明,GSA对单值收缩因子和谱半径优化的优化效果比GSA对按维多值收缩因子和谱半径优化的优化效果好;使用10折交叉验证训练误差均值与测试误差均值的均值作为GSA的适应值函数最佳。