论文部分内容阅读
随着改革开放的发展,中国的股票市场逐渐被世界主要经济体认可,国内股市吸引了越来越多的境外投资者。股票价格预测系统的目的是为金融市场的经营者提供异常收益,并成为风险管理工具的基础。大数据时代的来临,计算机信息技术和金融工程联系日益密切,在股票交易机制的发展中,使用机器学习算法的计算密集型系统越来越普遍。国内外许多学者运用统计学习方法,在科学理论的支撑下建立股票价格预测模型,并且已经应用于股市的价格和涨跌趋势预测。本文在支持向量回归(SVR)的基础上,引入非线性技术的降维方法组合成集成学习模型,对中国股市指数进行预测,该课题具有一定的研究意义和应用前景。本文以上海证券交易所的股指数作为课题研究对象,把SVR模型理论应用在股票市场不同频率价格的预测。首先,基于股票价格预测问题选取每日数据和每分钟数据进行模型参数选择,构建了非线性的支持向量回归预测模型,并对转换后的收盘价格进行预测。在训练模型之前,根据国内外研究文献,选取合适的TA技术指标作为模型输入变量。考虑到不同的数据特征变量组合在模型预测时会表现出不同的预测结果,为了进一步防止特征变量陷入“高维诅咒”的陷阱,引入非线性技术的核主成分分析。然后,对预处理后的数据集在网格搜索法的基础下使用交叉验证方法进行组合参数优化,本文研究的参数优化组合包括核主成分分析中的PC个数、高斯核参数与非线性SVR模型中的惩罚系数、损失函数的阀值、非线性核参数。最后,通过组合式参数选择理论选出最优的参数组合,并利用最优参数对不同频率的股票数据集进行建模,期望在股票价格预测过程中能够对股票的下个交易时段做出高精度、低误差的股价预测,从而为投资者提供更多的买卖时机进而获利。股票价格预测问题涉及到复杂的时间序列和非线性问题,建模过程中容易受到各种不可预测的因素影响预测因子。本文以不同频率的股票价格为研究对象,从不断变化的股票市场中寻找合适的技术指标,并运用非线性的特征降维技术和SVR机器学习算法重点对高频数据进行建模分析,采用合适的模型调参方法来提高股票价格预测的准确性,证明了本文所提出的研究方法的可行性,并为投资者的投资策略提供一定的借鉴意义。