论文部分内容阅读
我国股票市场作为实体企业筹集资金和各种类型的投资者配置自身资产的重要渠道,是我国金融市场不可缺少的重要组成部分。股票作为兼具高收益性和高风险性的金融资产,在金融市场的发展中有着举足轻重的地位,一直以来也受到金融市场各界人士的重视。然而股票数据是具有高复杂性,高数据量,高变化频率的金融时间序列,同时它具有高噪声、非线性、非平稳的特点,有悖于一些经典理论的基本假设,制约了经典理论的适用范围。因此,找到合理的股票市场数据的提取方法,构建一个能够描述股票市场复杂度非线性特点的模型,对于进一步揭示股票市场的内在运行规律,更好的发挥股票市场应有的功能,更加及时揭露金融风险等方面,都具有现实以及理论价值。时至今日,模型分析的方法已被广泛应用到金融行业的分析领域,其中比较经典的是ARMA、ARCH、GARCH等模型。这些方法都是以统计学基本原理为基础与依据,在时间序列满足平稳性假设或正态分布假设的前提下进行建模分析。这些分析方法仅从时间域这一方面做研究,其计算效率低,预测精度不足且研究层面单一。因此,经典预测模型已经很难适应现下对金融时间序列研究的需求。随着机器学习体系的建立以及其在实证分析研究中广泛应用,机器学习算法逐步进入人们的视野,为金融时间序列预测研究注入新的力量。这些算法中,极端梯度提升树(XGBoost)作为GBDT的改进算法,具有计算复杂度低、运行速度快、准确度高等特点。将XGBoost模型运用到股票预测领域,在提高预测精度同时也能提高预测速率,是非常有效的及其学习算法。另外,在工程领域有诸如集合经验模态分解(EEMD)的许多物理信号处理方法,应用于金融领域也十分有效。基于上述背景,本文详细介绍了EEMD分解方法与XGBoost算法的基本原理,通过将两者进行结合,构建EEMD-XGBoost组合模型,并对2018年1月5日至2019年12月29日深证综合指数的日收盘价序列进行预测与分析,从而得到更加优化的股票价格预测模型。