论文部分内容阅读
股票价格指数是由证券交易所或者相关金融机构编制的用以反映股票市场上各种股票价格变动和走势的指标。其不仅仅反映股票总体走势情况,还与指数基金、股指期货等投资产品紧密联系,因此能否有效地对股票价格指数进行建模预测从而实现相关产品的投资收益是近些年来学者们以及投资者们关注的热点。由于股票价格指数序列往往存在着高波动频率、高噪声、非线性以及不平稳的特征,一些经典经济金融理论会因为无法在此基础上作出合理的假设而使得在利用传统的建模方法对其内在特征进行提取时难度陡增。近年来,随着工程领域数据挖掘方法的推广以及深度学习研究成果爆发式地增长,越来越多学者开始尝试将它们的组合模型应用于股票市场的预测研究,并取得了可观的效果,这些建模方法在股票市场的应用具有非常重要的参考意义。在此背景下,若能够能够通过高效地挖掘出股票价格指数序列的不同层次的波动特征来揭示非线性、高复杂度股票市场内在运行规律,不仅会使得股票价格指数的建模预测效率得到极大提升,而且还能在一定程度上通过提供股市波动风险的数据依据进而促使投资者理性投资。本文选取标普500指数、日经225指数、以及沪深300指数在2011年6月1日到2021年6月1日这段时间内的日收盘价作为样本数据,并在模型组合思想以及“分解-重构-预测-集成”理念的启发下,尝试构建了一种结合自适应噪声的完备集合经验模态分解(Complete Ensemble Empirical Mode Decomposition with Adaptive Noise,CEEMDAN)与时间卷积网络(Temporal Convolutional Network,TCN)的改进组合模型来进行建模预测。该组合模型的改进点在于利用均值检验与基于动态时间规整(Dynamic Time Wraping,DTW)距离的层次聚类来对CEEMD AN方法分解出的本征模态分量进行重构优化。文章的具体工作如下:(1)CEEMDAN分解。首先利用CEEMDAN将各个股指的日收盘价分解成不同尺度的本征模态分量与趋势项,并对本征模态分量与股指日收盘价序列的关系进行分析。然后先通过均值检验将高频IMF与低频IMF分离出来,再利用基于DTW距离的层次聚类法将高频IMF中的中频IMF分离出来,并对三种频率段的IMF分别进行重构。最后对重构序列的波动规律进行分析并揭示了股票价格指数日收盘价在不同时间尺度上的运行特点。(2)搭建TCN模型并进行预测。首先阐述了改进的CEEMDAN-TCN模型的建模预测总流程与实验的目标。其次紧紧围绕实验目标利用TCN对标普500、日经225以及沪深300的重构序列、趋势项进行预测。最后将每个股指日收盘价的重构序列以及趋势项预测结果加总为每个股指日收盘价的预测结果并对模型效果进行评估。研究结果表明:本文所构建的结合均值检验以及基于DTW距离的层次聚类进行重构优化的CEEMDAN-TCN模型在对各个股指日收盘价的预测效果均优于本文设置的对照模型,这种改进的CEEMDAN-TCN模型相对于对照模型对股指日收盘价的预测效果的提升尤其在尺度越大的股指中越明显。同时,本文研究也发现单一 TCN模型与单一 LSTM模型在股指建模预测中的效果相当,但加入CEEMDAN方法以及本文所提出的重构优化方法后,TCN模型不仅预测效果更好,而且TCN模型的预测提升效果要强于LSTM。本文的创新之处在于利用一个改进的CEEMDAN-TCN模型对不同层次股票市场的代表性股票价格指数进行了建模预测,该改进点是利用均值检验与基于动态时间规整(Dynamic Time Wraping,DTW)距离的层次聚类来对CEEMDAN方法分解出的本征模态分量进行重构优化进而提高CEEMDAN-TCN对股票价格指数的建模预测效率。