论文部分内容阅读
股票的价格呈现趋势化运动,趋势对于股价预测来说至关重要。股价预测主要有两大类方法——基本面分析和技术分析,本文从技术分析的角度研究股价运动趋势,将股价预测转化为时间序列分析问题。时间序列分析的工具又分为传统计量模型和计算智能模型,传统的计量模型虽然解释性好但往往预测效果不理想,而计算智能模型,尤其是人工神经网络模型可以进行自适应学习,具有强大的非线性映射能力,故本文选用人工神经网络进行建模。预处理和网络模型定义是建立神经网络预测模型的重要方面,现有的预处理方法多为信号分析、时序分割、主成分提取等自动化的手段,缺少明确的金融意义;在网络模型方面,循环神经网络强大的时序学习能力以及深度学习的发展为金融预测带来了新的机遇,故本文关注的重点是提取更具金融意义的特征并利用循环神经网络进行建模。本文所做的工作主要有两点:一是对趋势因子进行了两阶段的预处理,首先从价格、收益率、动能、量价、波动率五个方面提取了趋势因子,价格特征反映了不同时间尺度上的价格水平,收益率特征反映了价格的速度,动能特征体现了价格的加速度,量价特征蕴含了成交量带来的额外信息,波动率特征则包含了区间数据带来的信息,第二阶段根据每个因子与趋势之间的内在联系进行了离散化处理,进一步反映趋势的动态特征;二是建立了不同的循环神经网络预测模型,通过实验对比了三种特征表达方式、不同网络类型以及深层结构在预测中的表现。实验结果表明,趋势因子预处理显著提高了模型的预测表现;三种循环神经网络中,门限神经单元的表现最好;在隐层神经元总数保持不变的情况下,深层结构比浅层结构表现好。在所有超参数设置中,以离散化后的趋势因子作为输入、采用三隐层结构的门限神经网络模型表现最佳,相比于随机的三分类预测正确率提升了35个百分点左右。根据实验结果,本文得到以下重要结论:价格、收益率、动能、量价和波动率中蕴含着股价趋势信息,可以有效提高预测模型的表现;在三种循环神经网络中,门限神经网络更适用于处理股指日数据这种低频的小样本金融时间序列;深度学习不是万能的,从金融意义的角度进行特征表示往往能事半功倍,比单纯依靠深层结构的特征学习更能提升模型的预测效果。本文的创新点主要有三个:一是从技术分析及趋势预测的内在逻辑出发对趋势因子进行了两阶段的提取;二是对输出变量做了细致的预处理,包括利用五日收益率设定类标签并在传统的涨跌分类基础上添加了“震荡”类,有助于下一步交易策略的制定;三是分析了三种不同类型的循环神经网络在股指趋势短期预测中的表现,并初步探索了深度学习的适用性。