论文部分内容阅读
股票价格走势关系着广大股民的根本利益,深刻地影响了一国的宏观经济政策。股指价格变动反映了权利类市场的走势情况,是重要的金融行情指标,一直备受学术界关注。经典的金融计量模型大多建立在线性范式的基础之上,对金融时间序列的非线性规律刻画不足,在股票价格预测上存在较大局限。随机微分方法假设变量服从马尔科夫过程,造成市场信息选择性遗漏,很难在指数价格预测上“有所建树”。寻找克服上述缺点的价格预测模型,探究深刻影响中国股票指数运行规律的变量特征,有很强的现实和理论意义。本文采取理论分析和实证检验相结合的方法,以沪深300指数为研究对象,选取了2006年1月到2019年3月的数据对股票指数价格进行预测,在已有研究的基础上,提出了一种基于监督学习的信息提取方法。混合信息提取器通过学习Heston和ARIMA的输出特征,将原始的输入变量转化为对Heston和ARIMA敏感的二级变量,巧妙地建立起了机器学习方法同Heston和ARIMA方法的桥梁。然后,本文基于沪深300价格指数,比较H-LSTM、计量经济学方法、随机微分方法对指数价格预测的结果,以探究最符合中国股票指数运动情况的时序模型。最后,本文进一步研究了沪深300指数交易行情、技术面情况、成分股经营状况和宏观经济走势等因素对指数价格的影响,探讨了混合信息提取器特征提取方法同主成分分析、稀疏自编码、t-SNE方法在预测沪深300指数价格上的差异。通过实证研究显示:(1)沪深300指数存在难以被线性模型解释的变动规律,H-LSTM模型对中国指数运动特征的刻画较好,价格预测效果要优于计量经济模型和随机微分模型。(2)加入混频信息处理信息,采用分批预测、逐点后推、控制涨跌幅度策略可以防止长短期记忆神经网络的预测结果和真实结果间出现偏移,进而显著提升LSTM对价格预测的精准度。(3)在对沪深300指数价格进行预测时,增加网络输入变量数量、减少预测的时间宽口可以增加LSTM模型对指数价格的预测结果沪深300指数真实走势间的拟合度。(4)混合信息提取器可以有效的对沪深300指数价格的运行特征进行提取。在输入变量为交易行情、技术面情况、成分股经营状况和宏观经济走势时,混合信息提取器的特征提取效果要优于主成分分析法、稀疏自编码方法和t-SNE等方法。