论文部分内容阅读
在金融市场中,由于波动率对经济金融决策、组合配置、金融产品定价和风险管理都是至关重要的,所以波动率一直是金融领域研究的热门主题。根据金融波动率理论,实际中的波动率随时间而改变,即它是随机的。于是,构建一种既能够刻画波动率特征又可以准确预测波动率的模型就显得十分重要。由于波动率是无法被直接观测的量,这一问题深深地影响着对波动率的度量。为了解决这一问题,早期基于低频收益率数据的GARCH类模型、SV类模型在估计和预测波动率以及刻画波动特征方面取得巨大成功。近十几年来,金融市场的发展十分迅速,基于低频数据的研究已经不能适应金融市场发展的需求,所以人们诉诸于高频数据甚至于超高频数据的研究。对于高频数据的研究,传统的适用于低频数据的分析方法可能并不能取得很好的效果。这促使研究者们开始研究适用于高频数据下的波动率模型。此时,以已实现波动率(realized volatility,RV)为代表的一类已实现测度(realized measure,RM)因具有无模型、计算简单等特点而受到研究者们的欢迎。重要的是这些已实现测度可以当作波动率的直接观测。基于这些已实现测度,建立起 HAR-RV类模型用来刻画波动率的演变规律和预测未来的波动率。然而,这些方法虽然利用的是日内高频数据,但最终得到的却是日间的波动率。显然,这样的日间波动率肯定是无法刻画波动率的日内波动模式。 函数型数据分析方法把每天的日内高频交易数据当作时间的随机函数,这与波动率时变而随机的特性不谋而合。鉴于此,本文以2015年沪深300指数日内5分钟高频交易数据为例来探索中国股票市场波动率在日内层面上的三个问题。首先,利用已有文献中的函数型波动率过程从日内价格数据中提取出波动率的日内估计数据,并借助函数型主成分分析对波动率和成交量的日内典型变化模式进行特征提取。其次,利用函数型典型相关分析和函数型线性回归分析对日内波动率和日内成交量的价量关系进行研究。最后,基于函数型时间序列分析方法研究了日内波动率的预测及实时动态更新问题。通过上述对2015年沪深300指数日内5分钟高频数据的一系列的函数型数据分析,在日内层面上给出本文的结论。 第一,利用函数型主成分分析( FPCA)发现波动率在日内整体表现出典型的“日历效应”,即在开闭市时波动率高的特征。可以用四个主成分来分别刻画波动率的日内变化模式。具体四个主成分分别对应波动率在上午达到波峰、下午收市前和上午开市后波动率递减以及波动率在下午开盘后一小时达到波谷等4种模式。 第二,利用函数型主成分分析( FPCA)发现对数成交量日内整体呈现出“U”形特征。用三个主成分来刻画成交量的日内变化模式。具体地,第一主成分曲线突出的是上午开盘后成交量的变化,即开盘时的成交量比较高,然后逐渐减少直到午间收盘;第二条主成分曲线显现的则是下午收盘前成交量的变化,即从下午开盘后成交量逐渐增加,直到下午收盘前成交量增长到比较高的水平;而第三条主成分曲线描述的大约是中午休市前后各一小时内成交量的变化特征,呈现出先减后增的趋势。三组主成分得分的两两散点图进一步证实了上述三个主成分刻画的对数成交量的日内典型变化模式。 第三,利用函数型典型相关分析( FCCA)对2015年沪深300指数日内波动率和日内对数成交量之间的相关关系进行分析。实证结果说明二者之间存在一定程度的线性相关关系。然后利用函数型线性回归模型(并行模型)对日内波动率和对数成交量数据进行建模,发现沪深300指数的日内波动率与成交量之间存在正向相关关系。 第四,通过函数型时间序列分析(FTSA)研究沪深300指数波动率的短期预测问题。函数型时间序列分析利用波动率函数在时间上相依性来提高波动率短期预测的精度。在日内波动率的点预测和区间预测方面,实证分析结果显示:基于函数主成分回归的ARIMA模型比 VAR模型的预测精度要稍高一些。另外,还考虑了利用已观测到的上午半天的价格数据预测下午半天的波动率的动态更新问题。实证分析结果显示:函数型线性回归( FLR)得到的更新后的点预测及区间预测比区块移动方法(BM)的误差小。