论文部分内容阅读
统计诊断在数据分析中占据重要地位,它的主要用途就是利用诊断统计量检测既定模型拟合观测数据的合理性。时间序列数据从广义的层面看就是一列按照时间顺序观察到的数据,从概率的角度来看就是离散型随机过程。随着对时间序列数据研究的不断扩展和深入,在参数估计和应用预测等方面,时间序列分析己经形成了相对比较成熟的理论,在有相依性误差项的模型统计诊断中时间序列分析也有了一定程度的研究。但是,因为时间序列模型中的数据点之间可能有一定的相关结构存在,所以诊断时间序列模型的异常点和强影响点相对比较复杂。股票价格指数是一个典型的时间序列数据,股票价格指数是衡量一个国家或地区经济发展状况的晴雨表。本文中我们将使用逐步局部影响分析法(Shi and Huang,2011)来检测GARCH模型下的异常点,以我国股市代表性指数为研究对象,即上证综合指数、深证综合指数和创业板指数。研究股市波动主要是研究其风险,收益率比价格往往更能体现风险,所以我们对收盘价取对数后作一阶差分处理后再研究。首先我们比较了在局部影响分析方法下创新扰动模式、可加扰动模式和数据扰动模式的检测效果。我们发现尽管创新扰动模式可能会遇到掩盖效应的影响,但是该方法能给出比另两个扰动模式更好的结果。然后我们在创新扰动模式下用逐步局部影响分析法来检测异常点和发现掩盖效应。我们第一步先扰动全部观测点,识别出一些强影响点,第二步把由第一步识别出来的强影响点剔除影响集,再扰动余下的数据集进行局部影响分析。经过这两步,第一步中被掩盖的没被识别出的强影响点有些就会在第二步中被识别。反复进行这个过程一直到没有新的强影响点再被发现,则检测过程结束。研究表明逐步局部影响分析法能够成功的检测出在创新扰动模式下所有的异常点。整个分析基于我国证券市场三个代表性指数数据,以对数收益率为研究对象,结果证明在GARCH模型中逐步局部影响分析能在创新扰动模式下检测出多种异常点和掩盖效应。另外,本文在六组实验中选取样本点均值加减两倍标准差作为初始判断异常点的标准,用该方法粗略判断出的异常点都被逐步局部影响分析证明确实是影响点,说明用样本点均值加减两倍标准差识别出的异常点可以作为初判判断各种识别方法的依据。然后我们比较上证综合指数、深证综合指数和创业板指数,我们发现上证综合指数异常点较少,而且异常点与其他点区分较为明显,表明上证综合指数受外部冲击的反应更小,更加稳定。