论文部分内容阅读
随着中国经济和金融环境不断地开放,经济金融方面的海量高维数据的不断积累,大数据时代已经到来。不仅大数据有其本身的价值,而且针对大数据进行建模分析的应用价值也越来越明显。一般来说,面对着同一数据,研究人员可能会有许多可供选择的模型,如何从较多模型中选择出具有应用价值的模型成为了理论界和实证界一直以来所共同关注的焦点。在1980年以前,统计学家对于模型选择的研究方向较多地集中在信息准则方面,比如AIC、BIC和Cp准则,它们的原理简单但计算的维度较高,当变量较多的时候,如果要在所有的可能模型中选择出满足特定准则最小的模型,这类方法面临着实际的操作难度。因此,一个能够大幅度地减少搜寻次数并且具有一定理论优势的研究方法开始被提出,其中Tibshirani(1996)所提出的Least Absolute Shrinkage and Selection Operation(简称LASSO)方法,不仅可以避免最小二乘法在高维条件下的不稳定性,而且还能将不显着的参数自动估计为零,达到模型选择的目的,因此逐渐地成为了众多研究者选择模型的主要方法之一,其中,Efron(2004)提出的最小小角回归(Iars)算法是目前比较流行的解决LASSO的快速而有效的方法之一。由于LASSO方法在一定条件下等价于贝叶斯方法,因此,从贝叶斯的角度考虑模型选择的研究也成为一种新的方向。而且,随着贝叶斯方法在实践中的应用效果被许多研究者关注,由于LASSO方法可以用一种Laplace先验分布的贝叶斯估计进行表示,因此,贝叶斯LASSO方法(Park,2008)逐渐地被正式地提出和被应用。这种方法的主要特点在于,不仅它具有模型选择的作用,而且还能发挥贝叶斯统计的优点,运用MCMC方法进行参数的逼近估计在经济金融研究领域,研究者们普遍面对的数据是时间序列,针对时间序列的建模方法有许多,其中平稳时间序列中三种基本方法即:AR模型、ARMA模型和ARCH模型。目前,从本论文所研读的最新文献来看,时间序列模型中采用LASSO方法的研究已有少许,但尝试性地探讨贝叶斯LASSO方法在平稳时间序列模型中应用效果的研究几乎没有。基于这样的理论和现实背景,本文尝试将贝叶斯LASSO方法应用于平稳时间序列模型中。本文主要从理论和实证两个方面研究了贝叶斯LASSO在平稳时间序列模型中的应用效果。理论方面,首先,本文从平稳时间序列基本方法、LASSO的发展和应用现状、贝叶斯LASSO的发展和应用现状等三个方面综述了已有的研究成果,并讨论了贝叶斯LASSO方法在平稳时间序列模型中的推广的可能性及意义所在,形成本文的理论基础。其次,本文从LASSO的基本思想、贝叶斯基本原理和贝叶斯LASSO方法三个方面,逐层次地将LASSO和贝叶斯紧密地联系在一起。再次,本文分别详细介绍了三种基本平稳时间序列模型:AR模型、ARMA模型和ARCH模型,并通过数据变换的处理方式,成功地从理论上说明贝叶斯LASSO方法应用到上述三种模型中的可行性。最后,通过R软件平台,本文应用现有的贝叶斯LASSO算法,分别将贝叶斯LASSO方法应用在AR模型、ARMA模型和ARCH模型的数据模拟分析之中,验证了三种模型的模拟应用的效果。实证方面,本文主要输入了上证300指数的数据,对指数的日对数收益率数据进行了波动率的ARCM建模分析,并将实证结果与一般的ARCM模型进行了对比,结果表明本文的方法在ARCM波动率实证研究中的尝试具有一定的可行性效果。本文的主要结论包括:(一)平稳时间序列模型的估计可以运用贝叶斯LASSO方法进行解决,并能够取得一定的效果,但并非总是优于LASSO。因为,本论文的数据模拟分析发现,在适当的样本容量条件下,本文方法的正确率在有的条件下对某些参数而言是高于LASSO方法的,有的条件下也是低于LASSO的。(二)贝叶斯LASSO方法能够提供更多的概率决策信息。因为,本文所采用的方法属于贝叶斯框架的分析方法,故可以提供更可靠的区间估计等信息。本论文的算法是通过MCMC模拟确定了样本后验分布的稳定性,我们从该分布中分析出很多的信息,如本文所定义的“变量接受概率”,它可以根据实际情况根据样本量和时间序列维数进行合理的设置,当样本量比较大的时候,设置较高的接受概率可以准确选择出合理的变量,当样本量逐渐下降的时候,某些参数的变量接受概率会随着样本量的下降而不断降低。