论文部分内容阅读
整数值时间序列数据广泛存在于我们日常生活中的各个领域中,例如,经济学、金融学、生物、计算科学、电子工程、环境学、医学、保险等等.使用统计模型分析整数值时间序列数据的基本方法是捕捉其相关的特征,如过离散或者欠离散、零膨胀、甚至重尾等.经典的高斯AR过程不能捕捉整数值时间序列的特征,如过离散、非对称边际分布或零膨胀,这引发了对新模型和新方法的研究和发展.研究者提出并研究了许多处理整数值时间序列数据的模型,其中整数值自回归(integer-valued autoregressive,INAR)模型和整数值广义自回归条件异方差(integer-valued generalized autoregressive conditional heteroscedastic,INGARCH)模型最具有代表性.具有泊松新息项的二项稀疏算子的INAR模型是等度离散的,因此该模型通常在实际数据集中不适用.一方面,研究者通过改变新息项的分布,提出了各种各样的拓展的INAR模型来建模具有零膨胀和过离散特征的整数值时间序列.另外一方面,研究者通过替换二项稀疏算子来拓展INAR模型.另外一种常见的整数值时间序列模型是基于条件方差建模的INGARCH模型.类似于前文具有泊松新息项的INAR模型,泊松INGARCH模型也只能建模条件等度离散的整数值时间序列.然而,在实际中,计数数据可以呈现出其他的特征,例如条件欠离散或者过离散.传统的INGARCH模型将不再适用.虽然研究者已经提出了很多可以建模过离散和零膨胀的模整值时间的模型,但具有重尾特征的整数值时间序列模型较少.在时间序列中,我们经常观察到序列呈现重尾的特征,这意味着尾部概率不可忽略或下降非常缓慢.如果忽略尾部,那么可能会导致有用信息的丢失.建模重尾数据的挑战在于寻求适当的分布来处理数据的主要部分,并且兼顾重尾.本文对传统的INAR和INGARCH模型进行了推广和扩展.本文的主要内容分为三个部分,具体如下:1、具有重尾新息项的INAR(1)模型.泊松逆高斯(Poisson-inverse Gaussian)分布,作为负二项分布的替代分布,可以建模比泊松分布和负二项分布尾部要厚的数据.该分布已被广泛研究.Zhu和Joe(2009)指出广义泊松逆高斯(generalized Poisson-inverse Gaussian,GPIG)分布族通常作为泊松逆高斯分布的拓展分布,并且可以建模重尾计数数据.广义泊松逆高斯分布包括常见的泊松分布、泊松逆高斯分布和离散稳定分布(discrete stable)等.我们提出了一种新的具有广义泊松逆高斯新息项的INAR(1)过程,该过程能够捕捉到整数值时间序列的过离散或者等度离散、零膨胀、甚至重尾的特征.我们研究了该模型的平稳性和遍历性,并给出了边际均值和方差的表达式.我们利用条件极大似然方法来估计未知参数,并给出了估计量的相合性和渐近正态性.我们还考虑了该模型的h-步预测,定义了h-步向前预测单位均方误差(h-step ahead predicted root mean squared error).在模型诊断部分,我们考虑了拟合模型的Person残差和概率积分变换(probability integral transform)图.为了说明提出的模型在处理整数值时间序列数据时具有良好灵活性,我们把该模型用于三个不同的实际数据集.第一个实际数据集说明GPIG-INAR(1)模型能够处理含有过多零的整数值时间序列数据,第二个和第三个实际数据集说明GPIG-INAR(1)模型在处理重尾整数值时间序列数据数据时具有良好的表现.2、一类含有解释变量的max-INAR(1)模型.在一些实际的数据集中,我们会遇到数据的路径在一个方向上增加,之后减少,然后往复运动.如果考虑这种类型的计数数据,传统的具有加性结构的INAR过程就不能捕捉上下移动的趋势.为了解决这一问题,Scotto等(2018)将max-AR过程推广到离散情况,称为max-INAR(1)过程.传统的INAR模型的自回归参数被假定为一个常数.然而自回归参数可能会随着时间变化.例如,Xt表示第个月的失业人数,α°Xt-1表示第-1个月的失业并且第个月仍失业的人数,ct表示第个月新增加的失业人数.失业率可能受到各种因素的影响,例如国家或者地区政策、经济水平等等.为了让max-INAR(1)模型更加灵活,我们引入了一类带解释变量的max-INAR(1)过程,即自回归参数的稀疏算子依赖于解释变量.我们利用条件极大似然估计方法对参数进行估计.我们给出了该模型的可能边际分布,并探索了该模型的极值理论.通过验证,我们可以得知该模型满足极值条件.我们对带解释变量的max-INAR(1)模型进行了有限样本的数值模拟.最后,我们把带解释变量的max-INAR(1)模型应用到股票交易数据和Koeberg风向数据中.通过与其他模型的比较,我们的模型更具有灵活性和优越性.3、广义Conway-Maxwell-Poisson整数值GARCH模型.在实际数据集中,模型的选择一直是我们关心的热点问题.为了解决该问题,我们寻找能够捕获尽可能多的数据特征的分布.Imoto(2014)指出广义Conway-Maxwell-Poisson分布是对COM-Poisson分布的一种推广,它通过增加一个参数来控制尾部的长度.基于近似广义COM-Poisson分布的均值,我们定义了再参数化的广义COM-Poisson分布,并提出了一种更加灵活的基于再参数化广义COM-Poisson分布的INGARCH模型来建模整数值时间序列.该模型为建模欠离散或者过离散、零膨胀、重尾的整数值时间序列数据提供了一个框架.我们研究了该模型的基本性质,并利用条件极大似然法得到了参数的估计量.通过Monte Carlo数值模拟研究了未知参数估计量的有限样本表现.最后,广义Conway-Maxwell-Poisson整数值GARCH模型应用到三个实际数据集中.通过与已有的整数值GARCH模型的比较,广义Conway-Maxwell-Poisson整数值GARCH模型更加灵活和实用.