若干重尾整数值时间序列模型的研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:judycome7
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
整数值时间序列数据广泛存在于我们日常生活中的各个领域中,例如,经济学、金融学、生物、计算科学、电子工程、环境学、医学、保险等等.使用统计模型分析整数值时间序列数据的基本方法是捕捉其相关的特征,如过离散或者欠离散、零膨胀、甚至重尾等.经典的高斯AR过程不能捕捉整数值时间序列的特征,如过离散、非对称边际分布或零膨胀,这引发了对新模型和新方法的研究和发展.研究者提出并研究了许多处理整数值时间序列数据的模型,其中整数值自回归(integer-valued autoregressive,INAR)模型和整数值广义自回归条件异方差(integer-valued generalized autoregressive conditional heteroscedastic,INGARCH)模型最具有代表性.具有泊松新息项的二项稀疏算子的INAR模型是等度离散的,因此该模型通常在实际数据集中不适用.一方面,研究者通过改变新息项的分布,提出了各种各样的拓展的INAR模型来建模具有零膨胀和过离散特征的整数值时间序列.另外一方面,研究者通过替换二项稀疏算子来拓展INAR模型.另外一种常见的整数值时间序列模型是基于条件方差建模的INGARCH模型.类似于前文具有泊松新息项的INAR模型,泊松INGARCH模型也只能建模条件等度离散的整数值时间序列.然而,在实际中,计数数据可以呈现出其他的特征,例如条件欠离散或者过离散.传统的INGARCH模型将不再适用.虽然研究者已经提出了很多可以建模过离散和零膨胀的模整值时间的模型,但具有重尾特征的整数值时间序列模型较少.在时间序列中,我们经常观察到序列呈现重尾的特征,这意味着尾部概率不可忽略或下降非常缓慢.如果忽略尾部,那么可能会导致有用信息的丢失.建模重尾数据的挑战在于寻求适当的分布来处理数据的主要部分,并且兼顾重尾.本文对传统的INAR和INGARCH模型进行了推广和扩展.本文的主要内容分为三个部分,具体如下:1、具有重尾新息项的INAR(1)模型.泊松逆高斯(Poisson-inverse Gaussian)分布,作为负二项分布的替代分布,可以建模比泊松分布和负二项分布尾部要厚的数据.该分布已被广泛研究.Zhu和Joe(2009)指出广义泊松逆高斯(generalized Poisson-inverse Gaussian,GPIG)分布族通常作为泊松逆高斯分布的拓展分布,并且可以建模重尾计数数据.广义泊松逆高斯分布包括常见的泊松分布、泊松逆高斯分布和离散稳定分布(discrete stable)等.我们提出了一种新的具有广义泊松逆高斯新息项的INAR(1)过程,该过程能够捕捉到整数值时间序列的过离散或者等度离散、零膨胀、甚至重尾的特征.我们研究了该模型的平稳性和遍历性,并给出了边际均值和方差的表达式.我们利用条件极大似然方法来估计未知参数,并给出了估计量的相合性和渐近正态性.我们还考虑了该模型的h-步预测,定义了h-步向前预测单位均方误差(h-step ahead predicted root mean squared error).在模型诊断部分,我们考虑了拟合模型的Person残差和概率积分变换(probability integral transform)图.为了说明提出的模型在处理整数值时间序列数据时具有良好灵活性,我们把该模型用于三个不同的实际数据集.第一个实际数据集说明GPIG-INAR(1)模型能够处理含有过多零的整数值时间序列数据,第二个和第三个实际数据集说明GPIG-INAR(1)模型在处理重尾整数值时间序列数据数据时具有良好的表现.2、一类含有解释变量的max-INAR(1)模型.在一些实际的数据集中,我们会遇到数据的路径在一个方向上增加,之后减少,然后往复运动.如果考虑这种类型的计数数据,传统的具有加性结构的INAR过程就不能捕捉上下移动的趋势.为了解决这一问题,Scotto等(2018)将max-AR过程推广到离散情况,称为max-INAR(1)过程.传统的INAR模型的自回归参数被假定为一个常数.然而自回归参数可能会随着时间变化.例如,Xt表示第个月的失业人数,α°Xt-1表示第-1个月的失业并且第个月仍失业的人数,ct表示第个月新增加的失业人数.失业率可能受到各种因素的影响,例如国家或者地区政策、经济水平等等.为了让max-INAR(1)模型更加灵活,我们引入了一类带解释变量的max-INAR(1)过程,即自回归参数的稀疏算子依赖于解释变量.我们利用条件极大似然估计方法对参数进行估计.我们给出了该模型的可能边际分布,并探索了该模型的极值理论.通过验证,我们可以得知该模型满足极值条件.我们对带解释变量的max-INAR(1)模型进行了有限样本的数值模拟.最后,我们把带解释变量的max-INAR(1)模型应用到股票交易数据和Koeberg风向数据中.通过与其他模型的比较,我们的模型更具有灵活性和优越性.3、广义Conway-Maxwell-Poisson整数值GARCH模型.在实际数据集中,模型的选择一直是我们关心的热点问题.为了解决该问题,我们寻找能够捕获尽可能多的数据特征的分布.Imoto(2014)指出广义Conway-Maxwell-Poisson分布是对COM-Poisson分布的一种推广,它通过增加一个参数来控制尾部的长度.基于近似广义COM-Poisson分布的均值,我们定义了再参数化的广义COM-Poisson分布,并提出了一种更加灵活的基于再参数化广义COM-Poisson分布的INGARCH模型来建模整数值时间序列.该模型为建模欠离散或者过离散、零膨胀、重尾的整数值时间序列数据提供了一个框架.我们研究了该模型的基本性质,并利用条件极大似然法得到了参数的估计量.通过Monte Carlo数值模拟研究了未知参数估计量的有限样本表现.最后,广义Conway-Maxwell-Poisson整数值GARCH模型应用到三个实际数据集中.通过与已有的整数值GARCH模型的比较,广义Conway-Maxwell-Poisson整数值GARCH模型更加灵活和实用.
其他文献
本论文主要针对多时变时滞离散BAM(Bidirectional Associative Memory)神经网络(即,双向联想记忆神经网络)给出了全局指数稳定性判据以及状态观测器的设计方法,并针对多时变时滞离散Cohen-Grossberg型BAM神经网络的状态反馈镇定问题进行了研究,获得了一些易于实现的控制器设计方法,具体如下:首先,简述了神经网络以及时滞神经网络的发展概况,并分析了时滞BAM神经
近年来,新能源汽车的推广和应用对汽车轻量化技术提出了更高的挑战,车身轻量化研究也成为研究热点。采用多材料混合车身结构是实现汽车轻量化最有效的途径之一,碳纤维增强复合材料(CFRP)因具有比强度和比刚度高、易于成型和结构可设计性强等优势,近年来受到汽车制造业的青睐。连接技术是多材料车身结构工程应用的关键问题,自冲铆作为一种新轻型薄板材料机械连接技术,在连接异种材料和非金属材料方面具有优势,在车身制造
物种共存取决于生物自身属性及生境异质性等多重因素的综合效应,本研究基于较大空间尺度(21°~35° N)的野外调查,比较了水生型入侵植物空心莲子草与其本土共存种双穗雀稗在形态及化学计量特征等方面的差异,并分析了环境因子对二者属性差异的影响。结果表明:空心莲子草盖度和重要值显著大于双穗雀稗(34.3%、104.0%),而双穗雀稗高度显著大于空心莲子草(13.8%)。空心莲子草TN、N:P显著高于双穗
埃塞俄比亚经常受到来自邻国的恐怖主义、宗教极端主义以及直接的政治干涉的威胁,这些威胁破坏了国家的和平稳定,削弱了共存和容忍的文化传统,并进一步侵蚀了对宗教的传统敬畏,加剧了宗教冲突,人们的认同冲突也在其中酝酿发酵,许多基础设施遭到破坏,国家遭受巨大损失。政府经常表示,这些问题不仅是国内的问题,也和其他国家息息相关。对于埃塞俄比亚来说,上述关切和埃及、厄立特里亚和索马里有关,并可以从这三个国家的方面
艺术叙事作为生活叙事的一种延续,是对生活叙事的“典型化”。生活中每个人都处于线性时间之中,时间性是叙事的必然本性。个人生活的线性化相互交织形成复杂、无限多重的社会叙事,只不过这种复杂的生活叙事并不能直接为艺术所用。社会生活的容量无限,但艺术叙事的容量却极为有限。另外,生活叙事的杂乱无序,很难让人去理解、把握,更遑论审美。艺术的意义与价值在此时得以体现,对生活叙事的筛选、提炼、典型化、想象乃至幻想,
中子活化瞬发伽马分析(PGNAA)技术采用透射式或反射式方法进行物料检测,具有无损、非接触、在线、快速等特点。国产PGNAA技术在水泥、煤炭领域已经得到成功应用,而烧结领域的PGNAA技术被美国垄断。这项工作以PGNAA技术为检测手段,应用蒙特卡罗仿真技术对检测装置进行优化升级,采用修正算法消除了烧结混合料自身的伽马自屏蔽、中子自吸收效应,最终实现了烧结混合料元素含量的实时、在线检测。论文的主要工
近年来,数字人文在中国学界方兴未艾。数字人文对知识生产方式的改变,好比在学术圈这个相对平静的湖水中投进一颗石子,泛起的涟漪会波及整个学术领域[1]。2017年,中共中央办公厅、国务院办公厅印发的《国家“十三五”时期文化发展改革规划纲要》指出:文化遗产保护工程需加快文物藏品数字化保藏,推进数字故宫、数字敦煌、数字丝绸之路和中国人民抗日战争数字博物馆建设[2]。在数字化浪潮中,人文活动在数字技术赋能下
伴随着中国经济的快速腾飞,我国人口集聚现象开始进入快速发展模式,大规模人口为追求更好的自身发展向大型城市迁移,为当地带来丰厚的人力资本,从而为城市经济的进一步发展奠定了可靠的劳动力基础,第六次人口普查数据显示,2010年底全国迁移人口达到2.6亿,其中1.7亿人口选择将城市作为迁移目的地,人口向城市集聚的现象尤为显著。2016年国务院印发的《国家人口发展规划(2016—2030年)》中指出,对人居
本文研究了时间序列分析中两类重要的问题.其一是对一个时间序列的自相关性的检验,本文引入小波变换作为工具,从频域角度为这一检验问题提供新的方法.其二是整数值时间序列的建模,其中,两个核心关注点分别是整数值数据中存在的非线性现象和从整数值时间序列的角度分析分类时间序列.因此,本文的主要研究内容分为如下三个部分:1.序列相关性的多频段检验.考虑一个对所有t∈Z满足E(yt)=0的随机序列{yt}Tt=1
截至2020年3月,我国移动短视频用户规模接近8亿,占全体网民的86%,成为移动互联网的新风口,超越综合视频成为第三大移动应用。同时受到新冠疫情影响,2020年下半年用户规模进一步大幅提升,移动短视频观看时长日均3亿小时,成为领跑互联网的新发展热点。虽然随着移动短视频竞争格局走向良性,内容质量得到提升,版权意识也不断增强,但是移动短视频作为新兴事物和新兴业态,还是存在一系列的生态问题。如何挖掘移动