基于带惩罚变量选择的结构突变理论研究及其应用

来源 :上海财经大学 | 被引量 : 0次 | 上传用户:ilovebaidoudou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
结构突变亦称变点。结构突变问题是统计学、计量经济学、信号处理和生物信息学等诸学科领域中非常活跃的研究问题。关于结构突变理论的研究,首要的问题就是检测变点发生的个数和时刻(位置)。从统计学的角度上来看,在统计建模中,如果数据结构本身存在变点而忽视变点的存在就完全可能产生错误的统计模型,或者错误的模型参数估计等统计分析结果,所建模型也就没有任何实际意义。在金融时间序列上,检测结构变点,可以在变点时刻附近有针对性地找出引发结构突变的原因,还可以评价一个事件或一项新政策对经济发展的影响。  模型选择和变量选择是现代统计学研究的前沿热点之一。Tibshirani(1996)在Bridge Regression和Nonnegative Garrote思想方法的启发下,提出了一种新的基于带惩罚思想的变量选择方法—LASSO。带LASSO类惩罚的变量选择方法的最大特点是可以在参数估计的同时实现变量选择。带LASSO类惩罚的变量选择方法保留了传统子集选择方法的优点,弥补了传统子集选择方法在变量选择上的不足之处,在现代统计学领域引起了研究者的广泛关注,可以说在变量选择问题研究上具有里程碑式的意义,之后有许多学者相继提出了针对LASSO的改进技术。  本文首先简单介绍了文中用到的LASSO及其相关变量选择方法,主要有(Adaptive)LASSO,(Adaptive)Group LASSO,Sparse Group LASSO及(Adaptive) LAD-LASSO稳健变量选择方法等。基于带惩罚变量选择的变点检测研究方法,是2008年才提出的处理变点检测问题的最新研究方法,本文综述了这一变点检测方法的研究进展。  本文主要考虑均值转移模型、线性回归模型及自回归时间序列模型中的多变点检测问题,把带LASSO类惩罚的变量选择方法引入变点检测问题研究中,这一新检测方法的基本思想是通过适当转换把多变点检测问题转化成带LASSO类惩罚的变量选择问题来解决,这样可以将现代变量选择的丰富研究成果引入变点检测问题研究中。与传统变点检测方法不同,传统变点检测方法一般先检验是否存在变点及变点个数,然后再估计推断变点时刻(位置)。类似于LASSO方法的特点是可以同时实现参数估计和变量选择,带LASSO类惩罚变量选择的变点检测方法的独特优势是能同时实现变点个数和变点时刻的估计,而且具有良好的快速计算能力,可以用于大数据环境下的变点问题,使得LASSO类变量选择方法在变点检测问题研究上具有很强的应用活力,是最近几年处理变点检测问题的最新研究方法。由于直接运用带惩罚变量选择方法得到的一步变点估计是过估计的,本文考虑两步估计法。在第二步,对于第一步得到的初步变点估计集合A中的每一个“变点”,检验其是否为真的变点就是一个在给定时点数据模型结构是否发生变化的两样本检验问题,本文提出在第二步运用两样本变点检验从中筛选出真实变点。  本文的研究工作主要在于以下几个方面:  1.对于均值转移模型中的变点检测问题,当模型误差项分布服从重尾分布或数据集含异常值时,一般认为最小一乘LAD估计比最小二乘OLS估计更加稳健,因此,本文将LAD稳健估计与LASSO变量选择方法两者结合起来,提出了基于(Adaptive)LAD-LASSO稳健变量选择的均值转移模型中变点估计的一种新检测方法,在问题转化过程中对相应优化问题的约束条件仅做一次松弛。由于直接运用LAD-LASSO方法得到的一步变点估计是过估计的,本文提出在第二步运用邹氏检验筛选出真实变点。随机模拟和实例表明所提出的估计方法是切实可行的,算法更加简单易行,且估计结果具有很好的稳健性。  2.对于多元线性回归模型中的变点检测问题,本文将线性回归模型中的变点检测问题转化成了Adaptive Group LASSO群组变量选择问题来解决,同时给出了变点个数、变点位置和不同区域上模型回归系数的一步(初步)估计。在适当的条件下,当变点个数估计(m)=m时,证明了变点时刻估计和回归系数估计的相合性。由于直接利用Adaptive Group LASSO得到的变点一步估计是过估计的。本文提出在第二步用邹氏检验筛选出真实变点。  3.对于一阶自回归AR(1)时间序列模型中的变点检测问题,本文将AR(1)中的变点检测问题转化成Adaptive LAD-LASSO稳健变量选择问题来解决。对于p阶自回归AR(p)时间序列模型中的变点检测问题,本文将相应的变点检测问题转化成了Adaptive Group LASSO群组变量选择问题来解决,同时给出了变点个数、变点时刻和不同区域上自回归系数的一步(初步)估计。在适当的条件下,给出了变点个数、变点时刻及自回归系数估计的相合性定理。由于直接利用Adaptive Group LASSO得到的变点一步估计是过估计的。本文提出在第二步用似然比检验筛选出真实变点。  4.对于p阶自回归AR(p)时间序列模型中的变点检测问题,当p较大时,为了在每一段上得到稀疏的更易解释和预测的自回归模型,本文把Sparse GroupLASSO双层变量选择方法引入变点检测研究中。这里不仅考虑组间稀疏性,也考虑组内稀疏性。组间稀疏性可以得到变点的估计,组内稀疏性可以得到每段上模型系数的稀疏解。本文将相应的变点检测问题转化成了Sparse GroupLASSO变量选择问题,从而同时给出了变点个数、变点时刻和不同区域上自回归系数的一步(初步)估计。在适当的条件下,探讨变点个数、变点时刻和自回归系数估计的相合性定理。由于直接利用Sparse Group LASSO得到的变点一步估计是过估计的。本文提出在第二步用似然比检验筛选出真实变点。
其他文献
近年来中国进行了一系列的财政管理改革,如部门预算、国库集中支付制度及政府采购等.这些财政管理方面的改革措施对政府会计提出了更高的要求,政府会计也显得越来越重要.从实
为配合国库集中支付制度改革试点工作顺利进行,解决财政资金支付过程中的信息记录和信息反馈等问题,各级政府财政部门急需开发一套财政集中支付管理信息系统为改革提供信息支
该文共分为五部分,采取总—分—总的结构方式,对税收筹划的理论和实践问题作了初步的研究和分析.该文的主要内容是:1、税收筹划的基本理论问题研究,包括其起源和发展、概念、
生活中,冠心病患者为了以防意外,经常会随身携带复方丹参滴丸、硝酸甘油等,把硝酸甘油称作冠心病患者的“救命药”一点也不算太夸张,因为只要舌下含服一片,便能有效地制止心
技术创新是近年来国内外经济管理学界的一个研究热点,被认为是一个正在兴起的研究领域。自从熊彼特在20世纪初首先提出了技术创新理论,技术创新领域研究已经取得了许多成果。在此基础上,本论文对企业技术创新的可持续性进行深层次研究和探讨。本文深入的挖掘了影响企业持续技术创新的主要因素,利用理论研究中较为流行的分析方法,对这些影响因素的有关问题进行了深入的分析,并以此为基础对企业构建可持续发展的创新体系的有关
该文试图通过对中国现行证券交易税制的一些研究,从理论分析和国际经验借鉴的角度对这一问题进行深入的探讨,以期能对完善中国的证券交易税制提出若干政策建议.该文以马克思
机械设备是企业重要的物资源,是企业进行施工生产的主要技术物资基础。其固定资产原值一般占企业固定资产总值的80%以上,要保证国有资产保值增值,发挥设备资产效益,保证设备完好及
该文作者参阅了大量中、外文资料,致力于研究目前中国商业银行金融业务创新的现状、风险及如何对其进行监管.该文的研究表明,金融业务创新与风险相互并立而存在,相互斗争而发
随着全球经济一体化进程的推进以及信息时代的到来,保险业与银行业不断进行金融创新,以强强联合、优势互补策略寻求更大发展空间.银行保险(Bancassurance)是保险产品通过银行分
该文在对敏捷供应链管理研究的基础上,主要结合Web Services技术来实现敏捷供应链系统的集成开发.该文首先讨论了供应链的产生及其概念,供应链是一个随着社会实践不断发展的