关于线性模型的稳健模型选择和模型平均

来源 :南开大学 | 被引量 : 0次 | 上传用户：drrrrr123

【摘要】

：

【作者】

：

郭云飞

【机构】

：

南开大学

【出处】

：

南开大学

【发表日期】

：

2021年01期

【关键词】

：

异常点共线性模型选择模型平均岭估计 M估计岭M估计

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

模型选择是统计学重要的研究方向之一,并在计量经济学,金融学等领域有着重要的应用.为了避免模型选择过程的不确定性,以及存在选择到很差模型的风险,学者们提出了模型平均或预测组合的方法.由于模型平均估计是对所有候选模型的估计进行加权平均,故模型平均估计具有更加稳健的优点.普通最小二乘估计（Ordinary Least Squares,OLS）是一种常用的估计方法.尽管OLS是在所有无偏估计中方差最小的估计,却通常存在以下几个问题:（1）因变量y存在异常点（简称为异常点）或（和）随机误差项违背正态性假设;（2）自变量之间存在多重共线性（简称为共线性）;（3）同时存在异常点和共线性.上述三个问题在许多实际数据中存在,特别是在比较流行的大数据以及复杂数据中.而基于最小二乘估计的常用的模型选择和模型平均方法,也会受到这些问题的影响,因此,稳健的模型选择和模型平均方法有待于进一步研究,本文将针对问题（1）,（2）,（3）下的稳健的模型选择方法和模型平均方法进行研究,具体研究成果包括以下几个部分:1)针对问题（1）,即,因变量y存在异常点的情况,本文提出了基于Sp准则的,对异常点稳健的模型平均方法SMA（SpModel Averaging）.所提出的SMA方法结合了经典模型平均和稳健模型选择两种方法.既考虑了异常点对模型选择的影响,同时与稳健模型选择方法相比,更充分地考虑了模型选择过程中的不确定性.通过大量的随机模拟研究,说明了所提方法相对于一些常见方法的优势.存在异常点的情况下,本文所提出的SMA方法在均方误差MSE准则下要一致优于一些常见的模型选择和模型平均方法;即使数据中不存在异常点,SMA的方法也能非常接近于本文比较中的最优的方法.最后通过对Stack loss实际数据分析进一步验证了所提方法的实用性和有效性.2)针对问题（2）中的多重共线性问题,本文将基于岭估计的Rp模型选择方法拓展到了模型平均,提出了一种新的模型平均方法,RMA（RpModel Averaging）.能够在多重共线性的情况下,依然稳健地做出统计预测.在均方误差意义下,优于一些常见的模型选择和模型平均方法.通过蒙特卡洛模拟实验,探究了本文所提方法及常用模型选择和模型平均的有限样本性质.存在共线性情况下,特别是在样本量小,方差比较大的情况下,RMA方法明显优于常见的模型选择和模型平均方法,以及本文提出的SMA方法;不存在共线性时,RMA的表现与本文研究中的最优的方法几乎一致,因此证实了所提方法的优越性.最后通过对Hald水泥实际数据分析,验证了RMA方法的可行性.3)针对问题（3）,也就是异常点与多重共线性共存的情形,本文在对异常点和共线性共存下稳健的岭M估计方法基础上,提出了稳健的模型选择准则,RMp,并进一步基于RMp准则提出了一种稳健的模型平均方法RMMA（RMpModel Averaging）.通过模拟研究,表明了本文所提的方法相对于其他常用的模型平均和模型选择方法的有效性.具体来讲,异常点和共线性共存情况下,RMMA方法表现的几乎一致最优;在只有异常点情况下,RMMA与最优的SMA或Sp几乎一致;只存在共线性情况下,RMMA与最优的RMA或Rp相差很小;在既无异常点,也无共线性情况下,RMMA非常接近最优的MMA或Cp方法.对于烟草数据（Tobacco data）的实例分析进一步说明了RMMA方法的实用性.本文的创新点在于:（1）本文提出了对异常点稳健的模型平均方法SMA,一定程度上缓解了异常点对模型平均估计的影响,并通过数值模拟以及实例分析验证了所提方法的有效性;（2）在数据中存在多重共线性情况下,发展了一种对共线性稳健的模型平均方法RMA,有效地抵抗了模型平均中的共线性问题,模拟研究与具体的实例分析展示了RMA方法在共线性情况下相对于一些常用方法的优势;（3）针对数据中异常点与共线性共存的问题,提出了一种新的稳健的模型选择方法RMp,并以此为基础,得到了相应的异常点与共线性共存下的稳健的模型平均方法RMMA,蒙特卡洛模拟以及实际数据分析,表明了RMMA能够为模型平均方法提供一种保障机制.

其他文献

对“液氮冷冻联合伊曲康唑治疗马拉色菌毛囊炎的临床观察”一文的发表提出质疑

期刊

破11万亿! 2021年江苏GDP增长8.6%

报纸

GDP高技术服务业工业增加值主要经济指标

室内人体飞沫传播的数值研究

人体口腔飞沫容易携带许多病毒和细菌微生物。针对飞沫产生的不同条件（如呼气、喷嚏等） ,对其在室内的传播和扩散过程进行数值模拟分析。模拟结果说明 ,适当的换气次数可以有效削弱由正常呼吸产生的口腔飞沫 ,但是一般的空调通风系统不能有效削弱由于剧烈咳嗽或打喷嚏而产生的口腔飞沫。

期刊

口腔飞沫SARS数值模拟通风

改良简易吞咽激发试验对渗漏和误吸评价的临床应用

目的:探讨改良简易吞咽激发试验（改良SSPT）对急性脑梗死渗漏误吸评价的诊断价值。方法:对45例急性脑梗死患者24h内进行临床评估（改良SSPT-0.4mL、改良SSPT-2mL、SSPT-0.4mL、SSPT-2mL、饮水试验）和吞咽造影检查,以吞咽造影对渗漏误吸的观察结果为标准,分析五项临床评估对渗漏误吸诊断的可靠性和一致性。结果:改良SSPT-0.4mL、改良SSPT-2mL、SSPT-0.

期刊

改良简易吞咽激发试验简易吞咽激发试验吞咽造影渗漏误吸急性脑梗死评估

提质培优背景下高职老年护理构建有效课堂的作用

目的探讨推行高职老年护理有效课堂，对老年护理人才培养目标的达成的积极作用。方法2020年度，分析高职老年护理课堂教学中存在的问题，从课程思政、目标、教学方法及手段、评价等方面入手，推动老年护理“课堂革命”，将课程教学改革推向纵深。结果培养学生的创新精神和实践能力，培养高质量的老年护理应用型人才，缓解人口老龄化所带来的问题。结论通过老年护理有效课堂的构建，有效提高学生课堂学习质量，培养更优质的

期刊

提质培优老年护理课堂革命有效课堂

中国畜牧业与资源环境承载力的时空耦合协调关系

高质量发展背景下，探究畜牧业生产布局与资源环境承载力的时空耦合关系是破解畜牧业资源环境约束的关键。以肉蛋奶蛋白当量度量畜牧业生产布局，构建涵盖资源供给、环境消纳、社会支持三大系统的畜牧业资源环境承载力评价体系，分别采用状态空间模型、耦合协调指数测算全国省域畜牧业资源环境承载力及其与畜牧业布局的时空耦合协调关系，并采用GWR模型分析耦合协调关系的驱动因素及空间异质性特征。结果表明：（1）全国畜牧业资

期刊

畜牧业布局资源环境承载力状态空间模型耦合协调耕地资源环境治理

广义（α,β）-度量的独角兽问题研究

在Finsler几何中,有两类重要的流形,分别是Berwald流形和Landsberg流形.根据定义,Berwald流形一定是Landsberg流形.但是自从L.Berwald引入这些概念以来,人们始终没有找到非Berwald型的Landsberg流形.这成为了Finsler几何中一个自然而长期存在的开放问题:是否存在非Berwald型的Landsberg度量?2005年,D.Bao建议将非Ber

学位

Berwald流形Landsberg流形广义（αβ）-度量等价性定理平行移动

钙和锌日动态饲喂对蛋鸡钙、磷和锌昼夜变化的影响及其调控研究

钙（Calcium,Ca）元素是蛋鸡产蛋周期的关键营养素之一,锌（Zinc,Zn）元素则是蛋鸡机体内生理代谢过程必需的微量元素之一。Ca和Zn元素均可通过蛋鸡体内的一系列代谢和生理过程影响蛋鸡的骨骼健康与蛋壳品质。本论文以蛋鸡为试验对象,研究钙或锌的日动态饲喂（每天上午和下午分别饲喂含不同水平Ca和Zn的饲粮,但每天饲喂的饲粮总Ca和Zn水平保持不变）对产蛋鸡生产性能和蛋品质的影响,同时探讨其对血

学位

日动态饲喂钙锌生物节律蛋鸡

植物源卤水发酵过程菌群结构变化及特征风味形成机理的研究

“食臭”自古有之,虽然其气味不甚友好,但因独特的风味、浓厚的地域特色和深厚的文化底蕴,彰显着其存在的价值。长沙臭豆腐是地方特色风味小吃代表之一,其特征风味源于植物原料为主的发酵卤水。卤水制作目前多沿用传统工艺发酵而成,但因发酵微生物不明确、风味形成机制不清晰,工艺无法定性和定量,导致产品质量不稳定。本课题针对卤水制作中技术“瓶颈”问题,在研究长沙臭豆腐植物源卤水特征风味物质的基础上,以冬笋、香菇、

学位

植物源卤水特征风味菌群芳香族氨基酸代谢宏基因组学代谢组学

几类均值回归过程的参数估计/金融应用

近几十年来,均值回归过程由于具有周期性的特点,被广泛应用到金融、经济、物理等领域中来刻画季节性、周期性的现象,如经典的OU过程（Ornstein–Uhlenbeck process）,最早是在物理学中用于计算在摩擦影响下的大质量布朗粒子速度的一个模型。由于OU过程具有平稳、高斯、马尔可夫性和均值回归的特点,在运筹管理、金融以及随机分析理论中被广泛应用。由于其刻画利率、商品期货、库存等恒正的事物,需

学位

均值回归过程参数估计桥过程随机场价差期权

关于线性模型的稳健模型选择和模型平均

与本文相关的学术论文