基于Adaptive GROUP Bridge的稳健变量选择

来源 :曲阜师范大学 | 被引量 : 0次 | 上传用户:chenlinwu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
变量选择对数据的处理起着至关重要的作用.有效的变量选择可以通过剔除冗余的变量来给出最优的预测变量,从而得到最简洁的模型.同时,有效的变量选择可以大大提高模型的预测精度.另外,近二十年来,基于惩罚思想的变量选择方法是统计学家们研究的热点问题之一.惩罚方法能够在选择变量的同时得到参数的估计,减小计算量.因此,惩罚变量选择方法在处理数据时有较大优势[28].在实际数据中,变量经常以分组的形式呈现且自变量和响应变量中通常存在异常值.因此,寻求一个处理异常值的同时可以进行组和组内变量选择的方法至关重要.
  本文的内容主要有四章.第一章介绍了国内外对于组和组内变量选择及估计方法的研究现状.第二章是本文的主要部分,包括模型介绍和理论性质.我们提出调整WLAD回归估计:将WLAD与最小二乘估计的优良性质相结合,并利用adaptivegroupbridge方法实现自变量和响应变量中同时存在异常值时组和组内的变量选择.此外,我们给出了所提出方法的理论性质,包括估计的相合性、变量选择的相合性和估计的渐近正态性,并且在一定条件下给出了理论证明.第三章中我们在线性模型下进行了基于三类数据的数值模拟,并得到了不错的数值结果.为了说明所提出方法在实际问题中的效果,本文基于Boston住房数据和沙胡萝卜素水平数据进行数据分析,以说明在自变量和响应变量中同时存在异常值时,基于调整WLAD回归的adaptivegroupbridge方法与groupbridge方法相比的优越性.由结果可知,我们提出的方法有着不错的表现.第四章对本文的研究进行了总结.
其他文献
目前,人们一直争论着暴露于小剂量,中度到高剂量的酒精的影响。尽管在某些研究中甚至报道了少量会引起不良的妊娠结局和神经行为影响,但其他研究并未发现负面影响。美国,加拿大,澳大利亚,冰岛,法国,挪威和瑞典等许多国家/地区的当局提出的建议中普遍存在怀孕期间饮酒安全水平的证据以及促进怀孕期间完全戒酒的预防原则。在包括加纳在内的许多发展中国家,该领域的研究仍不发达,在加纳,孕妇中的酒精摄入量很高。与此相应,
学位
如果说当今社会什么是在变化的,那一定是交流的概念和过程。包含交流的方式等等的每个方面都在日益变化着。在全球范围内,不得不说媒体的传播一直是一项巨大的信息工程,它承载这是亿万人民以一种廉价而又容易的方式获得的教育。大众传媒是一个以构建具有嵌入价值的信息的群体,并将这些信息传播给有效的公众,以实现有效的目标。  另一方面,公共教育在每个国家都是非常必要的。教育是一种社会现象,是通过交流和实践,塑造人们
学位
During the past decades,the discussion of economic integration has extensively emphasized in the national economic agendas of many countries all over the world,particularly as a means for enhancing ec
学位
长寿风险分担是社会养老保险的基本功能之一。社会养老保险中的短寿参保者和长寿参保者通过保险基金转移实现对长寿风险的分担,而人为设定的养老金领取年龄决定了短寿参保者和长寿参保者的比例,进而影响社会养老保险长寿风险分担功能的强弱。本文试图对现收现付制社会养老保险中养老金领取年龄与社会养老保险长寿风险分担功能之间的关系进行定量研究。  在李宇飞(2018)“代内长寿风险分担模型”的基础上,本文放松了参保者
我国为了加快经济建设和更快推进城市化建设,政府基于公共利益的需求,大量征收土地,用于开发区、园区等建设,大力推进城市化的发展。由此而致大量农民失去土地,逐渐形成了被征地农民群体。而我国一直以来按照土地原有价值进行补偿,使得征地补偿费明显偏低,但各地安置政策往往处于滞后状态且安置力度不够,被征地农民就业能力差、就业率不高,社会保障制度不完善等情况一直没有得到妥善处理,所以那些被征收土地的农民成为了无
学位
从我国城市发展的历史经验来看,行政区划调整是地方政府优化资源配置、提高空间效率、优化城市空间结构的常见做法。改革开放以来,行政区划在县级层面上的调整模式具体可表现为整县改市,主要包括撤县设市(增加小城市的数量)和撤县设区(扩大已有城市的规模)。城市蔓延是伴随城市化进程而衍生的副产物,其主要表现为人口密度的增长速度远远落后于同时期城市建设用地的扩张速度,原先集中于城市中心的社会活动向城市边缘地区转移
学位
精准扶贫是我国当前的一项重点工作,驻村扶贫工作队作为实现精准脱贫的重要力量,其工作成效的一个重要评价内容是当地贫困群众的满意度。武陵山片区作为国家级扶贫攻坚示范区,对该地区驻村扶贫工作队的扶贫成效满意度及其影响因素进行研究,并根据研究结果为政府和相关部门在驻村扶贫工作队的考核领域提供理论依据和相关政策建议,对加速我国精准脱贫事业具有一定的指导意义。本文以武陵山片区怀化市溆浦县的驻村扶贫工作队为研究
新常态下,经济发展速度的变缓,表明工业化初期带来的加速性福利正在削弱,中国经济正式步入“结构性减速”时代。经济增速的变缓,使得“三重压力”、“中等收入陷阱”和“城市病”等问题凸显。在新常态下,面对人口,资源和环境等多重制约因素,寻找新的发展动能显得愈发重要。产业结构升级作为经济发展新动能转换的重要支撑,推动产业结构升级则要发挥好新型城镇化、科技创新推拉效应。为此,在丝绸之路经济带综合建设的背景下,
经典线性回归模型中的一个重要假设就是模型满足同方差性.然而在实际问题中,由于遗漏解释变量,测量误差以及随机因素的影响等原因,许多模型是不满足这个假设条件的,此时,模型出现了异方差.当模型中出现异方差时,若仍然继续使用普通最小二乘法进行模型估计,则模型估计和统计检验结果的精度会降低,同时模型的预测结果也会产生一定的偏差.针对一个实际的线性回归模型问题,模型是否存在异方差能够直接影响模型的估计、评价和
党的十九大报告提出:“支持和鼓励农民就业创业”。2019年中央“一号文件”提出“支持乡村创新创业”,鼓励在外务工的农民等各类人员返乡下乡留乡创新创业。因此,在当前政策背景下,研究乡村创业环境、返乡农民工创业能力及创业意愿作用关系,对激发返乡农民工的创业意愿、推动创业活动的开展有重要意义。  本文在梳理和分析GEM模型理论、创业能力理论、计划行为理论等理论的基础上,构建了乡村创业环境、返乡农民工创业