【摘 要】
:
本文关注带测量误差的变系数部分线性模型的变量选择问题.随着科学技术的发展,人类能够得到的数据越来越多,然而当我们要考虑这些因素对某一个变量的影响时,就需要从众多的数
论文部分内容阅读
本文关注带测量误差的变系数部分线性模型的变量选择问题.随着科学技术的发展,人类能够得到的数据越来越多,然而当我们要考虑这些因素对某一个变量的影响时,就需要从众多的数据中选出我们所需要的变量.这样就产生了一门新的研究方向.变量选择.变量选择广泛应用于需要将数据中有十个,百个,或上千个变量可用时的领域,例如基因研究,机器学习等等.变量选择的方法从20世纪70年代以来有了长足的发展.Fan and Li(2004),Wang,Lin,Gutierrez and Carroll(1998),Liang,Hardle,and carroll(1999)等都对变量选择问题做了大量的研究. 本文第一章介绍了变量选择产生的背景及其近年来的发展,以及常用的变量选择的方法和它们在统计计算中的整体思路,特别介绍了近年来流行的LASSO方法. 在第二章中,我们首先介绍了常见的回归模型,侧重介绍了变系数模型和测量误差模型.结合这两个模型给出了我们要研究的带测量误差的变系数部分线性模型.对于非参数部分我们采用的是核估计的方法,然后运用SCAD方法,分别在平方损失(最小二乘方法)和分位数损失两种情况下给出了模型参数部分的估计.并且在一定的条件下证明我们得出的参数部分的估计具有较好的相合性,零项得到的估计就是零,而且非零项的估计还具有渐近正态性.在此基础上我们将模型条件进行了一些放松,即假设误差项的方差与未知参数β之间有一定的关系时,在SCAD方法和平方损失下我们得出参数部分的估计在一定条件下也是相合估计.最后我们模拟了一种情况,用核估计的方法得到参数部分的估计,然后带到惩罚最小二乘函数中,通过最小化函数得到估计值. 在第三章中,我们给出了本文主要结论的证明过程.
其他文献
非线性泛函分析作为现代数学的一个重要分支,因其能很好的解释自然界中各种各样的自然现象受到了越来越多的数学工作者的广泛关注,并在物理学,应用数学,航天,生物等领域有着
统计学习理论是由万普尼克(Vapnik)于上世纪60年代为解决小样本条件下机器学习问题而建立的理论体系,为研究有限样本情况下机器学习的理论和方法提供了理论框架。该理论中发展
本文研究了一类三阶中立型微分方程的振动性质以及一类二阶时滞动力方程正解的分类,所得结果推广和改进现有文献的相关结论,全文共分三章: 第一章为绪论,介绍了时标动力方程的
分数图论是一个相对年轻的分支.第一部关于分数图论的书籍是ClaudeBerge于1987年写的分数图论[17].图的因子的研究已超过100年。在1891年J.Peterson发现一个关于1-因子的充分
经典线性模型的普遍化——广义线性模型,成功地处理了因变量与自变量之间复杂的非线性关系,克服了经典线性模型的局限性。数据缺失现象不可避免的存在于各个领域,丢掉缺失的数据
沈敏康1926年生。中共党员。第六、七届全国人大代表,市八届、九届人大代表,常委会秘书长。曾任中共上海市委办公厅主任。1949年上海刚解放,当时沈
Shen Min Kang born in 1
Cutoff现象描述的是一些马氏链在收敛到平稳状态过程中呈现出急剧的转变的现象.已有研究表明cutoff现象的产生与谱隙和混合时有关,本硕士论文得到连续时间生灭过程separation
光纤通信以其独特的优越性成为当今信息传输的主要手段,因此光纤障碍定位及其维护的问题显得尤为重要。OTDR(光时域反射仪)是目前监测光纤障碍最为有效的工具,它是根据瑞利散射
近些年,在生物数学模型中,以生态种群动力系统为基础的研究已经得到了充分的发展,其中动力系统主要分为连续微分系统和脉冲微分系统。连续微分系统一直是上世纪的研究方向,当人们
本文研究了Banach空间中一类集值映射的度量次正则性,给出并且证明了parametric constraint系统度量次正则性的充分条件,然后将其应用到数学规划中,得到了不等式约束问题误差界