高维数据部分线性模型的变量选择

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:whhuazi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本论文主要研究在高维数据下部分线性模型的变量选择问题.对于高维数据,本文考虑了两种情形,一种是参数维数发散的情形,另一种是超高维,即参数维数远远大于样本量的情形,对于参数维数发散的情形,我们考虑了误差分布为重尾分布的情况,利用更加稳健的非凹惩罚M估计方法完成变量选择过程并得到系数的估计.本文采用SCAD惩罚作为惩罚函数,用局部二次逼近方法给出了迭代算法,并证明了估计的收敛速度、稀疏性和渐近正态性.随后,通过数值模拟对所提方法的有限样本性质进行了研究,对于第二类超高维数据,我们采用了降维的思想,首先通过求条件期望的方法将部分线性模型化为线性模型,并用核估计方法对线性模型中的未知项进行估计,之后利用SIS方法将参数维数降至样本量以下,最后采用SCAD惩罚估计方法进行变量选择.最后,通过一个数值模拟分析来说明本文方法的优良性。  本文的特色主要体现在以下两个方面:  (1)本文采用了更加稳健的非凹惩罚M估计方法针对部分线性模型进行变量选择,该方法可以适用于误差分布为重尾分布的情况。  (2)本文考虑了协变量个数远远大于样本量的情况,提出了在这类高维数据下部分线性模型的变量选择方法。
其他文献
本文研究了基差在大宗商品现货和期货价格波动性过程中的影响,并把基差的季节性考虑进去。文章把基差与历年基差的平均值的差定义为广义基差,并分别其正部和负部的影响,构建
中组部召开的领导班子思想政治建设座谈会和全国干部教育培训工作会议,非常重要,非常及时,对于加强换届后各级领导班子思想政治建设、推进新一轮大规模培训干部工作,具有重要
提出了一种结合信道状况考虑的(m,k)-firm弱硬实时调度算法.该算法将消息划分为强制(mandatory)和可选(optional)2种类型,并优先调度强制消息.消息的类型由线下静态分配和线
我们知道在金融界最著名的期权定价公式是由Black和Scholes在1973年提出的。它是假设在完全市场情况下,资产价格连续变化,对数资产收益是服从正态分布的。但在实际市场中,突发事
排序问题又称时间表理论,是组合优化的重要组成部分.它来源于我们实际的生产生活,并广泛应用于科学管理、航海运输、工程机技术等诸多领域.随着科技的进步和同行产业间竞争的
本文的主要目的是评价蒙特卡洛(MC)方法在期权定价中的应用。特别地,论文对最小二乘蒙特卡洛(LSMC)方法在美式期权定价中的应用进行了分析,该方法LongstaffandSchwartz提出的
本文主要研究了排序理论中比较新型的排序问题——同时加工排序,它属于现代排序论的范畴,在前人研究的基础上和图论内容结合在一起进行讨论,指工件在一台批加工机器上进行加工,且
布尔网络在生物调控网络中有着相当多的实际应用,生物调控网络在生物系统的生命活动中处于核心地位,其结构和功能是系统生物学研究的重要课题。其正向工程,即通过生物学方法
有限元梯度重构技术是指在原来问题的有限元解基础上通过某种方法构造出更好的梯度,它在理论和实际中都有着重要的应用。它除了可以提供比原来有限元解梯度更好的结果,还可以用
本文主要研究考虑变现决策权的股权估值模型。由于公司股东不但享有剩余价值分配权,同时享有对公司经营政策和财务政策的决策权,其中变现决策权赋予了股东在公司未来经营产生