回归中降维模型的估计与检验

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:seuarchi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大规模数据降维技术是统计中一个非常重要的问题,而充分降维是这个领域中一个非常重要的工具。充分降维的思想是:在不假定任何参数模型以及不损失条件分布F(Y|X)中所含有的信息的前提下,通过数据中高维的自变量的一些线性组合来达到降维的目的。在我的论文中,主要考察回归中的充分降维问题。 在论文的第一部分,我们将考察数据集的充分降维的可能性的问题,即检验如下模型是否充分拟合数据 H0:Y(?)X|BTX.这里,Y是一维的响应变量,X是p×1的自变量,B是一个p×K的矩阵,记号“(?)”表示独立。我们采用Score检验的思想,采用残差的加权和的形式构造一个Score type检验统计量。我们使用的“残差”实际上是Y的密度函数与X的某些特定投影的密度函数的差异。我们采用核函数来估计这一些密度函数,因此,构造的Score type检验统计量是不依赖随机变量的分布的。另外,在对立假设已知的情况下,权函数的引入能保证Score检验的最优性。受Score检验统计量的构造的启发,在对立假设存在多种可能的情况下,我们构造了Maxmin检验。这两个检验都能检查对立假设以n1/2的速度趋向原假设的情形。关于这个检验另一个重要的应用便是决定模型的结构维数K,即我们至少需要多少个投影方向就能提取条件分布的全部信息的问题。 在如上的条件模型成立的条件下,文献上有大量的充分降维的办法用于估计B。在所有这些方法中,基于X对于Y的逆回归方法,而不是通常的Y对X的回归,比如说切片逆回归(SIR,Li 1991)以及切片平均方差估计(SAVE,Cook and Weisberg 1991),是非常有效的两个方法。为了估计切片逆回归的核矩阵,Li(1991)提出了用切片估计的思想。这个方法非常简单并且效果很好。当切片数n1/2到n/2这个范围以内变化的时候,Zhu and Ng(1995)证明了切片估计的渐近正态性以n1/2的速度成立。遗憾的是,Liand Zhu(2004)在用切片的想法来估计切片平均方差的核矩阵时,得到了完全不一样的渐近性质。因而,在本文的第二部分,我们将用核估计来估计切片平均方差的核矩阵,并指出了核估计和切片估计的不同之处。为得到n1/2的渐近正态性,在使用核函数的时候,我们需要undersmoothing,即选用一个比较小的窗宽。为此,我们提出了一个data-driven的办法来选择窗宽。另外,借用BIC的思想,我们提出了一个修改的准则来决定模型的结构维数。这个准则使用起来非常简单,并且只需要核矩阵的特征值收敛就可以保证估计的结构维数是收敛到真实的结构维数了。 由于条件方差对于模型的建立以及数据的波动的描述都是非常重要的,因而,在论文的最后部分,我们提出了用中心方差空间(CVS)的想法来提取回归中条件方差的
其他文献
重韵的出现是学术界用后来产生的等韵名目框范《切韵》韵类的结果。韵书里重韵的分立是当时的文学语言系统中实际读音有别的反映。重韵现象不宜用来作为《切韵》是综合音系的
真是一个理想的好天气。就是千挑百选,也找不到一个比今天开游园会更好的日子了。天空万里无云,天气和煦温暖,而且沒有一丝儿风。只是蔚蓝色的天空罩着一层被阳光染成了淡淡
研究目的通过检测HBV感染者外周血T淋巴细胞表面共刺激分子和T淋巴细胞亚群,探讨其在HBV感染发展中的作用及与HBV-DNA的关系。研究方法采用病例对照研究的方法,根据本研究的
我国非物质文化遗产保护工作起步较晚,缺少强有力的理论支持和经验指导,造成保护效果差强人意。针对这一现象,文章提出保护工作要在调研的基础上,考虑非物质文化遗产保护工程
在人类文明飞速发展、科学技术日新月异的今天,贫困问题依然困扰着不少国家。新世纪伊始,189个国家便在联合国首脑会议上签署了《联合国千年宣言》,正式承诺要将全球贫困水平
提出了一种新颖的病毒图像分类方法.该方法主要利用PCANet提取病毒图像的特征,从而达到提高分类正确率的目的.首先,利用双三次插值对实验数据进行预处理.然后,利用PCANet提取
在当前高校与学生法律关系转型期,我国高校学生组织在章程的制定、领导人的产生、运行方式等方面的自治水平比较高,但在经费、校政参与、监督等方面又存在诸多限制。同时,从法律
随着安防行业飞速发展,目前的GB/T 28181-2011标准已经不能满足当前的互联网环境了,因此,GB/T 28181-2016标准呼之欲出。GB/T 28181-2011明确了视频监控体系的组织架构,包括
我国尾矿库数量众多,分布广泛,在低含水量条件下,风力作用引起的尾砂扬尘会对周边环境造成污染。而尾矿库表面积大,含水量变化快,传统的含水量监测方法效率低、安全性差、成
分数阶微分方程的特点是含有非整数阶导数,能非常有效的描述各种各样的物质的记忆和遗传性质,在物理,数学,机械工程,生物,电子工程,控制理论和金融等领域发挥越来越重要的作