高维数据的统计推断

来源 :浙江大学 | 被引量 : 0次 | 上传用户:wangcong1001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高维数据分析被广泛地应用于各个领域,如计算生物学,医学,金融分析,风险控制等。在本文中,我们将致力于统计中的高维数据分析,具体地,我们主要考虑以下两个方面:高维假设检验和高维变量选择。首先,我们将简要介绍一下统计中的高维数据分析的现状。其次,我们考虑高维情形下,变量集之间独立性的假设检验问题。我们将给出一个新的检验统计量,并且,在样本量和维数一起趋于无穷的情形下,给出该统计量在原假设成立下的渐近分布。因此,该统计量可以应用于维数与样本量接近,甚至大于样本量的情形。接着,我们研究了高维情形下自适应Lasso (Adaptive Lasso)的性质。特别地,我们考虑线性回归模型的误差项具有比高斯型尾概率分布更一般的分布,即只要求误差项具有有限的2k阶矩,k>0。在此条件下,我们证明了自适应Lasso仍具有Oracle’性质。进一步,我们给出了一种两步骤(Two-step)的方法,来处理超高维数据。之后,我们考虑了高维情形下自适应集群Lasso (Adaptive group Lasso)的性质。类似于自适应Lasso,我们证明了高维情形下自适应集群Lasso的Oracle’性质。最后,我们研究了无穷方差自回归模型的变量选择问题。特别地,我们采用两种不同的惩罚方法来同时进行变量选择和参数估计。我们先采用自权重最小绝对偏差(SLAD)作为惩罚方法中的损失函数,结合自适应Lasso来建模,并证明了由此得到的估计具有模型选择的相合性和渐近正态性。然后,我们指出,若采用普通的最小绝对偏差(LAD)作为损失函数,能够有效地提高变量选择的精度,但是,我们不能得到最终估计的渐近分布。因此,如以变量选择为目的,后者更佳,但若需要对模型进行进一步的统计推断,则前者更适合。
其他文献
在油田的井下采油作业过程中,井下工具质量的好坏会直接影响到原油的生产,加上近年来,由于致力于油田生产服务的厂家为了充分占领市场并在市场中占有一席之地,加大了对于各种
大学生骨干日渐成为大学生群体中一支强大的队伍,无论从思想、科研、文体、社会活动等各方面都起着表率作用。大学生骨干家访也成为大学生骨干积极影响大学生群体的一个载体,
手机和电子产品外壳的轻薄化是一种发展趋势。目前美国苹果公司、韩国三星公司和中国华为公司在一些新型大屏幕高端智能手机采用高强度7075和6013铝合金制造机身,提高机身的
近年来,随着高维问题研究的深入,模型选择的重要性更加凸显,但是因为模型选择存在不确定性,所以根据所选择的“最优模型”进行预测带来的风险就变的不容忽视,因此降低模型选
本文设计实现了一种基于MATLAB GUI的图像处理实验系统。该系统可实现图像的预处理、图像分割、形态学处理等功能,用户可运用该系统方便地对图像进行相应的处理。经过多次测
该专题在介绍气动阀岛的起源和发展的基础上,介绍了气动阀岛的结构类型及其对应的应用场合,并重点介绍代表最先进技术的模块化智能型气动阀岛的特点和应用案例,展望气动阀岛
叙迹了残余应力的产生、危害、消除方法和用盲孔法测量残余应力的原理,并用两个抽油机减速箱下箱体作对比实验,一个用退火方法消除残余应力,一个用低频共振方法消除残余应力。在
长远来看,未来随着城市化的快速推进,新型农村社区建设会成为我国农村一个很重要的管理模式。未来国家应该在各地试点的基础上,通过大量的调研,总结出一些共性的东西,出台国
目的:探讨超微针刀立体松解法治疗颈心综合症的临床疗效。方法:运用超微针刀立体松解法松解颈、胸、背部病变筋结点。结果:治愈42例,显效12例,有效4例,总有效率为100%。结论:
目的探讨先天性宫颈阴道闭锁初次手术失败的影响因素及再次手术的处理。方法对2006年5月~2012年2月5例先天性宫颈阴道闭锁外院初次手术失败均以术后周期性持续性腹痛转入我院