高维数据下总体均值的假设检验问题

来源 :北京理工大学 | 被引量 : 3次 | 上传用户：lijie04113209

【摘要】

：

诸如微阵列中基因表达值和单核苷酸多态性研究等,高维数据的出现给传统的多元统计方法和理论带来了极大的挑战.以假设检验问题为例,一方面,当变量维数太大时,经典的检验统计

【作者】

：

赵俊光

【出处】

：

北京理工大学

【发表日期】

：

2016年01期

【关键词】

：

高维数据霍特林检验广义似然比 p-渐近理论并交原理

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

诸如微阵列中基因表达值和单核苷酸多态性研究等,高维数据的出现给传统的多元统计方法和理论带来了极大的挑战.以假设检验问题为例,一方面,当变量维数太大时,经典的检验统计量从形式上来说已经失去了定义,无法使用;另一方面,由于经典的统计极限理论是建立在样本容量n远远大于变量维数p的假设下,所以当维数相对于样本量很大时,经典的极限理论结果不再适用.在高维数据的背景下如何解决各种统计问题,是目前非常热门的研究领域.本文以总体均值的假设检验问题为例,提出了一些新的方法来解决高维数据带来的问题.为了能够得到可以使用的检验统计量,一种处理方法是假设变量间具有独立性,这种做法在高维数据的分类问题中也有使用,见Bickel和Levina(2004)[92].使用独立性假设,Srivastava和Du(2008)[66]基于Hotelling检验统计量,把样本协方差矩阵替换为样本协方差矩阵的对角线上的元素组成的方差阵,得到了可以应用于高维数据的检验统计量.但是这种处理忽略了变量间的相关性信息,为了研究加入相关性信息是否会大大增加检验的功效这一问题,我们对SD检验进行了修正,得到了一个新的检验统计量,在一定条件下得到了检验统计量的渐进分布和渐近功效.模拟表明,利用变量间的相关性信息可以显著提高检验的功效.在多元统计分析中,似然比检验是最常用的检验方法.我们深入研究了似然比检验在高维数据下失去定义的原因,然后借助并交原理,利用似然函数得到了总体均值假设的广义似然比检验.经过分析,我们发现广义似然比检验可以看成是经典似然比检验在高维数据下的推广.在p-渐近框架下,我们得到了广义似然比检验统计量在原假设下的渐近分布,并在一定条件下得到了渐近功效.为了弥补渐近理论在高维数据下的不足,我们还使用了随机化的方法对广义似然比检验统计量进行了深入研究,并和其他检验进行了比较.模拟研究表明,新提出的广义似然比检验在大多数情形下都具有极大的优越性.

其他文献

1,3-丁二烯热稳定性和聚合反应研究

1,3-丁二烯（BD）作为主要的石油化工产品之一,广泛应用于合成橡胶、精细化工等领域。BD具有共轭双键,化学性质活泼,容易发生氧化反应和聚合反应。氧化和聚合反应生成的过氧化物

学位

13-丁二烯MCPVT稳定性聚合反应过氧化物引发剂

医药营销专业人才培养方案优化调研报告

<正>为深化人才培养模式改革,明确市场营销专业定位,探索医药院校市场营销专业人才培养模式,对市场营销专业人才培养方案的优化进行了调研。1对象与方法1.1调研对象调研单位

期刊

医药院校市场营销培养方案调研报告

提高建筑业女工闲暇生活质量的社会工作实践研究

随着社会生产力的发展,人们逐渐从繁重的劳动中解放出来,闲暇时间的增多使得人们越来越关注闲暇。近年来,学术界对不同主体的闲暇生活研究层出不穷,涉及各个社会阶层群体,例

学位

女工闲暇生活社会工作

小学科学教学中的德育渗透探析

<正>学科德育是通过学科教学重视德育与智育的结合,提高教学质量的实践活动。科学教育是培养有德的高素质学生,因此学生的成长离不开德育教育,小学的科学教学也应渗透德育,让

会议

非我执量表和无我量表的修订及信、效度研究

非我执和无我是积极心理学领域的两个新概念。为了修订出适合于中国文化背景下的非我执量表和无我量表,本研究基于国外开发的非我执量表和无我量表,修订了中文版的非我执量表

学位

非我执量表无我量表正念训练信度效度

日本人的出版精神

□有危机,就有应对危机的办法。有人说,日本出版人是愈挫愈勇的。他们最大的特点,就是能在危机中求变。□见城彻认为编辑应该是"无中生有,把人的精神这一无形的东西做成书这

期刊

应对危机吉川英治《三国志》商务印书馆

回瞥与怨恨:中国现代七大作家的现代性体验

在中国现代文学史中,一部分作家极力反抗传统,但他们始终就在传统之中;另一部分作家试图建构现代文化,但他们或者急于建构而不得,或者发现现代性也是一种有着弊端与缺憾的悖

期刊

现代性体验文化反思徐士秀《水藻行》沈从文

酸枣仁汤联合栀子豉汤治疗焦虑性失眠的临床研究

目的:观察酸枣仁汤联合栀子豉汤治疗焦虑性失眠的临床疗效及对多导睡眠图(PSG)的影响。方法:120例患者随机分为两组,治疗组60例,对照组60例。治疗组给予酸枣仁汤合栀子豉汤煎

会议

失眠症焦虑酸枣仁汤栀子豉汤

图网络表示与半监督学习模型及其在目标跟踪中的应用

图表示学习是机器学习领域的一项重要研究任务,并被广泛应用于计算机视觉的各种应用问题中。通过图表示学习可以深入地了解结构化数据信息。传统的机器学习方法通常使用度统计或者核函数的启发式方法来提取图的结构信息。随着深度学习和非线性降维技术的发展,通过自学习将图结构编码为低维嵌入的方法越来越多。这些方法地提出可以更好地利用图结构,更深入地挖掘数据信息。在很多实际的问题中,由于手动标记数据的成本高昂,标记数

学位

图神经网络半监督学习目标跟踪弹性流形排序

高血压性脑出血患者应用术后康复护理的临床效果

目的分析高血压性脑出血患者手术后康复护理的应用效果。方法选择2013年3月至2016年2月我院收治的高血压性脑出血手术患者80例为研究对象,分为观察组和对照组,每组40例。其中

期刊

高血压性脑出血神经功能缺陷评分术后康复护理

高维数据下总体均值的假设检验问题

与本文相关的学术论文