【摘 要】
:
诸如微阵列中基因表达值和单核苷酸多态性研究等,高维数据的出现给传统的多元统计方法和理论带来了极大的挑战.以假设检验问题为例,一方面,当变量维数太大时,经典的检验统计
论文部分内容阅读
诸如微阵列中基因表达值和单核苷酸多态性研究等,高维数据的出现给传统的多元统计方法和理论带来了极大的挑战.以假设检验问题为例,一方面,当变量维数太大时,经典的检验统计量从形式上来说已经失去了定义,无法使用;另一方面,由于经典的统计极限理论是建立在样本容量n远远大于变量维数p的假设下,所以当维数相对于样本量很大时,经典的极限理论结果不再适用.在高维数据的背景下如何解决各种统计问题,是目前非常热门的研究领域.本文以总体均值的假设检验问题为例,提出了一些新的方法来解决高维数据带来的问题.为了能够得到可以使用的检验统计量,一种处理方法是假设变量间具有独立性,这种做法在高维数据的分类问题中也有使用,见Bickel和Levina(2004)[92].使用独立性假设,Srivastava和Du(2008)[66]基于Hotelling检验统计量,把样本协方差矩阵替换为样本协方差矩阵的对角线上的元素组成的方差阵,得到了可以应用于高维数据的检验统计量.但是这种处理忽略了变量间的相关性信息,为了研究加入相关性信息是否会大大增加检验的功效这一问题,我们对SD检验进行了修正,得到了一个新的检验统计量,在一定条件下得到了检验统计量的渐进分布和渐近功效.模拟表明,利用变量间的相关性信息可以显著提高检验的功效.在多元统计分析中,似然比检验是最常用的检验方法.我们深入研究了似然比检验在高维数据下失去定义的原因,然后借助并交原理,利用似然函数得到了总体均值假设的广义似然比检验.经过分析,我们发现广义似然比检验可以看成是经典似然比检验在高维数据下的推广.在p-渐近框架下,我们得到了广义似然比检验统计量在原假设下的渐近分布,并在一定条件下得到了渐近功效.为了弥补渐近理论在高维数据下的不足,我们还使用了随机化的方法对广义似然比检验统计量进行了深入研究,并和其他检验进行了比较.模拟研究表明,新提出的广义似然比检验在大多数情形下都具有极大的优越性.
其他文献
1,3-丁二烯(BD)作为主要的石油化工产品之一,广泛应用于合成橡胶、精细化工等领域。BD具有共轭双键,化学性质活泼,容易发生氧化反应和聚合反应。氧化和聚合反应生成的过氧化物
<正>为深化人才培养模式改革,明确市场营销专业定位,探索医药院校市场营销专业人才培养模式,对市场营销专业人才培养方案的优化进行了调研。1对象与方法1.1调研对象调研单位
随着社会生产力的发展,人们逐渐从繁重的劳动中解放出来,闲暇时间的增多使得人们越来越关注闲暇。近年来,学术界对不同主体的闲暇生活研究层出不穷,涉及各个社会阶层群体,例
<正>学科德育是通过学科教学重视德育与智育的结合,提高教学质量的实践活动。科学教育是培养有德的高素质学生,因此学生的成长离不开德育教育,小学的科学教学也应渗透德育,让
非我执和无我是积极心理学领域的两个新概念。为了修订出适合于中国文化背景下的非我执量表和无我量表,本研究基于国外开发的非我执量表和无我量表,修订了中文版的非我执量表
□有危机,就有应对危机的办法。有人说,日本出版人是愈挫愈勇的。他们最大的特点,就是能在危机中求变。□见城彻认为编辑应该是"无中生有,把人的精神这一无形的东西做成书这
在中国现代文学史中,一部分作家极力反抗传统,但他们始终就在传统之中;另一部分作家试图建构现代文化,但他们或者急于建构而不得,或者发现现代性也是一种有着弊端与缺憾的悖
目的:观察酸枣仁汤联合栀子豉汤治疗焦虑性失眠的临床疗效及对多导睡眠图(PSG)的影响。方法:120例患者随机分为两组,治疗组60例,对照组60例。治疗组给予酸枣仁汤合栀子豉汤煎
图表示学习是机器学习领域的一项重要研究任务,并被广泛应用于计算机视觉的各种应用问题中。通过图表示学习可以深入地了解结构化数据信息。传统的机器学习方法通常使用度统计或者核函数的启发式方法来提取图的结构信息。随着深度学习和非线性降维技术的发展,通过自学习将图结构编码为低维嵌入的方法越来越多。这些方法地提出可以更好地利用图结构,更深入地挖掘数据信息。在很多实际的问题中,由于手动标记数据的成本高昂,标记数
目的分析高血压性脑出血患者手术后康复护理的应用效果。方法选择2013年3月至2016年2月我院收治的高血压性脑出血手术患者80例为研究对象,分为观察组和对照组,每组40例。其中