关于高维总体两样本比对的一个新检验统计方法

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:dfvg43g3544
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科学的进步和社会的发展,现在统计学的应用显得尤为重要,其中一个非常重要的组成部分就是多元统计.比如说我们在面对基因研究分析中的超高维数据的时候,很多情况下我们都可以直接或间接的将检验的问题归纳为两个高维数据均值向量的比较.当数据维度远小于样本数量的时候,HotellingT2检验已经得到证明是很有效的,然而在面对维度远大于样本量的时候,传统的HotellingT2检验的功效已经很难保证了.有不少学者已经进行了相关研究,主要分为两方面,一类是比较两向量所有元素差异的和的方式,(通常是元素差的平方和的形式),另一类则是基于差异分量最大值的形式.在本文中,首先介绍这两类方法比较有代表性的两种检验:Srivastava(2013)和Cai(2014),然后我们提出了一种基于列分量中最大和最小平方和的统计量用于检验稀疏双样本情况下高维数据的向量等价性.该方法利用不同方向信息的最大最小列分量构造统计量进行检验,期望获得比现有方法更大的功效,并且对该方法在理论上进行了证明.在某些正则条件下,得到了该方法的渐近分布,然后选取了两种比较有代表性的检验进行大量的模拟实验,最后通过对基因表达随年龄变化规律的真实数据分析,验证了我们提出的方法的优越性.
其他文献
冷战结束以来,中俄朝三国在东北亚地区面临相似的困境、在朝鲜半岛问题上拥有相近的立场,再加上传统的友谊,三国走向一起可谓水到渠成、顺理成章。中国拒绝“零和游戏”,面对
目的:研究Nesfatin-1大鼠大脑中动脉缺血再灌注后(Middle cerebral artery occlusion rePerfusion MCAO/R)CAMKⅡ和PSD95蛋白表达的影响,探讨Nesfatin-1对大鼠脑缺血再灌注有
本文以人的本源性、“人本位”、“后人类学”为核心理论,首先析取梳理科幻片中的拯救情节,然后阐释拯救情节中的“多个人”——拯救者与被拯救者关系,最后分析拯救情节中的
股东代表诉讼是当公司怠于追究损害公司利益的对象时,符合条件的股东以自己的名义代表公司提起诉讼的制度。为了平衡公司的法人独立性和赋予股东权利保护公司利益的迫切性,股
随着无线移动通信技术的发展,移动网络用户规模不断扩大。互联网行业的高速发展,也促使部分传统行业与互联网应用相结合,兴起了许多新型的移动互联网服务。在线办公、在线教育、视频直播等依托于多媒体视频传输的应用便是其中的一个典型案例。然而,随着网络服务需求的增加以及入网智能设备的增加,现有频谱资源越发紧缺。然而,现有的授权服务频段的频谱利用率并不高,通过频谱共享可以有效地提升无线通信系统潜在的系统容量。本
随着大数据时代的发展,生活中记录的数据呈现出海量化、多样化和非规则化等特点。其中复杂的非规则的分布式网络结构广泛存在于现实当中,例如,疾病传播网络,社交网络,全球海平面温度网络,传感器温度网络等。对于复杂的非规则的网络数据,传统数字信号处理难以对其分析处理,因此发展出了图信号处理。在传统数字信号处理中,多尺度变换方法可以在不同分辨率水平下揭示关于信号的结构信息。同时,它们能提供一种粗到细分析方法,
邮轮旅客人身损害事故纠纷在审判实务中屡屡发生,由于船票销售模式、旅客人身损害原因的不同,邮轮专门立法的缺失,导致邮轮旅客、邮轮公司与旅行社之间的法律关系复杂。因此,
洛阳与文学的关系已经众多学者进行研究,但关于洛阳意象的研究并不多。洛阳在汉代和唐代的地位不尽相同,汉代对于洛阳又具有特殊意义,频繁出现在汉唐两个朝代文学作品中的洛
本文以罗璟为研究对象,正文共计三章,主要内容包括罗璟的生平、家族成员、著述情况、交游情况及以《罗冰玉先生文集》为中心的罗璟诗文创作研究。附录有罗璟年谱与《罗冰玉先
无线传感器网络(Wireless Sensor Networks,WSNs)是一种由大量传感器节点通过单跳或者多跳的方式进行协同感知而构成的自组织网络,目前已被成功应用于军事、农业、医疗、环境