高维回归模型的若干统计推断和应用

来源 :北京工业大学 | 被引量 : 1次 | 上传用户:wangxd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着现代技术的不断发展,很多领域都产生了大量复杂的数据,其中比较典型的是高维数据。例如,在生物医学对DNA微阵列的研究中,一般情况下,DNA微阵列包含成千上万种基因,但是受实验成本较高的影响,只能得到很少的实验数据,因此就会获得基因的数量远远大于样本量的高维数据。对微阵列数据建立高维线性模型,并进行相关统计推断的研究已经变得越来越重要。方差估计是统计推断中一个非常重要的部分,它与模型的区间估计和密切相关。在经典线性模型中,在进行方差估计时,最常用的方法是最小二乘(OLS)估计方法,它是通过选择合适的系数,使得残差平方和最小,从而得到方差的估计量。而在高维数据中,特别是当p>n时,得到?~2可靠的估计量是非常具有挑战性的。如果对高维数据进行变量选择或降维后,基于新的模型,利用传统的方差估计方法进行方差估计,也会因为丢失重要变量或选择过多的无关变量,而效果很差。而且利用传统的方法得到的方差估计量的渐近分布完全依赖于第一阶段所选择的变量,方差估计量的偏差也会随着数据维数的增加而增大。因此,高维数据中方差估计就变得很重要。本文将选取大鼠眼组织的微阵列数据,利用该微阵列数据研究与导致Bardet-Biedl氏综合症相关的致病基因TRIM32相关的其它基因,对其建立高维线性模型,并利用有关的统计推断对模型进行评价。在对模型进行区间估计和显著性检验时,方差的估计量是其不可缺少的一部分。文章将采用修正的交叉验证(RCV),矩方法(MM)进行方差估计,并与传统的普通二阶段估计方法进行比较。可以看出上述两种方法削弱了传统方差估计方法因为丢失重要变量或选择过多的无关变量而导致的偏差问题,使方差估计的准确度得到了有效地提高,而且上述两种方法得到的方差估计量具有相合性和渐近正态性。同时利用新的方差估计量进行区间估计和假设检验,最终得到显著的线性回归模型。
其他文献
随着中国“走出去”战略的实施和“一带一路”倡议的推进,越来越多的中国企业开展海外投资业务,遍布各个行业和国家,但其中不乏许多企业因对海外投资的东道国制度风险因素了解不足或考虑不周使整体海外投资受阻率较高,从而引发学者们的关注。东道国制度风险无疑是企业海外投资时面临的重要问题,且制度风险具有影响范围广、期限长和差异大的特征,对企业海外投资受阻与否起到决定性作用。然而目前东道国制度风险对海外投资受阻影
在庭审语境下,不同类型的反问句往往具有不同的语用功能,它不仅可以表明说话人的态度意义及言外之意,也在语言与非语言模态的共同构建下反映出情感意义。本文根据评价理论的
大量保险数据表明,保险公司的破产主要是由于发生极端事件导致索赔额过大(或保险净损失过大)引起的,在应用概率论中,这类索赔额(或保险净损失:索赔额减去保费收入)的分布通常
天然产物是发现生物农药和新药先导化合物的重要来源,而真菌具有产生结构新颖和活性广泛的次级代谢产物的潜力。随着社会的发展,人们很难从普通生境来源的微生物中发现结构新颖的化合物。荒漠地区是一种有着干旱和寡营养的特殊生境,生活在其中的植物内生真菌受到各种生物与非生物因素的影响,能够产生结构复杂多样和生物活性广泛的次级代谢产物。另外,灵芝是一种蕈类真菌,其含有的多种药理活性成分,在我国有着古老的药用历史,
学位
目的:三氯乙烯(Trichloroethylene,TCE)是环境中广泛存在的工业污染物,会引起小鼠肝癌发生率升高,但大鼠肝癌发生率无变化。本研究探讨三氯乙烯在诱发肝癌方面的种属差异的分
背景:慢性阻塞性肺疾病(Chronic obstructive lung disease,COPD)是一种可以预防和治疗的肺部疾病,临床特征是气流受限不完全可逆,并逐步进展。COPD全球倡议组织(The Global ini
目的:通过观察补肺养荣汤联合化疗治疗气阴两虚型晚期肺腺癌患者的临床疗效,来探究本方作用机理,为中医药治疗晚期肺腺癌积累临床资料。方法:选取60例符合病例选择各项标准的患者,随机分为试验组(补肺养荣汤联合化疗组)和对照组(单纯化疗组)各30例。21天为1个周期,连续治疗2个周期后,观察两组治疗前后中医证候、T淋巴细胞亚群、KPS评分、肺癌肿瘤标志物、肿瘤病灶变化、抗肿瘤药物毒副反应六项指标变化情况,
斯义桂先生是美声唱法在中国发展的推动者,同时也是中国声乐史上第二批踏出国门前往欧美国家系统学习声乐艺术的歌唱家。1947年春留学美国后斯先生以亚洲人的身份成为在西方
近年来,随着科技的快速发展,汽车工业在国民经济和人们的日常生活中扮演着越来越重要的角色。然而,汽车工业飞速发展的同时也带来一些问题:尾气排放引起的环境污染及不可再生