生存数据统计模型的变量选择方法

来源 :华东师范大学 | 被引量 : 0次 | 上传用户：xiahou001

【摘要】

：

生存数据广泛出现在生物医学、经济金融、保险精算、可靠性工程等领域。由于生存数据一般都存在删失,完全数据下的统计方法几乎都会失效。因此,如何对其统计分析一直是一个方

【作者】

：

刘吉彩

【出处】

：

华东师范大学

【发表日期】

：

2014年期

【关键词】

：

生存分析删失数据多元生存时间数据高维数据变量选择正则化方法非凸惩罚组变量选择两水平选择可加危险率模型边际危险率模型部分线性模型部分变系数

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

生存数据广泛出现在生物医学、经济金融、保险精算、可靠性工程等领域。由于生存数据一般都存在删失,完全数据下的统计方法几乎都会失效。因此,如何对其统计分析一直是一个方兴未艾的主题。而且,在许多的实际问题中,往往会观察到多个不同的生存时间,我们称为多元生存时间数据。该数据的主要特点是各类生存时间之间可能是相依性的。由于这种复杂的相依性和删失的存在,使得对多元生存时间数据的统计分析变得比较困难。然而,因其广泛的实用性价值,引起了越来越多学者的关注。随着现代科技的发展,海量数据随处可见,特别是在生物信息、航空航天、人工智能以及电子商务等方面。这些海量数据的特点一般是维数很高、噪声很大。如何从这种高维数据中提取出有用信息是人们最为关心的问题。变量选择作为一种重要的信息提取工具,受到了统计学家们高度的重视。然而,经典的变量选择方法面对如此的高维数据有可能完全失去作用。为此,统计学家提出了各种的改进方法。其中,最为流行的方法就是正则化方法,如LASSO、SCAD以及MCP等。本文主要在生存数据,包括多元生存时间数据框架下研究正则化变量选择方法的三个问题：第一,结构化协变量的选择问题；第二,超高维,即p》n下的变量选择；第三,半参数回归模型的变量选择。在本文的第二章中,基于可加危险率模型我们讨论具有组结构协变量的变量选择问题。研究的目标是同时识别重要的组内和组间变量。为此,我们考虑了一个层次化的惩罚方法。在协变量维数发散情况下,我们证明了所提估计的大样本性质。数值计算结果表明,在协变量具有组结构情况下,该方法优于现有的方法,如LASSO, SCAD和Adaptive LASSO等。最后,我们使用所提方法分析了一组基因数据。本文的第三章主要研究,在协变量的维数p=O(exp(nδ))其中δ>0情况下,可加危险率模型的一类非凸惩罚方法的大样本性质。在类似于Zhao and Yu[97]的不可忽略性条件(Irrepresentable Condition)下,我们证明了所提估计具有强Oracle性质。有趣的是该性质对LASSO同样适合。另外,我们也建立了该非凸惩罚估计(此时不包括LASSO)的渐近正态性。本文的第四章以及第五章基于多元生存时间数据分别考虑部分变系数、部分线性比例危险率回归模型的变量选择问题。对于参数部分协变量的选择和估计,我们主要采用一步回切估计的思想。对于非参部分的重要性识别,主要是通过假设检验完成。在一些正则化条件下,我们分别获得了相应估计的Oracle性质。模拟结果证实所提方法具有很好的变量选择效果。最后,我们分别将该方法应用于结肠癌数据统计分析中。

其他文献

卷烟制丝线工艺设备技改趋势小议

综述了我国近年来在卷烟制丝线相关工艺设备方面的改造成果,以期为现有制丝线流程的优化、设备的调整与更新以及管理方法的调整提供借鉴与参考。

期刊

卷烟制丝线工艺设备分组加工

高校资金结算中心应当撤消

<正> 随着我国市场经济的逐步建立和完善,高校资金结算中心的功能逐渐萎缩,资金效益不明显,财务风险增大,已不适应社会发展的需要。因此,笔者建议撤消高校资金结算中心。

期刊

高校资金结算中心撤消

马克思分工思想的本体论意义

传统本体论作为与现象世界分离的纯粹原理体系,与现象界的鸿沟难以弥合,以致产生了本体如何产生或作用于现象世界,超验的本体如何变为现实的有生气的东西,从而达到经验与超验

学位

马克思本体实践真正分工人的存在的二重性

马克思恩格斯国际关系思想研究

马克思恩格斯的国际关系思想内容丰富,具有深入挖掘的价值,目前国内有许多学者研究马克思主义国际关系理论,但是马恩本人的国际关系思想却很少有人关注,研究马恩国际关系思想

学位

马克思恩格斯国际关系思想生产方式国际关系理论逻辑启示

硬化钢钢轨

采用硬化钢钢轨可降低钢轨磨耗，提高钢轨的抗疲劳能力，从而降低维修支出。根据美国运输试验中心（TTCI）的研究，采用更硬的钢轨可运行大轴重车辆，同时减少钢轨的磨耗和疲劳损伤率。该

期刊

钢轨磨耗硬化试验中心滚动接触疲劳断裂性能抗疲劳损伤率美国轴重车辆

按揭购入固定资产的会计处理

按揭是指货物购买人为解决购买商品资金不足的问题，而在销售人的配合下，以所购货物产权做抵押向银行贷款，取得贷款来支付货款，以后购货人按期向银行支付本金和利息的一种法律行为

期刊

按揭固定资产会计核算抵押贷款资产使用权融资租赁资产管理

菜用型甘薯中硒的累积及分布规律研究

试验采用不同品种甘薯进行无土栽培,通过人工喷施不同浓度硒溶液,比较不同硒浓度下相同品种甘薯中硒含量和分布以及相同硒浓度下不同品种甘薯中硒含量和分布。结果表明,无土

期刊

菜用甘薯硒含量累积分布规律

“米”从何处来——初中作文教学有效性探究

ue＊M＃’＃dkB4＃＃8＃”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:（100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技

期刊

写作现状找“米”

铁路货车的新发展

<正> 铁路货车是以运输货物为主要目的的装载车辆。目前我国全国铁路拥有货车超过45万辆,承担的货物周围量占全国总货物周围量的50％以上。可见,我国铁路货车在全国交通运输市

期刊

铁路货车铁路运输货物运输新产品

多元线性分析麦芽质量指标与啤酒风味稳定性的关系

期刊

大麦啤酒麦芽多酚多元线性回归抗自由基能力壬烯醛潜力

生存数据统计模型的变量选择方法

与本文相关的学术论文