基于弹性网技术下的加速失效时间模型的规范化估计

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:fangduohui129
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对高维度基因数据研究的一个重要目标就是识别和疾病的发生和发展有关的基因标记,其中十分有代表性的例子是微阵列数据的预后分析。从微阵列基因表达数据中搜寻显著相关的生物标记是十分困难的。由于基因表达数据的高维度性质使得标准的生存分析技术无法直接应用其中,而且在被研究的数以千计的基因中,只有很小的一部分基因是与疾病有关的。当研究的对象为时间数据时,往往由于删失情况的存在而无法得到准确的数据,因而筛选相关的基因变得十分具有挑战性。我们提出利用弹性网惩罚规范化加速失效模型的Gehan估计方法,从而筛选出对生存时间有重要影响的基因数据,采用和LASSO相似的算法得到估计值,并且证明了估计值的性质。和已经存在的基于逆概率加权和Buckley and James估计不同,本文所提出的方法不要求对删失数据的额外假设,使得本方法更加具有普遍适用性。在本文中我们做了大量数字模拟,其中部分模拟采用Cai,T.于2009年发表的文章中对模拟研究的设置,从而对所提方法在有限样本上进行了验证。通过和Cai,T.的方法进行对比可以发现本文方法在筛选变量的能力上有所提高,并且能够处理变量个数大于样本观测值的情况,这是Cai,T.的方法所无法解决的。但是本文方法也存在着一定的缺陷,如在协变量间相关系数较大时均方误差和Cai,T.相比较大等。最后我们将所提方法用于Beer, D文章中的肺腺癌实验研究数据,筛选出与肺腺癌有关联的基因数据。在最终筛选出的数据中我们选出了Beer, D文章所没有找出的基因,并且通过t检验表明这些基因对病人是否患病有显著影响,当然所选基因是否与疾病真正相关仍需要后续临床研究的证明。
其他文献
2015年7月9-12日,宁夏小巨人机床有限公司(以下简称“小巨人”)在银川举办了MTF2015制造未来展示会,来自相关行业千余人参加了此次活动。全面进击亮点满载MTF自2004年创办以
期刊
根据12321网络不良与垃圾信息举报受理中心(www.12321.cn)接到网民举报的短信、邮件、网站等信息,2019年3月,被举报的钓鱼网站前十名如下:rn被举报最多的是假冒苹果公司的钓
期刊
职业教育的特点,决定了中职语文教学必须要以专业为本,在教学实践中与专业课进行有机结合,才能充分发挥出语文教育在提高中职学生综合职业能力和素质的作用。本文主要分析了中职
2015年7月31日,大连蒂业技凯瓦轴工业有限公司在大连新工厂内举办了盛大的新工厂开业典礼.rn新工厂情况rn首先由大连蒂业技凯瓦轴工业有限公司的总经理大野先生介绍新工厂情
期刊
近年来,由于房地产市场的高速发展,房价突飞猛进的上涨,所以在二手房买卖中出现了原房主拒绝继续履行合同的情形.而在后期,由于政府调控力度的加大,买房人也出现以各种理由解
教育督导的最终目的是通过与学校及其老师合作,促进学生的成长和发展。督导员要熟练掌握相应的关于学生的成长模式,并将其与学校和教师教学联系;此外,督导员还要了解学生的生活环
新甘石联网工程是四川省电力公司的2012年的一号工程,该工程的建设将打破甘孜州电网发展瓶颈,解决高海拔的牧区县广大牧民的缺电问题,使农牧民生活“点得亮、步步高”。 Nep
信息技术的应用是企业纵向边界变动的重要影响因素,21世纪以来随着数字化技术的应用以及全球化进程的加快,企业纵向边界的影响因素更加复杂,信息技术的发展改变了企业生产经营活
好的复习在高考前至关重要,而在复习中有自己的思维更是重中之重。所以在高考复习过程中有意识自觉地培养学生的思维能力,优化学生的思维品质,把思维能力的培养和提高放在一个重
对以西江为水源的某水厂及其各处理工艺单元出水浊度进行为期1年的现场监测研究,发现原水浊度在夏秋高温季节变化较剧烈,水厂常规处理工艺对浊度的平均去除率约为98.83%,其中