生存数据模型的变量选择

来源 :中南大学 | 被引量 : 0次 | 上传用户:hzjojo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生存分析是20世纪70年代以来发展起来的数理统计新分支,着重对生存数据进行统计分析研究的一门学科。在许多学科领域,如医学、生物学、保险精算学、可靠性工程学、公共卫生学、经济学以及人口统计学等领域,都存在对某给定事件发生的时间进行估计和预测的问题。生存分析就是对一个或多个非负随机变量进行统计分析,即根据观测到的数据对其性能进行统计推断的学科。基于统计学方法的生存分析的内容以及到目前为止的理论发展可以归纳如下:基本的数据类型,参数模型和极大似然估计,非参数方法,半参数模型,删失数据的回归分析、假设检验以及多变量生存分析等。对于COX模型,经过一个未知的单调变换后等于协变量的线性函数加上一个随机误差,随机误差可以是已知的也可以是未知的,即其线性变换模型为g(T)=-β’Z+ε.对于这个模型本文先求出变换函数g(·)的估计,进而利用lasso方法将生存数据模型系数进行压缩并且使某些系数变为0,再利用AIC或BIC准则将为0的系数截去,从而确定模型的阶数,进而达到变量选择的目的;并根据改进的fused lasso运用Monte Carlo方法确定调整参数,使模型的波动性变小,比较稳定。最后通过模拟数据和实际数据的运算结果来说明生存数据的变量选择问题,并提出了有待进一步解决的问题。
其他文献
随着高通量测序技术和串联质谱技术的快速发展,人类基因组和蛋白质组的全景图逐渐被建立,越来越多的以前未被发现的蛋白质被人们鉴定到。然而,与海量的组学数据产生速度相比,
选择茶(Camellia sinensis)幼苗为试验材料,在盆栽条件下采用受控模拟酸雨喷淋的试验方法,设置3个酸雨梯度p H 2.5、p H 4.0和p H5.6,每个梯度下分别设计地上处理、全淋处理
纷繁嘈杂的快节奏生活,造就了“快综艺”如雨后春笋般喷薄欲出,成为人们通过媒介解压的产物,而近些年快节奏的冲突与刺激,渐渐成为束缚时代的枷锁,观众也因此产生疲态感,自20
目次前言一、有限合伙的再认识二、我国对有限合伙的本土探索与法制障碍分析三、有限合伙在我国的立法价值四、我国有限合伙的制度构造再析:离现代化水准是近还是远?五、结束
简.奥斯汀的代表作《傲慢与偏见》以高超的话语技巧为自己在现代文学史上争取到了话语权。本文从会话合作原则出发,通过分析小说中人物形象在交际过程中违反会话合作原则而体
中药的安全性是临床应用的关键因素。肝脏作为药物代谢的重要场所,也是药物毒性反应的主要靶器官之一。中药毒性与药性、体质、配伍等密切相关。中药肝毒性的作用机制涉及氧
权利优先性是指在政治实践推理中权利应该优先于社会总体的功利计算。信奉自由至上主义和自由平等主义的政治哲学家、法理学家广泛地分享这一理念,德沃金提出的"作为王牌的权
人们说,西藏是歌舞的海洋。不管牧人和庄稼汉生下来不久都会唱歌跳舞,都会抒发自己的感情。人们又说,西藏是民歌的海洋,民歌来自农奴和奴隶的心底,能把山河唱得悲苦悲泣,能把领主唱
采用设置加劲肋的方法控制冷弯薄壁卷边Z型钢梁在均布荷载作用下的畸变屈曲,应用有限元软件ABAQUS分别对4种带有加劲肋不同卷边角度的冷弯薄壁卷边Z型钢梁进行分析。综合考虑
运用科学计量软件CitespaceⅢ,对Web of Science数据库中检索的534篇有关项目治理领域的文献进行可视化分析,从合作网络、研究热点以及知识基础和研究前沿3个角度绘制了项目