区间删失资料的Bayesian比例风险模型应用研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:langguoji
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
区间删失是临床随访研究中除右删失之外普遍存在的数据删失情形。Cox比例风险回归模型是分析随访数据中生存分布与其影响因素的重要方法。对于包含区间删失的数据,采用简单填补法如删失区间的左端点或中点进行填补之后,可以采用常规的偏似然函数对比例风险模型进行参数估计,但是将区间中点填补为观察时间会高估生存率,而将左端点作为生存时间可能会低估生存率,均会使模型的偏倚增加。因此常规填补法并不是理想的处理方法。参数统计方法体系下处理区间删失数据的模型构造,需要明确基线风险函数形式和生存时间的分布,模型估计较为复杂。Bayesian统计方法体系下,结合了基线风险和生存函数的似然函数,同样有模型过于复杂,计算负担重的问题。因此,运用常规的参数统计方法和常规的Bayesian统计方法都存在实际应用的问题。因此,本研究对近年来提出的一种Bayesian比例风险模型方法的统计学性质与实际应用进行了探讨。该法在贝叶斯比例风险回归模型的框架下,以单调样条函数构造联合似然函数中的基线生存函数,以非齐次泊松过程为基础对区间删失的生存时间进行数据扩增,采用Gibbs后验抽样计算,完成比例风险模型的参数估计。本研究通过模拟样本,将该法与多重填补法和经典参数法进行比较,对贝叶斯比例风险模型的推断性能进行评价;并且将该法用于含有区间删失数据的冠心病患者治疗出院后复发心血管事件的随访研究数据,以探讨与冠心病患者预后复发的潜在相关因素为例说明该法的实际应用。主要结果(1)统计模拟试验结果A.不同样本特征对贝叶斯比例风险模型的影响对不同删失区间宽度和区间删失率进行分析,主要结果显示:在10、50、100、200的删失区间宽度下,模型的估计偏差(Bias)没有明显规律与差异;在0.2、0.5、0.8的区间删失率组中,该模型的估计偏差同样没有差异。其余发现包括:随着删失区间宽度的增加,回归系数估计值的95%置信区间的宽度也在不断增加;对于服从正态分布资料的协变量的估计结果的偏差要大于服从二项分布的协变量,其估计结果的标准误(SE)要小于服从二项分布的协变量。B.贝叶斯方法与多重填补法,经典方法的比较三种方法下估计结果的偏差的绝对值都会随着右删失率的增加而增加;在不同区间删失率的样本下,三种方法间的偏差没有明显差异。三种方法估计结果的标准误会随着右删失率的降低而降低,且贝叶斯方法的结果标准误是最小值;在运行速度上,三种方法的运算时间都会随着区间删失率的升高而增加,其中贝叶斯方法的运行时间最长。C.贝叶斯比例风险模型的超参数设置对模拟结果的影响单调样条函数中伽马先验的a_λ和b_λ两个超参数依据已有研究设置为从0.001至1的范围,结果显示其对贝叶斯模型参数估计的偏差绝对值、标准误差和模型拟合优度指标(LPML)的均没有影响;单调样条的估计节点数对于参数估计和模型拟合的影响在不同区间删失率下的样本下均较小,但是通常在节点数为10时偏差最小。(2)实例数据分析结果对心血管事件复发随访研究的分析,在样条节点数为10,超参数a_λ=b_λ=1的模型参数下,Bayesian比例风险模型拟合结果为:早发型冠心病(HR=0.57,95%CI:(0.40,0.79))和糖尿病(HR=1.75,95%CI:(1.38,2.22))均为有统计学意义的变量;多重填补法得到的结果为早发型冠心病(HR=0.60,95%CI:(0.50,0.71))和糖尿病(HR=1.81,95%CI:(1.60,2.03))均为有统计学意义的变量;经典方法的结果为早发型冠心病(HR=0.59,95%CI:(0.43,0.83))和糖尿病(HR=1.80,95%CI:(1.42,2.29))均为有统计学意义的变量。主要结论(1)通过模拟分析,不同删失区间宽度和区间删失率对Bayesian比例风险模型的估计误差影响较小,但是随着区间删失率和删失区间宽度的提高,估计的精度会下降,置信区间会变宽;相比于经典方法和多重填补法,贝叶斯方法有着更为稳健的结果估计,但是检验效能要低于其它两种方法;贝叶斯比例风险模型中的对不同伽马先验超参数和单调样条节点数的设置估计结果都比较稳健。另外,贝叶斯方法较久的运算时间应该被考虑到,因此其在应用中更适用于小样本的数据,并且在其实际应用中可以通过对超参数的设置,得到更为准确的结果。(2)通过对冠心病患者随访调查数据的实例分析,我们认为相较于晚发型冠心病患者,早发型冠心病患者的预后效果较好;合并有糖尿病是心血管事件再发的危险因素。在处理区间删失数据上,临床上常用的单点填补方法应该得到提高,更为稳健的贝叶斯框架比例风险模型是值得向研究者推荐的一种方法。
其他文献
目的:探讨鼻腔鼻窦恶性淋巴瘤的临床特征和不同治疗方法的疗效,为防治鼻腔鼻窦恶性淋巴瘤提供科学依据。方法:70例鼻腔鼻窦恶性淋巴瘤患者中,行放、化疗42例,放疗28例。化疗
结合21世纪经济发展全球化、区域经济一体化和城市整合发展的趋势,文章在有关“地缘关系”理论的基础上,提出“地缘城市”的概念,通过边界、次区域合作和城市整合的界定与分
目的:探讨老年高血压患者睡眠障碍的影响因素及其护理对策。方法:选择80例老年高血压患者进行回顾性研究,分析其睡眠障碍的影响因素。采用匹兹堡睡眠质量指数(PSQI)评价患者
介绍了模具石墨的性能特点和切削加工机理,指出了复杂结构电火花石墨模具铣削加工中的困难,提出了CVD金刚石涂层刀具的解决方案。在此基础上介绍了国内外CVD金刚石涂层刀具在
玛丽·雪莱的小说《弗兰肯斯坦》与改编的电影构筑了一个不断外延的庞大叙事综合体。其中书写的生与死、家庭与友谊等永恒的主题,在小说和电影中通过情节和人物以不同的姿态
笔者通过本人自身的竹笛演奏体会到,在演奏竹笛作品时,为了更好的将作品艺术风格特点以及审美特征表达出来,对曲目流派表现形式的了解至关重要。本选题将对中国南派、北派竹笛演奏艺术风格进行解析,从美学角度对两者的演奏技术所表达的艺术效果进行梳理。通过对融合两个派别演奏技巧的同一首作品进行分析,探索竹笛流派融合的艺术特征以及重要性,本文研究的重点是在竹笛演奏过程中如何进行艺术处理来表现作品的内涵与音乐表现形
采用二苯甲烷型双马来酰亚胺(BDM)和二甲基二乙氧基硅烷(DMDES)共同改性双酚A型环氧树脂(EP/CYD-127)/芳香胺(DDM)固化体系,并对改性后的环氧树脂进行力学性能和热学性能分析
当今社会,世界各国都已经认识到了数据对一个国家的战略意义。在大数据时代,海量的数据已经成为新的生产要素,和传统的生产要素相比大数据具有可再生、无污染、无限性等特点
根据戴明循环在实验室质量管理方面的应用对实验室质量管理中的一些问题进行阐述与分析,以便提高实验室质量管理水平,进而提高检验工作质量。
为满足当前雨量监测多样化的需求,本文通过实验的方式研究了孔口出流的压强与流速的关系,建立了数学模型,设计了一种基于孔口出流原理的暴雨测量系统。本设计的特点是不含翻