Buckley-James模型的模拟及其应用基础研究

来源 :中山大学 | 被引量 : 0次 | 上传用户:edisonlin123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文通过蒙特卡罗模拟和实例分析来探讨 Buckley-James模型在生存分析中应用。 研究材料和方法:蒙特卡罗模拟方法,首先、利用S语言模拟出不同样本量、不同删失比例、单因素及多因素模型、是否满足PH假定的样本数据,对数据分别运用BJ模型和Cox模型进行拟合,得到每种情况估计值的相对误差和因素检出率。通过对比分析,进一步比较BJ模型和Cox模型在满足PH假定和不满足PH假定的情况下估计值的准确性和检验的功效。 其次、模拟出不同的样本含量、生存分布、删失分布、删失比例、确定系数的生存数据,分别运用迭代算法和非迭代新算法估计回归系数。进一步计算两种算法在每一种情况下的估计值的绝对误差、相对误差、100个估计值的标准差SB、迭代算法所计算出的100个标准差的均值-XSE。通过对估计值误差及标准差的对比分析来比较两种算法的准确性及稳健性。通过配对T检验及相关回归分析来检验SB和-XSE的差别和相关程度,从而验证迭代算法所计算出的标准差的准确性。 再次、通过Bootstrap重抽样方法从胃癌数据中抽取100个Bootstrap样本,分别运用迭代算法和非迭代算法进行估计。通过检验两种算法估计值的标准差的差异,来进一步比较新旧算法估计值的稳健性。 实例资料:利用经典的生存分析数据90例胃癌数据及中山大学肿瘤防治中心346例鼻咽癌患者的随访资料作为实例资料。其中鼻咽癌资料随访了中山大学肿瘤防治中心1996年12月至1997年12月收治的鼻咽癌患者346例,终止日期为2004年7月23日,共有99例死亡,删失比例为71.4%。对以上资料运用参数回归模型、BJ模型和Cox模型进行拟合,并对结果加以讨论。 研究结果与分析: 1、Cox模型与BJ模型比较的模拟研究:当满足PH假定时,Cox模型的检出率要高于BJ模型,并且差别有统计学意义。两种模型的相对误差相差不大,在低删失比例下BJ模型要低于Cox模型。在删失比例为60%时BJ模型的相对误差要大于Cox模型。当模型中存在不满足PH假定的变量时,BJ模型对于不满足PH假定的变量的检出率高于Cox模型,差别有统计学意义。在低删失比例下,BJ模型的相对误差要远低于Cox模型。随着删失比例的增加,BJ模型的相对误差逐渐增大,而Cox则逐渐减小,同样在高删失比例下,BJ模型的相对误差要大于Cox模型。 当存在不满足PH假定的变量时,Cox模型对该变量的估计是无效的,可能会得到专业上无法解释的悖论,而且Cox模型会低估其它满足PH假定的变量对生存影响的作用。同时不满足PH假定的条件下基于Cox模型的分析很少能得到一个有统计学意义的风险比,而在此BJ模型则显示出其优势。 2、新旧算法比较的模拟研究:随着确定系数及样本量的增加,删失比例的降低,两种算法的估计值的标准差是逐渐变小的,而新旧算法间的标准差的差别没有统计学意义。在低删失比例下,两种算法估计值的偏倚差别很小,并且随着样本量以及确定系数的增加偏倚都是减小的,但在高删失比例下,新旧算法的差别明显。新算法的偏倚是正向的,旧算法在样本量为50和100时为正向的,而在200时却变为负向偏倚。通过分析建议当样本量及删失比例较大时,低确定系数(小于0.3)时选择旧算法,当确定系数大于0.3时选择新算法,其中新算法特别适用于高样本量、高删失比例的情形,而在低样本量以及低删失比例下,两种方法都可以选择。通过Bootstrap方法比较新旧算法估计值的稳健性,结果表明新旧算法Bootstrap估计值的标准差差别不大,旧算法小于新算法,但差别没有统计学意义,故两种算法的稳健性相当。 3、BJ模型标准差的估计:每种情况下-XSE和SB很接近,差别很小。配对T检验:t=1.002,v=404,P=0.317,两组的差别没有统计学意义。相关分析:Pearson相关系数=0.983,P<0.0001。故据原始公式所计算出来的标准差是比较准确的,基本上可以用它代替真实的标准差。 4、实例分析:90例胃癌患者的生存数据:拟合Cox比例风险模型以及考核PH假定,治疗因素的回归系数β=0.265,P=0.26,两组生存率的差异无统计学意义。检验PH假定:P<0.05,不满足PH假定。对该资料拟合BJ模型,回归系数为-153.3,P=0.02409,两组治疗的差异有统计学意义,说明化疗组优于联合治疗组。柳青教授对该资料的分析指出,如果拟合Cox模型,回归系数的检验P>0.05,两组生存率的差别没有统计学意义。但如果拟合带时变协变的Cox模型,回归系数的检验P<0.01,回归贡献有统计学意义,和本文的分析结果完全一致。由此可见在不满足PH假定时Cox模型的结果会有很大的偏倚,甚至会出现错误的结论。346例鼻咽癌患者生存数据:LogNormal回归模型筛选出年龄、候治时间、治前血红蛋白等九个变量,BJ模型最终筛选出七个变量,较参数模型少了两个变量;而Cox模型筛选出八个变量,较参数模型少了一个变量。故当生存时间满足其特定的分布时其检验效能会高于Cox半参数模型。BJ模型和Cox模型的结果基本一致,BJ模型的结果略逊于Cox模型(较Cox模型少筛选出一个变量)。该数据的删失比例为71.4%,在高删失比例下Cox模型要优于BJ模型。BJ模型在寻找危险或保护因素的方面的效果和Cox模型效果相当。通过BJ模型多因素分析筛选出的七个预后因素建立了预测鼻咽癌患者放射治疗后期望生存时间的预测方程和列线图,为临床实践提供指导。 讨论:BJ模型与Cox模型所需计算量相当,效果的好坏应取决于线性模型与比例风险模型哪一个对实际资料更恰当。当两种模型都满足其前提条件时,各有其优势。当资料满足比例风险模型的假定,Cox模型的结果则比线性模型丰富,比如Cox模型可直接计算与自变量相联系的相对危险度、生存函数等。而BJ模型不需要计算基准风险函数,线性回归结构简单直观、易于理解,参数估计值也更易于解释,可以直接对生存时间进行预测等等。可以说BJ模型是Cox模型在不满足PH假定条件下的主要的替代模型之一。 通过对于BJ模型的新旧两种算法的模拟研究,可以发现新算法对于旧算法来说显示出一定的优势,其中新算法特别适用于高样本量、高删失比例的情形。在高样本量及高删失比例时,迭代算法往往经过上千次的迭代都得不到收敛,这时非迭代新算法就显示出其优势了。而在低样本量以及低删失比例下,两种方法都可以选择。但是新算法只考虑了一个自变量的情形,所以在实际应用中就受到了限制,故将新算法推广至多维以及多维时电脑程序的实现是进一步研究的重点。 对于迭代算法,虽然Buckley和James1979年所提出的计算标准差的公式仅仅利用非删失观察值的信息,同时也没有任何理论上的校正。但通过模拟研究可以看出,其所计算出来的标准差是比较准确的,基本上可以用它代替真实的标准差。 通过几个实际例子的讨论,不难发现在不满足PH假定时Cox模型的结果会有很大的偏倚,甚至会出现错误的结论。而BJ模型的结果准确,可靠。在多变量模型的例子中Cox模型可以检验出的变量,同样BJ模型也可以检验的出。所以BJ模型可以应用解决实际问题。 以上几方面的研究通过模拟和实例的分析,探讨了BJ模型在生存分析中的应用,旨在为分析者运用BJ模型时提供一些指导,使BJ模型在医学研究中得以最有效的应用。另外,将余岐青教授在UNIX操作系统下编写的新算法C语言程序移植到Windows系统下,并加入了一些控制选项供使用者进行选择。使该算法的计算更加简便、易懂、快速。
其他文献
研究目的:通过对广州医科大学学生进行批判性思维能力、循证意识及教学过程评价的问卷调查,了解其影响因素及相关关系并重点探讨在LBL+PBL+EBM模式、LBL+PBL模式和LBL模式下医
教学内容:一年级下册第5、6页。  教学过程:   一、探索新知  1.学生介绍自己坐在教室的什么位置   (我坐在第一组第三个; 我坐在第四排第二个; 我坐在第五行第六个)  我们可以怎样描述同学的位置呢?在日常生活中我们习惯上从观察者的左边往右边数,称之组数,由前往后数称之为行数。从左往右数,请第1组同学向老师招招手(学生招手);第5组同学向老师点点头(学生点头);第8组同学笑一笑(学生笑)。
教学内容:二年级上册第4—5页例3、例4。  教学过程:  一、导入新课  1.请用你的小尺子量一量我们教室的黑板有多长,说一说有什么感觉?  2.出示米尺,这是米尺,如果换这把尺子测量,感觉怎么样?  3.引入新课:我们量比较长的物体或距离时,用“米”作长度单位。今天,我们就来认识新的长度单位“米”。  【设计意图】通过选用哪种尺子测量黑板的长度更方便,引出新知。  二、认识米,用米量。  1.
教学内容:二年级上册第38—39页例1、例2。  教学过程:  一、导入课题  课件播放:(配画外音)上海世博会有246个国家和国际组织参加,创造了世界博览史上最大规模纪录。这条长约1000米、宽约100米的世博大道上,错落有致地分布着6个像喇叭花从地上悄然绽放的建筑,它们有一个温暖的名字叫“阳光谷”。与它相映生辉的就是著名的中国馆,它像一顶高耸华冠,寓意着中华民族五千年的文化精神与气质。  画面