论文部分内容阅读
研究背景和目的在过去的几十年里,疾病发生发展的分子机制研究取得了积极的进展,分子靶点和靶向治疗药物相伴互随,靶向治疗药物的研发成为医药研究领域中的重要方向。但是,具有较好疗效的靶向治疗药物还不能满足实际的需要。特别是随着人类基因组计划的完成,针对靶向治疗药物的靶向临床试验呈快速增长趋势。如何合理设计和评估靶向临床试验是靶向治疗药物研发的关键。根据是否将研究药物药理学治疗靶点作为靶向临床试验的纳入和排除标准,靶向临床试验常用的临床试验设计方法有三种,分别是富集设计、全随机设计以及策略随机设计。目前国内外对靶向临床试验设计方法的统计学性能模拟研究主要基于终点指标为连续型变量及两分类变量的情形。然而,靶向临床试验大部分是针对肿瘤的研究,其常用的主要临床终点指标通常并不是定量资料或两分类资料,而是无进展生存时间(PFS)、总生存时间(OS)等生存时间资料。由于生存时间资料可能存在截尾数据的特殊性,在以生存时间作为终点指标的临床试验中,不同设计方法的统计性能如何不得而知。本研究针对存在截尾数据的生存时间资料对三种常用的靶向临床试验设计方法进行统计学性能模拟比较研究,评估各种设计方法的统计学效能,为更好的进行靶向临床试验提供设计选择依据。另外,对于富集设计靶向临床试验,由于疾病标靶诊断技术的不完善,很难获得100%的阳性预测值,因此无法保证入组到靶向临床试验中的受试者都具有该种疾病标靶,其中一些实际不具有该疾病标靶的受试者可能被错误的检测为阳性,致使入组病人中存在假阳性的现象。假设试验终点指标为定量资料。显然,按传统方法得到的两组样本间均数差值E(YT-TC)=Y(μT+-μc+)+(1-γ)(μT--μc-)由两部分组成(μi+、μi-分别表示在试验组和对照组中真正拥有疾病标靶和不具有疾病标靶受试者的效应大小(i=T,C),Y表示诊断阳性预测值):一是标靶检测为阳性且为真阳性的受试者的效应;二是检测为阳性但实际为阴性的受试者的效应。如果假设靶向治疗对靶点阴性患者的疗效低于对靶点阳性患者的疗效,则可以认为按常规方法获得的靶向临床试验的处理效应低估了真标靶病人的实际效应,从而产生了效应估计的偏倚。如何校正疾病标靶诊断方法的不准确性对靶向临床试验结果的影响,刘仁沛提出了一种基于EM算法联合参数Bootstrap重抽样过程的方法。本文将模拟研究刘仁沛等提出的基于EM算法联合Bootstrap重抽样技术的方法对校正富集设计靶向临床试验效应估计偏倚的统计学性能,比较该方法与传统方法所获得的相对偏倚度及其95%CI的覆盖率,验证该方法的可行性及可能的适用条件。研究方法利用SAS9.2统计分析系统借助Monte Carlo模拟技术,在预先设定诊断方法灵敏度及特异度、截尾数据比例、生存时间服从分布类型等模拟条件下,对三种常用的靶向临床试验设计方法的样本量与把握度之间的关系进行模拟研究。另外,模拟比较刘仁沛等提出的基于EM算法联合Bootstrap重抽样技术的方法与传统方法所获得的富集设计靶向临床试验效应估计值的相对偏倚度及其95%可信区间的覆盖率。具体过程如下:模拟研究三种常用的靶向临床试验设计方法在不同情况下随机分配样本量与把握度之间的关系的具体实施步骤为:第一步,设定参数值及模拟数据分布类型;第二步,通过模拟迭代的方式估算选定分布类型不同参数条件下截尾数据服从均匀分布的参数值;第三步,按照设定参数值及模拟数据分布类型产生2000个存在截尾数据的生存时间资料的随机样本;第四步,通过log-rank检验计算不同设计方法不同随机分配样本量取双侧检验水准α=0.05的每一种情况下拒绝无效假设的比例,即把握度。本研究以相同设定条件下把握度的大小作为统计学性能的判定指标,把握度越大,则认为统计学性能越好。当模拟研究富集设计所需待筛查样本量与把握度之间的关系时,其模拟试验基本步骤的不同之处为:在实施以上步骤之前,需以P+λsens+(1-P+)(1-λspec)的值作为参数值产生一组服从伯努利分布的随机样本,其中nse表示待筛查样本量,值等于1的随机数个数表示随机分配样本量。然后,按照以上步骤进行模拟研究。模拟研究刘仁沛等提出的基于EM算法联合Bootstrap重抽样技术的方法的统计学性能的具体实施步骤如下:第一步,设定诊断方法阳性预测值、靶向阳性病人及靶点阴性病人分别接受靶点治疗及对照治疗所获得的效应均数及标准差等参数值;第二步,以诊断方法的阳性预测值PV+作为伯努利分布的参数值产生一个随机变量Xi,0代表该病人无该疾病标靶,1代表该病人有该疾病标靶,然后按照1:1的比例随机分配到试验组或对照组中;第三步,在对照组和试验组中根据病人疾病靶点真实情况按照事先规定好的参数值产生服从正态分布的随机数据;第四步,分别根据EM算法联合Bootstrap重抽样技术的方法和传统方法估算靶阳性的真实效应值及其95%可信区间;第五步,重复以上步骤2000次,分别计算按EM算法联合Bootstrap重抽样技术的方法和传统方法获得的真阳性病人效应估计值的相对偏倚度及其95%可信区间覆盖率。研究结果三种常用的靶向临床试验设计方法在不同情况下随机分配样本量与把握度之间关系的模拟研究结果:第一种情况下,当靶点阴性病人接受试验药物治疗的死亡风险与接受对照药物治疗的死亡风险比例RR=0.5时,全随机设计与富集设计在相同随机分配样本量情况下获得的把握度基本相同,策略随机设计获得的把握度最低。然而,在把握度相同的条件下,富集设计需要的待筛查样本量比全随机设计要大。第二种情况下,当靶点阴性病人接受试验药物治疗的死亡风险与接受对照药物治疗的死亡风险比例RR=0.75时,若随机分配样本量相同,富集设计获得最大的把握度,其次是全随机设计,最后是策略随机设计。在该种情况下,富集设计仅仅选取了获益最大的那部分受试者,即靶阳性病人,获得了最佳的统计性能,但是却忽略了试验药物对靶阴性病人的疗效。而且,在把握度相同的条件下,其需要的筛查样本量也比全随机设计大。第三种情况下,当靶点阴性病人接受试验药物治疗的死亡风险与接受对照药物治疗的死亡风险比例RR=1时,得到的模拟结果与第二种情况下得到的模拟结果相似,在随机分配样本量相同的条件下,富集设计取得最大的把握度,其后是全随机设计及策略随机设计。不同的是,为获得相同的把握度,富集设计需要的筛查样本量比全随机设计小。第四种情况下,当靶点阴性病人接受试验药物治疗的死亡风险与接受对照药物治疗的死亡风险比例RR=2时,富集设计在随机分配样本量相同的条件下取得把握度仍然最大,其次是策略随机设计,最后是全随机设计。这也是唯一一种策略随机设计在样本量相同的情况下取得的把握度大于全随机设计的情况。基于EM算法联合Bootstrap重抽样技术的方法的统计学性能模拟研究结果:(1)效应估计值相对偏倚度:由EM算法联合Bootstrap重抽样技术的方法计算得到的真阳性病人效应估计值的相对偏倚度随着PV+、μT+及n的增大而减小,随σ的增大而增大。只有当PV+、μT+及n较大且σ较小的情况下,通过该方法获得的效应估计值的相对偏倚度才可能达到理想的要求。例如,当μT+=120时,不论n、PV+、σ取值为多少,相对偏倚度的绝对值都大于1%。当n=100、PV+=0.7、σ=20且μT+=120时,相对偏倚度的绝对值达到最大值,约等于14.8%。另外,通过传统方法估算得到的真阳性病人处理效应估计值的相对偏倚度都在(1-PV+)×μT-左右轻微波动。(2)效应估计值95%可信区间覆盖率:由EM算法联合Bootstrap重抽样技术的方法计算得到的真阳性病人效应估计值的95%可信区间覆盖率受μμT+、PV+及σ的影响较大。覆盖率随6的增大而越远离95%,随PV+的增大而越接近95%。同时,其随μμT+的变化规律则较为复杂,在σ确定的情况下,可以将覆盖率随μT+的变化规律概括为:存在两个值a和b,假设b>a,当μT+<a时,随μT+的增大覆盖率越远离95%;当a<μT+<b时,随μT+的增大覆盖率越接近95%;当μT+>b时,随μT+的增大覆盖率总在95%左右轻微波动。例如,设定n=200、PV+=0.7、σ=20,当μT+=130时,覆盖率取得最小值57.05%,当μT=120时,覆盖率等于65.35%,当μT+≥140时,覆盖率取值大于57.05%,且随μT+的增大而增大。覆盖率与n的关系则不明显。另外,通过传统方法估算得到的真阳性病人处理效应估计值的95%可信区间覆盖率在μT+较大时几乎等于0,随着μT+及n的减小或σ及PV+的增大,其值越接近95%,当n=100、PV+=0.9、σ=20、μT+=120时其覆盖率获得最大值87.25%。综合效应估计值相对偏倚度及其95%可信区间覆盖率进行考虑,只有当σ较小且μT+较大的情况下,EM算法联合Bootstrap重抽样技术的方法才可以较为准确的得到富集设计靶向临床试验真阳性病人的效应估计值。而临床实践中的情况不可能局限于这一苛刻的要求,因此,该方法无法获得较小的相对偏倚度及满意的95%可信区间覆盖率,同样不能准确估计真实处理效应值,难以满足实际分析的需要。研究结论当有足够的证据表明靶向治疗药物的疗效与其治疗靶点之间有明确的相互作用关系且拥有可靠的靶点检测方法时,我们建议采用富集设计。如果不存在可靠的靶点检测方法或不能确定靶向治疗药物是否对无靶点病人有效时,建议采用全随机设计。EM算法联合Bootstrap重抽样过程的方法并不能很好的解决富集设计靶向临床试验中存在的效应估计偏倚问题,现实中还需寄希望于通过提高靶点诊断方法性能的途径来减小偏倚。在还没有高效性能的靶点诊断方法出现的前提下,必须积极探讨另外的解决方法。好在这种偏倚是对真实效应的低估,虽然潜在降低了发现对真阳性病人有效的靶向药物的可能性,但从某种意义上讲更有利于保护病人权益。