论文部分内容阅读
研究背景:在新药和医疗器械的非劣效验证中,非劣效界值的确定一直存在争议。ICHE10(International Conference on Harmonization of Technical Requirements for Registration of Pharmaceuticals for Human Use)和CPMP (Committee For Proprietary Medical Products)对非劣效性界值标准的确定均提供了一个基本的指导原则,即要使试验药物疗效既要优于安慰剂以保证药物的有效性,又要好到不差于阳性对照药,但缺乏具体的标准,因此如何确定合适的非劣效界值一直存在争议。目前药物和医疗器械的临床试验如果设计阳性对照并进行非劣性验证,通常采用双臂设计,即仅设置试验组和阳性对照组。此时,试验药组与安慰剂的疗效差异只能参照阳性对照的既往研究进行间接比较。为此,Hung等人(2003)提出了考虑安慰剂效应后,采用率比RR确定非劣效界值的方法,Chow and Shao(2006)则提出了考虑安慰剂效应后,采用率差RD确定非劣效界值的方法。两种方法均考虑了安慰剂的疗效,但同时又引出了另一个问题,即在一个具体的非劣效试验中,选用率比和率差确定非劣效界值是否可以得到相似的I类错误和检验效能?如果不能,哪种情况下应选用率比确定非劣效界值,哪种情况下选用率差确定界值呢?针对此问题,笔者查阅了大量国内外文献,尚未见到关于两者异同之处的研究报道。研究目的:本研究拟基于二分类资料,考虑成组和配对两种设计类型,应用SAS程序模拟比较非劣效验证中采用率差和率比确定非劣效界值的Ⅰ类错误和检验效能,为新药临床试验中非劣效界值的确定提供参考。方法:1.非劣效界值的确定:设Pc0,Pp0分别表示既往优效性研究中阳性对照组和安慰剂组临床阳性事件的发生率;Pc,Pp和Pt分别代表非劣效试验中阳性对照组、安慰剂组和试验组临床阳性事件的发生率;假设效应指标均为高优指标,即:效应指标取值越大,效应越好;取值越小,效应越差。(1)基于率差的非劣效界值确定方法:采用率差确定非劣效界值的基本思想是,试验药物与安慰剂的疗效差至少达到阳性对照药物与安慰剂的疗效差的一定百分比(用f表示)。采用公式1计算:△rd=(1-f)(Pc0-Pp0)(公式1)式中△rd为基于率差的非劣效界值,(Pc0-Pp0)为既往研究中阳性对照组和安慰剂组阳性率的差值,可采用Meta分析构建的(Pc0-Pp0)的95%CI下限或点估计值,f为试验药物与安慰剂的疗效差至少达到阳性对照药物与安慰剂的疗效差的百分比。为方便起见,基于率差的非劣效界值以下简称RD界值。(2)基于率比的非劣效界值确定方法:采用率比确定非劣效界值的基本思想是,试验药物相对于安慰剂的疗效至少达到阳性对照药物相对于安慰剂疗效的一定百分比(用f表示)。采用公式2计算:(公式2)式中△rr为基于率比的非劣效界值,为既往研究中阳性对照组和安慰剂组阳性率的比值,可采用Meta分析构建的的95%可信区间下限或点估计,f为试验药物相对于安慰剂的疗效至少达到阳性对照药物相对于安慰剂疗效的百分比。为方便起见,基于率比的非劣效界值以下简称RR界值。由于目前国内外判断新药临床非劣效性大多基于恒定假设(即假定非劣效试验中的试验条件与既往历史研究相一致,保证阳性对照组和安慰剂的疗效变化不大),使用传统的假设检验或可信区间方法进行判断。因此本次模拟均基于恒定假设,采用可信区间方法判断非劣效性。1.成组设计模拟验证(1)I类错误的模拟参数设置:设Pc0为既往研究中阳性对照组的阳性率,分别取0.6,0.65,0.7,0.75...0.9,0.95;f分别取0.5,0.6,0.7,0.8;Pp0为既往研究安慰剂组的阳性率,取为0.35;根据公式1和公式2分别计算基于率差和率比的非劣效界值;设Pt为非劣效试验中试验组的阳性率,其取值为0<Pt<min(Pc0-△rd,Pc0/△rr);样本量n按照平衡设计考虑,分别取50、100、150…和500。考虑不同f值、样本量和阳性对照组阳性率的组合,采用SAS9.2软件编程,从二项分布中抽样,每种组合的模拟次数为100000次,对于RD界值,计算(Pt-Pc)可信区间下限大于-△rd的次数在总的模拟次数100000次中所占比例,即I型错误率;对于RR界值,计算Pc/Pt的可信区间上限小于△r,的次数在总的模拟次数100000次中所占比例,即I型错误率。并计算两种界值确定方法I类错误的相对比,以RR界值法的I类错误为参照。检验方法:采用可信区间方法。1)基于率差的可信区间:按单侧100(1-α)%可信度,计算出(Pt-Pc)可信区间的下限q,若[CL,∞]完全在[-△rd,∞]范围内,或者CL>-△rd,可下非劣效性的结论。2)基于率比的可信区间:按单侧100(1-α)%可信度,计算出Pc/Pt可信区间的上限Cu,若[-∞,Cu]完全在[-∞,△rr]范围内,或者G<Δrr,可下非劣效性的结论。(2)检验效能的模拟参数设置:设只。为既往研究中阳性对照组的阳性率,分别取0.6,0.65,0.7,0.75…0.9,0.95;f分别取0.5,0.6,0.7,0.8;Pp0为既往研究安慰剂组的阳性率,取为0.35;根据公式1和公式2分别计算基于率差和率比的非劣效界值,设Pt为非劣效试验中试验组的阳性率,其取值为两种情形:(1)Pc-Pt≠0,试验组阳性率取值为Pt>max(Pc0-Δrd,Pc0/Δrr),(2)Pt=Pc;样本量n按照平衡设计考虑,分别取50、100、150…和500。考虑不同f值、样本量和对照组阳性率的组合,采用SAS9.2软件编程,从二项分布中抽样,每种组合的模拟次数为100000次,对于RD界值,计算(P-只)可信区间下限大于-△rd的次数在总的模拟次数100000次中所占比例,即检验效能(1-β);对于RR界值,计算Pc/Pt的可信区间上限小于△rr的次数在总的模拟次数100000次中所占比例,即检验效能(1-β)。并计算两种界值确定方法检验效能的相对比,以RR界值法的检验效能为参照。检验方法亦采用可信区间法。2.配对设计模拟验证(1)I类错误的模拟参数设置:设Pc0为既往研究中阳性对照组的阳性率,分别取0.6,0.65,0.7,0.75...0.9,0.95;f分别取0.5,0.6,0.7,0.8;Pp0为既往研究安慰剂组的阳性率,取为0.35;根据公式1和公式2分别计算基于率差和率比的非劣效界值;设Pt为非劣效试验中试验组的阳性率,其取值为0<P<min(Pc0-Δrd,Pc0/Δrr);样本量n分别取50、100、150…和500。考虑不同f值、样本量和阳性对照组阳性率的组合,采用SAS9.2软件编程,从二项分布中抽样,每种组合的模拟次数为100000次,对于RD界值,计算(Pt-Pc)可信区间下限大于-△rd的次数在总的模拟次数100000次中所占比例,即I型错误率;对于RR界值,计算Pc/Pt的可信区间上限小于△rr的次数总的模拟次数100000次中所占比例,即I型错误率。并计算两种界值确定方法I类错误的相对比,以RR界值法的Ⅰ类错误为参照。检验方法:采用可信区间法。除可信区间的计算公式与成组设计不同外,其余与成组设计相似。(2)检验效能的模拟参数设置:设Pc0为既往研究中阳性对照组的阳性率,分别取0.6,0.65,0.7,0.75...0.9,0.95;f分别取0.5,0.6,0.7,0.8;Pp0为既往研究安慰剂组的阳性率,取为0.35;根据公式1和公式2分别计算基于率差和率比的非劣效界值,设Pt为非劣效试验中试验组的阳性率,其取值为两种情形:(1)Pc-Pt≠0,试验组阳性率取值为P>max(Pc0-Δrd,Pc0/Δrr),(2)Pt=Pc;样本量n分别取50、100、150…和500。考虑不同f值、样本量和阳性对照组阳性率的组合,采用SAS9.2软件编程,从二项分布中抽样,每种组合的模拟次数为100000次,对于RD界值,计算(Pt-Pc)可信区间下限大于-Ard的次数在总的模拟次数100000次中所占比例,即检验效能(1-β);对于RR界值,计算Pc/Pt的可信区间上限小于△rr的次数总的模拟次数100000次中所占比例,即检验效能(1-β)。并计算两种界值确定方法检验效能的相对比,以RR界值法的检验效能为参照。检验方法亦采用可信区间法。结果:(1)成组设计:从Ⅰ类错误的角度看,不同f和Pc0组合下两种界值确定方法的Ⅰ类错误比较,RD界值的Ⅰ类错误率均在检验水准0.025以下,并随阳性对照组阳性率的增大而逐渐减小,其减小趋势比较平稳;n=50时,RR界值的一类错误在Pc0<0.8时在检验水准0.025的水平线附近波动;当Pc0>0.8时稍高于0.025水平线,但波动幅度不大;当n>50时RR界值的一类错误则趋于平稳,围绕0.025的检验水准上下波动;两种界值确定方法的Ⅰ类错误比较,RD界值的Ⅰ类错误不论样本量和f取值如何,均小于RR界值的Ⅰ类错误,并随着阳性率的增大,两者的差距也逐渐增大。不同f和样本量组合下两种界值确定方法的Ⅰ类错误比较,不管f取值如何,n=50时, RR界值的Ⅰ类错误均在0.025的检验水准附近波动,当样本量增大时,其Ⅰ类错误有逐渐减小的趋势;不同样本量和f值组合下,RD界值的Ⅰ类错误始终小于RR界值的Ⅰ类错误,在0.025的检验水准之下,两者的Ⅰ类错误差距随样本量的增大稍有增大,但增大趋势不明显。从检验效能的角度看,Pc-Pt≠0,样本量分别为50、100和150时,不同f取值下,RD界值和RR界值随阳性对照组阳性率变化的检验效能。可见RD界值的检验效能始终小于RR界值的检验效能;两者的检验效能均随阳性对照组阳性率的增大而逐渐增大,其中RR界值的增大幅度更加明显。两者检验效能的差距也随对照组阳性率的增大逐渐增大。Pt=Pc,样本量分别为50、100和150时,不同f取值下, RD界值的检验效能始终小于RR界值的检验效能;两者的检验效能均随阳性对照组阳性率的增大而逐渐增大。本次模拟发现一个有意思的现象:即不同样本量取值时,两者检验效能的差距随阳性对照组阳性率的增大呈现先增大后减小的趋势,其开始减小时对应的阳性对照组的阳性率因不同样本量和f值的不同而不同,样本量越大,f取值越小,两者检验效能的差距开始减小时对应的Pc0越小。不同f和样本量组合下两种界值确定方法的检验效能比较,不同f值下两者的检验效能均随样本量的增大而增大。f=0.5,n>=100时,f=0.6,n>=200时,f=0.7,n>=350时,两者检验效能比值基本接近1,f=0.8时,样本量取500时两者检验效能比值为0.8442,说明两者检验效能亦非常接近。(2)配对设计:从Ⅰ类错误的角度看,不同f和只。组合下两种界值确定方法的Ⅰ类错误比较,RD界值的Ⅰ类错误均在检验水准0.025以下,并随阳性对照组阳性率的增大而逐渐减小,其减小趋势比较平稳;n<50时,RR界值的Ⅰ类错误大都在检验水准0.025的水平线以上波动,随样本量增大,其Ⅰ类错误曲线逐渐趋于0.025的水平线以下。两者Ⅰ类错误比较,不同f取值下, RR界值的Ⅰ类错误有随对照组阳性率逐渐增大的趋势,而RD界值Ⅰ类错误则有随对照组阳性率缓慢减小的趋势,两者Ⅰ类错误差别也随对照组阳性率的增大而逐渐增大,RR界值的Ⅰ类错误始终高于RD界值,但比后者更接近0.025的检验水准。不同f和样本量组合下两种界值确定方法的Ⅰ类错误比较,不管f取值如何,两者的Ⅰ类错误均随样本量的增大逐渐减小,两者Ⅰ类错误的差距亦随样本量的增大逐渐减小。从检验效能的角度看,Pc-Pt≠0,样本量分别取50、100、150和200时,不f取值下,RD界值和RR界值随阳性对照组阳性率变化的检验效能。可见RD界值的检验效能始终小于RR界值的检验效能;两者的检验效能均随对照组阳性率的增大而缓慢增大,其中RR界值的增大幅度更加明显。两者检验效能的差距也随对照组阳性率的增大逐渐增大。Pt=Pc,样本量分别取50、100、150和200时,不f取值下,RD界值的检验效能始终小于RR界值的检验效能;两者的检验效能均随阳性对照组阳性率的增大而逐渐增大。Pt=Pc时,与成组设计模拟结果类似,配对设计下亦存在如下现象:即不同样本量取值时,两者检验效能的差距随阳性对照组阳性率的增大呈现先增大后减小的趋势,其开始减小时对应的阳性对照组的阳性率因不同样本量和f值的不同而不同,样本量越大,f取值越小,两者检验效能的差距开始减小时对应的Pc0越小。结论:本文通过SAS模拟,考虑了成组设计和配对设计下,不同样本量,阳性率取值和f取值的组合,比较基于率差和率比确定非劣效界值的Ⅰ类错误和检验效能,以期为临床试验非劣效界值的选择提供参考。结果显示不论成组设计还是配对设计,从Ⅰ类错误和检验效能的模拟结果综合来看,得出以下结论:(1)从统计性能的角度,Ⅰ型错误率越接近检验水准(本例取0.025),检验效能越高,说明此种方法越可靠和稳健,效率越高。研究显示RR界值法的统计性能优于RD界值法,即采用率比确定非劣效界值较好,尤其在f较大(≥0.8)以及样本量较小(<50)的情况下。(2)从实际应用角度,期望Ⅰ类错误越小越好,这样可以拒绝药效达不到要求的药物,以保障患者的健康和利益。模拟结果显示RD界值法的Ⅰ类错误始终小于RR界值法。虽然后者具有较大的检验效能,但是以增大其Ⅰ类错误为代价的。因此,从实际应用和患者自身利益出发,推荐采用基于率差的界值确定方法。