论文部分内容阅读
研究背景与目的:临床试验的效率对于制药业来说变得越来越重要。以往,药物、疫苗或医疗器械在上市前往往需要分别独立开展Ⅱ期和Ⅲ期临床试验,这么做需要准备不同的注册方案,在每次研究开展前需要重新进行项目启动,受试者招募等。但实际上,Ⅱ期和Ⅲ期临床试验常具有相似的研究目标、相同的主要终点和重复的试验持续时间。如果将Ⅱ期和Ⅲ期合并为一个试验,则能够使用一个统一的方案设计这两个阶段的临床试验,从而减少收集证实试验药物或疫苗有效性所需信息量的时间,节省样本量,降低开发成本。为了实现上述优点,适应性设计应运而生。适应性设计因为允许在期中分析时进行早期停止和重新评估样本量,为研究人员提供了对期中数据做出反应的机会,从而节省时间和样本,已被广泛应用于肿瘤药物开发领域。在具有单个主要终点的临床试验中无缝设计已被普遍接受和应用,但在具有多个共同主要终点的试验上,无缝Ⅱ/Ⅲ期设计依然面临着一些亟待解决的问题。因此,本研究拟验证和比较现有文献中所涉及的Ⅱ/Ⅲ期无缝设计方法在存在多个共同主要终点临床试验中的应用条件和操作特征;探索基于狄利克雷-多项分布模型的贝叶斯预测功效(Bayesian Predictive Power,BPP)方法,并在存在多个共同主要终点临床试验的Ⅱ/Ⅲ期无缝设计中验证和评价该方法;基于单个历史对照数据集,在存在多个共同主要终点的Ⅱ/Ⅲ期临床试验中验证和比较现有文献中涉及的动态历史信息借用方法,特别是探索基于狄利克雷-多项分布模型构建归一化幂先验的可行性。研究内容与方法:本文主要关注对于存在多个共同主要终点的临床试验如何进行Ⅱ/Ⅲ期无缝设计,重点探索期中分析时因有效或无效而早期停止的试验策略和样本量重新估计方法,研究内容包括频率统计方法和贝叶斯统计方法。此外,我们还探讨了动态历史信息借用方法在存在多个共同主要终点的Ⅱ/Ⅲ期无缝临床试验中的应用。具体的,在第二章中,本研究基于条件功效(Conditional Power,CP)的方法提出两种适用于存在多个共同主要终点临床试验的无缝设计方案,并研究在不同相关性、疫苗效应、终点个数情景下Ⅱ/Ⅲ期无缝设计的整体功效,Ⅰ类错误率,期望样本量等操作特征,从而总结多价疫苗Ⅱ/Ⅲ期无缝设计的最佳策略。该研究以一项已发表的9价HPV疫苗Ⅲ期临床试验为背景,利用无缝设计方法重新设计该试验,以探究相应设计的真实表现。在第三章中,本研究采用狄利克雷-多项模型评估一项以非劣效为研究假设的Ⅱ/Ⅲ期无缝脑膜炎球菌破伤风类毒素结合疫苗试验中四个二分类终点血清反应结果的组合结局。在期中分析时,根据Ⅱ期试验阶段观察到的数据计算整个研究结束时预期试验成功的贝叶斯预测功效,并根据贝叶斯预测功效结果进行试验继续还是停止的决策。如果试验继续进行到下一阶段,则根据贝叶斯预测功效重新估计样本量。最终分析分别使用频率方法(BPP1)和贝叶斯方法(BPP2)。为了进行比较,还讨论了基于条件功效的替代方法(对照方法)。在第四章中,本研究基于单个历史对照数据集进行动态信息借用,重新设计一项已发表的Ⅱ/Ⅲ期无缝联合破伤风疫苗临床试验,从而实现最终分析时在两个二分类共同主要终点上的非劣效性检验。为了考察动态借用历史信息方法在存在不同程度的数据差异场景下的操作特性,我们利用检验后合并法、幂先验法、归一化幂先验法和稳健Meta分析预测先验法在两个共同主要终点下建模,并与不纳入历史信息的传统方法相比较。研究结果:首先,在第二章中我们发现基于条件功效进行无效停止的设计1在绝大多数情景下能够得到更高的全局功效,而在设计1的基础上添加了基于成组序贯进行有效停止的设计2所消耗的样本量最小。在各情景下,设计1和设计2均可将I类错误发生率控制在预定的单侧检验水准0.025以下。当设置的模拟参数均值比达到90%或以上时设计2在各情景下均能达到98%以上的有效停止比例;而当模拟参数均值比低于80%时,设计2的有效停止比例比成组序贯方法高5%及以上。当各终点相互独立时,基于条件功效而无效停止试验的比例为94.85%,随着终点间相关性增加,无效停止比例下降,当相关性增加到0.6时,无效停止比例下降到53.23%。接着,在第三章中我们同样发现在各情景下基于贝叶斯预测功效进行早期无效停止的两种方法BPP1和BPP2均可将I类错误发生率控制在预定的单侧检验水准0.025以下。在全局功效方面,当Ⅱ期阶段所使用的单组样本量为50时,BPP1方法的表现比对照方法优越;而当Ⅱ期阶段样本量分别为150和200时,BPP1方法的全局功效在各情景下均保持在对照方法的±5%之内。而BPP2方法的全局功效在绝大多数场景下比BPP1方法稍高。期望样本量的大小与全局功效的大小成比例增减。而当Ⅱ期阶段样本量为50时基于BPP1(BPP2)的方法在早期错误停止试验的概率比CP方法低10%及以上。汇总各相关性情景,BPP1(BPP2)与CP方法间的早期错误停止试验概率的差值的均值分别为14.17±1.61(n1=50),3.28±1.95(n1=100),0.27±2.08(n1=150)和-1.34±2.30(n1=200)。最后,在第四章中我们发现在各情景下检验后合并法、幂先验法、归一化幂先验法和稳健Meta分析预测先验法均可将I类错误发生率控制在预定的单侧检验水准0.025以下。此外,随着历史对照组和同期对照组间真实血清转换率的差值从-0.3增加到到0.3,幂先验法的全局功效逐渐降低;而在三种动态借用信息的方法中归一化幂先验法在全局功效上的变化幅度最大,稳健Meta分析预测先验法的变化幅度最小。从纳入样本量的角度考虑,随着历史对照组和同期对照组间真实血清转换率的差值从-0.3增加到到0.3,归一化幂先验方法的灵敏度最高,最先开始纳入历史对照信息,而检验后合并方法的峰值最高,在达到预先规定的数据相似性要求的情况下纳入的样本量最多。研究结论:首先,第二章的研究表明基于条件功效的Ⅱ/Ⅲ期无缝设计在具有多个共同主要终点的临床试验均表现优越,相应方法可灵活有效的在期中分析时停止无效试验或提前停止有效试验;可基于累积信息重新评估样本量从而维持目标统计功效或节约整体样本量;此外相应方法还能够缩短总试验持续时间,同时维持一个较小的I类错误率。上述结果表明,在具有多个共同主要终点试验的无缝设计中添加的有效停止或无效停止等适应性手段具有稳健性。其次,第三章研究表明基于贝叶斯预测功效的方法不依赖单个估计值评估成功概率,而是基于各终点血清反应率的整体分布预测成功概率,这么做可以将治疗差异间的可变性纳入考虑,从而提供比基于条件功效的方法更全面的估计结果。另外,与基于条件功效的方法相比,在基于贝叶斯预测功效的方法中使用狄利克雷模型可以通过减少错误的早期停止比例来改善全局功效。狄利克雷共轭分布的使用还减轻了贝叶斯预测功效的计算负担,提高了其在临床试验中的适用性。最后,第四章基于单个历史对照信息的动态借用实现了两个二分类共同主要终点上的非劣效性检验。具体的,四种方法中幂先验法导致I类错误的膨胀程度跟具体情景有关,而在三种动态信息借用方法中检验后合并方法导致I类错误的膨胀最明显,稳健Meta分析预测先验方法对I类错误的控制最好。从全局功效的角度分析,幂先验法的结果与不纳入历史信息的传统方法结果之间的差异较大,而三种动态信息借用方法其对照组受历史对照影响相对较小。三种动态信息借用方法中归一化幂先验法最灵敏;稳健Meta分析预测先验法最稳健;检验后合并方法的峰度和灵敏度都低于归一化幂先验方法。