论文部分内容阅读
研究背景临床试验样本量的合理估计直接关系到试验的成败,样本量是研究者在试验设计阶段考虑的重要问题。在传统的固定设计临床试验中,研究者在试验开展前根据相关文献设定试验的关键参数,对样本量进行估计,期望达到预设的检验效能。当某些临床试验的部分参数缺乏可供参考的文献,或是试验条件差异较大时,试验开始前初始设定参数可能与真实参数存在较大偏差,以此为基础估计的样本量可能较大程度的偏离理想样本量。若样本量过大会为研究带来不必要的负担,也存在伦理问题;若样本量不足则可能导致检验效能过低,使得有效疗法或是有效药物不能被发现适应性设计允许研究者能够根据期中分析结果重新估算样本量,以使试验达到预设的检验效能。在实际临床试验中生存资料是一种常见的资料类型,期中分析时生存资料会产生大量的截尾数据,为样本量再估计带来了极大的挑战。期中分析时对试验揭盲,在揭盲状态下进行样本量再估计会破坏试验的完整性。本研究针对生存资料,探索盲态下样本量再估计方法。目的与方法本研究假定生存时间服从特定分布(指数分布或Weibull分布),在期中分析时,根据期中分析时间点模拟产生截尾的生存数据,对截尾的生存数据进行填补形成期中分析数据,对填补后的期中分析数据应用极大似然法进行盲态下样本量再估计,并采用Monte Carlo模拟实验的方法对样本量再估计结果的准确性和稳定性进行评价。构建基于log-rank检验的双臂临床试验,两组样本比例为1:1,试验开始前设定不同的参数初始估计值对样本量进行估计,并以参数初始估计值为依据设定搜索范围(Hunting zone,HZ),将搜索范围内用于模拟产生填补数据的参数称为填补参数。在期中分析时,以搜索范围为依据产生模拟数据对实际数据进行填补,用模拟数据中大于期中分析时间点的数据填补截尾数据,构成期中分析数据,对期中分析数据应用极大似然法进行参数再估计,在搜索范围内筛选出与填补参数之差最小的参数极大似然估计值做为期中分析时的参数再估计值,并计算出再估计样本量,该过程修正了EM算法依赖初始值设定的问题,称为调整的EM算法。设定两种不同的期中分析时间点划分方案,每种方案预设4个期中分析时间点,比较各期中分析时间点上的样本量再估计结果。方案1是以随访时间t设定4个期中分析时间点(Interim,I),4个期中分析时间点分别为I1-I4,I1是入组结束时(T0),I2是T0+0.25t,I3是T0+0.5t,I4是T0+0.75t;方案2是以事件数E(number of events)设定4个期中分析时间点,4个期中分析时间点分别为I1、I2e-I4e,I1是T0,I2e是0.25E,I3e是0.5E,I4e是0.75E。每种参数背景下模拟实验次数为1000,计算再估计样本量的均值和标准差,与样本量理想值比较,评价再估计样本量的准确性和稳定性,对再估计样本量的均值进行log-rank检验,重复10000次计算相对应的α和power。结果与结论本研究分别模拟了生存时间服从指数分布和Weibull分布时的样本量再估计结果。主要研究结果和结论总结如下:1.当生存时间服从指数分布时,假定风险比HR不变,以对照组中位生存时间M10为依据暂定搜索范围为M10±0.5M10,对比不同HR时4个期中分析时间点样本量再估计结果;在期中分析点I2-I4和I3e-I4e,且搜索范围包含参数真实值时,经过期中分析调整后的样本量再估计值(?)接近理想值,且标准差较小;考虑到实际应用中,期中分析时间点越晚,研究时间就越长,研究成本也随之增加,因此,相似背景下若以随访时间为划分依据,建议在I2时进行期中分析;若以事件数为划分依据,建议在I3e时进行期中分析。若是其他差异较大的背景时,需重新进行模拟实验,并根据模拟实验结果确定期中分析时间点。2.当生存数据服从Weibull分布时,待估参数是形状参数γ,根据以往相关文献确定γ的搜索范围,若风险率随着时间的推移而减小,则γ的搜索范围为0.5-1;若风险率随着时间的推移而增大,则γ的搜索范围为1-2;若风险率随着时间的推移变化不大,则γ的搜索范围为0.5-1.5;搜索范围包含参数真实值γ时,经过期中分析调整后的样本量再估计值(?)接近样本量理想值,但由于γ的微小变化可引起样本量的较大波动,因此样本量再估计值变异较大;同时建议相似背景下,在I1时进行期中分析即可。若是其他差异较大的背景时,需重新进行模拟实验,并根据模拟实验结果确定期中分析时间点。