论文部分内容阅读
背景亚组识别是精准医学的重要手段,生存数据是临床试验中极为常见的资料类型,如何对这类数据中潜在的获益亚组进行可靠的甄别是亟待解决的问题。对于该类数据的亚组识别,常用的Cox 比例风险模型的前提假设有时是不成立的,而加速失效时间(Accelerated Failure Time,AFT)模型不需要满足该假定,可以作为替代模型。在生存分析中,常规的模型通常适合于协变量少而样本量多的数据。而对于协变量数量超过样本量的数据,常规模型不再适用,需考虑惩罚模型。因此,本研究探索了单变量AFT模型和引入Adaptive Elastic Net的惩罚AFT模型在生存数据中亚组识别的能力。目的针对临床试验中的右删失生存数据,基于AFT模型提出一种新的亚组识别策略。方法在单变量AFT模型以及引入Adaptive Elastic Net的AFT模型(惩罚模型)中,通过检验协变量与治疗组别的交互项来识别亚组相关协变量;并在单变量模型中通过Benjamini-Hochberg法来控制错误发现率。基于所筛选的亚组相关协变量计算患者的预测得分。基于change-point算法建立分类器寻找预测得分的截断点以对患者进行亚组划分。采用适应性设计对所识别的获益亚组的治疗效果进行评价。通过模拟研究,(1)对比含/不含协变量主效应的单变量模型,结合不同分类器在不同样本量、删失比例、亚组比例下的亚组识别效果。(2)对比含/不含协变量主效应的单变量模型和惩罚模型,结合change-point算法在样本量不超过协变量个数(n≤p)、样本量远大于协变量个数(n>p)数据中,不同情形下的亚组识别效果。结果模拟结果显示,(1)不同情形下,不含协变量主效应的单变量模型优于含主效应的单变量模型;亚组比例小于0.5时,基于change-point算法的分类器优于基于中位数的分类器。(2)含协变量主效应的惩罚模型优于不含主效应的惩罚模型;在样本量较小、删失率较高以及样本量不超过协变量个数(n≤p)的情况下,含协变量主效应的惩罚模型在获益亚组的识别上有明显的优势;而其他情况下,则是不含主效应的单变量模型较优。在二阶段适应性设计中,含协变量主效应的惩罚模型、不含主效应的单变量模型的Ⅰ类错误都能控制在0.05左右。当潜在获益亚组时,相比于传统设计,适应性设计很大程度上提高了检验效能。结论不含协变量主效应的单变量AFT模型、含协变量主效应的惩罚AFT模型适用于生存数据的亚组识别。在样本量不大、删失率不低以及n≤p的情况下,后者占优;而其他情况下则是前者占优。相比于传统设计,二阶段适应性设计更适用于潜在获益亚组的疗效评价。