论文部分内容阅读
目的本研究的主要目的是利用竞争风险的理念构建老年结直肠癌术后患者肿瘤相关死亡的预测模型,并将模型以列线图的形式可视化呈现出来,通过内部与外部验证评估模型性能,帮助临床医生个性化预测结直肠老年患者肿瘤相关死亡概率。方法构建模型的数据来自美国国立癌症研究所(The Surveillance,Epidemiology,and End Results,SEER)数据库,选取“SEER 18 Regs Custom Data(with additional treatment field),Nov 2017 Sub(1973-2015 varying)”中的数据。纳入数据包括2010-2015年所有行手术治疗的结直肠癌患者。利用竞争风险理念,将非肿瘤相关死亡作为竞争事件,通过计算肿瘤相关死亡的累积发生函数(cumulative incidence function CIF)进行单因素分析,排除单因素分析中无统计学差异的协变量后,将剩余变量纳入多因素分析。在多因素分析中构建部分分布比例风险回归(proportional subdistribution hazard regression)模型,排除多因素分析中无统计学差异的协变量后,将剩余变量纳入预测模型的构建,并以列线图的形式呈现该模型,在列线图中显示1年、3年、5年的肿瘤相关死亡概率。完成模型构建后,通过内部和外部验证评估模型性能。内部验证:利用Bootstrap重抽样法,通过计算一致性指数(concordance index,C-index)来反映区分度(Discrimination),通过绘制校准图(Calibration plot)来反映校准度(Calibration)。外部验证:电话随访扬州大学临床医学院附属苏北人民医院2012-2016年胃肠中心结直肠癌老年术后患者的随访数据,包括术后的生存情况、化疗情况,并搜集其他和模型相关协变量,最终获得669例有效随访数据,利用该数据进行外部验证。外部验证同样采用Bootstrap重抽样法计算C-index和绘制校准图的方式进行。结果经过筛选,最终纳入24908名SEER数据库患者进行预测模型构建。中位随访时间为29个月。所有患者中有7218例患者随访结局为死亡,其中肿瘤相关死亡5171例,非肿瘤相关死亡2047例。纳入的预测因素包括婚姻状态、性别、人种、肿瘤部位、肿瘤大小、肿瘤分级、淋巴结阳性率、TNM分期、癌胚抗原(Careinoembryonie antigen,CEA)、周围神经侵犯、化疗情况,将其中连续变量转变为分类变量后进行预测模型的构建。肿瘤相关死亡的 5 年累积发生率是 29.285%(95%Confidence interval,[CI]29.281%-29.289%),非肿瘤相关死亡的5年累积发生率是13.650%(95%CI 13.648%-13.653%)。单因素分析发现性别、人种、肿瘤部位在肿瘤相关死亡患者中无统计学差异(P>0.05),排除该3项指标后将剩余指标纳入多因素分析。多因素分析显示剩余指标均和肿瘤相关死亡相关,根据多因素分析调整变量分组方式后,最终将7个协变量纳入预测模型的构建,并以列线图的形式呈现出来,在列线图中显示肿瘤相关死亡的1年、3年、5年的累积发生率。内部验证显示列线图的C-index值为0.818(95%CI 0.812-0.824),校准图表现良好。外部验证显示C-index值为0.764(95%CI 0.728-0.801),校准图同样表现良好。经过内部及外部验证,说明本研究所构建的预测模型具有良好的预测性能。结论依靠大样本数据库及竞争风险理念,为老年患者这一特殊人群建立了结直肠癌术后临床预后模型,并将该模型以列线图的形式呈现,内部验证及外部验证均显示模型性能良好。该可视化的模型实现了对老年结直肠癌人群的个体化预测,有助于帮助临床医生制订临床决策。