论文部分内容阅读
目的:术前新辅助放化疗(neoadjuvant radiochemotherapy,NRCT)+全直肠系膜切除术(total mesorectal excision,TME)是局部进展期直肠癌(locally advanced rectal cancer,LARC)患者的标准治疗方式。但在实施NRCT后,仅有约20%的患者可以达到病理学完全缓解(pathological complete response,pCR)。因此,如何选择合适的患者进行新辅助治疗成为研究热点。本研究利用基因表达谱分析预测局部进展期直肠癌新辅助放化疗后病理学缓解的靶基因,为未来临床验证提供靶点。方法:从GEO(Gene Expression Omnibus)数据库中筛选有新辅助放化疗后病理学缓解分级的局部进展期直肠癌基因表达谱数据,得到4个数据集GSE35452、GSE46862、GSE68204和GSE53781。合并前3个数据集并对批次效应校正后分为训练集(n=121)和内部验证集(n=53),最后1个作为外部验证集(n=26)。训练集中单因素Logistic和t检验筛选与病理学缓解相关基因(未多重校正P<0.05),并按P值排秩。取P<0.05所有基因纳入LASSO算法,取前50基因纳入SVM算法构建预测模型并在对应的验证集中验证。反复随机取样500次以判断标签基因和模型的稳定性。取LASSO算法纳入模型次数最多的21个基因作为构建预测模型的候选基因,分别以在174例合并数据集或外部独立验证集中的Logistic回归系数与表达值乘积和作为放化疗敏感指标进行验证。在174例合并数据集中分析NRCT缓解组与未缓解组间差异表达基因和调控网络。结果:1.GSE35452、GSE46862和GSE68204数据集共12803个基因纳入分析。LASSO算法在内部验证集中诊断病理学缓解的准确性、特异性和灵敏度分别为0.523(95%CI:0.396-0.642)、0.578(95%CI:0.373-0.762)、0.464(95%CI:0.258-0.700)。SVM法在内部验证集中的诊断准确性、特异性和灵敏度分别为0.504(95%CI:0.377-0.623)、0.596(95%CI:0.393-0.830)、0.405(95%CI:0.182-0.650)。LASSO算法纳入模型次数最多的21基因,其放化疗敏感指标对174例合并数据集和外部独立验证集的病理学缓解诊断的AUC分别为0.863(95%CI:0.811~0.912)和0.925(95%CI:0.817~1.000)。2.在174例合并数据集中,差异表达基因共505个,它们主要是受NF-kB、CTNNB1、IL6/STAT3、E2F1、GLI2以及MYC转录因子调控。调控网络分析表明直肠癌放化疗抵抗可能由直肠癌浸润、转移以及干性转化的机制介导。结论:1.本研究筛选出21个预测基因,可能与直肠癌放疗和化疗敏感性有密切联系,其机制涉及糖代谢、丝氨酸/甘氨酸合成与代谢、促凝血机制、转录调控和细胞周期调控等。2.利用筛选出的相关基因构建局部进展期直肠癌新辅助放化疗疗效预测模型具有一定的预测能力,仍需我们进一步完善。