论文部分内容阅读
研究背景和目的在世界范围内,食管癌是癌症相关死亡的第六大原因,是最具侵袭性的疾病之一。在过去的几十年中,食管癌患者的预后虽有所改善,但相较于其他大多数癌症,其预后仍然较差,5年存活率仅为20%。即便是接受手术治疗的早期患者,5年内依然有50%的可能性复发。临床上,TNM分期是食管癌生存的主要预测指标,然而具有相同肿瘤分期且接受相似临床治疗的患者,其结局也可能截然不同,表明该指标无法为患者提供充分的预后信息。因此,为提高患者的个体化预测和治疗方案选择的准确性,尚需筛选新的预测指标来补充分期系统。目前已有部分研究从基因和浸润免疫细胞层面来寻找食管癌预后的潜在指标,但仍有一些问题亟待解决,如阴性样本数据利用不充分,模型免疫特征纳入少以及预测准确度有限等。本研究从食管癌生物学特征的不同角度来构建预后模型,并将其整合至列线图模型,以期对食管癌患者的预后进行更准确地预测。研究内容和方法本文利用食管癌的基因表达数据来对患者的预后进行研究,样本的基因表达数据及其相应的临床数据从基因表达综合数据库(Gene Expression Omnibu,GEO)和癌症基因组图谱(The Cancer Genome Atlas,TCGA)中下载获得。本研究从基因表达和免疫浸润两个角度分别对食管癌的预后进行了探讨,并初步构建了食管癌患者的列线图个体化预测模型。研究工作主要从以下几个方面展开:(1)基于基因表达数据的风险模型构建:利用加权基因共表达网络分析(Weighted gene co-expression network analysis,WGCNA)算法分别构建正常组织与肿瘤组织的共表达网络,并将其划分为不同的模块,随后从网络节点密度与节点连通性的角度对基因模块的保守性进行评估。并在此基础上提出了逐步向前加权随机生存森林方法来筛选预后拓扑重要的基因。(2)基于浸润免疫细胞的风险模型构建:利用基因的表达数据通过CIBERSORT反卷积算法来量化食管癌样本中的免疫细胞,并使用x Cell算法对免疫细胞的含量进行验证。通过LASSO COX回归模型来筛选食管癌预后相关的免疫特征,并建立基于免疫细胞的预后预测模型;(3)整合多指标的列线图模型构建:将食管癌预后相关的多个指标整合到列线图模型,并实现交互式图示化的预测。通过ROC曲线、一致性指数、校准曲线和决策曲线来评价模型的预测性能及其临床应用价值。研究结果通过WGCNA算法分别在正常组织和肿瘤组织的共表达网络中识别出32个和20个基因模块。模块保守性分析结果显示,正常组织中有8个基因模块在肿瘤组织网络中不保守,其中两个模块的保守性统计量小于2,分别是purple(Zsummary=0.200,Psummary=0.102)和midnightblue(Zsummary=0.603,Psummary=0.321)。功能分析结果表明,非保守性模块中的基因在消化,胃肠道上皮细胞的维持,消化道发育及胃酸分泌等生物学过程或通路中显著富集。对非保守性模块中的基因我们先使用COX模型和加权随机生存森林来降维,再通过LASSO方法来细化纳入预后模型的特征,最终构建了一个基于24个基因特征的RNA评分模型。训练队列中RNA评分分别在第2、3和5年的预测中取得了0.805、0.801和0.824的AUC值。验证队列中第2、3和5年的预测AUC值为0.701、0.645和0.811。通过CIBERSORT反卷积算法,我们得到了22种浸润免疫细胞的丰度。食管癌组织中含量最高的前5种免疫细胞分别为浆细胞、静息态树突状细胞、CD8+T细胞、激活态肥大细胞与调节性T细胞,其平均比例的总和为64.8%。通过LASSO COX回归模型筛选出12种免疫细胞来构建免疫评分模型。训练队列中免疫评分模型分别在第2、3和5年的预测中取得了0.733、0.736和0.747的AUC值。验证队列中第1、2和3年的预测AUC值为0.649、0.664和0.724。基因集富集分析结果显示,低免疫评分组显著富集于免疫相关通路,包括炎性反应、IL6-JAK-STAT3信号、T细胞受体信号通路与肠道免疫网络Ig A产生等。在不同临床特征的分层分析中,RNA评分和免疫评分能将食管癌患者进一步划分为不同风险分组的人群,表明这两个指标都能够补充TNM分期系统的预测能力。多因素回归模型显示RNA评分、免疫评分、年龄和肿瘤分期是食管癌预后的独立影响因素,并将其整合至列线图模型用于可视化。列线图模型分别在第2、3和5年的预测中分别取得了0.851、0.842和0.857的AUC值,实现了预后预测价值的最大化。一致性指数显示列线图模型的预测能力优于TNM分期系统以及单个指标的预后预测。在校准曲线中预测线与理想线具有高度一致性。决策曲线结果显示,整合多指标的列线图模型比TNM分期系统具有更高的临床应用价值。开发的交互式列线图工具可方便快速地对患者预后情况进行评估。研究结论和意义(1)从系统的角度来对网络进行比较可充分利用阴性样本的信息,因此能获得具有更高生物学相关性的基因模块;(2)整合了网络权重信息的逐步向前随机生存森林方法可有效筛选出与预后相关且在网络中具有高度连通性的基因特征;(3)基于基因表达的RNA评分与基于浸润免疫细胞的免疫评分均可作为食管癌患者预后的可靠指标;(4)相较于与传统的TNM分期系统,整合多个指标的列线图模型可以更加准确地对患者的预后进行预测。综上,本研究构建的食管癌预后预测模型具有较高的准确性,对患者个性化治疗方案的选择以及临床决策的制定有着重要的指导意义。此外,这种通过对网络的连通性和模块性进行比较,并在网络上寻找发挥特殊作用的基因的分析思路,为复杂性状疾病的机理研究以及寻找疗效指标提供了新的视角。