基于基因表达与浸润免疫细胞的食管癌多指标特征整合及预后预测模型构建研究

来源 :中国人民解放军陆军军医大学 | 被引量 : 0次 | 上传用户:w253602739
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
研究背景和目的在世界范围内,食管癌是癌症相关死亡的第六大原因,是最具侵袭性的疾病之一。在过去的几十年中,食管癌患者的预后虽有所改善,但相较于其他大多数癌症,其预后仍然较差,5年存活率仅为20%。即便是接受手术治疗的早期患者,5年内依然有50%的可能性复发。临床上,TNM分期是食管癌生存的主要预测指标,然而具有相同肿瘤分期且接受相似临床治疗的患者,其结局也可能截然不同,表明该指标无法为患者提供充分的预后信息。因此,为提高患者的个体化预测和治疗方案选择的准确性,尚需筛选新的预测指标来补充分期系统。目前已有部分研究从基因和浸润免疫细胞层面来寻找食管癌预后的潜在指标,但仍有一些问题亟待解决,如阴性样本数据利用不充分,模型免疫特征纳入少以及预测准确度有限等。本研究从食管癌生物学特征的不同角度来构建预后模型,并将其整合至列线图模型,以期对食管癌患者的预后进行更准确地预测。研究内容和方法本文利用食管癌的基因表达数据来对患者的预后进行研究,样本的基因表达数据及其相应的临床数据从基因表达综合数据库(Gene Expression Omnibu,GEO)和癌症基因组图谱(The Cancer Genome Atlas,TCGA)中下载获得。本研究从基因表达和免疫浸润两个角度分别对食管癌的预后进行了探讨,并初步构建了食管癌患者的列线图个体化预测模型。研究工作主要从以下几个方面展开:(1)基于基因表达数据的风险模型构建:利用加权基因共表达网络分析(Weighted gene co-expression network analysis,WGCNA)算法分别构建正常组织与肿瘤组织的共表达网络,并将其划分为不同的模块,随后从网络节点密度与节点连通性的角度对基因模块的保守性进行评估。并在此基础上提出了逐步向前加权随机生存森林方法来筛选预后拓扑重要的基因。(2)基于浸润免疫细胞的风险模型构建:利用基因的表达数据通过CIBERSORT反卷积算法来量化食管癌样本中的免疫细胞,并使用x Cell算法对免疫细胞的含量进行验证。通过LASSO COX回归模型来筛选食管癌预后相关的免疫特征,并建立基于免疫细胞的预后预测模型;(3)整合多指标的列线图模型构建:将食管癌预后相关的多个指标整合到列线图模型,并实现交互式图示化的预测。通过ROC曲线、一致性指数、校准曲线和决策曲线来评价模型的预测性能及其临床应用价值。研究结果通过WGCNA算法分别在正常组织和肿瘤组织的共表达网络中识别出32个和20个基因模块。模块保守性分析结果显示,正常组织中有8个基因模块在肿瘤组织网络中不保守,其中两个模块的保守性统计量小于2,分别是purple(Zsummary=0.200,Psummary=0.102)和midnightblue(Zsummary=0.603,Psummary=0.321)。功能分析结果表明,非保守性模块中的基因在消化,胃肠道上皮细胞的维持,消化道发育及胃酸分泌等生物学过程或通路中显著富集。对非保守性模块中的基因我们先使用COX模型和加权随机生存森林来降维,再通过LASSO方法来细化纳入预后模型的特征,最终构建了一个基于24个基因特征的RNA评分模型。训练队列中RNA评分分别在第2、3和5年的预测中取得了0.805、0.801和0.824的AUC值。验证队列中第2、3和5年的预测AUC值为0.701、0.645和0.811。通过CIBERSORT反卷积算法,我们得到了22种浸润免疫细胞的丰度。食管癌组织中含量最高的前5种免疫细胞分别为浆细胞、静息态树突状细胞、CD8+T细胞、激活态肥大细胞与调节性T细胞,其平均比例的总和为64.8%。通过LASSO COX回归模型筛选出12种免疫细胞来构建免疫评分模型。训练队列中免疫评分模型分别在第2、3和5年的预测中取得了0.733、0.736和0.747的AUC值。验证队列中第1、2和3年的预测AUC值为0.649、0.664和0.724。基因集富集分析结果显示,低免疫评分组显著富集于免疫相关通路,包括炎性反应、IL6-JAK-STAT3信号、T细胞受体信号通路与肠道免疫网络Ig A产生等。在不同临床特征的分层分析中,RNA评分和免疫评分能将食管癌患者进一步划分为不同风险分组的人群,表明这两个指标都能够补充TNM分期系统的预测能力。多因素回归模型显示RNA评分、免疫评分、年龄和肿瘤分期是食管癌预后的独立影响因素,并将其整合至列线图模型用于可视化。列线图模型分别在第2、3和5年的预测中分别取得了0.851、0.842和0.857的AUC值,实现了预后预测价值的最大化。一致性指数显示列线图模型的预测能力优于TNM分期系统以及单个指标的预后预测。在校准曲线中预测线与理想线具有高度一致性。决策曲线结果显示,整合多指标的列线图模型比TNM分期系统具有更高的临床应用价值。开发的交互式列线图工具可方便快速地对患者预后情况进行评估。研究结论和意义(1)从系统的角度来对网络进行比较可充分利用阴性样本的信息,因此能获得具有更高生物学相关性的基因模块;(2)整合了网络权重信息的逐步向前随机生存森林方法可有效筛选出与预后相关且在网络中具有高度连通性的基因特征;(3)基于基因表达的RNA评分与基于浸润免疫细胞的免疫评分均可作为食管癌患者预后的可靠指标;(4)相较于与传统的TNM分期系统,整合多个指标的列线图模型可以更加准确地对患者的预后进行预测。综上,本研究构建的食管癌预后预测模型具有较高的准确性,对患者个性化治疗方案的选择以及临床决策的制定有着重要的指导意义。此外,这种通过对网络的连通性和模块性进行比较,并在网络上寻找发挥特殊作用的基因的分析思路,为复杂性状疾病的机理研究以及寻找疗效指标提供了新的视角。
其他文献
G蛋白偶联受体(G-protein coupled receptor,GPCR)是一类数量庞大的膜受体家族。在人体内GPCR发挥着重要的作用。腺苷2A受体(Adenosine 2A receptor,A2AR)是属于GPCR的A类家族
研究背景:肿瘤发病率随年龄增加而升高,PD-1/PD-L1抗体阻断免疫检查点的治疗,目前已成为很多肿瘤治疗的新方法。但考虑到老年患者的机能下降和其它慢性疾病的发病率升高,他们
中国“新文学”的诞生是从“世界文学”到“中国文学”,再由“中国文学”到“世界文学”的繁杂转变过程,这个转变的发生是十分隐秘的。外国文学的译介在这个转变过程中发挥着
慢性肾病(chronic kidney disease,CKD)是猫发病率和死亡率较高的一种疾病。针对猫CKD的高发病率和死亡率,以及目前治疗方法单一、有效率不高等问题,本研究对猫CKD临床发病情
背景肺癌目前仍然是位居全球肿瘤发病率和死亡率首位的恶性肿瘤。组织类型上肺癌分为非小细胞肺癌(NSCLC)和小细胞肺癌(SCLC),其中,NSCLC占肺癌总类型的80-85%,肺腺癌是NSCLC的主
背景和目的:肝细胞癌(hepatocellular carcinoma,HCC)是肝癌中最常见的类型,发病率和死亡率极高。HCC本身是一个多步骤、多阶段发展的疾病,涉及到的调控机制错综复杂,大量基
本文书写的新民谣音乐是现代流行音乐体系的重要组成部分,区别于传统民歌及流传在民间的歌谣,这种区别既体现在乐理学概念上,又彰显于生产、传播机制中。新民谣音乐起源于西
土壤pH值对植物健康和病虫害抗性具有重要作用。为探究土壤pH值对山核桃干腐病发生的影响,本文通过对野外山核桃样地进行调查,分析了土壤pH值与类型、不同施肥与除草方式对山核桃干腐病感病指数的影响。设置不同土壤pH值的山核桃苗试验组,测定了不同土壤pH值对人工接种茶藨子葡萄座腔菌(Botryosphaeria dothidea)后山核桃干腐病发生的变化,并采用高通量测序,研究了不同pH值对山核桃苗盆栽
研究背景:经皮酒精消融(Percutaneous ethanol ablation,PEA)作为一种局部介入治疗方法,在临床应用于小肝癌治疗已30多年,具有安全有效、并发症发生率低等特点。而肝细胞癌内血
1.研究背景和意义Fractalkine(FKN,亦称CX3CL1)是趋化因子CX3C亚类中的唯一成员,通过与受体CX3CR1特异性结合,募集炎症细胞而在动脉粥样硬化的病理过程中发挥重要的作用。但是