论文部分内容阅读
目的:肺腺癌(lung adenocarcinoma,LUAD)是肺癌的主要亚型之一,预后不良。最近的研究表明缺氧相关的可变剪切(alternative splicing,AS)在多种癌症中发挥重要作用,但其在LUAD中的研究较少。本研究旨在探究LUAD中缺氧相关的可变剪切特征及预后价值,并构建相应的预后模型。方法:首先,从TCGA数据库(https://www.cancer.gov)下载LUAD的转录组数据以及相应的临床信息,随后从TCGA Splice Seq(https://bioinformatics.mdanderson.org)中下载LUAD的AS事件。在GSEA网站(www.gsea-msigdb.org)获取缺氧信号显著的基因集,并提取其中的缺氧相关基因(hypoxia-related genes,HRGs),然后比较LUAD肿瘤样本和正常样本之间HRGs表达量的差异,得到显著差异的HRGs,随后将基因所对应的AS事件与所获取的差异HRGs相匹配。随后将有完整临床信息的样本随机平分为训练集和测试集。在训练集中,通过单因素Cox回归和Lasso回归分析获取在LUAD中与总生存期(overall survival,OS)相关的差异表达的可变剪切事件(differentially expressed alternative splicing,DEAS),随后进一步进行多因素Cox回归分析,从DEAS中进一步筛选出的有预后价值的AS事件,然后通过风险评分公式计算每个样本的风险值,将样本以风险评分中位值为阈值分为高、低分险组。将有预后价值的临床因素与风险评分整合后建立临床列线图。预后模型的效能和准确性通过Kaplan-Meier生存分析和受试者工作特征曲线(receiver operating characteristic curve,ROC)评估,其可靠性在测试集中进行验证。同时,使用GO和KEGG分析探究与OS相关的DEAS事件的潜在生物学机制。最后,使用ESTIMATE算法评估缺氧环境下LUAD的免疫浸润情况,并比较高低风险组之间肿瘤突变负荷(tumor mutational burden,TMB)的差异。结果:首先通过差异分析获取了429个HRGs,对LUAD中的AS事件的剪切百分比值(percent spliced in,PSI)进行过滤后,共检测到272个HRGs以及对应的805个AS事件,对上述HRGs进行差异表达分析后,得到184个差异基因以及相对应的379个DEAS。通过单因素Cox回归分析,确定了50个与OS显著相关的DEAS,其相应基因的功能富集结果为:调节RNA聚合酶II启动子对缺氧的反应、ADP代谢的转录调控过程、核染色体分离和有丝分裂。将与OS相关的DEAS用于拟合Lasso-Cox回归模型,最终发现了11个AS事件有显著的预后价值,包括PSMF1-58475-AA、PAIP1-71962-AD、AMPD3-14345-AP、NOLC1-12942-AA、SNAPC5-31278-ES、FANCI-32419-ES、DDX11-20967-ES、PDCD2-78501-RI、HIF3A-50552-AT、LRP8-3060-ES和IDE-12532-AT。随后以训练集的风险评分的中位值为阈值,开发了一种预后分类器,将患者分为高风险组和低风险组。生存率分析表明,低风险组的患者比高风险组的患者生存率显著提高。随后生成了第1、3、5、10年的ROC曲线,并计算出曲线下的面积(area under the curve,AUC),在训练集中ROC的AUC值在0.755至0.828之间,在测试集中ROC的AUC值在0.611至0.685之间。将肿瘤Stage分期和风险评分整合构建了列线图,该列线图的校准曲线在预测和实际预后之间显示出良好的一致性,用于总生存期预测的一致性指数(concordance index,C-index)在训练集中为0.777,在测试集中为0.827。免疫浸润评估表明高风险组患者表现出较低水平的CD4记忆静息T细胞(P=0.031)和静息肥大细胞(P=0.013),高风险组患者的巨噬细胞M0水平较高(P=0.002)。此外,将ESTIMATE算法用于肿瘤微环境评分,从而评估LUAD的免疫评分和基质评分。与低风险组患者相比,高风险组患者显示出明显更高的肿瘤纯度和较低的免疫评分,但在基质评分方面无显著差异。结论:该研究筛选出了具有预后价值的11-AS,建立了LUAD患者风险评估的预后模型,可以有效将LUAD病人有效分为高低风险组,可以更精准判断LUAD患者的预后,促进LUAD的个体化治疗。