论文部分内容阅读
背景和目的:肝细胞癌(hepatocellular carcinoma,HCC)是全世界最常见的恶性肿瘤之一,排在我国癌症死因的第二位。我国是肝癌大国,肝癌的五年总生存率仅为14.1%。肝癌患者长期生存率低的原因有很多,如高危人群筛查率低;早期诊断率低,大多数患者在确诊时已经是中晚期;肝细胞癌的异质性导致新辅助治疗和免疫治疗效果有限;术后5年复发转移率高达40%-70%等。因此,探索更适合的筛查、诊疗和预测的方法极为重要。随着生物信息技术的快速发展,研究肝癌发生发展过程中的分子生物学变化,能够帮助评估患癌风险、寻找早期诊断或预测生存期的标志物、探索新的治疗靶点以及进行肿瘤分型。长链非编码RNA(long non-coding RNA,lncRNA)是一类转录本长度超过200个核苷酸大小的RNA,不具备蛋白质编码能力。但近年来的研究表明,lncRNA具有广泛的生物学功能,在肝癌发生发展过程中扮演着重要的作用,可以调控肿瘤细胞的增殖、分化、侵袭以及转移等多种生物学过程,有望成为肝癌诊断及预后新的生物标志物和潜在的治疗靶点。坏死性凋亡是一种程序性细胞死亡方式,被发现在癌症的发生、发展、转移、免疫等生物学调控中发挥关键作用。近年的研究发现,lncRNA与癌细胞的程序性细胞死亡关系密切。本文旨在通过生物信息学方法,整合TCGA数据库中肝细胞癌的转录组数据和临床信息,筛选出与坏死性凋亡相关的lncRNA,并基于这些lncRNA进行肿瘤分型并构建预后风险模型,为肝癌患者的预后风险预测和免疫治疗提供参考和依据。研究方法:从癌症基因组图谱(The Cancer Genome Atlas,TCGA)网站下载肝细胞癌(TCGA-LIHC)转录组测序数据和详细的临床资料。借助Perl语言脚本提取转录组数据表达矩阵,并继续提取lncRNA表达矩阵和m RNA表达矩阵。从已发表的文献中收集到67个坏死性凋亡相关基因。从m RNA表达矩阵中提取坏死性凋亡基因的表达量,得到坏死性凋亡基因的表达文件。然后将该文件与lncRNA的表达矩阵进行相关性检验,得到相关系数和相关性检验的p值并保留筛选后的lncRNA作为坏死性凋亡相关lncRNA(相关系数过滤标准cor Filter=0.4,p值过滤标准pvalue Filter=0.001)。利用“limma”R包筛选在肝癌和正常肝组织中差异表达的坏死性凋亡相关lncRNA(FDR<0.05且|log FC|>1),然后将这些lncRNA的表达数据与整理后的生存资料合并。进行单因素COX回归分析(p<0.05),根据p值选择预后相关的lncRNA进行Lasso(Least absolute shrinkage and selection operator,Lasso)回归分析,以最小的λ值筛选出的lncRNA进行后续的多因素COX回归分析。将343位肝癌患者(删除生存时间未知,生存时间小于30天和生存状态未知的样本)按照1:1的比例随机分为训练组和测试组。基于多因素COX回归分析筛选出的坏死性凋亡相关lncRNA的表达量和回归系数构建预后风险模型,同时计算出每个肝癌患者的风险得分,根据训练组风险得分的中位值将样本分为高低风险两组。通过KaplanMeier分析、时间依赖的受试者工作特征(ROC)、nomogram、校准曲线来验证和评价模型。然后对高低风险组进行主成分分析(PCA)、免疫微环境和免疫检查点分析。最后利用筛选出的坏死性凋亡相关lncRNA的表达对肝癌患者分群,分析肿瘤分型间的差异。结果:本研究中肝癌的转录组和临床数据来源于TCGA数据库,经过相关性分析筛选得到1016个坏死性凋亡相关lncRNA。然后通过与正常组织进行差异分析,找到280个具有显著差异的坏死性凋亡相关lncRNA。对280个差异性表达的1nc RNA进行单因素Cox回归分析,以P<0.05为筛选标准共得到27个差异性表达的1nc RNA与肝癌患者的预后有关。进一步通过LASSO回归分析,得到9个与肝癌患者的预后更相关的坏死性凋亡相关1nc RNA(P<0.05)。将LASSO回归分析中得到的9个1nc RNA进行多因素Cox回归分析,提取每个lncRNA的表达量和回归系数,构建基于5个1nc RNA的肝癌预后风险模型,同时计算每一个样本的风险得分,根据训练组风险得分中位数将患者分为高、低风险两组。K-M生存曲线结果显示高风险组患者的预后较差(P<0.01),ROC曲线结果显示1年,3年和5年生存率的曲线下面积分别为0.802、0.704、0.685,表明该模型具有较好的预测能力。对肝癌免疫微环境和免疫检查点分析,结果提示高风险组免疫细胞浸润水平更高,大多数免疫检查点也在高风险组更多的被激活。这提示构建的风险模型可以根据肿瘤免疫微环境对肝癌患者进行区分,更有希望找到合适的免疫检查点抑制剂。利用这5个坏死性凋亡相关lncRNA的表达对肝癌患者重组为两个集群,cluster1和cluster2。经过主成分分析验证,这两个集群在风险性和聚类上可以很好的区分开。在Kaplan-Meier分析中,cluster1生存期要明显好于cluster2(p<0.01)。cluster2中的肝癌组织免疫细胞浸润的程度更高且免疫评分高于cluster1,有显著差异(p<0.01)。因此,利用经过筛选后的坏死性凋亡相关lncRNA可以将肝癌区分为热肿瘤(cluster 2)和冷肿瘤(cluster 1),两者可能会对免疫治疗存在不同对反应,cluster 2更容易受到免疫治疗的影响。结论:我们的研究表明,坏死性凋亡相关lncRNA与肝癌的预后,免疫分型密切相关。基于5个坏死性凋亡相关lncRNA构建的预测模型能较好的预测肝癌患者的生存预后,具有一定的临床参考价值。不仅如此,利用这5个坏死性凋亡相关lncRNA的表达可以简单有效地区分冷、热肿瘤,筛选肝癌高风险人群,指导制定个性化的免疫治疗方案。我们的研究为预测肝癌患者的预后提供了一种新的模型,并为阐明和验证坏死性凋亡、lncRNA、肿瘤免疫在肝癌之间的机制和联系提供了一定的生物信息学基础。