论文部分内容阅读
目的:膀胱癌(Bladder cancer,BLCA)是一种发病率高、死亡率高的恶性肿瘤,其发病率和患病率的稳步上升使膀胱癌成为世界上最常见的泌尿生殖道癌之一。RNA结合蛋白(RNA-binding Proteins,RBPs)的异常表达在多种恶性肿瘤中均有报道且与肿瘤的发生、发展密切相关。但RNA结合蛋白在膀胱中的作用仍不清楚,因此探索RNA结合蛋白在膀胱癌中的潜在生物学功能并建立临床预测模型是非常有意义的。方法:本研究通过生物信息学分析,从肿瘤基因组图谱(TCGA)数据库下载BLCA的RNA测序数据和临床数据,利用R软件筛选出正常组织和癌组织中差异表达的RNA结合蛋白(DERBPs)。为了识别相关通路并对DERBPs进行功能注释,利用R软件进行GO&KEGG生物富集分析来分析其主要参与的生物学过程,并可视化。后利用互作基因检索工具(STRING)数据库进行蛋白质-蛋白质相互作用(PPI)分析,并用Cytoscape 3.7.2软件以及其中的MCODE插件来筛选了关键模块并进行可视化处理。后通过对DERBPs基因进行单因素和多因素Cox回归分析,识别出与生存相关的RBPs,并建立预后模型。为了验证模型的有效性将所有患者的生存数据以1:1随机分为训练组Train和验证组Test,分别计算两组患者的风险评分。并从生存分析、ROC曲线、风险曲线和独立预后分析等方面来验证模型的有效性。然后基于预测模型绘制列线图。并最后利用Human Protein Atlas(HPA)数据库分别在基因的转录和翻译水平再次验证模型的有效性。结果:共筛出385个DERBPs基因,其中上调基因218个和下调基因167个。GO&KEGG生物富集分析后提示,DERBPs主要参与了nc RNA代谢过程、nc RNA加工、核糖核蛋白复合物的生物发生过程、翻译调控、RNA剪接、t RNA代谢过程、核糖体合成、核糖核酸分解过程、m RNA分解、细胞质核糖核蛋白体、m RNA代谢过程的调控、核糖核蛋白颗粒、RNA催化活性等生物进程。STRING数据库中将置信评分设为0.7后得到一个包含311个节点和2020条边的蛋白质互作网络。后利用Cytoscape 3.7.2软件中的MCODE插件筛选了3个PPI网络的关键子网络并进行可视化和功能富集分析。对DERBPs基因进行单因素和多因素Cox回归分析后最终确定了由CLK2、HNRNPH3、CTU1、OAS1、MRPL38、CTIF、DARS2和XPOT等8个DERBPs组成的最佳预测模型。根据该模型进一步的分析表明,患者的风险得分与其预后存在差显着相关性。分析显示8-RBPs预测模型的1年、3年、5年的风险值的ROC曲线下面积(AUC)为0.742、0.713、0.776。之后建立了一个基于8-RBPs预后风险评分模型的列线图,该列线图能够很好的预测BLCA患者1年、3年和5年总体生存率。为了验证模型的有效性在TCGA队列中进行了内部验证,验证组1年、3年、5年风险值的AUC分别为0.720、0.639、0.653,同样验证了该模型的对BLCA的预测价值。最后利用Human Protein Atlas(HPA)数据库分别在转录和翻译水平再次验证了8-RBPs模型的有效性。结论:本研究基于生物信息学方法,通过对TCGA数据库的BLCA分析获得了CLK2、HNRNPH3、CTU1、OAS1、MRPL38、CTIF、DARS2和XPOT等8个RBPs基因组成的最佳预测模型,且多指标验证了8-RBPs基因预后模型对预测BLCA的可靠性并基于8-RBPs基因构建了列线图。该研究将有助于提高对BLCA发病和预后的认识,为进一步探讨BLCA的诊断和治疗提供参考。