论文部分内容阅读
目的:DARS2是编码天冬氨酰-tRNA合成酶(Asp-tRNA Synthetase,Asp RS)的基因,不仅具有催化蛋白质生物合成的经典功能,而且随着近年来更加深入的研究,已证明其参与部分肿瘤(肝癌、肺腺癌)的演化过程。然而,目前对DARS2在膀胱尿路上皮癌(Bladder Urothelial Carcinoma,BLCA)中作用的认识是有限的。因此,本研究将基于多个数据库,利用生物信息学技术初步探究DARS2在BLCA患者中表达情况,分析其与多种临床变量和预后的相关性;通过基因集富集分析(Gene Set Enrichment Analysis,GSEA)探索DARS2在BLCA发生发展中的潜在调控机制;分析在BLCA中DARS2的表达与肿瘤免疫微环境之间的相关性;进一步评估DARS2在泛癌中的表达情况及其与临床分期、预后的相关性。方法:本研究主要运用R语言及包括GEPIA2、TIMER、cBio Portal、COSMIC在内的多种在线网站对癌症基因组图谱(The Cancer Genome Atlas,TCGA)数据库中BLCA数据和基因表达综合(Gene Expression Omnibus,GEO)数据库中GSE7476数据集进行生物信息学分析。首先,利用R语言初步过滤筛选TCGA-BLCA及GSE7476数据集的完整数据;然后,R语言分析DARS2分别在TCGA-BLCA和GSE7476数据集中的差异表达情况,并利用GEPIA2数据库进行验证;分析DARS2与TNM分期、病理分级、性别、年龄、种族等不同临床病理特征间的相关性并利用单基因logistics回归分析评估DARS2和每个临床变量之间的关系程度;绘制受试者工作特征曲线(Receiver operating characteristic curve,ROC),根据曲线下面积(Area under curve,AUC)分析变量DARS2在区分膀胱尿路上皮癌组织和正常膀胱组织间的能力,并确定最佳阈值;使用Cox生存回归分析评估DARS2表达在预后中的作用,单变量Cox回归中具有统计学意义的变量被进一步纳入多变量Cox回归;在c Bio Portal和COSMIC数据库中评估BLCA中DARS2的突变频率及突变类型;为研究潜在机制,对BLCA样本按照DARS2基因的表达值分成高低表达组(模拟类似过表达或者敲低该基因的效果),分析两组中的差异分子,得到与DARS2可能关联的分子后行GSEA分析并可视化;基于ss GSEA算法分析DARS2与BLCA免疫微环境相关性,并利用TIMER数据库验证,揭示其作为免疫治疗靶点的可能性;最后,从UCSC Xena数据库下载包括BLCA在内的33种癌症类型的基因组数据和相应临床数据后利用R语言、GEPIA2及TIMER数据库对DARS2在泛癌中的表达情况,及其与预后、临床分期的相关性进行可视化分析。结果:与正常膀胱组织相比,DARS2基因在BLCA组织中明显高表达,DARS2表达水平的增加与不同的种族、T分期、M分期、临床分期、病理组织学分级、主要治疗结果、总生存期、疾病特异生存期、肿瘤状态均具有显著相关性。诊断性ROC曲线显示在预测BLCA结局上,变量DARS2的预测能力有一定准确性(AUC=0.868,CI=0.798-0.937),最佳诊断临界值为4.065,灵敏度(84.2%)及特异度(81.1%)均较高。Cox生存回归分析显示,在BLCA患者中,DARS2的高表达与预后不良明显相关,多变量Cox回归风险模型显示DARS2表达水平是BLCA患者的独立预后因素。单基因GSEA分析表明DARS2可能通过影响BLCA患者细胞周期检查点、细胞周期、有丝分裂纺锤体检查点、M期、DNA复制等通路发挥作用。基于ss GSEA分析的结果显示,DARS2表达水平与多种免疫细胞的浸润水平显著相关。最后,从泛癌数据中的进一步分析表明,DARS2在各种癌症组织与正常组织中的表达差异显著,同时其与多种癌症的临床分期和预后有关。结论:研究结果表明,DARS2表达水平的增加与BLCA的进展显著相关,有可能通过促进肿瘤细胞周期、改变肿瘤免疫微环境促进BLCA进展,可以作为BLCA患者的一种新的预后生物标志物,并且有可能在多种肿瘤中推广。