论文部分内容阅读
目的:通过生物信息学分析筛选肝细胞癌(Hepatocellular carcinoma,HCC)的差异表达基因(Differentially expressed genes,DEGs),探讨其在HCC发生发展中的作用,为HCC的诊治与预防提供新思路。方法:(1)采用R语言对数据集GSE102079、GSE121248、GSE84402和GSE60502中HCC及正常肝脏组织进行分析,筛选出DEGs;利用DAVID数据库对其进行GO功能分析和KEGG通路富集分析;(2)利用STRING数据库构建了蛋白质相互作用(Protein-protein interaction,PPI)网络,将所得源文件导入Cytoscape软件对PPI网络进行可视化分析,并用插件cytoHubba进行关键基因筛选;(3)为验证关键基因,首先采用GEPIA数据库分析关键基因与HCC患者预后的关系,然后用UALCAN和Oncomine数据库、qRT-PCR法检测关键基因在HCC及正常组织中的mRNA表达水平,最后使用HPA数据库找出关键基因在蛋白水平的差异;(4)使用LinkedOmics数据库揭示候选基因与HCC临床特征的关系。(5)使用NetworkAnalyst在线工具获得了调控关键基因的转录因子(Transcription factors,TFs)并用GEPIA分析了其与关键基因的相关性。结果:(1)筛选出591个在HCC中显著表达的上调基因,它们主要参与细胞周期、DNA复制、嘧啶代谢和p53信号通路等过程,与HCC的发生机制密切相关;Venn图显示同时富集在前10位的KEGG/GO中有51个基因;(2)应用51个上调基因构建PPI网络,筛选出前10位的关键基因分别是CDK1、CCNB2、CCNB1、CDC20、BUB1、MAD2L1、MCM3、BUB1B、MCM2和RFC4;(3)GEPIA数据库分析显示:除CCNB2外,其余9个基因的高表达与HCC患者的不良生存有关;UALCAN、Oncomine和qRT-PCR分析表明这9个基因在HCC组织中显著高表达;HPA数据库结果显示HCC组织中CDK1、CCNB1、CDC20、MAD2L1、MCM3、MCM2和RFC4免疫组化染色呈阳性;(4)LinkedOmics数据库显示关键基因与总生存期、总体分期、病理T期、种族和发病年龄有关;(5)TF分析显示MYBL2、KDM5B、MYC、SOX2和E2F4是调控这9个关键基因的TFs;相关性分析显示:MYC与CCNB1、BUB1、MAD2L1、MCM3和BUB1B的表达呈显著正相关,而其余4个TFs均与这9个基因表达呈显著正相关。结论:CDK1、CCNB1、CDC20、BUB1、MAD2L1、MCM3、BUB1B、MCM2和RFC4在HCC中显著高表达并能预测HCC的不良预后,有可能成为HCC的潜在治疗靶点。