论文部分内容阅读
背景肝癌(liver cancer)是最常见的恶性肿瘤之一,发病率和死亡率高。早期诊断争取最佳治疗时机很重要。研究表明:基因在肝癌形成的过程中起到重要的作用,参与了癌症形成的多个阶段。正常肝细胞到癌前变过程及癌前病变至肝癌过程皆存在特征性的差异表达基因,随着免疫组织化学和分子病理学以及分子生物学的发展,分子杂交技术与组织形态学检测相融合,免疫学及分子生物学研究在肝癌病理的研究方面发挥重要作用,随着越来越多的肝癌相关的基因及其蛋白质产物的发现,为探讨肝癌发病机制发现了新方法,更加能够揭示肿瘤组织的生长活性在肿瘤生长、浸润和转移方面的作用,从而更加准确地指导临床治疗,判断预后。目的全基因表达谱与甲基化谱关联分析挖掘肝癌的表观驱动的预后标志物。材料和方法下载肝癌的甲基化450k数据和RNA-Seq数据,匹配甲基化谱与RNA-Seq共同的癌与癌旁样本,经过数据标准化后,进一步筛选出在各个样本中变化差异的基因和差异的启动子甲基化基因,进一步找出启动子甲基化与基因表达差异状态互斥的基因即差异上调且差异启动子甲基化下调基因(Epigenetically induced,EI)和差异下调其差异启动子甲基化上调基因(Epigenetically suppressed,ES),进一步通过富集分析这些基因的功能,计算EI和ES基因的启动子甲基化与其表达的相关性,筛选出显著负相关的基因作为最终的EI和ES基因,进一步整合人类蛋白质互作网络,构建EI|ES-互作子网,进一步挖掘子网中的关键基因,分析关键基因的功能以及在癌症发生发展中的表达变化及其对预后的影响,进一步使用GEO数据验证关键基因在癌症中的表达与其启动子甲基化的关系。结果从TCGA数据集中得到41对同时包含RNA-Seq数据及甲基化450k数据的癌和癌旁样本,根据差异筛选条件从17937个基因中共得到了5119个在癌和癌旁样本中表达差异的基因,其中4519个基因上调,600个基因下调;从17937个启动子甲基化基因中共得到8853个在癌和癌旁样本中差异的启动子甲基化基因,其中3467个基因启动子甲基化上调,5386个基因启动子甲基化下调。启动子DNA甲基化与正常和癌组织中的基因表达之间存在负相关,差异上调与差异启动子甲基化下调基因即EI共1177个,差异下调与启动子甲基化上调基因即ES共165个。通过网络挖掘进一步筛选显著负相关的基因,共得到EI基因419个,ES基因68个。构建EI|ES基因互作子网,具有互作用基因共有315个,其中EI|ES基因富集性最高且显著性p值的FDR小于0.05的基因分别为TIPIN、RBM15B、DUSP28、TRIM31。其中,TIPIN、RBM15B在癌症的各个stage中存在显著的表达差异,差异有统计学意义,p值分别为0.00228、0.00562;TIPIN、RBM15B表达高低与预后表现出显著差异,差异有统计学意义,p值分别为0.037、0.0064,TIPIN、RBM15B表达越高,预后越差。DUSP28、TRIM31在癌症的各个stage中的表达及对预后的影响差异无统计学意义。我们使用GEO数据集GSE2977验证TIPIN、RBM15B的表达与启动子甲基化存在显著的差异,并且存在互斥现象。结论1.肝癌的表观诱导的潜在肿瘤标记物为TIPIN、RBM15B。2.TIPIN、RBM15B与肝癌的发生发展过程密切相关。3.TIPIN、RBM15B与肝癌患者的预后相关,高表达的患者预后差。4.TIPIN、RBM15B的表达与启动子甲基化存在显著的差异,并且存在互斥现象。