论文部分内容阅读
目的:挖掘肝细胞癌基因芯片数据,筛选出肝细胞癌相关的易感生物靶点分子,初步探索肝细胞癌发生发展过程中的生物功能富集通路,构建肝细胞癌的疾病模块并进行功能分析,为肝细胞癌患者的病因研究与早期诊断提供依据。方法:(1)从GEO数据库中检索出肝细胞癌基因芯片数据集GSE14520,数据来自平台GPL3921。该数据集为人类来源的全基因组RNA表达芯片,共选取225例肝细胞癌组织标本和220例癌旁正常组织标本进行后续研究。(2)利用GEO2R在线分析平台对基因芯片数据进行标准化处理,以|log2FC|>1、P.adjust<0.05为标准筛选肝细胞癌差异表达基因。(3)利用DAVID在线分析工具对筛选出的前250位肝细胞癌差异表达基因进行GO功能富集分析和KEGG通路富集分析。(4)应用String在线分析平台构建差异表达基因的蛋白-蛋白交互作用网络,并利用Cytoscape3.6.1软件对蛋白交互作用网络进行可视化分析,使用Cytoscape软件中的MCODE应用程序对蛋白交互作用网络进行疾病模块化分析,利用DAVID在线分析平台对疾病模块中的差异基因进行生物通路富集分析,得到各个模块所代表的生物学功能。(5)使用CytoHubba对蛋白质相互作用网络进行核心基因筛选,并根据连通度(Degree)大小进行排序,筛选出核心基因。(6)通过前期的生物信息学分析和文献数据库检索,对得到的肝细胞癌易感基因与疾病发生发展之间的关系进行Meta分析,综合分析既往研究,达到生物信息学研究补充和验证的目的,以期更全面的得到易感基因与肝细胞癌发生发展之间关系的分析结果。结果:(1)对GSE14520数据集进行分析,利用GEO2R筛选得到排序前250位的肝细胞癌差异表达基因,其中上调基因122个,下调基因128个。(2)GO功能生物过程分析显示肝细胞癌差异表达基因在有丝分裂细胞周期过程、细胞周期过程、细胞分裂、有丝分裂细胞周期相变、细胞对锌离子的反应、细胞周期调控、核分裂,染色体组织通路等过程中发挥作用;KEGG富集通路显示肝细胞癌差异基因在矿物质吸收、细胞周期、DNA复制、视黄醇代谢、代谢途径、药物代谢-其他酶、咖啡因代谢、卵母细胞减数分裂、药物代谢-细胞色素P450及其对异生物的代谢通路等生物途径中起调节作用。(3)构建PPI网络,共得到195个基因,通过CytoHubba对PPI网络进行核心基因筛选,提示CDK1(Degree Score=63)、RFC4(Degree Score=59)、CDC20(Degree Score=58)和CCNB1(Degree Score=57)等基因可能在肝细胞癌的发生过程中起到重要的调节作用。(4)通过Cytoscape3.6.1软件的MCODE应用程序进行网络模块分析显示,共有四个主要的疾病模块,其中MCODE得分最高的疾病模块A(MCODE Score=41.143)主要与细胞周期、DNA复制、卵母细胞减数分裂、孕酮介导的卵母细胞成熟、p53信号通路和人类T淋巴细胞白血病病毒Ⅰ型感染通路相关。(5)通过Meta分析,中国人群CYP2E1基因型频率分布与患肝细胞癌风险增加无统计学关联,合并OR=0.67(95%CI:0.39,1.14),Z=1.48,P=0.14;中国人群PTTG1高表达与患肝细胞癌风险增加有关,且这种关联具有统计学意义,合并OR=7.94(95%CI:1.22,51.85),Z=2.16,P=0.03。结论:(1)肝细胞癌的发生发展可能与细胞周期和有丝分裂的异常进程相关,其中CDK1、RFC4、CDC20和CCNB1等基因可能在肝细胞癌的进展中起着较重要作用,可作为肝细胞癌后续研究潜在的易感生物靶点。(2)PTTG1基因高表达可能是肝细胞癌发生发展的危险因素。