论文部分内容阅读
背景:肝癌是发生于肝脏组织中的一种常见恶性肿瘤。肝癌具有初期隐匿且临床症状不典型,中后期发展迅速的特点,其发生率和死亡率近年来不断升高,严重威胁着人类的生命和健康。由于癌变过程是一个涉及多基因、多步骤、多阶段的复杂生物学过程,肝癌的关键分子标记物及肝癌状态下的异常基因表达模式和通路的研究,对理解肝癌的发生发展过程及临床诊断具有重大的意义。TCGA项目,即美国政府发起的癌症和肿瘤基因图谱计划,为系统分析癌症组织提供了海量的实验数据。已有的共表达网络分析、文献挖掘、富集分析、表观信息整合分析等工具为研究癌症基因组提供了一个新的研究方法。 方法:本工作以取自 TCGA数据库的肝癌基因、miRNA、DNA甲基化和拷贝数等表达谱的数据为研究对象,采用以下方法进行了相关研究:第一,应用WGCNA(Weighted Gene Coexpression Network Analysis),即加权基因共表达网络的方法,对肝癌基因和miRNA的数据进行共表达网络的分析,寻找与TNM分期相关的枢纽基因或 miRNA。第二,通过临床信息将基因表达量数据按照肝癌TNM分期分成Normal、Stage I、Stage II三个数据集,分别对Normal和Stage I、Stage I和Stage II进行差异表达分析,得到两组差异基因簇,通过对两组差异基因簇的维恩图分析,寻找与Stage II特异相关的基因;基于数据库、文献挖掘、富集分析等手段,构建肝癌发生过程的基因互作网络图。第三,使用 CNAmet软件包对肝癌的基因表达量、甲基化、拷贝数进行了整合分析,采用 TCGASpliceSeq工具分析对DNA甲基化和拷贝数对基因表达有显著影响的基因进行可变剪接分析,初步探究肝癌状态下异常剪接模式和表观遗传信息的关联。 结果:第一,通过共表达网络分析得到了226个与肿瘤分期高度相关且在模块中具有高连接度的枢纽基因和1个 miRNA(hsa-mir-4746),Stage I上调的基因显著富集到细胞周期等GO子类。第二,富集到MAPK和p53信号通路的基因显著上调,得到313个Stage II特异差异表达基因,其中ATP1A4、CELA3B、CTRB1、CYP11B2、PNLIPRP1、GLI2、SERPINB3、SERPINB4、UGT1A5、WNT7A与肿瘤血管构建、转移相关,并绘制了肝癌发生过程的基因互作网络图。第三,整合分析发现了DNA甲基化和拷贝数对基因表达有显著影响的267个基因。可变剪接分析发现 AOC1、CDH19、SELP、TYRP1、RGS13、CACNB3的剪接模式在正常和肝癌样本中有明显差异。 结论:肝癌分期与细胞周期紧密相关,hsa-mir-4746可能是肝癌分期潜在的分子标志物;MAPK信号通路和p53信号通路可能是肝癌发生的主要通路;DNA甲基化和基因拷贝数变异对肝癌状态的剪接模式可能存在潜在的调控作用。