论文部分内容阅读
DNA甲基化是最重要的表观遗传修饰之一,它在癌症发生过程中发挥着重要作用。相对于正常组织细胞而言,癌症细胞基因组中DNA甲基化水平总是紊乱的,而启动子区域CpG位点的甲基化模式改变,与癌症细胞基因表达紊乱息息相关,尽管如此,DNA甲基化与基因表达之间的调控关系还不够清楚,目前尚未形成统一的结论。癌症细胞具有一定的组织来源特异性,而全基因组DNA甲基化数据已经被广泛应用于癌症亚型研究,但是很多研究人员仅关注单一组织来源的癌症亚型,或者在多组学数据整合的研究中不以DNA甲基化为核心。因此,癌症细胞中DNA甲基化的相关研究仍然十分有限,特别是在跨癌症的层面上。本论文以TCGA数据平台提供的全基因组DNA甲基化数据和基因表达数据为基础,在跨癌症水平上,系统分析癌症细胞基因组中CpG位点甲基化的模式特征,深入剖析启动子区域CpG位点甲基化与其所在基因表达的关系,创新利用高异质性的启动子区域CpG位点甲基化数据完成有效的癌症亚型分型。本论文在跨癌症水平上揭示了癌症细胞中转录因子的表达紊乱与DNA甲基化的紊乱相关,而且DNA甲基化的紊乱性是癌症细胞的固有特征,它不是病人特异性导致的,此外,启动子区域CpG位点甲基化的分布模式具有组织来源特异性。我们还发现,启动子区域CpG位点甲基化与其所在基因表达之间,可以同时存在强正相关和强负相关的两种关系,这两种关系在跨癌症水平上都具保守性,而且都与癌症细胞中基因表达紊乱相关。在癌症亚型分型的研究结果中,我们发现有些癌症类型被细分成了多个亚型,有些癌症亚型中则聚集了多种组织来源的癌症样本,而且层次聚类结果中的不同癌症亚型之间,具有临床预后生存差异。总的来说,本论文使用泛癌分析的方法,基于大规模癌症病人的多组学数据,以DNA甲基化为核心,展开了系统和深入的数据分析挖掘工作,揭示了癌症细胞中DNA甲基化模式的分布特征,分析了DNA甲基化与基因表达之间的复杂关系,研究了不同组织来源的癌症样本之间的聚集规律,有效细分了癌症亚型。论文成果进一步完善了癌症DNA甲基化研究领域的知识体系,加深了我们对癌症发生过程的理解,同时,还可以给相关领域的后继研究提供可靠的数据支持,辅助临床上癌症的诊断以及精准医疗方案的制定。