论文部分内容阅读
随着全基因组DNA甲基化谱芯片的快速发展和应用,已经积累了大量的各种不同癌型的DNA甲基化数据。基因启动子的异常甲基化在癌症的发生过程中起着重要的作用,但是其功能特征尚不明确。同时,由于在癌基因组中存在着广泛的基因启动子差异甲基化,如何从大量的甲基化异常的基因中提取出导致癌症发生的“驱动”基因也是一个重要的问题。因此,本论文首先系统的分析了启动子差异高、低甲基化基因在癌症发生过程中的功能模式,然后提出了一种结合基因甲基化谱和表达谱筛选“驱动”基因的算法,最后针对配对样本的特殊数据对该算法做了适当的调整。本文主要包括以下三部分内容:1.癌组织中启动子高、低甲基化基因的功能模式分析。首先,通过对五套不同癌型的全基因组启动子甲基化数据的功能分析,分别评价了高甲基化基因和低甲基化基因在不同癌型中的功能一致性,发现高、低甲基化基因在不同癌型中均是功能一致的。然后,确定了一组高甲基化基因特异的功能(主要和发育过程,生物学过程调控,细胞内信号转导等功能相关),这组功能显著富集高甲基化基因,而显著缺乏低甲基化基因(少于随机期望值)。同时,本工作也确定了一组低甲基化基因特异的功能(包括细胞死亡和刺激应答,免疫和炎症应答)。这些结果说明启动子高、低甲基化基因在不同的癌型中分别存在着相同的功能模式,而在癌组织中发生的高、低甲基化基因倾向于影响不同的功能。2.预测癌症的“驱动”基因。假设一个“驱动”基因的甲基化改变会导致该基因以及一组下游基因的表达改变,进而扰动一个或多个癌相关的通路,最终诱导癌症表型的出现。据此提出了一种整合基因甲基化谱和表达谱数据筛选“驱动”基因的方法。利用多套乳腺癌数据,多组“驱动”基因被筛选出来。然后,通过已有的癌基因数据库结合蛋白质互作网络,证明了筛选出的癌“驱动”基因的可靠性。最后,我们发现有些“驱动”基因的甲基化改变对basal-like, luminal-A和HER2+三种乳腺癌亚型是亚型特异的甲基化改变。3.在癌症-正常配对的甲基化谱数据中筛选癌症的“驱动”基因。从每个患癌个体的癌组织与癌旁正常组织采集的癌症-正常配对数据提供了每组配对样本特有的自身相对改变的信息。针对此特点,对前面提出的预测癌症“驱动”基因的方法做了调整,提出了一种整合癌症-正常配对样本基因甲基化谱和表达谱数据筛选“驱动”基因的方法。把这种方法应用到了一个由五套乳腺癌配对样本整合的数据中,筛选出了一组癌症“驱动”基因,并且通过已有的癌基因数据库证实这组“驱动”基因和癌症的发生密切关联。综上,本工作证明了高、低甲基化基因在多种癌型中分别存在着相同的功能模式,这表明低甲基化在癌症的发生过程中具有和高甲基化同样重要的作用;同时提出的整合基因甲基化谱和表达谱来预测癌症“驱动”基因的方法可以有效地识别癌症“驱动”基因,有助于人们对启动子甲基化改变在癌症中的分子致癌机制的了解,并对未来癌症的表观遗传学靶向治疗有重要的提示意义。