论文部分内容阅读
DNA甲基化是表观遗传方面重要的研究内容之一,是指附着在胞嘧啶第5位碳原子被甲基化转移酶所催化,形成5-CG-3二核苷酸(称为CpG)的化学过程。大多数脊椎动物基因组中存在甲基化胞嘧啶核苷酸的集群,主要集中在基因5非编码区。CpGs中胞嘧啶的甲基化状态影响蛋白-DNA相互作用、染色质的结构和稳定性,因而在生物过程,如转录、X染色体失活及基因组印记中起到至关重要的作用。最近的研究表明,哺乳动物动物中DNA甲基化模式是具有组织或细胞系特异性。然而,我们对那些特定DNA甲基化调节作用的认识并不全面。因此,分析并比较组织和细胞系类型之间的基因甲基化特性,对于了解在不同生物过程中DNA甲基化机理是必不可少的。 基于UCSC基因组浏览器中下载的49611个基因,从中提取具有两个以上外显子的基因,经过筛选后剩余21740个基因。对于任何基因,将它看成由六个功能区域构成,即转录起始区域(TSSR),第一外显子(FE),中间外显子区域(MER),内含子区域(IR),最后外显子区域(LE),和转录终止区域(TTSR)。本文针对9类细胞系和15种组织,从NCBI数据库浏览器中下载了Bisulfite-Seq甲基化数据,给出每个CpG位点的甲基化程度(数值范围为0~1)。基于此,对基因的六个功能区域的甲基化水平及其差异进行了分析和比较,发现6个功能区域之间的DNA甲基化水平具有很大的差异。因此,本文提出利用离散增量法和欧式距离法来识别差异甲基化基因(DMG),并发现了一些甲基化差异显著的基因。同时,针对管家基因的分析表明,管家基因保持着低甲基化水平,这对保持细胞的基本代谢是至关重要的。 进一步,为了阐明CpG位点甲基化程度与邻近序列的相关性,以CpG为中心提取长度为23bp的核苷酸片段,构建CpG邻近序列数据库。根据CpG位点甲基化水平的不同,等间隔地分为11组,并对每组序列进行分析,结果显示CpG位点甲基化程度与上下游DNA碱基组分相关联,低甲基化水平的CpG位点邻近序列有更多的C(c),G(g)碱基或CC,GG,GC,CG二联体。通过MEME motif软件分析高、低甲基化序列集合,分别得到一些特定的模体(motif)。通过计算序列能量,相对稳定和灵活性,我们发现其能量、相对稳定和灵活性随着CpG位点甲基化程度的增加而逐渐减少。