论文部分内容阅读
DNA胞嘧啶上5位碳原子的甲基化(5-methylcytosine,5mC)是一种经典的表观修饰,它能够调控基因表达和个体发育,并通过基因印记这种特殊形式在亲代和子代间传递表观遗传信息。TET蛋白家族是目前已知的唯一一类可以在哺乳动物里面介导5mC氧化,从而介导DNA主动去甲基化的蛋白质。但是人们对其结构和在生物体内的功能了解还很少。本文通过对比小鼠体内多种组织的转录组的数据,意外地发现了TET1在小鼠的不同发育时期存在两个有明显差异的蛋白亚型。其中全长TET1亚型(TET1e)仅在小鼠早期胚胎,小鼠胚胎干细胞和原始生殖细胞中表达;而缺失了N端的短TET1亚型(TET1s)则广泛表达于小鼠体细胞中。进一步的研究证明了这两个蛋白亚型是由不同的启动子分别转录的,而胚胎干细胞内的关键转录因子OCT4,SOX2和NANOG对于启动TET1e的转录具有重要作用。TET1s缺失了N端一共653个氨基酸,包括可以介导TET1蛋白与DNA靶向结合的CXXC结构域。有趣的是,染色质免疫共沉淀测序(ChIP-seq)结果显示,虽然缺失CXXC结构域,TET1s的靶向结合位点仍然和TET1e相似,都集中于基因组的CpG岛和启动子上。相反,TET1e的N端能够显著提高TET1对整体染色质的亲和力。通过对不同TET1蛋白突变体进行检测,我们发现除了CXXC结构域,TET1蛋白N端前1-131位氨基酸序列也能够显著增强TET1的整体染色质亲和力。我们将这个新的结构域命名为“BC结构域”(Before CXXC)。随后,我们通过CRISPR/Cas9介导基因编辑,特异性地将TET1蛋白的N端去除,构建出了只能表达TET1s的胚胎干细胞。与表达TET1e的细胞相比,表达TET1s的细胞内5位羟基化胞嘧啶(5hmC)含量降低,同时其整体甲基化水平有一定的上升。细致分析数据后,我们还发现TET1介导的DNA去甲基化并不依赖于ChIP-seq检测到的靶向性结合位点,而更有可能与其整体染色质亲和性相关。最后,我们建立了在整个生命周期中只能表达TET1s的小鼠模型,并发现在这种小鼠的原始生殖细胞中,基因印记不能被正确地去除和重建。这种印记基因的缺陷将传递到子代,从而造成子代部分小鼠体型缩小或出生后死亡。综上所述,我们鉴定了TET1蛋白在小鼠体内的两种亚型并阐明了它们在结构和功能上的区别。同时我们对TET1e在小鼠发育过程中的选择性表达做出了解释。