论文部分内容阅读
植物胚乳发育的研究一直是植物生殖发育,表观遗传学和作物遗传育种关注的热点领域和重要科学前沿。DNA甲基化是一种非常重要的表观修饰因子,参与异染色质的形成,转座子的沉默,基因表达的调控以及基因组印迹的发生。越来越多的证据显示DNA甲基化和基因组印迹对胚乳发育和种子大小形成具有重要的调控作用。目前已经在模式植物如拟南芥、水稻和玉米的种子中调查了DNA甲基化的水平和分布,揭示出胚乳基因组的低甲基化状态。但是,关于胚乳基因组的低甲基化状态是如何建立和维持的,是否具有广泛性以及它在胚乳发育过程中的作用,目前还不是很清楚。特别是对于大多数真双子叶植物包括拟南芥,胚乳组织是瞬时的,随着种子的发育逐渐消失,因此在真双子叶植物种子中研究胚乳DNA甲基化的调控方式以及DNA甲基化对胚乳发育和基因组印迹的调控受到了很大的限制。蓖麻种子是典型的双子叶胚乳型种子,胚乳在整个种子发育过程中持续存在,具有大的体积且易于分离,是种子生物学研究的模式材料。蓖麻为深入研究表观调控因子对胚乳发育的影响提供了理想的研究系统。本研究以蓖麻品系ZB107的种子为研究材料,结合全基因组DNA甲基化测序、small RNA测序、mRNA测序以及实验验证,全面分析了DNA甲基化的分布规律、调控方式和对基因表达的影响。主要结果如下:1.蓖麻胚乳基因组的低甲基化通过全基因组DNA甲基化测序,我们发现蓖麻胚乳基因组中CG和CHG甲基化水平分别为30.3%和18.3%,明显低于胚基因组中CG(40.7%)和CHG(24%)的甲基化水平,与拟南芥、玉米和水稻中的报道一致。但是蓖麻胚乳CHH甲基化水平(11.2%)相对于胚(12.7%)并没有发生显著下降。在检测的所有甲基化位点中,CHH甲基化类型占了大约68%。在蓖麻种子中绝大部分CG和CHG的甲基化水平维持在90%以上,而CHH的甲基化水平平均分布在30%-100%。而且胚乳基因组广泛的去甲基化作用导致了胚乳和胚间差异甲基化的形成。2.DNA甲基化的分布规律以及对基因表达的影响通过调查DNA甲基化在基因区域和转座子区域的分布,我们发现CG甲基化在整个基因组都有分布,而CHG和CHH甲基化在基因区很少分布,绝大部分分布在转座子区域。在基因区和转座子区,胚乳的DNA甲基化水平均明显低于胚。通过分析DNA甲基化与基因表达的关系,我们发现不同表达程度基因的DNA甲基化水平并没有发生明显的改变,而不表达的基因(RPKM≤1)的DNA甲基化水平最高,表明DNA甲基化的主要作用是抑制基因的表达。而对于胚乳特异表达的基因,DNA甲基化水平,特别是CG和CHG甲基化,在胚乳中发生了明显的下降,表明CG和CHG的低甲基化对胚乳特异表达基因的调控作用。3.24-siRNAs对DNA甲基化的调控为了进一步解析蓖麻种子中高比例的CHH甲基化,我们调查了蓖麻胚乳和胚中small RNA以及与DNA甲基化的关系。small RNA测序结果显示,蓖麻种子中包含丰富的24-nt small RNA,且这些24-nt siRNAs与基因组CHG和CHH甲基化的分布和水平显著相关。在胚基因组中,基因区和TE区24-nt siRNAs的丰度明显高于胚乳,且在胚和胚乳中,24-nt siRNAs很少在基因上分布,与CHG和CHH甲基化在基因区的分布一致。另外,我们发现24-nt siRNAs显著地富集在CHH的高甲基化区域;而在CHH低甲基化区域24-nt siRNAs的丰度发生了明显的下降,这些结果表明蓖麻种子中24-nt siRNAs参与了基因组CHH甲基化的维持。4.蓖麻种子DNA甲基化调控方式为了揭示蓖麻种子中DNA甲基化分布的潜在机制,我们调查了DNA甲基化相关基因在不同组织中的表达。结果表明,相对于胚组织,DNA甲基转移酶基因RcMET1和RcCMT在胚乳中的表达明显下降,而且DNA去甲基化酶基因RcDME在胚乳中也表达,共同导致了胚乳CG和CHG甲基化水平的下降;而DNA甲基化酶基因RcDRM3在胚乳中的表达并没有受到抑制。同时,在蓖麻胚和胚乳中丰富的24-siRNAs以及RdDM途径的激活维持了蓖麻种子基因组高比例的CHH甲基化。基因组印迹是一种典型的表观遗传学现象,主要发生在开花植物的胚乳中,与胚乳和种子的发育密切相关。在本研究中,我们以蓖麻品系ZB107和ZB306为亲本进行互交,对获得的杂交胚乳组织进行了深度mRNA测序和等位基因分‘离分析,调查和特征化了蓖麻胚乳中的印迹基因。主要结果如下:1.在蓖麻胚乳中鉴别到大量印迹基因通过全基因组重测序,我们在亲本ZB107和ZB306品系间鉴别了1007066个SNPs和100615个indels。结合这些SNPs和严格的筛选,我们在蓖麻胚乳中鉴别到184个母源印迹基因(maternally imprinted genes,MEGs)和9个父源印迹基因(paternally imprinted genes,PEGs)。在挑选的67个印迹基因中,57个得到了实验验证,有5个基因表现出品系依赖性印迹。在胚乳的不同发育阶段,我们发现这些基因表现出动态的印迹过程。另外,我们也鉴别到14个印迹的long non-coding RNAs,并得到了实验验证。在这些验证的印迹基因中,仅39%的基因在胚乳中特异表达,大部分基因在蓖麻各个组织中均有表达。2.印迹基因的特征化通过印迹基因的聚类分析,发现仅有少量印迹位点在基因组中发生了明显的聚类。GO功能富集分析显示出这些印迹基因显著地参与了胚乳的发育过程。另外,我们发现TE显著地富集在这些印迹基因的周围(上下游4 kb范围内),特别是LTR/Gypsy TE类型。通过比较拟南芥、水稻、玉米和蓖麻中的印迹基因,发现印迹基因在物种间的保守性比较低,说明印迹基因在物种间发生了独立分化,有较快的进化速率。3.DNA甲基化对印迹基因表达的调控通过对杂交胚和胚乳基因组DNA甲基化测序,我们发现胚乳的低甲基化区域显著地富集在印迹基因周围(上下游2 kb范围内),且这些低甲基化区域主要发生在LTR/Gypsy TE上,表明了TE的去甲基化过程对印迹基因表达的影响。另外,我们检测到6个MEGs的母源等位基因甲基化水平明显低于其父源等位基因,表明等位基因甲基化水平的差异对印迹基因的表达调控作用。