论文部分内容阅读
着床前胚胎发育是一个受到精密调控的发育过程。研究着床前胚胎发育机制对于生殖生物学及再生医学都有深远意义,因此着床前胚胎发育一直倍受瞩目。在着床前胚胎发育过程中会发生一系列特异事件,如合子基因激活(zygote genome activation,ZGA)。长非编码RNA(long non-coding RNAs,lnc RNAs)参与调控已经成为新的生物学研究领域。随着测序技术的进步,大量lnc RNA在早期胚胎中被发现,但是,目前还没有研究能够回答有没有一些lnc RNA会参与到着床前胚胎发育调控过程中,如果有,这些lnc RNA以怎样的机制参与调控。内源逆转录病毒(Endogenous retroviruses,ERVs)是进化上内化于高等有颚脊椎动物基因组的逆转录病毒序列元件。内源逆转录病毒序列广泛分布,占人类基因组的8%,占小鼠基因组的10%。内源逆转录病毒序列曾一度被认为是垃圾DNA,但越来越多的证据表明,内源逆转录病毒序列参与了多方面生物学调控。病毒序列编码的蛋白质可参与宿主细胞功能。有些内源逆转录病毒尚保持转座能力,对于生殖细胞内基因重组等进化相关事件起到关键作用。我们早就知道小鼠ERV在着床前胚胎中转录,但具体发挥什么功能尚不清楚。是否存在ERV相关的lnc RNA参与着床前胚胎发育调控值得研究。我们针对ERVs的精心设计了半随机引物,通过半随机扩增,从小鼠早期胚胎各时期筛选m ERV相关未知转录本,经过分子克隆技术(链特异性PCR及RACE等)获得至少一个转录本全长,分析其是否为lnc RNA。对明确是lnc RNA的未知转录本进行亚细胞定位分析、表达模式分析以及功能研究。具体结果如下:通过PCR及测序结果的UCSC比对分析,我们鉴定出了36个新转录本。大部分新转录本(28/36)是ERV相关的,与预期相符。其中23个是GLN相关的,5个是Mu ERVL相关的;通过链特异性逆转录PCR以及RACE技术,我们发现lnc-GET是GLN,MERVL及MERVK相关的、可剪切的、有多聚腺苷酸尾的、含两种剪切突变体的RNA;Dyei是由GLN的LTR转录的、长665 nt的、GLN相关的、含3个外显子的RNA。亚细胞定位分析表明lnc-GET和Dyei定位于核,且主要是染色质定位的,因此lnc-GET和Dyei是非编码的。二级结构预测及mi RNA反义Northern印记实验排除了lnc-GET和Dyei是mi RNA前体的可能性。Taq Man定量PCR实验及RNA-FISH实验表明,lnc-GET是2-至4-细胞胚胎特异表达的,Dyei是4-细胞胚胎特异表达的;干扰lnc-GET导致胚胎发育阻滞于2-细胞时期,而干扰Dyei不影响着床前胚胎发育。干扰lnc-GET的胚胎在培养液中能维持2-细胞状态至少4天而不凋亡。干扰lnc-GET阻滞的胚胎呈Brd U强阳性、CAF1阴性,表明阻滞于G2时期,呈H3第10位精氨酸磷酸化(H3S10ph)染色阳性,表明阻滞于G2晚期。γH2A.X免疫荧光染色呈阴性,表明阻滞不是由于DNA损伤导致的。阻滞胚胎内,G2/M转换相关关键细胞周期蛋白依赖的蛋白酶CDK1以及母源蛋白OCT4和CDX2没有显著变化;主要合子基因激活(major ZGA)起始不受影响。我们还发现臂间卫星序列的正义链及反义链转录本表达水平没有变化,DNA-FISH结果显示臂间环已经变成了染色中心;通过低起始量RNA-seq我们比较了注射对照锁核酸(LNA)的对照晚期2-细胞胚胎(2225枚)与干扰lnc-GET的阻滞2-细胞胚胎(2042枚)在major ZGA时期的基因表达情况。总体上讲,在干扰lnc-GET的阻滞2-细胞胚胎中有723个基因上调,521个基因下调(FDR≤0.0001,RPKM≥1,2倍以上),多达11060个基因发生了异常剪切,表明干扰lnc-GET造成了major ZGA严重异常。KEGG通路分析表明干扰lnc-GET主要影响了MAPK信号通路,表现在ERK1/2-MAPK及LNK/p38-MAPK通路的核心因子表达量显著下降。异常剪切基因的GO-BP分析结果表明发生异常剪切的基因主要聚类于细胞周期相关基因(主要是M周期相关的)。表明干扰lnc-GET造成的阻滞可能是影响了细胞周期相关基因的转录及可变剪切导致的;我们通过pulldown-质谱来检测lnc-GET结合的蛋白,鉴定出了hn RNP U、FUBP1、DAZAP1及ILF2。这4个蛋白定位于晚期2-细胞及早期4-细胞核内,说明是与lnc-GET共定位的。这4个蛋白都是剪切复合体组分,3个是转录因子,表明pulldown-质谱结果与RNA-seq结果相符:lnc-GET可能参与了转录及剪切调控;无论通过Wilcoxon rank sum检验结合Benjamin多重检验,还是Wilcoxon rank single检验(p<2.2×10-16)均发现DEGs倾向于富集在其相关的GLN,Mu ERVL及ERVK的LTR(GLK-LTRs)附近。因此lnc-GET可能是通过介导GLK-LTR的顺式调控元件的活性来实现转录调控的。