论文部分内容阅读
哺乳动物早期胚胎发育是一个十分复杂的生物学过程,该过程包括卵母细胞受精直至发育到囊胚的整个阶段。随着科学和医学领域的发展,哺乳动物早期胚胎发育过程也逐渐成为了众多科研工作者们关注的焦点,哺乳动物早期胚胎发育机制的研究对医学领域中辅助生殖的发展具有良好的推动作用。猪在免疫学和生理学上与人类相似,早期胚胎发育机制也和人类相似,所以猪早期胚胎发育机制的研究对医学及农业发展具有重要意义。近年来,长非编码RNA(long nocoding RNA,lnc RNA)在早期胚胎发育过程中的调控机制越来越引起研究者们的关注。lnc RNA是一类大于200nt并且不编码蛋白的转录本,其在剂量补偿、表观遗传调控、细胞周期调控和细胞分化等众多生物过程中发挥重要作用。内源逆转录病毒(endogenous retrovirus,ERV)是一类含有长末端重复序列(Long terminal repeat,LTR)的转座子,LTR含有病毒启动子序列和多聚腺苷酸化位点,其内化入宿主基因组后可作为启动子或增强子激活周围序列表达,或作为终止子造成宿主基因转录的提前终止,从而产生lnc RNA。目前为止,lnc RNA的研究主要局限在小鼠和人中,考虑到ERV在物种间的保守性较差,而且lnc RNA序列上保守性也较低,在不同物种早期胚胎中鉴定ERV来源的lnc RNA,阐明其在早期胚胎发育过程中的功能,有利于理解哺乳动物在早期胚胎发育进化上的保守性和特异性。目前,lnc RNA的识别主要利用高通量RNA-seq数据,但由于读段长度的限制、样品的降解、建库方法和碱基偏好性等问题,RNA-seq读段的覆盖存在偏差,尤其在转录本末端出现缺失,影响转录本注释的完整性,给lnc RNA的识别、表达水平的定量以及进一步的功能解析带来偏差。因此,提供精准的lnc RNA的注释,进而准确的获取lnc RNA的表达信息显得尤为重要。目前,已有研究报道表明基因启动子和转录起始位点可产生大量小RNA(small RNA,s RNA)。据此,我们提出设想:RNA-seq和s RNA-seq数据的整合能否有助于改善转录本注释的完整性。本研究首先整合我们已获得的猪卵母细胞和合子的RNA-seq和s RNA-seq测序数据(GSE88860),进行转录本的注释,我们在卵母细胞和合子中分别注释了27,694条,32,875条转录本,卵母细胞中89.05%的转录本有s RNA参与拼接,合子中86.21%的转录本有s RNA参与拼接,而且高比例的s RNA拼接在转录本5’端和3’端区域。我们对转录本的完整性进行分析,发现卵母细胞和合子中s RNA参与拼接的转录本长度显著较长,且卵母细胞(61%)和合子(64%)中大多数转录本第一个碱基为嘌呤(A或G),而且在转录本上游-30至-10bp处发现核心启动子元件TATA盒;在3’端上游-40至-10bp处发现了终止子基序AATAAA,以及在3’端下游+1至+30bp处发现富含GC的序列。这些结果表明,RNA-seq和s RNA-seq数据结合注释的转录本大多数是完整的。进一步,我们对这些转录本的编码能力进行预测,分别在卵母细胞和合子中预测得到6,312条和18,349条lnc RNA,分别占总体转录本的25.59%和22.14%,其中卵母细胞中新预测的lnc RNA 6,039条,占95.68%,合子中新预测的lnc RNA6,040条,占96.26%。这些lnc RNA的表达水平和长度都显著小于编码基因。接下来,我们筛选ERV来源的lnc RNA,发现卵母细胞中30.05%的lnc RNA含有LTR序列(LTR-lnc RNA),合子中28.65%的lnc RNA含有LTR序列,且LTR序列绝大部分位于lnc RNA的5’和3’端,主要属于ERVK和Ma LR LTR的亚型,说明猪中lnc RNA的形成可能主要与这些ERV相关,这些LTR-lnc RNA的表达水平和长度都显著小于编码基因。综上结果表明,利用全转录组可获得较完整转录本,进而为lnc RNA的注释及ERV来源lnc RNA的识别和功能解析奠定基础。为了解析LTR-lnc RNA对猪早期胚胎发育的调控,我们关注合子中高表达的LTR-lnc RNA,共筛选出19条在合子中高表达的LTR-lnc RNAs。为探究这些LTR-lnc RNAs对猪早期胚胎发育的影响,在成熟卵母细胞中分别注射其si RNAs,对这19条LTR-lnc RNAs进行有效敲低,在24h,48h,156h统计胚胎的发育情况,结果显示TCONS_00035465敲低后,卵裂率和囊胚率与对照组相比显著降低(p<0.05);TCONS_00031520敲低后卵裂率和四细胞率与对照组没有显著差异,而囊胚率显著低于对照组(p<0.05)。表达模式分析发现,TCONS_00035465在二细胞时期呈现高表达,暗示其可能与猪早期胚胎合子基因激活相关;TCONS_00031520在八细胞时期呈现高表达,预示其可能对猪桑葚胚的致密化和极化有一定影响。Lnc RNA的识别是lnc RNA功能解析的的起点和基础,其对早期胚胎发育具有重要调控作用。本研究结果表明,RNA-seq和s RNA-seq数据相结合可有效改善转录本注释的完整性,有利于LTR-lnc RNA的识别。得到结论如下:(1)RNA-seq和s RNA-seq数据的结合可注释较完整的转录本,s RNA主要参与拼接在转录本的5’和3’端;(2)LTR-lnc RNA在猪合子中的表达量高于成熟卵母细胞;(3)LTR-lnc RNAs TCONS_00035465和TCONS_00031520对猪胚胎早期发育具有一定调控作用。