论文部分内容阅读
RNA甲基化修饰,尤其是6-甲基腺嘌呤(m6A),是生物体内广泛存在的RNA水平表观遗传修饰。其动态可逆的调控模式,赋予m6A在各种生物学过程进行灵活调控的功能,在基因转录后调控过程中扮演着重要角色。近年来,随着高通量测序技术的进步,以及m6A-seq技术的进步,在转录组范围内进行m6A修饰的研究逐渐成为热点。人、小鼠、拟南芥和水稻等动植物的m6A修饰的研究已经相继出炉,而作为重要的研究人类生长发育及疾病发生模型的猪的转录组m6A修饰却鲜有报道。猪的肝脏在解剖学和生理学上与人类肝脏的许多相似之处,在生长过程中同样经历复杂的内外环境调节,可以作为人类肝脏发育及疾病研究的重要模型。同样作为表观调控家族的一员,长链非编码RNA(lncRNA)也在近些年受到普遍的关注。鉴于此,本研究主要从这两个方面入手对猪肝脏生长过程中的表观调控现象进行研究。采集0日龄(初生期),21日龄(哺乳期),2年(成年期)的荣昌母猪的肝脏,通过RNA-seq和m6A-seq技术分别获得了上述三个年龄阶段肝脏组织的转录组的mRNA、lncRNA和m6A修饰。主要研究结果如下:(1)初生期的肝脏组织胞浆呈水肿、空泡样变明显,胞质内容物较少;哺乳期的肝细胞空泡样变明显减少,胞质内容物明显;成年期肝细胞没有空泡样变,内容物丰富。(2)在9个RNA-seq链特异性测序文库中,总共获得约118Gb(gigabases)的原始数据。经过质量过滤后,平均每个文库获得13.02 Gb的数据。(3)由stringtie对获得读段(reads)组装,组装完成后共鉴定出17,558个表达的编码基因(FPKM>0.1),覆盖了约69.33%(17,558/25,323)的参考基因组已注释的编码基因。约69.12%的蛋白编码基因FPKM>1。(4)共计获得了 6,743个候选lnc RNA转录本(FPKM>0.1)。基因区内(Genic)lncRNA3,179个,基因间区内(Intergenic)lncRNA 2,586个,无法确定位置关系的lncRNA 978 个。约 69.33%的 lncRNA 的表达量(FPKM)小于 1。(5)lncRNA的平均表达量要明显低于mRNA平均表达量,lncRNA在低水平表达的密度要明显低于mRNA。(6)碱基长度方面,约68%的lncRNA长度在200到1,200nt之间,平均长度为615nt。mRNA转录本平均长度约为1,770nt。lncRNA平均具有2个外显子,少部分外显子数目超过6个,mRNA平均外显子数为7.8个。(7)肝脏组织初生期与哺乳期相比有1,771个基因差异表达;初生期与成年期中有差异表达基因2,418个;哺乳期与成年期中有1,212个基因差异表达。初生期中有396个基因,哺乳期有260个基因,成年期有324个基因具有相比其他两个阶段较高的表达量(高表达)。功能分析显示:初生期高表达的基因富集在蛋白质相关的通路中,基因的转录、RNA催化、合成和翻译等代谢过程;哺乳期高表达的基因富集在细胞周期、DNA的复制和重组、核的有丝分裂等和细胞快速增殖相关的通路。成年期高表达的基因富集在氧化还原反应等肝脏营养物质代谢相关的通路,以及各种药物代谢的过程。(8)肝脏组织初生期与哺乳期有321个lncRNA差异表达;初生期与成年期有差异lncRNA631个;哺乳期与成年期有294个。初生期中有87个lncRNA,哺乳期有31个lncRNA,成年期有120个lncRNA分别高表达。发现多个lncRNA调控的通路与肝脏的生长具有紧密的关系。lncRNA调控的基因涉及到一些同生长相关的信号通路的调控中。在三个年龄阶段高表达的lncRNA预测功能中,都可以看到一些lncRNA参与调控肝脏代谢过程中重要的营养物质代谢通路。此外,lncRNA调控的基因还参与一些免疫功能相关的信号通路。(9)本研究共测定了包括初生期、哺乳期和成年期肝脏组织在内的9个样品m6A甲基化的IP数据和对应的Input数据。IP平均在9.33 Gb,Input样品平均在7.67Gb。唯一比对到基因组上的数据量IP平均为6.70Gb,Input平均为5.86Gb。(10)本研究在初生期、哺乳期和成年期三个阶段分别发现了11,022,8,727和9,860 m6A峰。大约80%峰的至少在两个生物学重复中被鉴定出。(11)在肝脏转录组中大约有33%基因受到了 m6A的修饰,平均每个表达的基因中有1.33~1.42个m6A修饰位点。m6A修饰主要偏向于终止密码子分布。在本研究获得的m6A位点中,78.90%的位点观察到至少一条m6A经典“RRm6ACH”模体序列的分布。m6A修饰与所修饰基因表达量呈明显的负相关关系(皮尔森相关系数r =-0.45,P<10-16)。(12)在三个年龄阶段持续性受到m6A修饰的基因功能富集于重要的生物学代谢通路,主要涉及到对猪肝脏细胞的分化和肝脏组织生长发育的调控,以及营养物质代谢的调控。(13)对三个年龄阶段m6A高水平修饰而基因低水平的表达基因进行功能分析发现,m6A修饰的基因涉及到的功能同三个不同年龄阶段肝脏组织的生长代谢特点明显地吻合。