论文部分内容阅读
目的:骨骼肌是肌肉的重要组成部分,具有重要的农业经济价值。骨骼肌的生长发育受多种基因的共同调控,通过探究骨骼肌发育过程中的关键调控因子及重要作用元件,可以帮助科研人员更好的了解绵羊骨骼肌发育过程中的调控机制。长链非编码RNA(lncRNA)作为非编码RNA界的新起之秀,在表观遗传,转录及转录后水平调控骨骼肌的发育,但报道鲜少。因此,本研究分析了绵羊胚胎和成年两个时期lncRNA的表达情况,这将进一步丰富绵羊ncRNAs数据库信息,为后续肉羊的育种奠定基础。方法:采集胚胎和成年哈萨克羊骨骼肌并提取总RNA,利用Illumina HiSeq 2500二代高通量测序技术,经过一系列的筛选条件获取新的lncRNA及不同发育时期骨骼肌中差异表达的lncRNA,通过qRT-PCR及DNA测序验证高通量测序的准确性;利用lncRNA与mRNA共定位预测lncRNA靶基因,并对差异表达的lncRNA进行功能富集分析。通过分子生物学技术,构建lncRNA融合表达载体;利用细胞生物学手段,验证lncRNA蛋白编码能力。结果:1.经高通量测序共获得199,001,830的clean reads,且过滤获得的数据质量均可靠。与绵羊基因组进行比对,整体的比对率超过80%。2.经过拼接组装和一系列的筛选后共获得511个已注释的lncRNA和1055个候选lncRNA。3.与绵羊参考基因组比对,lncRNA均匀的分布于染色体的正、负链上,无明显的偏好性。92.5%的lncRNA为lincRNA。lncRNA的平均长度为1788 nt。平均外显子数为2.3个,且具有2个外显子的lncRNA占78%。lncRNA的ORF平均长度为126 nt,且57%的lncRNA的ORF长度集中在90~150nt。4.在胚胎和成年期哈萨克羊中获得404个差异表达的lncRNA,其中,359个lncRNA在胚胎期哈萨克羊骨骼肌中表达量上调,而45个lncRNA在成年期哈萨克羊的骨骼肌中表达量上调。选择10个差异表达的lncRNA进行RT-PCR和DNA测序,序列比对结果一致。利用qPCR对这10个lncRNA进行荧光定量检测,结果与RNA-seq数据一致,进一步证明了RNA-seq数据的真实性。5.生物信息学分析发现,已注释的511个lncRNA靶向2587个靶基因,1055个新的lncRNA靶向2795个靶基因。其中一个lncRNA靶向多个mRNAs,或多个lncRNA靶向同一个mRNA。6.靶基因的GO富集分析发现:筛选获得的lncRNA与蛋白激酶活性、肌肉结构成分、微管蛋白结合和肌原纤维等相关。KEGG通路富集分析发现:筛选获得的候选lncRNA可能参与新陈代谢、疾病、细胞通讯和内分泌调节等调控过程。然而,多个lncRNA被富集到与肌肉发育相关的Wnt信号通路、钙信号转导途径等通路中。7.构建lncRNA-miRNA-mRNA相互作用网络图,筛选到61个表达量上调和6个表达量下调的lncRNA与肌肉发育相关,且这些lncRNA具有一个或多个miRNA结合位点,且有些lncRNA至少可以吸附三个miRNA。8.构建lncRNA-MRLN融合表达载体,在小鼠成肌细胞上验证了lncRNA-MRLN可以编码蛋白,且在不同物种中是保守的。结论:1.利用高通量测序,共筛选获得1055个候选lncRNA,且特征区别于mRNA。2.在哈萨克羊的骨骼肌中发现上千个lncRNA,且不同生长发育阶段的表达水平不同。通过靶基因预测及功能富集分析,发现部分lncRNA可能参与骨骼肌的生长发育,这为随后从lncRNA角度进一步地理解肌肉生长发育的分子调控机制解提供了宝贵的数据。3.通过构建lncRNA-MRLN真核表达载体,并在细胞水平上验证,发现lncRNA-MRLN基因可以表达蛋白,使人们对lncRNA编码蛋白潜能有一新的认识。