论文部分内容阅读
RNA是最重要的生物学分子之一,不仅是生物体遗传信息的中心媒介,还在一系列生物过程中发挥重要功能,如催化RNA剪接加工,修饰前体RNA,调控翻译过程,影响RNA的降解和定位等等。RNA的种类繁多,主要包括mRNA、rRNA、tRNA和其他非编码RNA。mRNA、rRNA和tRNA负责蛋白质的合成,其他非编码RNA并非转录垃圾,它们在细胞中同样行使重要的功能,例如snRNA、snoRNA主要参与RNA剪接和RNA修饰,miRNA通过与靶基因互补介导基因沉默。单链RNA可以折叠成错综复杂的二级结构,而RNA的功能与结构是密切相关的。对于mRNA而言,其二级结构在翻译起始、蛋白质或mRNA的转运、翻译延伸、蛋白质折叠等一系列细胞过程中充当调控元件,对翻译效率、mRNA稳定性等有很大的影响。mRNA二级结构通过多种形式参与细胞过程,一种形式是二级结构特异性的结合其他生物分子(蛋白质、代谢小分子),从而调控一些生物过程。另一种形式涉及mRNA的结构稳定性。大量的研究将重点放在那些包含保守二级结构的功能元件上,却忽略了mRNA上的结构稳定区(HSR)。因此,本研究从基因组水平上探索四个肠道菌和两个非肠道菌mRNA编码序列上的结构稳定区,并重点关注这些二级结构的数量变异与基因功能的关系。本研究采用滑动窗口的方式用RNAfold软件计算序列的自由能,随后基于标准化的自由能搜索编码序列上的结构稳定区。结果发现,真实序列的HSR密度显著高于对照序列,说明选择压作用于真实序列使其保持一定数量的HSR,而且HSR的位置倾向于CDS的5’端和3’端。与随机HSR相比,真实HSR具有很好的稳健性,说明选择压作用于HSR使其结构维持较高的稳定性,从而行使功能。研究发现HSR起始位置附近核糖体翻译速率较低,说明HSR可能通过阻挡核糖体来调节共翻译过程。本文还指出编码区HSR密度较高的基因主要编码行使细胞分离、蛋白质折叠、翻译等生物功能的蛋白质,低HSR密度的编码序列的表达产物主要涉及发酵、化合物的生物合成等代谢过程。另外,必要基因编码区的HSR密度显著高于非必要基因。随后,在本研究中,我们证实了二级结构数量变异与蛋白质表达量和mRNA半衰期均没有关系,也就是说,之前得出的结论并不是由蛋白质表达量或mRNA整体稳定性的差异造成的。总之,这些结果呈现了之前未被关注的结构稳定区数量变异与基因功能之间的关系。