论文部分内容阅读
m RNA是单链分子,倾向于通过自身碱基互补配对形成大量稳定的二级结构。这些结构是m RNA上最要的翻译调控因素之一,参与了m RNA的细胞质定位、翻译起始、蛋白质共翻译折叠等过程的调控。m RNA二级结构可通过结构稳定性的变化调控翻译过程。目前,这些结构在基因组上的分布及结构稳定性参与翻译调控的机制尚不明晰。本研究以结构稳定性为中心,深入分析了m RNA二级结构在翻译过程中的功能,研究了进化过程中m RNA二级结构稳定性的维持机制。1.高结构稳定性区域与基因功能的关系。高结构稳定性区域指可折叠成稳定二级结构的m RNA区域。本研究系统分析了大肠杆菌编码序列高结构稳定性区域的分布,及与基因功能的关系。发现这些区域多分布于编码序列的5’和3’端,承担不同的调控功能。重要的是,大部分高结构稳定性区域内的序列折叠成的二级结构并不保守,但这些结构区可显著降低核糖体移动速率,进而参与一系列共翻译调控过程。GO分析结果表明,高结构稳定性区域多的m RNA编码的蛋白质大多参与细胞分裂、生长等过程,而结构区少的m RNA编码的蛋白质多参与细胞合成和分解代谢等过程。2.一个特定的高结构稳定性区域功能分析。分析了27个物种编码序列5’端结构稳定性的变化规律,发现几乎在所有物种的翻译起始位点下游30-80 nt区域内都存在一个稳定的二级结构。该结构的构型在进化过程中并不保守,表明该二级结构可能通过结构稳定性而非结构构型本身参与翻译调控。此外,翻译延伸早期的高核糖体密度现象与该结构有关。重要的是,在大部分物种中编码分泌蛋白的m RNA在该区域的结构稳定性显著高于编码非分泌蛋白的m RNA。这种关联不受密码子和氨基酸偏好性等因素的影响,说明该区域的二级结构可能参与了分泌蛋白的共翻译调控过程。3.m RNA二级结构调控翻译速率的机制解析。m RNA二级结构可显著降低核糖体移动速率,这不利于高翻译速率的维持。但研究发现:1)大部分m RNA上均存在大量稳定的二级结构;2)m RNA二级结构稳定性与蛋白质表达量之间存在显著正相关,且这种正相关不受m RNA丰度等其他因素的影响。说明m RNA二级结构可能以一种更复杂的方式参与翻译速率的调控。本研究使用计算机模拟的方法,分析了翻译过程中m RNA二级结构稳定性的动态变化过程,及其与核糖体移动速率的相互关系。发现m RNA二级结构与稀有密码子共同调节m RNA上核糖体的距离,进而限制翻译过程中m RNA的折叠(包括减少结构区的数量和降低二级结构的稳定性),最大程度的减弱翻译过程中m RNA二级结构对翻译速率的影响。该结果很好地解释了高结构稳定性的m RNA具有高翻译速率的现象。4.m RNA二级结构区替换规律的研究。分析了进化过程中m RNA二级结构稳定性的维持机制。结果表明:1)m RNA上的二级结构区倾向于增加鸟苷酸(G)的含量,以增加结构稳定性;2)结构区的折叠构型发生适应性变化,以降低突变对m RNA二级结构稳定性的破坏程度;3)结构区的敏感位点上(该位点上的突变对结构稳定性破坏明显)的替换速率显著低于背景替换速率,而其他位点的替换速率则轻微高于背景值;4)结构区存在大量互补替换,用于修复结构区敏感位点上的突变对结构稳定性造成的破坏。互补替换的发生可部分解释非敏感位点上出现较高替换速率的现象。此外,互补替换的模式与保守二级结构上发生的互补替换模式有明显区别。高结构稳定区往往在多个位点发生多次替换,用以维持结构稳定性,但结构构型可能发生改变。保守二级结构往往是在特定位点发生特定类型的替换,以维持特定的结构构型。综上,本研究使用生物信息学的方法分析了翻译过程中m RNA二级结构的功能,及其进化规律,系统阐述了m RNA二级结构对翻译速率调控的机制。本研究的结果可深化对m RNA二级结构在基因表达调控过程中的功能的认识。