论文部分内容阅读
结构对称性普遍存在于蛋白质分子中且对蛋白质的稳定性以及生物功能有非常重要的作用。研究对称蛋白的序列及结构能够帮助我们认识第二遗传密码,即序列与结构的关系,并加强对蛋白质分子进化机制的理解。研究蛋白质对称结构的起源以及对称结构在蛋白质翻译过程中形成机制,可以揭示自然界构建生物大分子的基本规律,加深对蛋白质翻译过程的认识,并为基因工程及药物分子设计等应用领域提供重要理论基础。本论文围绕蛋白质对称性及其形成机制主要开展了三个方面的研究:第一:研究蛋白质序列及其结构的对称性,分析它们之间的对应关系。蛋白质一级结构是其他各级结构的基础,蛋白质一级结构决定其高级结构的特征,这是分子生物学中的一条基本假设。然而对于结构对称的蛋白质,它们的氨基酸序列却显示出比较随机的信息。本文利用改进的重现图方法结合皮尔森相关性分析,分别研究了left-handedbeta-helix(LBH)折叠子蛋白质序列及结构的对称性。其中蛋白质序列的相似性用Hamming距离来衡量,蛋白质结构的相似性用dRMSD来衡量。研究结果显示该类蛋白质的三级结构普遍存在两对称的特征,同时氨基酸序列也呈现出与结构对称一致的两对称性。这表明蛋白质氨基酸序列的对称性可能编码了蛋白质结构上的对称性,与Anfinsen一级序列决定三级结构的理论相符合。在此基础上,通过全原子力场和隐含水模型(GB/SA)进一步计算了LBH折叠子蛋白质结构的内部残基相互作用能。研究结果显示残基之间的相互作用基本上都发生在相近邻rung的残基之间,长程相互作用力在在这几个结构中都没有出现,说明两个对称的子结构之间相对比较独立。第二:研究基于蛋白质结构对称的核苷酸序列和密码子使用的内部对称性。基于进化的观点认为蛋白质的结构对称性是基因复制和融合的结果,但是由于长期的进化过称中基因突变和进化趋异,基因序列上很难直观的发现与蛋白质对称结构相应的重复序列特征。目前有许多方法在基因组范围寻找大量的重复片段信息,但是,在单个基因序列上寻找基于蛋白质结构对称的核苷酸序列对称信息的方法还很少。本文应用改进的重现图方法分析基因序列的内部对称性。首先,关于核苷酸序列的计算结果显示,结构对称的蛋白质其核酸序列普遍都具有相应的对称性,为结构对称蛋白质是来自于基因的复制和融合这一理论假设提供直接的证据。同时,由于氨基酸是由三联体密码子编码,同一种氨基酸还可以由多至6种密码子编码,我们进一步分析了对称蛋白密码子序列内部基于密码子使用偏好的对称性。计算结果表明,重现图方法同样能够有效地探测到密码子使用的内部对称性,密码子序列同样保留了编码结构对称的信息。此外,通过对保守残基密码子使用特征分析发现,保守残基的密码子使用也相对比较保守,且更多的出现高频使用密码子。第三:研究基因序列的内部特征与蛋白质结构对称的相关性。蛋白质的翻译是一个非常复杂且至关重要的生命过程,对于蛋白质翻译过程中各因素的调控机制以及伴随翻译的蛋白质早期折叠机制目前并不十分清楚。本文从结构对称性出发研究mRNA与蛋白质结构的关系,以探讨蛋白质翻译过程中对称结构形成的可能调控机制以及新生态链早期的折叠方式。我们着重分析了局部密码子使用偏好特征分布和局部mRNA折叠能量特征分布及其与蛋白质对称结构的相关性。研究结果发现,结构对称蛋白的局部密码子使用存在共同的保守模式:对称子结构连接区域附近的密码子使用偏好出现明显下降,表明对称结构的连接区域更倾向于使用稀有密码子。同时,局部mRNA折叠能量在对称结构的连接区域附近也能够观察到局部的突降或是持续的降低,说明对称结构的连接区域附近可能形成更高的二级结构。研究结果表明对于结构对称的蛋白质,除了基因复制和融合这一基本的假设以外,密码子使用偏好与mRNA折叠能量可能存在保守的模式对结构对称蛋白的翻译过程进行调控,以此提高翻译效率和避免翻译过程中发生错误折叠。由于连续的稀有密码子或是更高的mRNA二级结构都能够导致翻译速率的延缓,将新生肽链在时间上进行分隔,因此结构对称蛋白的新生肽链伴随翻译的早期折叠可能存在独立顺序的折叠模式。