论文部分内容阅读
在蛋白质的研究中,折叠路径的探索一直是一个重要且意义重大的课题。可以通过这种研究对蛋白质的活动有更加深刻地了解。Φ值分析方法是一个常用的了解蛋白在折叠转变态的属性的方法。因为Φ值能够用于刻画特定残基相互作用形成的程度。在几乎所有的两态蛋白质里面,高Φ值的氨基酸残基会在折叠转变态时聚集,并在空间上形成群簇。然而,不管是理论上还是实验上,获得氨基酸残基的Φ值并非一个简单的任务。往往耗费大量的实验,才能得到很少的几个残基的Φ值。而通过统计模型的分析方法提供了另一种较为简单且可行的预测蛋白质折叠态重要残基,也就是高Φ值的残基的手段。
在本工作中,改进了一种原有的统计方法,将蛋白质的空间拓扑结构信息与残基疏水性相结合,定义了一种新的用于预测折叠核的参数。通过对contact定义的矫正和残基对序列距离权重的引入,很大程度的优化了方法,将理论计算的重要残基和实验的高Φ值残基的完全吻合率由原来的41%提高到了74%,使原方法得到了很大的改进。另外,为了进一步证明多种因素在蛋白质折叠时的影响力,引入了一个类似于Go模型的模拟方法,创建一个虚拟index,使得该index计算出的曲线和Φ值曲线有最大的峰值吻合率,然后将这个Go-index在各种属性index上投影,最终该方法再次证明了疏水性对转变态蛋白质的重要作用。