论文部分内容阅读
科学的发展日新月异,计算科学自身的发展和应用进入了一个快速发展的新时期。
除了传统的确定性算法,随机性计算方法和启发式算法等新型算法有了较大发展,这些算法的应用也远远超出了传统的领域,在以前涉及算法很少的学科得到了极大的重视,对蛋白质结构的研究就是一个很好的例子。现在还不能明确提出一组普遍适用的规则,能够从蛋白质的氨基酸序列预测其三维结构,进而预测其功能。而没有对蛋白质结构的了解,蛋白质工程就无从谈起。在当前对蛋白质结构的研究中,基于蛋白质结构模型设计高效的算法来预测蛋白质的结构正是一个热点,世界各地很多研究人员都在集中力量把新型的计算方法引入蛋白质结构的研究中。
在利用算法研究蛋白质结构的理论方法中,基于势函数能量优化的从头预测方法具有其他方法没有的优点:首先,这种方法直接根据蛋白质氨基酸序列预测蛋白质的三维结构,其次可以模拟蛋白质的折叠过程。适当的势能函数和好的全局优化算法是这种方法的两大部分,也是两大难点,所以提出合适的势能函数和强大的优化算法正是当前该方法的研究热点。本课题研究了联合残基力场提供的势能函数并基于该势能函数进行了蛋白质能量优化的试验。
论文从引入蛋白质结构预测问题入手,分析了蛋白质的层次结构,对蛋白质结构预测的现状和已经发展的方法特别是基于能量优化的从头预测方法进行了分析,提出了当前的研究难点和本文的研究对象和任务。
用于蛋白质结构预测的联合残基力场模型是多肽链的一种简化表示,已初步成功的用于蛋白质分子模拟和蛋白质结构预测。该力场所涉及的运算量比全原子力场少的多,而且其势能函数考虑了蛋白质分子中的多种作用(诸如侧链间相互作用、短程间相互作用、缩氨酸组间的静电作用、侧链和缩氨酸组间的相互作用以及多体间的相关作用项),兼顾了模型的准确性与计算复杂度。模型中势函数的参数可通过对全原子力场求平均获得,或者通过与蛋白质晶体结构数据进行拟合获得,也可以利用Boltzman原理计算获得,而模型的总势能函数中各个能量项的权重通过对Z函数的优化确定。
拟牛顿法是一种通过构造满足拟牛顿条件的矩阵来近似目标函数的汉森阵的优化方法,可用于最小化上述的势能函数。论文利用BFGS公式(一种秩2校正法)通过一个四变量目标函数 分析了拟牛顿法的收敛特性,在迭代进行9次后相对收敛,所得最小点与实际最小点完全相等。使用拟牛顿法所用的计算量较少,仅计算了10次梯度函数,这对优化大规模的目标函数非常重要。
论文基于联合残基力场和拟牛顿法利用PROTARCH对多肽和简单蛋白质进行了能量优化和构象调整,使前者的能量从-7.150461E+01kcal/mol降低至-7.332767E+01kcal/mol,后者的能量从-8.131822E+01kcal/mol降低至-1.44871E+02 kcal/mol,从而使相应的结构更趋近于自然的空间结构。这两个试验结果都证明了联合残基力场对蛋白质结构建模的合理性和拟牛顿法应用于搜索构象空间的有效性。
最后,对本人所作工作的不足之处提出了改进的方向,对联合残基力场和优化算法的完善提出了可能的的思路。