论文部分内容阅读
蛋白质的三维结构预测问题是当今生物信息学方面的热点问题。因为生物体的生物功能的主要体现者就是蛋白质,而蛋白质所具有的生物学功能很大程度上与其三维空间的构型有关系。因此为了透彻了解生物体的生物学功能,就必须对蛋白质的三维空间结构予以一定程度的研究,以期给出一种合理的算法来通过蛋白质链的一维氨基酸序列得到蛋白质的三维空间构型。蛋白质的氨基酸序列是由疏水氨基酸和亲水氨基酸组成的。蛋白质的空间构型有如下特点:疏水氨基酸紧密的结合在一起。依据这种特性,很多学者提出了相关的模型和算法。通过对现有的预测蛋白质结构的模型和算法的比较和分析,发现现有算法都是利用离散模型来描述蛋白质空间结构,并应用模拟退火、遗传算法等方法来通过对蛋白质的一维氨基酸序列的演算而获得蛋白质的三维空间构型。离散模型固然很简洁优美,但是蛋白质结构的预测问题是NP-HARD问题,当蛋白质一维氨基酸序列的链长n很大的时候,计算时间随着问题规模的增加呈指数方式增长,求解将变得非常困难。并且离散模型并不能很贴切的描绘蛋白质的空间真实构型。因此,以上模型和算法分别对蛋白质三维结构预测问题的描述存在缺点。为了改进并优化蛋白质三维结构预测算法,在现有模型和算法的启发下,研究了一种新型的蛋白质三维结构预测的算法。该算法用一种抽象的蛋白质三维连续数学模型贴切的描述了蛋白质一维氨基酸序列通过各种力折叠成最后确定的三维空间构型的过程,并应用拟物的方法找到了对应于此数学模型的物理模型且用数学方法客观精准的对该模型进行了公式表达,然后应用数学求最值的方法并结合一种原创的优化策略对得到的局部最小值结果进行了有效的跳坑,从而得到了比较好的结果。因此,就找到了相应的一种求解蛋白质三维构型的高效算法,应用该算法能更快更优的得到相应蛋白质链的近似最优构型。