论文部分内容阅读
如今越来越多生物大分子的三维结构得到了精确测定。随着计算机技术的发展,在现代基于结构的药物设计中,计算机辅助药物设计的方法已经得到广泛应用。计算机辅助药物设计不仅可以节约新药研发的成本,而且可以缩短新药研发的时间。在计算机辅助药物设计中,分子对接是其重要组成部分。分子对接是通过计算机模拟,预测两个或多个分子形成稳定复合物的结合模式。分子对接在理解分子生物功能,预测药物毒性,虚拟药物筛选等方面都有广泛应用。在本文中我们主要分析蛋白质与小分子的对接。解决分子对接有两方面内容,一是空间搜索算法,二是打分函数。空间搜索是找出配体小分子在受体蛋白质结合位点附近最优的结合模式。空间搜索需要考虑小分子移动,转动,二面角扭转以及柔性对接中可变残基的空间变化。目前空间搜索有分子动力学模拟,几何匹配以及智能算法。如何快速有效地进行空间搜索是分子对接的研究重点。打分函数作为评价对接模式好坏的标准,在对接过程中起重要作用。打分函数不仅要能正确评估对接结果,还要能区分不同对接结果之间的差异。目前打分函数主要有基于力场的打分函数,基于经验的打分函数和基于知识的打分函数。影响打分函数的因素有范德华相互作用,氢键相互作用以及静电相互作用等。打分函数与空间搜索是分子对接密不可分的两个部分,打分函数作为空间搜索的指引标准,决定了对接结果的好坏,而空间搜索则需要能遍历到全局最优解,同时避免陷入局部最优解。目前有很多分子对接软件可供使用,其中既有免费的开源软件,也有很多商业分子对接软件。虽然目前分子对接软件已经有很多,但每年也持续有新的分子对接软件面世。这说明分子对接软件仍然面临诸多挑战。有研究显示,目前主流的分子对接软件的准确率只有70%左右,仍然有很大的提升空间。分子对接需要解决的问题是提高打分函数的准确性,同时采用更快速准确的空间搜索算法。在本文中,我们提出了一种采用多目标差分进化的分子对接算法。与以往打分函数综合所有分子相互作用得到一个总打分值不同,多目标优化是将不同的分子相互作用项作为多个优化目标,同时优化所有的分子相互作用。一直以来,传统打分函数的难点是如何分配不同能量项的权值,得到一个总打分函数。因为打分函数不可避免地受经验影响,要得到准确的权值是非常困难的。通过多目标优化避免了因权值的分配对对接结果的影响,可以更准确地评价对接结果。我们将分子间范德华相互作用,氢键相互作用,静电相互作用以及小分子内部的范德华相互作用作为分子对接优化的多个目标。针对分子对接问题,我们对这些能量项采用了改进的计算方法,在保证准确性的前提下,提高对接的速度。在空间搜索方面,我们采用差分进化算法进行搜索。作为一种进化优化算法,差分进化采用遗传进化的策略优化目标。但与其他进化算法不同的是,差分进化采用差分向量选取行的个体,速度更快更准确,而且差分进化采用实数编码,比遗传算法等采用二进制编码的进化算法计算量更少,速度更快。在分子对接过程中会产生大量的三维结构,特别是采用进化算法这种群体优化策略会产生很多不同的分子空间结构。我们提出了一种新的几何分类算法,并将其应用到分子对接中。几何分类算法是一种自顶向下递归的分类算法,以数据集合中边缘的个体为种子节点进行分类。种子节点的选取是根据距离矩阵计算能组成最大几何体的顶点。相比其他分类算法,几何分类算法对数据的处理更具有一致性。我们将几何分类算法应用到分子对接过程中和最终结果分析中。在对接过程中,将当前群体结构分类,提取具有代表性的结构,删除冗余的结构,提高了空间搜索的效率。实验结果表明,几何分类算法在分类结构数据中有很好的效果。基于以上对接方法,我们开发了一款具有完整功能的分子对接软件。我们将其与目前主流的分子对接软件在标准测试集上进行了比较,试验结果显示我们的方法可以准确地进行分子对接。