论文部分内容阅读
由于蛋白质的结构揭示了活细胞和患病细胞中蛋白质的功能等重要信息,所以了解蛋白质的天然结构是至关重要的。蛋白质结构预测在不同的领域都有非常重要的应用,如药物设计、疾病预测等。蛋白质结构预测问题已被证明是一种非常复杂的计算难题,属于 NP-难问题。在蛋白质结构预测中,有两个重要的难题,一个是蛋白质结构模型的设计,另一个是优化算法的设计。 由于真实的蛋白质结构复杂,目前大部分蛋白质结构预测方法都涉及显著降低蛋白质结构的复杂度,这些方法将高复杂度的蛋白质结构转换为离散的低复杂度模型。在本文中所采用的结构模型是一个简化的模型,称为AB非格点模型。模型确定后,需要优化算法来搜索基于该结构模型的蛋白质序列的最佳构象。目前对蛋白质结构预测的优化算法有蒙特卡罗法、模拟退火算法、粒子群优化算法等。这些算法的主要缺点之一是需要调整很多参数,而且算法对这些参数一般都具有较高的敏感度。算法的调参工作非常繁琐,但又是必不可少的。对此,本文提出了一种基于列表的噪声算法(List-Based Noising Method,LBNM),将基本噪声算法的参数简化为只剩一个,并将 LBNM算法用于研究二维AB模型的蛋白质结构预测问题,主要研究内容包括: 将基于列表的思想加入到基本的噪声算法中,简化了算法的参数。LBNM算法只有一个参数——噪声列表的长度。使用基于列表的降噪策略,所有的噪声值都存储在一个优先队列中。噪声值越大,其优先级就越高。在算法的运行过程中,噪声列表会随着解空间拓扑结构的变化而自动更新,即算法的降噪过程是自适应的。为了验证算法的有效性,将LBNM算法应用于组合优化问题中,并对算法的性能和参数敏感度进行分析。实验结果证明,LBNM算法中唯一的参数——噪声列表长度具有非常好的鲁棒性,而且在迭代次数相同的情况下,LBNM算法能够获得与现有的其他较好的智能优化算法相同甚至是更好的结果,而该算法仅仅只有一个参数。 为了更好地将LBNM算法应用在蛋白质结构预测问题上,本文对LBNM算法进行了一些改进,提出了一种新的基于列表的多 agent自适应邻域噪声算法(Multi-agent List-Based Noising Method with adaptive neighbor,MLBNM)。MLBNM算法采用Multi-move贪婪策略加快算法收敛速度,引入多 agent思想实现算法的独立并行,引入自适应的邻域结构和采样粒度以增强算法的全局搜索能力。为了有效平衡MLBNM算法的贪婪性和随机性,本文在人工蛋白质上对Multi-move贪婪策略的参数进行了调整和分析。随后,为了证明MLBNM算法的独立并行策略的优越性,将独立并行策略与两种信息交互策略进行比较,在人工蛋白质序列上的仿真结果表明独立并行策略优于这两种信息交互策略。最后,将MLBNM算法应用于二维AB模型的蛋白质结构预测问题中,对四条Fibonacci人工蛋白质序列、四条较短的真实蛋白质序列和两条较长的蛋白质序列进行预测。将预测结果与其它算法进行比较,预测结果进一步展现了MLBNM算法的优越性。