蛋白质结构预测的噪声算法研究

来源 :福建农林大学 | 被引量 : 0次 | 上传用户:reaker
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于蛋白质的结构揭示了活细胞和患病细胞中蛋白质的功能等重要信息,所以了解蛋白质的天然结构是至关重要的。蛋白质结构预测在不同的领域都有非常重要的应用,如药物设计、疾病预测等。蛋白质结构预测问题已被证明是一种非常复杂的计算难题,属于 NP-难问题。在蛋白质结构预测中,有两个重要的难题,一个是蛋白质结构模型的设计,另一个是优化算法的设计。  由于真实的蛋白质结构复杂,目前大部分蛋白质结构预测方法都涉及显著降低蛋白质结构的复杂度,这些方法将高复杂度的蛋白质结构转换为离散的低复杂度模型。在本文中所采用的结构模型是一个简化的模型,称为AB非格点模型。模型确定后,需要优化算法来搜索基于该结构模型的蛋白质序列的最佳构象。目前对蛋白质结构预测的优化算法有蒙特卡罗法、模拟退火算法、粒子群优化算法等。这些算法的主要缺点之一是需要调整很多参数,而且算法对这些参数一般都具有较高的敏感度。算法的调参工作非常繁琐,但又是必不可少的。对此,本文提出了一种基于列表的噪声算法(List-Based Noising Method,LBNM),将基本噪声算法的参数简化为只剩一个,并将 LBNM算法用于研究二维AB模型的蛋白质结构预测问题,主要研究内容包括:  将基于列表的思想加入到基本的噪声算法中,简化了算法的参数。LBNM算法只有一个参数——噪声列表的长度。使用基于列表的降噪策略,所有的噪声值都存储在一个优先队列中。噪声值越大,其优先级就越高。在算法的运行过程中,噪声列表会随着解空间拓扑结构的变化而自动更新,即算法的降噪过程是自适应的。为了验证算法的有效性,将LBNM算法应用于组合优化问题中,并对算法的性能和参数敏感度进行分析。实验结果证明,LBNM算法中唯一的参数——噪声列表长度具有非常好的鲁棒性,而且在迭代次数相同的情况下,LBNM算法能够获得与现有的其他较好的智能优化算法相同甚至是更好的结果,而该算法仅仅只有一个参数。  为了更好地将LBNM算法应用在蛋白质结构预测问题上,本文对LBNM算法进行了一些改进,提出了一种新的基于列表的多 agent自适应邻域噪声算法(Multi-agent List-Based Noising Method with adaptive neighbor,MLBNM)。MLBNM算法采用Multi-move贪婪策略加快算法收敛速度,引入多 agent思想实现算法的独立并行,引入自适应的邻域结构和采样粒度以增强算法的全局搜索能力。为了有效平衡MLBNM算法的贪婪性和随机性,本文在人工蛋白质上对Multi-move贪婪策略的参数进行了调整和分析。随后,为了证明MLBNM算法的独立并行策略的优越性,将独立并行策略与两种信息交互策略进行比较,在人工蛋白质序列上的仿真结果表明独立并行策略优于这两种信息交互策略。最后,将MLBNM算法应用于二维AB模型的蛋白质结构预测问题中,对四条Fibonacci人工蛋白质序列、四条较短的真实蛋白质序列和两条较长的蛋白质序列进行预测。将预测结果与其它算法进行比较,预测结果进一步展现了MLBNM算法的优越性。
其他文献
本论文通过XR分析研究不同预烧温度对ZriO-TiO2粉体六方钛铁矿结构的影响,得出800℃为体系的最佳预合成温度。通过掺杂少量的B2O3发现,陶瓷体的烧结温度降低到9000C以下,抑制ZnT
血管内皮细胞生长因子(Vascular endothelial growth factor,VEGF)是一个分子量为40KD的同源二聚体,属于分泌性糖蛋白家族中。它最初被称为血管通透因子(vascularpermeabilit
抗生素的发现使很多细菌感染性疾病得以控制,但是,随着抗生素的广泛使用,尤其是滥用和误用,导致大量的耐药菌株出现,甚至出现了多重耐药菌株和超级耐药菌株。此外,无论是临床
纳米二氧化锆(ZrO2)是目前研究较为活跃的无机纳米材料,它具有良好的生物相容性,比表面积大,无毒且表面存在大量的羟基(-OH)使得表面电性可调节,可充分利用静电吸附作用及表