链式几何结构的拟人型优化方法——蛋白质结构预测的高效算法

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:lc813
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质由氨基酸残基呈线性排列所形成,通过残基间的相互作用折叠成立体结构,蛋白质的功能取决于其立体结构。蛋白质结构预测的目标是通过蛋白质链直接预测其立体结构,它是当前蛋白质工程中的一项重要任务。  HP(Hydrophobic-Polar)格点模型是蛋白质结构预测的一个简化而重要的模型,它已被证明具有NP难度。对于NP难度问题,完整精确的求解算法一定超过多项式复杂度(除非P=NP),对于较大规模的问题实例,它所需要的运行时间在现实中往往难以接受。近似求解算法虽不能保证求得最优解,但所需要的时间可大大减少,能在可接受的时间内求出令人满意的近似最优解,它是完整精确的求解算法在现实情况下很好的替代品。  启发式优化算法是当前最为重要的近似算法。启发式优化算法将人类关于物理和生物界的知识用到算法的设计中来,近几十年得到了空前发展,产生了大量不同类型算法,是当前求解大规模复杂问题较为现实的途径。拟物拟人算法将物理知识和人类社会经验用到算法的设计中,是对现代启发式优化算法的重要扩展和补充,能进一步提高算法的效率。  通过对HP格点模型中蛋白质构型的几何结构的研究,得到了基于构型几何量的能量计算公式和上界估计式。在研究蛋白质的生长过程时,此能量计算公式得到进一步的细化,最终用于求解算法的设计。上界估计式可用于判断一个蛋白质构型是否为最低能量构型。  通过蛋白质构型的生长过程与围棋的对弈过程的对比,将围棋中的“实利”和“外势”这两个概念借用到蛋白质构型上来,用实利和外势引导蛋白质构型的生长。通过对当前格局对以后获取实利的影响的分析,构造外势的估算公式,此公式最后用于算法的构造。  蒙特卡洛方法是研究蛋白质结构预测的重要方法,PERM(Prune-Enriched Rosenbluth Mothed)算法是对蒙特卡洛方法中顺序重要性取样的重要改进,是当前求解HP格点模型最为高效的算法之一。通常的顺序重要性取样的权重只与构型的能量有关,没有考虑构型的几何结构对将来的影响。我们将构型的外势作为权重的一个因子,重新构造了权重计算公式,并结合PERM算法的分支控制思想,提出了一个拟人随机生长算法。另外,通过分析基于结构的能量计算公式在构型生长过程中的演变过程,和能量计算公式中各个分量对能量的影响,构造了新的顺序重要性取样的权重,提出了一个启发式结构优化算法。  我们用国际公认的重要算例,对拟人随机生长算法和启发式结构优化算法的二维情形进行了测算,并与当前国际上重要的算法进行了对比,结果表明,前述关于HP格点模型的相关计算公式可以用来改进求解算法的效率。  目前最为成功的结构预测方法是同源建模法。同源建模法利用氨基酸序列相似的蛋白质的已知结构作为“模板”,以获得未解析的同源蛋白质的结构。确定蛋白质链的相似性是同源建模法的基础,而蛋白质链的氨基酸片段匹配又是确定蛋白质链的相似性的基础。BM(Boyer-Moore)算法是字符串匹配的最为高效的算法之一,针对它们在生物信息学中的应用,提出了BM算法的改进型算法CBM算法和BMX算法,它们能使BM算法的效率进一步提高。
其他文献
移动Ad Hoc网络(MANET)具有独立组建网络、无中心以及网络拓扑结构动态变化、带宽和能源受限等特点。作为一种特殊形式的移动计算机网络,可广泛应用于战场指挥、临时会议、灾难
分布式拒绝服务DDoS(Distributed Denial of Service)攻击是通过占用网络带宽,消耗系统资源,阻塞网络流量,从而造成其他用户无法正常访问目标服务器,是现今网络攻击最常用的
图像质量评价在图像视频处理及计算机视觉应用等领域越来越重要。人类作为图像信息的最终接收者,作出的评价是唯一“正确”的,但是主观评价不能被嵌入到系统中。故研究的目标是
无线传感器网络(Wireless Sensor Networks,WSN)是由大量廉价的集传感能力、计算能力和通信能力于一体的微型嵌入式节点组成的具有动态监控、处理、传输功能的一种先进的网络
随着计算机技术的迅猛发展,计算机图形学的应用领域也越加广泛,从而使得作为计算机图形学重要研究内容的图形图像处理技术越来越受人们的关注。而在此研究领域中,如何较好地
句法分析是自然语言处理的核心课题之一。依存句法分析是应用依存语法对自然语言进行自动句法分析,具有形式简单、易于标注、便于应用等优点,可运用于关系抽取、机器翻译、本
自上个世纪八十年代随机共振被提出以来,相应的研究工作便立即展开,并且逐渐开始应用于弱信号的检测,这种理论能够使初始信号和噪声在非线性系统中产生协同作用,最终达到抑制
当今人们日常生活所用的Internet网络与上世纪中叶Internet建立者的初衷相比,承担着数以万计的服务,这使得Internet网络的负载越来越重。特别是Internet网络中流量的大幅增长
随着信息技术的发展,越来越多的数据流涌入到人们的眼前。由于目前普通的数据库系统在高速处理海量数据流方面存在一定的缺陷,越来越多的学者开始关注如何开发一种新的研究方
无线自组织网络(Ad Hoc Networks)是由一组带有无线收发装置的移动终端组成的一个无中心、自组织、采用多跳路由机制的特殊无线移动通信网络。由于具有无需架设网络基础设施