生物信息多序列比对算法研究

来源 :南京农业大学 | 被引量 : 0次 | 上传用户:tu309
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
将不同物种、不同进化水平的生物的相关序列进行比较分析,以发现生物序列中功能、结构等信息,是生物信息学研究的主要内容。序列比较的最基本操作就是比对。目前对双序列比对算法的研究已经很成熟了,而现有的多序列比对算法多是基于一个数学模型或生物模型,不能保证所给出的比对结果是最优的,而只是一个近似值。所以目前研究既高效又准确的多序列比对算法仍是一个热点和难点。本文基于智能化算法在处理多序列比对问题上具有的高效性能,提出一种基于进化思想的粒子群优化算法与隐马尔可夫模型相结合的多序列比对算法。本文首先介绍了序列比对的基础,分析了序列比对中空位罚分、替换矩阵对比对结果的影响。说明了多序列比对的定义和序列比对结果的评价模型SP模型,引入了当前比较流行的两类算法渐进比对算法和迭代比对算法,阐述了被公认为最经典的Clustalw算法的原理。在此基础上引入了智能化算法隐马尔可夫模型,阐述了隐马尔可夫模型的三个基本问题和解决的算法。在对多序列比对的隐马尔可夫模型进行研究之后,给出了基于隐马尔可夫模型解决多序列比对问题的算法流程。然后研究了基于隐马尔可夫模型解决多序列比对问题的不足之处。鉴于隐马尔可夫模型本身需要对大量相似序列进行训练,对训练问题的Baum-Welch算法会以较大的迭代步幅收敛于不甚理想的局部极小值,本文引入了粒子群优化算法来优化隐马尔可夫模型的训练问题。粒子群优化算法是通过模拟鸟群觅食行为而发展起来的一种基于群体协作的随机搜索算法。接着对粒子群优化算法在解决隐马尔可夫模型训练问题上的不足进行研究,阐述了粒子群优化算法中普遍存在的“早熟”现象。粒子群在搜索的过程当中,可能会陷入局部最优但却不是全局最优值的问题。为了解决这个问题,本文基于进化论的思想,改进了粒子群优化算法,如果发现某个粒子在搜索过程中陷入局部最优,则将该粒子淘汰,并填补进新的搜索能力更强的粒子,继续进行全局搜索,确保搜索的全局优化性,克服“早熟”现象。最后给出了基于进化思想的粒子群优化算法与隐马尔可夫模型解决多序列比对问题的算法流程。通过对BAliBASE2.0参考比对库中测试数据的模拟实验,验证了改进过后的算法要优于Baum-Welch算法,在解决多序列比对问题上是行之有效的。
其他文献
Web服务作为一种新型的分布式计算模型,具有高度的互操作性、跨平台性和松耦合等特点,得到了世界范围内学术界和工业界的极大关注。但是单个Web服务功能有限难以满足复杂的用户
软件的规模和复杂度越来越高,大大提高了软件漏洞挖掘的难度。人们知道软件的版本更新指示了旧版本中存在某些缺陷或修改,如何开发自动化的程序逆向分析工具用来辅助软件漏洞
学位
语义Web虽发展缓慢但却稳步发展。本体作为语义Web的核心部分受到了广泛关注并且还需寻找一些新的技术来实现本体的发展。为了使语义Web的研究切实可行,毫无疑问,本体映射和
VPN作为一种廉价安全的组网方案越来越受到企业用户的青睐。大多数现有VPN安全技术主要集中于用户身份的验证,以及传输数据保密性和完整性的保护,但是忽略了对客户端计算平台
随着计算机应用的迅速发展,Web的规模呈现爆炸式增长。搜索引擎作为人们网上冲浪必不可少的工具,得到了空前的发展。为了更好的完善搜索引擎的功能和性能,为人们上网时提供更
本文主要对PIM(Platform Independent Model)到EJBPSM(Platform Specific Model)转换进行了研究。介绍了模型驱动架构MDA的相关理论及技术,总结了对象约束语言OCL在MDA应用的
进入21世纪,面向服务架构(SOA)被视作是企业应用开发中的重要架构而得到长足的发展。起初,SOA仅仅是作为企业内部应用的架构模式,各应用通过服务的提供与消费来降低耦合。随
基于样例的纹理合成是近年来国内外一个比较活跃的研究领域,在计算机视觉、图像处理及计算机图形学等领域都占有重要的地位,有着非常广阔的应用前景。传统的基于样例的纹理合
图像分割是图像工程中一项基础而且十分关键的技术,它是图像分析和图像识别过程中首先要面临的问题,随着计算机处理能力的提高及对彩色图像应用的增加,彩色图像分割便受到了