基于A-Star和DiAlign算法的多序列比对

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:JeffreyHua
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
序列比对是现代生物信息学中一个最基本的研究课题。通过多序列比对,可以预测新序列的结构和功能,分析序列之间的同源关系,以及进行系统发育分析。本文首先介绍了序列比对涉及的基本问题:空位罚分,替换矩阵和比对结果评价标准。接着,主要介绍了两种序列比对算法:A*算法和斜线比对算法求多序列比对。理论上Needleman–Wunsch算法可以很容易地应用于多条序列中产生分值最优的比对,但是随着序列条数的增长,算法的复杂性成指数增长,而且算法不能扩展到多于三条序列。而A*算法利用合理的启发式函数限制多序列比对的搜索空间。用这种方法,即使是八条序列,每条序列含有几百氨基酸残基也可以同时比对。首先,该算法将多序列比对问题转化为求最短路径问题,利用A*算法可以在找到最短路径的同时有效地降低时间复杂度。本文将A*算法应用于多序列比对,选择有效的预测函数和边界值,最大限度的缩小搜索空间。并且从程序性能和算法性能上努力做出改进:找更接近的边界值;利用哈希链表代替简单链表提高程序的节点查找时间。最后,讨论了算法在测试例子中的应用,并且与经常使用的比对方法产生的结果比较。实验结果表明:设置边界值(BOUND)和利用哈稀链表代替简单链表后,程序的执行速度比未改进之前提高了好几倍。理论上讲,只要选择合适的目标函数和打分矩阵,计算出的结果应该是非常理想的;然而,实际情况与理想值之间还有较大的差距,还有待于预测函数以及目标函数进一步的改进。但是该算法的潜能是非常大的,一旦打分矩阵和目标函数的设定方面获得突破,其前景将不可限量。在本文中,接着介绍了另一个不同的序列比对的方法,即斜线比对算法。不同于比较单个的残基,它使用免空格段段比对算法比较随机长度的序列片段。特别地,该算法不使用任何空格罚分。通过定义关于斜线位置的集合,它把比对看成一个一致的等价关系。在寻找斜线段阶段,尝试使用新的方法。即先将两条序列比对,然后只在两两最优比对部分查找。在对算法的总体性能影响不太大的情况下,有效地提高了程序的执行速度。实验表明:该算法是一种有效的局部多序列比对算法,非常适合产生生物信息学上的有某种特定意义的比对。
其他文献
作为计算机视觉领域的基础课题之一,分割算法其相关研究已有几十年的历史。随着科学技术的发展,近几年来的关注重点转移到对视频的分割研究中,并提出了很多相关的算法。其结
随着互联网技术、移动通信技术和多媒体技术的不断发展,随着通信领域全新的市场需求和运营模式的出现,下一代网络(Next Generation Network)作为未来通信网络的发展方向,成为电
电子交易是我国期货和期权交易的唯一形式。分布式的电子交易系统是期货电子交易的核心。经过多年的发展,电子交易系统的体系结构已经发展为后台撮合服务器/通信服务器/会员端服
AES (Advanced Encryption Standard)高级加密标准是NIST (National Institute of Standards and Technology)于2001年公布,用于信息安全领域的数据加解密。AES可以用软件或
本文介绍并分析了现有负荷预测系统模型的优缺点,然后提出了采用数据挖掘技术的负荷预测系统模型。介绍了数据挖掘技术在负荷预测系统中的作用,在数据挖掘技术的选择上,采用了人工神经网络技术。然后采用“批处理”方法改进了BP算法收敛速度慢的缺陷,提高了网络学习效率。接着用改进后的遗传算法结合改进后的BP算法来改善神经网络的局部收敛性,同时采用了模糊理论的知识,对各种数据进行归一化和修正处理,提高了网络的预测
现场总线在现代工业控制领域有着广泛的应用。然而,在工业控制现场,不同时期和不同的环境下安装着支持不同标准的现场总线。在实际应用中常常需要在不同种类的现场总线间进行
随着计算机网络的发展,网络资源的管理越来越重要。分布式系统是网络资源中重要的组成部分,分布式系统的资源管理对分布式系统发展的发展起着重要的促进作用。金融交易系统作
随着信息技术的发展,竞争市场的不断成熟,现代世界经济已逐步步入电子商务时代。以生产为中心、销售产品为目的的市场战略逐步被以客户为中心、服务为目的的市场战略所取代。这
超大规模集成电路的规模不断增加,面对设计规模的急剧膨胀,对于计算机辅助设计软件来说,除了必须首要保证的正确性之外,效率成为一个非常重要的因素。 集成电路(IC)的开发流程
数据挖掘是从大量数据中提取可信的、新颖的、有效的并能被人们理解的模式的高级处理过程。关联规则挖掘用于从大量数据中揭示项集之间的有趣关联或相关联系,是数据挖掘的一项