基因组移位排序算法的改进和评测

来源 :山东大学 | 被引量 : 0次 | 上传用户:ljdoctor
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基因组重组问题是计算生物学中的常见问题,基因组重组算法对分子生物学中生物进化的研究具有重要意义。早在六十年前,Dobzhansky和Sturtevant发表了一篇重要论文,证明了两种不同物种Drosophilia pseudoobscura和Miranda的染色体基因序列可以通过基因组的17次反转操作相互转换。 染色体由基因组成,基因组是染色体组成的集合。基因组重组是微生物、植物、动物进化的一种重要模式。虽然基因组重组过程非常复杂,但根据基因重新排列的方式最终可将其归结为几种基本操作。其中,变异过程中的主要操作为:反转(reversal)、移位(translocation)和转位(transposition)。移位是哺乳动物进化过程中最常见的基因组重组操作之一。移位操作将基因组中的两条染色体各自断为两段并相互交换其中的一段,形成两条新的染色体。基因组排序问题可描述为:给定两个基因组,计算出从一个基因组转化到另外一个基因组所需操作的最少次数以及对应的最短重组序列。 本论文主要讨论基因组的移位排序算法及其实现过程。对于该问题,Kececioglu与Ravi首先给出近似性能比为2的多项式时间近似算法,并进一步给出近似性能比为3/2的移位与反转同时存在的计算重组距离的近似算法,最终在1996年由Hannenhalli给出复杂度为O(n~3)的移位排序的多项式算法。在此基础上,2001年,朱大铭、马绍汉将其复杂度降为O(n~2logn)。2005年,王鲁生、朱大铭又进一步将其复杂度降到了O(n~2),这也是目前世界上最快的移位排序算法。本文对该问题的研究,首先发现了原有算法中存在的错误。原有的移位排序算法中均未考虑可行灰边会产生偶隔离带的情况。如果移位排序过程中出现这种情况,根据原有算法计算会得到错误的移位序列。本文给出了这种情况的实例,并设计新算法修正了这一错误。另外,在修正算法的基础上,设计了详细的数据结构和实现方法,对复杂度分别为O(n~3)、O(n~2logn)和O(n~2)的三个移位排序多项式时间算法分别进行了实现和验证。并用其中效率最高的复杂度为O(n~2)的算法实现与前人的移位排序程序进行了对比。在输入长度为100,000个基因的情
其他文献
二十世纪蓬勃发展起来的智能算法为解决复杂优化问题提供了有利工具,在各个领域获得广泛应用。但是,智能算法种类多、待优化问题门类杂,如何在改善算法自身的同时,理清待求解问题
信息网络时代的到来给国家政府部门的工作提出了快捷、高效的要求,发展电子政务已是大势所趋。但是目前的电子政务系统在面临着很多问题,其中一个主要的难题就是信息源异构问题
传统的数据库安全机制对于成功数据攻击的防御能力非常有限,有授权的恶意事务可以通过破坏数据的完整性和可用性使得数据库系统不能正常工作。因此,入侵检测技术被用来加强系统
软件测试是软件质量保证的重要手段。随着互联网技术的普及,软件产品已从传统的单机环境迁移到复杂多变的网络环境。因此,研究如何对网络软件进行测试是软件测试领域的一个重
随着Internet的持续快速发展,人们对网络的需求由简单的数据传输向综合的多媒体业务发展。多播技术作为一种可大大节省网络资源的技术在多媒体业务中有着广泛的应用。很多实时
随着企业信息化的发展,企业越来越依赖于网络,Intranet中的关乎企业利益的安全问题越来越受到更到的关注。而如何能够有效地保障网络中这些与企业息息相关的重要数据信息的安全
本文针对XX部机关局域网的安全要求,提出了一套系统、先进和科学合理的网络安全整体解决方案,包括内部网络的安全、远程接入的安全、连接外部网络的安全以及操作系统安全、应用
分布式一致性是指n个处理器组成的分布式系统,其中最多有m个处理器发生故障,要求所有的无故障处理器都能做出相同的决定,并且决定值必须是合理的。区域故障模型是多个局域网中处
互联网的发展为全球范围内实现高效的资源和信息共享提供了方便,同时也对网络安全防护提出了新的挑战。网络入侵检测技术作为一种积极主动的安全防护技术正成为目前网络安全领
不断发生的瓦斯灾害事故带来的是巨大的生命和财产损失,为了让悲剧能够谢幕,我国也在不断地利用计算机等新兴高科技技术来推动瓦斯抽采监测系统的发展。要提高煤矿瓦斯抽采效