并行蚁群算法求解DNA杂交测序问题的研究

来源 :太原理工大学 | 被引量 : 0次 | 上传用户:xuexuexuehehehe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
DNA测序是分子生物学进一步研究的基础,但测序是一项艰巨的工作,因为直接使用显微镜读取DNA序列是不可行的,而间接的测序方法即使非常严密也避免不了错误的产生。DNA杂交测序(Sequencing by Hybridization,SBH)是目前使用最多的测序方法,该方法分为杂交实验和序列重构两个步骤。其中杂交实验产生的错误使得序列的重构更加困难,已经证明含有错误的序列重构问题是NP-hard问题。在实际研究当中,生物学工作者面对的是含有数万个碱基的DNA序列,因此,如何使得重构的序列更加精确,耗费时间更少,是本课题的目的与意义所在。   国内外现有的求解DNA杂交测序问题的算法大致分为两类:精确算法和启发式搜索方法。精确算法有分支定界算法,动态规划方法等;启发式搜索方法有禁忌搜索算法,遗传算法,蚁群算法,模拟退火算法等。比较之下,启发式搜索方法得到的解更优,但随着数据规模的增大,算法的性能随之下降。因此,进一步的研究工作是提高解的精度和收敛速度。   蚁群算法是在蚂蚁群体觅食过程中沿最短路径行进的生物学行为之上发展起来的一类群集智能优化方法,吸引了众多学者的注意。经过近20年的研究与实践,蚁群算法已显示出它在求解复杂优化问题的优势。它具有强大的全局寻优能力,较强的鲁棒性和适应性,且易于与其他算法融合,除此之外,蚁群算法固有的并行性非常适用于大规模并行计算,因此它已在组合优化和并行处理等领域得到了越来越广泛的应用。   首先,本文对并行计算、蚁群算法和并行蚁群算法的发展和特点进行综述,并介绍并行处理的硬件系统及支撑软件,其中主要叙述PC机群及该平台上采用的编程环境MPI(Message Passing Interface)。其次,将DNA序列重构问题与图论相结合,转化为一种特殊的哈密尔顿路径问题,并作形式化描述。再次,对最大最小蚁群算法做两方面改进,一是分别采用了双向构造解路径,二是利用不同阶段的最优解更新信息素;同时根据主从式并行程序的设计思想提出了一种新的信息交换策略——排序交叉信息交换策略。最后,搭建机群,详细描述其步骤,使用C语言编写程序并调试运行。   实验结果表明,在求解DNA杂交测序问题上,本文提出的并行蚁群算法提高了解精度和收敛速度,在求解规模较大的数据集时仍表现出良好的搜索能力,这优于现有的串行蚁群算法,禁忌搜索算法和进化算法。此外,并行蚁群算法的应用研究将有助于其他组合优化问题的解决。
其他文献
随着计算机的出现和航空、船舶、模具制造等现代工业的飞速发展,产品的形状信息如何使用计算机表示、分析和应用成了研究的热点。其中的核心问题就是寻求一种既符合计算机处
随着企业信息化集成程度的提高,如何通过自动组合已有的语义Web服务,从而为企业提供简单、高效的组合服务访问能力已经成为服务网络领域的研究重点。基于案例推理的语义Web服
在非对称逆布局的模式表示模型(NAM)的基础上,提出了两种新的NAM图像表示方法,一种是基于偏微分方程的矩形NAM图像表示方法;另外一种是基于多边形子模式的图像表示方法。针对
为了能够有效地从非结构性的文本数据中挖掘知识,研究将自然语言形式化为计算机输入信号的表示方法是文本意见挖掘任务的重点。基于深度学习的表示方法具有很强的特征学习能
面向服务的应用集成是服务计算的主要应用领域,服务组合是应用集成的关键技术之一。服务良好的复用性、灵活性和松耦合特征使得面向服务的计算成为一种具有里程碑意义的分布式
随着计算机技术和网络技术的发展,分布式系统得到越来越广泛的应用。单个服务器受到处理能力的限制,很可能会成为网络访问的新瓶颈。服务器集群系统具备高可用性和负载均衡性
随着政府采购模式的广泛普及,政府采购流程也越来越规范,各级财政部门制定了相应的制度与管理办法,通过利用计算机和网络技术,来管理采购过程,是一项将采购工作标准化、服务化、信
高性能计算集群以及多核处理器在各应用领域的推广普及,使得并行计算技术的使用更加广泛了,但是并行程序设计的难度给并行技术的推广增加了难度。为了解决并行程序员频繁考虑
随着用户数量的不断增长以及应用要求的不断提高,建成一个基于IP协议的,融合各类无线网络的,公共的、灵活的、无缝的异构网络是未来无线通信的发展目标。为了让用户能够借助
与传统的C/S模型相比,P2P技术在网络资源利用率、消除服务器瓶颈等多方面有明显的优势。系统中的对等点兼有客户机和服务器的功能,各个节点之间可以直接进行数据通信,共享计算机