基于分步查找的高效复合模式查找算法

来源 :西安电子科技大学 | 被引量 : 1次 | 上传用户:guaiguaikeleo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
复合模式查找是生物信息学中模式发现问题的一个新的研究领域,而寻求效率更高,精度更高的复合模式查找算法将是复合模式研究领域的长期热点与目标。本文对此进行了深入的研究和探讨。   本文深入研究了当今国际上的各种复合模式查找算法,系统地阐述了最具代表性的MITRA-Dyad算法和RISO算法。同时,由于本文实现的算法需要用到单分体模式查找算法,故对当今流行的单分体模式查找算法进行了简要的介绍,分析了各算法的优缺点,并对本文使用到的MITRA-Count单分体模式查找算法进行了系统阐述。   ECOMP算法是一种使用错配树数据结构的复合模式分步查找算法。本文针对复合模式的一种简单形式-二分体模式的特点进行研究,通过对:ECOMP算法的理论分析和实验测试,证明ECOMP算法可以应用于实际的复合模式查找问题。同时,由于ECOMP算法的第一部分MITRA-Count算法的设计机制,导致其运行速度和空间占用方面都存在低效性的特点,本文将对错配树的递归遍历方式改进为基于栈式节点存储的非递归遍历方式,从而提高了MITRA-Count的运行速度,减少了空间占用。另一方面,本文还对ECOMP算法的第二部分,即将单分体模式组合为复合模式的部分进行了空间优化,减少了算法实现时的内存开销,并通过模拟数据和真实数据的测试证明了本文对ECOMP算法改进的有效性。
其他文献
超分辨率图像重建是一个利用多帧具有互补信息的低分辨率图像复原出一幅高分辨率图像的过程。这项技术在遥感、军事、医学和公共安全等领域具有十分重要的应用价值和广阔的应
目前,UML已经成为软件建模的标准语言,UML状态图描述了系统在其生命周期中的动态行为。随着系统规模的扩大和复杂度的提高,UML状态图往往包含设计者所未预料到的隐患,如何保
随着经济的发展,为了让更多的国外企业了解到国内的生产厂家信息,及时进行业务联系,经济信息之间的交流尤其是作为“企业身份证”的组织机构代码信息的交流变得非常重要,充分利用
当今,网络信息安全成为制约以身份认证为基础的电子商务、政务快速发展的重要因素。指纹唯一性、不变性决定了指纹识别是逐渐成熟的最重要的生物识别技术。公钥基础设施PKI (
随着蠕虫病毒等大规模安全事件的频繁爆发,互联网用户的损失与日俱增,对于大规模网络异常事件的宏观预警问题的研究,变得越来越紧迫。然而多数安全事件对网络的影响和危害很
软件定义网络(SDN)为网络的管理提供了高度的可扩展性。随着网络规模的扩大,网络规则的频繁更新,SDN交换机需要频繁地在控制层和数据层之间切换,为交换机的正确性留下了隐患
目前智能手机市场上已经有多款手机搭载了例如指纹,虹膜识别等生物特征识别技术。生物特征识别技术不再仅仅是出现在那些好莱坞的大片中,它已经走进了我们的日常生活。本文研
随着网格技术的不断发展,一切网格应用都被抽象封装成为“服务”,需要为用户提供可靠、有保障的服务质量(QoS)。在这种情况下,需要良好的网格资源映射优化策略有效的分配资源
在信息化的时代,视频监控得到了长足的发展,每天从监控中产生的大量数据里面存在很多不必要的信息。这些不必要的信息占用了存储资源。如何从这些视频中提取出有用的信息,是
句法分析是自然语言处理领域的关键技术之一,在自然语言处理中具有十分重要的地位,它在机器翻译、信息检索、语音识别等研究中都有重要应用。在机器翻译的一些应用中,只需要