基于跳跃式匹配的多模式匹配算法研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:wxsshj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
模式匹配技术广泛应用于生物信息学、网络搜索引擎、内容过滤防火墙、入侵检测系统等领域,是信息科学领域中重要的研究方向之一。随着计算机网络技术的飞速发展,网络中的信息量呈现爆炸式增长。如何提高模式匹配效率成为人们研究的热点。本文介绍了模式匹配技术的国内外研究现状,探讨了模式匹配及其应用技术,研究了几种典型的模式匹配算法,包括单模式匹配BM算法、BMH算法、Sunday算法等及多模式匹配AC算法、AC_BM算法等,分析了他们的时间性能,并比较了各自的优缺点。针对AC_BM等算法的不足之处,提出一种改进的多模式匹配算法——AC TE,该算法具有以下特点:(1)基于跳跃式匹配思想,根据当前匹配窗口前两个字符确定模式树跳跃距离,保证在不发生漏检的情况下,使得模式树最大移动距离达到最短模式串长度minlen加2,从而减少匹配次数。(2)构建首字符表、minlen层字符表和字符串跳跃哈希表,分别存储模式树首层字符、minlen层字符和模式树中两两相邻字符组成的字符串的跳跃值,采用多层跳跃规则查找这三个表,快速获取模式树跳跃距离,提高算法的时间效率。分析了AC TE算法模式树最大移动距离和时间复杂度。对算法进行性能测试,测试结果表明,与AC_BMH、AC_SUNDAY算法相比,AC TE算法具有较好时间性能。
其他文献
随着社会信息化的不断发展,人们对Web信息管理系统的需求也不断增加。由于这类系统各模块的相似度比较高,因此开发人员在开发这类系统时会出现重复性编码工作。国内外很多研
随着信息技术的发展以及企业服务意识的提升,呼叫中心得到了广泛的应用,例如为用户提供如天气预报、股市行情、产品的最新报价、查询费用等信息。然而当人们希望在比飞机航班或
随着Intenet迅猛发展,各种资源不断增多。为了快速、高效的查找信息,信息处理以成为当前重要的研究领域。针对信息处理涉及的内容,本文对中文信息处理中的若干关键技术进行了
因特网已经应用到社会生活的方方面面,人们对网络安全的要求也逐渐提高。入侵检测作为一种积极主动的安全防护技术,对它的研究倍受重视。本文首先介绍了目前国内外入侵检测技
随着网络信息的急剧增长,在搜索引擎中使用确定的查询词检索时,返回结果一般是一个庞大的相关文档集列表。如何从该列表中快速获得想要的信息就成为一个极具研究价值的问题,解决
没有一套需求理论能放之四海而皆可用,因为不同的需求方法各有其专注的领域;同样,需求验证方法也必须遵循需求模型的特点才能达到更好的验证效果。本文针对主谓宾需求模型提出基
作为计算机学科的一个重要应用方向,生物特征识别技术正在成为一个蓬勃发展的研究领域,笔迹鉴定技术则是其中具有吸引力的一个方向。近年来,一些发达国家已把生物特征识别技术,从
随着数据时代的来临,大数据的分析、挖掘与可视化成为了信息技术发展的研究热点。数据可视化是利用计算机图形学和图像处理技术,将数据转换成图形或图像在屏幕上显示出来并进
基于工程图的三维形体重建技术是根据形体在二维投影视图中的几何信息和拓扑信息生成相应的三维形体,这是一个从低维到高维的构造过程,目前已成为CAD与CAM中的重要研究课题。
随着本地存储设备容量的增大,文件数量的增多,数据备份系统中的归档集规模也日益庞大。现有的数据备份系统,无论是开源还是商用,归档管理中都缺乏对归档文件按内容搜索的功能,用户