面向深度包检测的正则表达式匹配技术研究

来源 :中国科学院计算技术研究所 | 被引量 : 0次 | 上传用户:bencui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
正则表达式匹配是计算机研究领域的一个经典问题,是众多网络安全系统中的关键技术之一。随着互联网的的普及和发展,海量信息的处理和新的应用需求对正则表达式匹配技术提出了新的挑战。本文对面向深度包检测的正则表达式匹配技术进行了研究。正则表达式匹配技术主要有基于NFA的匹配技术、基于DFA的匹配技术、基于NFA和DFA的混合匹配技术、位并行匹配技术和过滤匹配技术。目前的应用系统主要使用基于NFA的匹配技术,但由于该技术匹配速度较慢,不能满足日益增长的应用需求,因此人们把目光集中在匹配速度更快的基于DFA的匹配技术上。DFA具有O(1)的状态转移时间,却带来了存储空间急剧膨胀的缺陷,目前的解决方法主要是对DFA进行压缩,以达到用较少存储空间获取更快匹配速度的目的。本研究主要内容及结果如下:   ⑴自动机分割和状态偏移量压缩算法:以“分而治之”为基本思想,把自动机分割为Trie结构和回边结构,然后分别对其进行压缩。在Trie结构中,通过把形状相同的状态转化为等价状态进行压缩;在回边结构中,通过提取每列最频繁的元素构造出大量可合并状态进行压缩。实验结果表明,在随机数据和真实数据上,该算法取得了很好的压缩效果。   ⑵簇分割自动机压缩算法:算法基于实验统计特征:每个状态的绝大部分转移边都会集中指向某几个簇。根据这一特征,本文作者把DFA的存储矩阵分成三个部分,分别对每个部分进行压缩。实验结果表明,在随机数据和真实数据上,簇分割算法都表现出比较好的压缩效果。   ⑶正则表达式匹配技术的实验及测试平台:构建了一个正则表达式→DFA的实验平台以及一个测试数据生成平台。通过实验平台,可以方便地从正则表达式构建出DFA;通过测试平台生成的数据,可以方便地测试匹配结果的正确性。
其他文献
P2P(Peer—to—Peer,对等)文件共享系统从1999年正式出现以来一直在经历着飞速的发展,现在这些系统已经吸引了大量的Internet用户以及占据了大量的Internet流量。最近的测量结
基于生物特征识别的身份鉴别技术提供了一种高可靠性、高稳定性的身份鉴别方式。在各种生物特征识别技术中,人脸识别是一项极具发展潜力的生物特征识别技术,在信息安全、公共安
学位
随着过去几十年勘探技术的发展和油气田大规模的开采,一些较易发现、较简单的油气田已几乎开发殆尽。人们的目标开始转向复杂油气藏。由于复杂油气藏在地质形态上表现为倾角较
二进制翻译技术通过软件手段将一种指令集体系结构(ISA)上的可执行程序翻译到另一种ISA上执行。该项技术可以应用于代码移植、动态优化、错误监测、系统安全等多个领域。  
近年来,由于计算机和互联网的高速发展,信息资源呈现出爆炸式增长,数量上越来越丰富,但同时也给知识获取增加了难度。如何能够对信息进行有效的组织和管理,使之转化为知识,成为知识
图像分割是图像分析、识别和理解的基础。图像分割主要是将图像分成各具特性的区域并可提取出感兴趣的目标的技术,其研究多年来一直受到了人们的高度重视,由于不同待分割图像的
随着虚拟化和云化等技术的发展,计算存储分离架构应运而生,计算存储分离具有很好的扩展性和可管理性。计算存储分离之后,资源按需扩容,使得总体成本降低。同时云化大规模并行处理
机群系统已经成为高性能计算机的主流,其中又以中小规模机群应用得最广泛。机群文件系统为机群应用提供数据存储、数据共享、数据访问等服务。高效、易管理、低成本、高可靠性
无线射频谚{别RFID(Radio Frequency Identification Technology)是一种非接触、低功耗和低成本的无线通信技术,可应用于物体识别和数据采集。与条形码相比,RFID具有非呵视传输
随着计算机技术、图像处理技术的迅速发展,外科诊断与治疗的手段正在发生着很大的变化。近年来出现的计算机辅助手术系统,仿真手术系统等就是信息科学迅速发展并应用于医学领域