基于规则集的正则表达式匹配算法研究

被引量 : 0次 | 上传用户:LUZIBIN
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着正则表达式在网络安全系统和各种服务中的应用越来越广泛,这些系统采用正则表达式匹配算法作为他们的核心,检测数据包有效载荷中的攻击特征。最近几年的研究大多集中在大规模的正则表达式规则集下,如何有效地减少DFA存储空间的开销。在现代网络入侵检测系统中,如何从海量数据中甄别出有害信息,对阻止和遏制潜在的危险行为,对维护网络中数据的传输安全与稳定,对促进互联网产业健康发展,都具有十分重要的现实意义。为了检测数据包有效载荷中的危险模式,需要在线速度内完成正则表达式匹配。虽然确定性有限状态机(DFAs)允许此操作在线性时间内完成,但他们在内存中的存储可能会需要过高的需求。在内存存储空间中,DFA的开销主要用于存储其状态转移表,表的行宽对应DFA的状态数目,而表的列宽对应着每个状态的转移边数目|Σ|(Σ是输入字符的字母表)。对正则表达式规则集进行分组是一种用于解决DFA状态膨胀问题的重要方法。目前为止,对于DFA在内存中存储开销过大问题的解决思路,可以分为两种,即减少DFA的状态数目和压缩DFA的转移边,通过正则表达式规则集分组算法来压缩DFA的存储空间属于上述中的第一种解决思路。本文在对目前状态机优化技术深入分析和研究的基础上,改进了正则表达式分组算法,其可以在处理规模较大的规则集时,提高状态机的匹配性能。由实验数据可知,改进后的算法不仅在分组性能上比一般的分组算法要好,其所需的更新时间也较小。在本文中,还分析和研究了大量的状态机优化技术。其中一种DFA压缩技术能使得在处理N长字符串时,最多产生2N个状态遍历。而且,该算法具有更低的时间复杂性且很适合某些动态场景。与此同时,随着那些以线速度实现正则表达式匹配的技术不断被人们发现。不同的解决方案:如自动机的类型(确定型vs非确定型)和实现具体参数的配置。虽然每种解决方案在某些特定的规则集和流通模式集中运行的很好,但是并没有对大量的方案、规则集和流通模式集的设定进行系统的比较。因此,对于一个实现者,在大量现有的算法和架构方案中做出一个合适的决定,这将是一个极大的挑战。为了解决这个问题,本文对大量的正则模式匹配技术做出一个综合性的评估,考虑到了算法和架构两个方面。还提供了详细的性能报告和通过基于对规则集的简单评估,决定最佳配置的明确指导。这些指导能在实现实际的正则匹配系统中提供显著的帮助。
其他文献
<正>2014年5月30日,我国央行使用了中韩本币互换协议下4亿韩元(约合240万元人民币)资金支持企业贸易融资,这也是央行首次在双边本币互换协议下动用对方货币。回顾历史,货币互
<正>小体操垫是体育教学中常用的器材,本人通过教学实践,总结出巧用小体操垫的几种练习方法,可有效激发学生的练习兴趣,发展学生的身体素质,现介绍如下:
成都作为四川乃至整个西部首屈一指的大城市,对流动人口具有极大的吸引力,从而成为今后很长一段时间外来流动人口在西部的主要聚集地。在第五次全国人口普查资料的基础上,本
目的:提高门诊药房患者满意度。方法:2010年12月-2011年5月,以"提高患者对门诊药房的满意度"为主题,在我院门诊药房按品管圈活动的10个步骤实施各项活动,并评价该活动的有形
目的:建立轮叶党参的质量标准。方法:用薄层色谱(TLC)法鉴别轮叶党参药材;以高效液相色谱(HPLC)法测定药材中轮叶党参皂苷的含量。结果:TLC中紫丁香苷和刺囊酸的斑点清晰,易
为了更合理地评价渡槽结构在使用过程中安全性能随时间变化的情况,基于在役钢筋混凝土渡槽结构,考虑时间因素,并考虑混凝土碳化引起结构耐久性下降因素的随机性与模糊性,以渡
目的探讨免散瞳眼底照相在社区50岁以上居民中眼底病筛查中的可行性及应用价值。设计横断面调查。研究对象北京市海淀区万寿路街道和田村街道通过电话通知及海报招募50岁以上
提出了一种适用于高速铁路环境的LTE越区切换方案,该方案利用列车移动轨迹的固定性和列车运行的规律性,采用了基于位置的双播机制。和传统采用双播机制的越区切换方案相比,该方
在现行的特困生资助体系中,往往会出现康德所谓"二律背反"的两难情境,即关注群体"趋同性"和注重个体连续性是"二律背反"的客观表现。其重要启示在于不但要在经济上给予困难学生及时
肝癌自发性破裂可能与门脉高压、瘤组织坏死、凝血功能障碍、血液流变学异常、血管病变及抗原抗体复合物的血管壁沉积有关。急诊治疗可采用肝动脉插管栓塞,待患者一般情况好