网包正则表达式匹配算法研究

来源 :解放军信息工程大学 | 被引量 : 2次 | 上传用户:DAVIDIBM
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网逐步发展成为综合性业务运营平台,新型应用不断涌现,信息容量稳步增长,网络接口速率快速提升。作为网络安全和精细化运营、管理的重要支撑,报文检测技术在匹配速率、资源占用等方面面临严峻挑战。为解决以上问题,正则表达式匹配技术成为现代网络关注和研究的热点。本文以提升正则表达式匹配速率为目标,按照理论分析、算法设计、平台验证的思路,对正则表达式匹配算法进行了研究。主要内容包括三个方面:提升正则表达式匹配速率、降低内存占用以及支持并发数据流的匹配。为提升正则表达式匹配速率,从自动机基础理论出发,分析了单周期多字符匹配结构的特性,并针对其存在的问题,提出一种单周期处理多字符的正则表达式匹配算法MC-DFA。通过合并标准DFA结构中的单字符状态转移,MC-DFA算法可以在单周期内处理多个字符,达到提升匹配速率的目标;为降低多字符处理引入的存储冗余,MC-DFA针对性的设计了状态转移表深度压缩算法,使得内存占用增长较小。MC-DFA算法在FPGA平台上达到了6.7Gbps的吞吐率。为降低DFA结构的内存占用,通过分析NFA转化为DFA时的状态指数增长现象,设计了基于状态约束的混合自动机结构SC-HFA。SC-HFA将NFA的状态集合按照约束关系分组,将可能引发指数增长现象的状态置于不同的组中,形成NFA和DFA共存的混合结构,有效的抑制了状态数的增长,减少了内存使用。与标准DFA相比,SC-HFA能够减少约75%的状态数。针对实际网络中数据流并发出现的情况,提出一种基于时分复用的并发数据流匹配方案VLSM-HFA。VLSM-HFA通过存储功能保存和恢复匹配状态,实现了对多数据流的支持;通过综合MC-DFA高速处理和SC-HFA内存占用小的特点,实现了高性能的正则表达式匹配。同时,为保证数据流切换的性能并兼顾数据流的公平性和差异性,MC-DFA设计了快速变长切换机制。平台验证部分,3386条规则下,VLSM-HFA方案在FPGA平台中,最多可支持131条并发数据流,吞吐率可达到9.6Gbps。综上所述,本文在理论分析的基础上,从算法实现和平台验证两个方面对正则表达式匹配技术进行了归纳和创新。理论分析为算法的设计提供了研究基础和方向,基于FPGA的部署检验了理论和算法的正确性,并为相关系统的设计提供了一定的参考依据。
其他文献
美术课程标准要求评价标准体现多维性和多级性,以适应不同个性和能力的学生的美术学习状况,帮助学生更全面和客观地了解自己的学习能力和水平,鼓励学生根据自己的特点发展美
硅藻土是一种主要由蛋白石构成的硅质沉积岩。本文通过实验研究了天然硅藻土、十二烷基磺酸钠改性硅藻土对水中Cd2+和Pb2+的吸附性能,比较了有机改性前后硅藻土对Cd2+和Pb2+的
<正>从中国铁路总公司获悉,2017年10月17日—19日,中欧班列运输联合工作组第一次会议在郑州举行,中国铁路总公司及白俄罗斯、德国、哈萨克斯坦、蒙古、波兰、俄罗斯等国家铁
期刊
主要讲述了关于智能配电系统结构组成,并且介绍了如何才能选择正确的智能断路器来配合智能电力仪表,举例验证了在同类品牌中高档智能低压断路器所具有的功能结论。
对我国中西部偏远地区众多小型企业社会资本形成和积累问题作了探讨。鉴于小企业发展是当地群众脱贫致富的重要途径,在投资和技术不足的条件下,社会资本形成和积累遂成为企业成
<正>浙大附中是浙江省一级重点中学、省一级特色示范学校,位于杭州西湖核心风景区内。学校创建于1947年,其前身是由著名教育家、画家丰子恺和潘天寿先生等为纪念经亨颐先生而
目的探讨股静脉穿刺不同体位的穿刺效果.方法将需要股静脉穿刺的90名患者随机分成A组、B组、C组各30例,不同体位相同的穿刺点进行穿刺.结果 A组一针穿刺成功率为93.3%,平均操
本刊讯4月14日,国家森林城市高峰对话暨全省森林城市建设座谈会在宜宾长宁县召开。参加会议的有国家林业和草原局宣传办副主任马大轶,四川省林业厅党组成员、森林防火指挥部专
多帕菲为紫杉醇类抗肿瘤药,主要成分为多西他赛,多西他赛可与游离的微管蛋白结合,促进微管蛋白装配成稳定的微管,同时抑制其解聚,导致丧失了正常功能的微管束的产生和微管的
2017年,全省各地、各有关部门和单位认真贯彻中央关于开展大规模国土绿化行动部署和习近平总书记“着力推进国土绿化”等系列重要讲话精神,认真落实省委省政府关于开展大规模绿