高性能深度数据包检测技术研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:mldn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度数据包检测(DeepPacketInspection,DPI)是现代网络入侵检测/防御系统(NetworkIntrusionDetectionandPreventionSystems,NIDS/NIPS)的核心。随着网络技术的发展和网络流量的迅猛增长,深度数据包检测技术面临着高性能的挑战,即如何满足线速的深度数据包检测和存储需求。深度数据包检测系统采用特征匹配算法进行高速的数据包负载过滤,特征匹配是计算机科学中经典问题,一般来说,确定性有限状态自动机(DeterministicFiniteAutomata,DFA)和非确定性有限状态自动机(Non-deterministicFiniteAutomata,NFA)是特征匹配算法最常用的结构,用于描述特征规则并与数据包负载进行匹配。DFA的匹配速度很快,但存在存储空间开销大的缺陷;NFA存储高效,但是匹配效率很低。因此,高性能特征匹配算法的主要研究内容在于如何设计时空高效的自动机算法。
  按照特征规则的表达语言划分,特征匹配算法可分为字符串匹配算法和正则表达式匹配算法。最早出现的特征匹配算法都是字符串匹配算法,随着网络应用类型日益复杂,正则表达式具有更强表达能力和灵活性的特点,使其逐渐替代字符串来定义特征规则。但正则表达式复杂的语义也导致基于正则表达式的特征匹配算法面临新的挑战,例如DFA的存储空间爆炸问题和多字符的自动机结构实现问题等等。
  本文将主要以时空开销为角度,讨论现代DPI系统面临的高性能挑战问题:
  首先,针对确定性有限状态自动机(DFA)和非确定性有限状态自动机(NFA)分别在时间和空间方面的优势和劣势,以及现有基于字符串规则的特征匹配算法时空互换的折衷性矛盾,本文提出了一种基于多步长索引表的NFA(MSI-NFA)算法。通过我们的分析与观察,确定对真实网络流量的特征匹配具有低频匹配成功率和高频状态迁移率的特点,MSI-NFA算法的设计针对这些真实网络流量特点,使用多步长索引表高速过滤网络流量中大部分无效内容匹配,尽量使相对低速的NFA只匹配正确的网络流量数据块。实验结果表明:在低匹配成功率的网络流量环境中,MSI-NFA算法在NFA存储优势的基础上,拥有接近DFA的匹配效率,同时,与现有主要字符串特征匹配算法相比,MSI-NFA都具有明显的时间与空间优势。
  其次,针对正则表达式的固定步长分割难题,我们提出了一种扩展的正则表达式分割方法,该方法扩展了正则表达式语义并且实现了正则表达式的多字符分割,这是建立正则表达式的多步长索引表和基于正则表达式的多步长特征匹配算法的基础。在实现了扩展正则表达式的多步长分割基础上,我们设计实现了正则表达式的多步长索引表和扩展的NFA算法(XNFA)。考虑到原MSI-NFA算法在大规模规则集下可伸缩性差的问题,我们改进了多步长索引表和MSI-XNFA的联合匹配机制,在不付出额外存储代价来提高索引步长的情况下,提高MSI-XNFA算法的可伸缩性。实验结果表明:改进的两步长索引的MSI-XNFA算法的过滤性能要优于三步长的MSI-NFA算法,且支持正则表达式规则库。
  最后,针对传统特征匹配算法单字符匹配模式的性能瓶颈问题,并考虑到现有多字符特征匹配算法都是基于精确字符串规则,本文提出了一种基于正则表达式的多步长DFA算法,包括多步长正则表达式DFA的构建和迁移表的压缩。我们设计了迁移边融合算法(TransitionMergingAlgorithm,TMA)来将单步长的DFA转化为任意多步长的DFA。此外,本文针对多步长DFA指数级的存储开销增长问题,提出了一种分别融合冗余状态和输入标识的迁移表压缩算法,减少多步长DFA的存储空间开销。实验结果表明:相比原始DFA,4步长DFA能够具有69.9%的吞吐量加速比,且减少了65.1%的匹配时间开销;迁移表压缩算法能够减少两步长DFA迁移表中2.1%-37.9%的状态和51.3%-87.2%的迁移边,整体存储空间减少了52.3%-92.1%。
其他文献
[db:内容简介]
睡眠与觉醒是人体中枢神经系统中的一种主动节律性活动,被形象化地称为人体的生物钟。睡眠是个体最基本的生存需求,而睡眠障碍却严重地影响了人们的生活质量。随着现代社会生活节奏的加快,人们对睡眠的关注程度越来越高,睡眠质量问题已经成为世界性的健康问题。目前,大学生普遍面临着学业繁重、就业竞争和人际关系等方面的心理压力,许多人不能很好地安排作息时间,以至于造成严重的睡眠不良问题。有调查报告指出,大学生中存在
目的观察超早期应用氨甲环酸对特急性创伤性硬膜外血肿进展的影响。方法选取我科2011年9月至2014年9月收治的80例符合入组标准的特急性创伤性硬膜外血肿,分为治疗组42例,超早期(伤后3小时内)行抗纤溶治疗;对照组38例,受伤3小时后行抗纤溶治疗。分别于受伤3小时后、24小时内动态复查头颅CT观察硬膜外血肿变化。结果治疗组血肿扩大发生率(23.87%)显著低于对照组(44.73%)(P20.05)
近年来,利用非平衡等离子体技术处理燃烧烟气中的主要污染物No及SO已经发展成为一种新兴的技术。等离子体放电的理论和计算机模拟处于初始阶段,使得放电参量的选取较为盲目,放电难以获得和控制。因此,对放电过程中的物理过程和化学反应机理的研究具有重要意义。本文针对介质阻挡放电等离子体NO/SO/N/O系统进行了动力学研究。根据相关理论知识的掌握,将整个反应过程的模型分为两部分:高能电子撞击气体的离解,电离
电力是国民经济发展的基础。改革开放以来,全国电力工业得到了迅猛的发展,促进了国民经济的发展,为国家的可持续发展打下了良好的基础。同时,电力推向了市场,国民经济的发展也对电力建设提出了更高的要求。但是,随着经济的发展,电力供给水平受到了很大影响,原有的发电设备落后,电力结构和电源分布不合理,能源利用率低,环境污染严重,并且供电管理对用户用电缺乏激励机制,导致在需求侧用电混乱。电力市场的需求侧管(DS
学位
大规模MIMO(Mutiple-Input Mutiple-Output)技术在基站(Base Station, BS)配置大量天线并利用同一时频资源同时服务多个用户(User Equipments, UEs),可大大提高频谱效率、数据速率、以及能量效率,成为未来5G无线通信系统的关键技术之一。未来5G移动通信系统将大力发展物联网(Internet of Things,IoT)应用、机器到机器(M
学位
研究电磁波在等离子体鞘层中的传播特性,对评估等离子鞘套覆盖下飞行器的通信信道的特性,探索缓解黒障问题的方法具有重要意义。自从Yee在1966年提出时域有限差分(Finite-Difference Time-Domain FDTD)方法以来,由于其在稳定性,准确性,容易建模等方面的优势,该方法已经被广泛应用于各种电磁问题的仿真计算。近年来,随着大批优秀的关于等离子体的FDTD计算模型被提出,FDTD
舞阳矿集区位于华北板块与秦岭造山带结合部位,处于鲁山背孜—舞阳出山复背斜构造的东段。研究区具典型的台地型双层地壳结构,基底地层为新太古界太华群,零星出露于研究区西部和南部的小丘陵区,面积16.4km~2,自下而上可分为:赵案庄组、铁山庙组、杨树湾组,为一套角闪岩相变质岩系,是赵案庄式-铁山庙式沉积变质型铁矿的赋矿层位.舞阳铁矿区大理岩分布于铁山庙组地层,与条带状磁铁矿整合产出,长期以来
目的:研究清肺汤方对ARDS患者的临床治疗效果。方法:选择南通大学第二附属医院ICU住院行机械通气的急性呼吸窘迫综合征(ARDS)患者60例,将60例ARDS患者随机分为清肺汤组和常规组。清肺汤组方:炙麻黄,黄芩,金荞麦,鱼腥草,葶苈子,熟大黄。在入院第1天和第7天进行白细胞、C-反应蛋白、降钙素、血气分析检测、机械通气时间测定、APACHEⅡ评分、肺损伤评分记录、血管外肺水指数监测和不良反应发生
自20世纪90年代以来,互联网和万维网得到了迅猛发展,其功能和业务也在不断扩展和增加,这使得它们成为21世纪用户获取资源、数据和信息的主要场所,这也使得Web数据挖掘的任务迫在眉睫。当前,k_means算法是最经典和使用最广泛的划分聚类算法,而PageRank算法是Web结构挖掘中使用最广泛的算法。基于此,研究了这两种算法的原理,并提出了两种算法的改进方法。  传统k_means算法选择初始聚类中