高速网络流量识别系统中深度包检测方法研究与实现

来源 :西安建筑科技大学 | 被引量 : 0次 | 上传用户:liongliong545
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度包检测技术以其强大的识别能力,现已被广泛应用于各种网络安全设备。然而随着网络带宽的爆炸式增长,如何在大流量网络环境中对数据包实现高速、准确的识别,已引起广大学者的关注。正则表达式以其强大的语言表达能力现已成为规则特征的主要描述方式,通过对正则表达式的匹配实现数据包的识别。目前,正则表达式主要通过不确定性有限自动机(Non-deterministic Finite Automata,简称NFA)、确定性有限自动机(Deterministic Finite Automata,简称DFA)实现,NFA占用空间小,但匹配时间长,DFA的匹配时间短,但存在状态爆炸隐患,导致计算机物理内存不能满足需求,所以两者都不能同时满足实际应用需求。相比较而言,DFA更适合高速网络流量识别,所以近几年的研究焦点主要集中在如何减少DFA的状态数目。本文针对上述问题,以高性能的正则表达式匹配引擎为主要的研究对象,深入分析了DFA状态爆炸原因。提出:先对正则表达式集分组,减少正则表达式之间的冲突所引起的状态数增加,然后将每一组正则表达式进行联合编译生成组合DFA,最后再对各组生成的组合DFA进行状态压缩。在此基础上,结合实际项目,详细阐述了深度包检测的具体实现。本文主要完成了以下内容:第一,深入研究了不同类型正则表达式的DFA结构特征,分析了单个DFA和组合DFA状态爆炸的原因;第二,针对组合DFA的状态爆炸问题。在前人的工作基础上,改进了一种近似比为1/(1-1/6))的正则表达式分组算法,经模拟测试表明,改进后的分组算法在分组效率上优于改进前,具有一定的适用性;第三,根据DFA状态间的相似度,提取状态转移表中的公共状态,将公共状态形成的状态转移表与提取公共状态后的原状态转移表分开存储,实现对状态的压缩。公共状态的提取属于聚类问题,然而传统的聚类方法普遍存在聚类时间过长,对此,本文采用并实现了一种基于最大生成树的层次聚类算法。第四,实现了改进后的正则表达式分组算法和基于最大生成树的公共状态提取算法,并通过实验证明基于上述算法的先分组后压缩的设计方案在处理大规模模式匹配方面的优越性。第五,以实际项目为背景,结合作者的工作内容,详细阐述了深度包检测方法在高速网络流量识别系统中的具体实现,并通过实际测试,给出系统的性能表现。
其他文献
随着人们对高清晰图像需求的提高,图像采集系统硬件的性能越来越满足不了这种需求。一种软件实现方法逐渐受到研究人员的关注,它不但弥补了硬件系统的限制,而且只在重复使用现有
从生物医学文献中抽取蛋白质交互作用关系是二十一世纪生物医学领域研究的热点内容之一,研究并实现有效的蛋白质交互作用关系抽取方法是本文的主要研究内容。本文在深入研究
本文结合粒度计算中的商空间相关理论与聚类分析进行交叉技术研究,首先给出了一种基于商空间的模糊聚类方法模型,该模型提高了对高维数据的处理能力,并对模糊相似矩阵的构建
非线性学科是非线性领域中的一门学科,混沌是其中的一个重要组成部分。本文研究了混沌系统的广义同步与相同步,并通过理论推导加以证明,数值实验说明了这些方案的有效性与可行性
随着中国国力的日益增强,中文信息处理(CLP,Chinese Language Processing)受到越来越多的重视。目前基于深度学习的自然语言处理的研究主要集中在字母语言(Alphabetic Langua
IP多媒体系统(IP Multimedia Subsystem)是3GPP提出的支持IP多媒体业务的子系统,旨在建立一个与接入无关、基于开放的SIP/IP协议及支持多种多媒体业务类型的平台来提供丰富的
在计算机虚拟化技术推动下,云计算中包括虚拟机在内的计算资源急剧增加,通常需要在大量的计算资源上动态地部署或反部署软件,以构建不同的计算环境满足用户不断变化的需求。
随着Internet网络的普及、电子商务的发展以及人们生活和消费观念的改变,网上购物受到越来越多的关注。结合网上购物项目,论文简介了课题研究的目的意义,国内外研究现状,实验
普适计算是信息空间和物理空间的融合。在普适计算环境中,人们可以随时随地、透明地获取数字化的服务。这种无处不在性和移动性使得发生服务的双方事先不可预知,因此传统的针
资源发现是网格技术的一个非常重要的方面,资源发现就是找到与预想的资源描述相匹配的资源。网格资源的发现方式必须能够适应具有大规模、异构性、分布性、动态性、开放性等