基于正则表达式的多模式匹配算法研究

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:heshang9994
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机和Internet技术的普及与发展,网络在人们日常生活中发挥越来越重要的作用,但是随之而来的网络安全问题也日益突出。入侵检测系统作为保障网络安全的重要防护措施得到了广泛应用,模式匹配作为入侵检测系统中的一项关键技术,其性能优劣关系到整个入侵检测系统的效率,提高模式匹配的效率是提高这类系统检测能力的关键所在。本文简单介绍了入侵检测系统,分析了多模式匹配算法在其中的应用,并对AC、AC_BM和WM算法做了详细说明。但是,随着网络技术的发展和规则集复杂性的增加,这些传统的字符串匹配引擎正逐渐被先进的正则表达式引擎所替代。正则表达式匹配引擎一般是基于非确定的有限自动机(Nondeterministic FiniteAutomaton,NFA)和确定的有限自动机(Deterministic Finite Automaton, DFA)的。基于NFA的匹配引擎匹配速度慢,但存储空间相对较小。基于DFA的匹配引擎具有先天的速度优势,但是消耗的存储空间过大,并且随着规则集规模的增大,其对存储空间的需求更大。本文从减少构造的自动机的状态数出发,提出了一种有效的DFA合并算法(称为COM_DFA算法)。在自动机构造过程中,将各个正则表达式分开处理,避免合并自动机时状态和迁移边之间的交互重叠情况的出现,能够大大地减少自动机的状态数。并且,通过引入空转移合并DFA,构造一个具有最小状态数的自动机,从而减少存储空间需求。最后,引入压缩率CR(Compressed Rate)的概念来描述合并算法对自动机状态数的压缩比率。实验结果表明算法对DFA状态数具有较好的压缩效果。针对NFA和DFA的匹配速度和内存需求之间的矛盾,提出一种基于DFA-NFA结构有限自动机的正则表达式匹配算法(称为D_N算法)。算法采用DFA-NFA结构实现自动机的构造,分开处理引起DFA空间爆炸的状态,以降低存储需求。由于网络中的数据只有很少一部分是恶意数据,而大部分是正常数据,DFA部分在NFA部分之前的设计可以实现数据过滤功能,能够加快算法的匹配速度。同时,在自动机的构造过程中,针对DFA-NFA边界上的关键状态,对同样的输入字符,设置相应迁移边的优先级。匹配过程采用基于优先级的查找算法,检查优先级来确定当前状态在读入字符下可以跳转到的下一状态,从而加快匹配过程。D_N算法的测试结果表明其匹配效率和在状态方面的存储需求比传统算法有较大提高。
其他文献
  本论文的主要研究内容是利用等离子体增强化学气相淀积的方法制备N-SiOX:H材料,初步研究其作为非晶硅电池的 N 型功能层以及在非晶硅/微晶硅叠层电池中的复合功能层的应用
糖尿病性骨质疏松(diabetic osteoporosis,DOP)是糖尿病在人体骨系统中引起的严重慢性并发症,随着糖尿病患者群体的不断扩大,DOP发病率逐年升高,给社会和患者家庭带来巨大的
  本文是在国家“863计划”项目(2012AA10A503),农业部公益性行业(农业)科研专项(201203026),北京市农林科学院青年科研基金(QN201107)的资助下,针对农业上作物信息自动检
为弄清南方鲇摄食行为与味觉中枢活动的关系,本文对南方鲇延脑神经细胞培养及其生理进行了研究。文章探索南方鲇延脑神经细胞的分离条件,采用了膜片钳技术,建立了分离的实用方法
近年来,我国快递服务业高速发展,信息化水平不断提高,大量的基于条形码和二维码的包裹自动分拣系统开始应用到分拣过程中。然而,快递分拣现场环境复杂,条码污损的情况时有发
肝癌为我国常见的恶性肿瘤之一,其死亡率在消化系统恶性肿瘤中列第三位,寻找和鉴定肝癌相关基因并研究它们的生物学功能,将有助于揭示肝癌的发生机制并为药物治疗提供选择药物的
胎盘植入是产科危急重症之一,近年来,其发生率呈逐年上升趋势,为孕妇及其家庭带来巨大的心理和经济压力,引起社会广泛关注.临床上结合病史,借助彩超检查及磁共振可以明确胎盘
以我室经过小麦花药培养、EMS诱变获得的耐盐性有明显差异的“一粒传”后代中的耐盐突变体RH8706—49和敏盐突变体H8706—34为材料,分离到了耐盐相关基因糖原合成酶激酶(glycogen synthase kinase in Triticum asetium,FaGSk1)。该基因已作为小麦中新发现的基因被GenBank接受,登录号为AF525086。本研究以小麦糖原合成酶激酶(TaGSK1
研究背景:在人类活动对自然界的影响、气候异常、臭氧层破坏、外来生物物种殖入等多重因素影响下,土壤生物物种多样性和生态功能也必然随之变化,如土壤出现盐碱化等。影响农林牧业和生态系统的可持续发展生产力.小麦作为我国最主要的粮食作物,有很高的科学研究价值。而丛枝菌根真菌(Arbuscular mycorrhizal fungi,AMF)是一种普遍存在于自然界中的内共生真菌,它能与80%以上的维管植物根系
非小细胞肺癌(non-small cell lung cancer,NSCLC)约占肺癌的85%,发病率和病死率位居全球前列,由于其起病与进展的隐匿性,被发现时患者已丧失最佳的治疗时机.国内外课题组致力