基于模式匹配的高性能网络信息过滤系统研究

来源 :中国科学院计算技术研究所 | 被引量 : 0次 | 上传用户:szshm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速发展,人们对互联网的依赖性越来越大,网络安全问题也日益突出.网络信息的过滤是网络和信息安全的核心关键技术之一.随着网络带宽和流量的"超摩尔"增长、对检测准确性要求的提高、以及网络应用和服务的迅速发展变化,对高速网络进行安全监测和内容监管面临着严峻的挑战. 在对性能要求很高的高速网络入侵检测或内容过滤系统中普遍采用的是基于规则匹配的过滤方法.经过长期的积累,已经研究出多种被普遍认可的高效算法,并接近或达到了理论上最优的时间复杂度.从匹配算法本身来看,似乎已经达到极限,无法再优化了,但这些理论分析都是以待检测样本的独立性为前提,而分析网络流的特征我们发现实际上网络流中的数据并不是相互独立的,并且样本与匹配规则以及规则集内部都存在着相关性.基于这一原理,论文提出通过规则优化方法提高匹配性能的思路,提出并实现了候选模式的提取、筛选和规则集约简等一系列算法,并通过理论分析和实验数据论证了引入正例和反例规则、对规则集进行优化后,可以在总体检测准确率和召回率保持很高水平的情况下大大降低匹配的开销. 由于现实网络中流量突发现象的普遍存在,在实际应用中系统的过载问题是无法避免的,系统过载状态对过滤能力的损害极大,远超过直观上看到的丢包率.针对这种情况,我们采取牺牲少量的准确率和召回率来提高系统检测能力的策略,并使用采样和规则泛化等近似处理技术来尽可能地保持系统在过载情况下的总体过滤能力. 论文最后结合实际应用需求和我们的实践经验,提出了一个完整的网络信息实时过滤系统的设计架构,论述了其中主要模块的原理、算法和实现机制,并将规则优化和过载处理等技术应用到该系统中,将理论与实际应用很好地结合起来.
其他文献
随着互联网的蓬勃兴起,企业应用从传统的客户机/服务器模式开始面向互联网。作为企业级应用程序解决方案之一,J2EE被认为是当今可用于企业软件开发的最佳平台,J2EE简化了基于工
随着机群系统规模的扩大,可靠性问题已成为制约机群系统应用的重要障碍.目前,针对机群系统可靠性的相关研究主要分为两类.一类以部件冗余为基础,以提供不间断服务为目的的高
“存储墙”问题一直是制约计算机系统性能的关键因素。随着多核处理器成为主流,单个芯片上可以同时运行的线程个数越来越多,这些线程同时竞争有限的访存资源,使得内存控制器面临
科学数据库经过二十多年发展,积累了大量科学数据资源。如何对这些分布、异构的数据资源进行集成和互操作,成为一个亟待解决的问题。由于传统元数据以及异构数据集成技术的局限
学位
视频运动分析试图赋予计算机对视频中出现的运动目标进行自动检测、识别、跟踪,进而对其运动行为进行智能推理的能力.该研究具有重要的学术研究价值和广阔的商业应用前景,本
虚拟机技术将操作系统与硬件资源隔离开来,在很多方面极大的方便了人们对计算机软硬件资源的管理。虚拟机在线迁移技术,是基于虚拟机技术的典型应用,能够将操作系统实例透明地在
随着网络技术的发展,互联网上的信息呈指数快速增长。人们利用搜索引擎,例如baidu,google从海量的信息中查找所需。然而,当前的搜索引擎只是把互联网上的网页收集到本地数据库,并
微粒群算法是一种基于群体智能的随机优化算法。其思想来源于人工生命和演化计算理论。微粒群算法通过微粒追随自己找到的最好解和群体找到的最好解来完成优化。该算法由于容
土地档案管理是国家档案的重要组成部分。土地档案管理不仅是土地管理工作的一项重要内容和基础工作,也是全面、科学用好土地的重要保证。随着社会主义市场经济的不断发展,土地
汉字输入技术是中文信息处理领域中特有的一项基础性关键技术。虽然目前有一些不依赖键盘的汉字输入产品和不少基于汉字字形的输入法,但是毋庸置疑拼音输入法是互联网用户最常
学位