基于多特征相似度的大规模网络异常检测

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:jinshi46
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络和网络技术的发展,全球互联网规模的日益扩大,网民数量的大量增加,人们在越来越依赖网络的同时,大规模的网络攻击和病毒扩散也日趋频繁。如何保障网络与信息系统的安全已经成为人们高度关注的话题。用于异常发现的传统入侵检测系统并不能简单地应用到大规模的网络环境中。而基于网络流的分析是一种更自然的方式。以流行为的动态变化过程作为研究对象可以在更高的粒度上研究网络本身的行为特征,这是当前一个重要的研究方面。大规模网络数据流的特点是数据持续到达、速度快、规模宏大,目前尚没有利用数据流挖掘技术来解决实际网络数据流检测和分析的技术。本文提出了用网络特征属性来描述大规模网络的状态;结合网络流量具有自相似的特性,提出了利用NetFlow技术进行流量采集,运用多特征相似度的方法进行异常检测,并通过实验证明了该方法的有效性,具有理论意义与实际应用价值。大规模网络异常检测系统由NetFlow数据采集模块、NetFlow流数据预处理模块、训练数据构建模块、异常检测模块组成。在NetFlow数据采集模块中,我们设置了分布式的预警代理用来接收NetFlow流信息,以应对大规模网络的要求。在NetFlow流数据预处理模块中,我们依据网络特征属性的需求,用高频统计的方法对网络数据进行聚集,将得到的数据存入数据库中。在训练数据模块中,我们根据网络流量具有周期性这一特点,从训练数据中挖掘出基于不同时段的标准网络特征属性矩阵和标准相似度阈值,这样能够更好的用于异常检测。在异常检测模块中,我们统一了各个特征属性量纲,改进了多特征相似度算法,通过与标准阈值的比较来进行粗粒度检测。当粗粒度检测出现异常时,结合异常时相似度的变化特征再进行细粒度的检测。在两次检测后,最终确定没有异常的情况下,实时数据也用作新的训练数据,以符合网络流量不断变化的特征。最后,我们组网对系统进行了测试。通过进行模拟网络攻击,我们发现原型系统能够有效地发现网络异常,实现了对网络流量异常的实时检测。并且比较了算法在改进前后,对于网络异常检测灵敏程度的影响。
其他文献
随着INTERNET的飞速发展,网上的信息越来越丰富,激增的数据背后隐藏着许多重要的信息。用户使用现有的搜索引擎浏览页面时,虽然能部分解决“资源发现”的问题,但精度不高,不
利用计算机图形学理论,在三维场景中对气体进行渲染,对于虚拟现实和环境保护等方面有着重要的意义。随着计算机硬件的发展,和实时流体模拟理论的进步,建立复杂环境中的气体渲染已
工作流技术是当前计算机应用领域的一个研究热点,利用工作流技术对企业进行业务过程的建模和分析不仅可以规范化企业的业务流程,发现业务流程中不合理和低效的环节,进而对企
混沌现象是20世纪人类最重要的科学发现之一。在过去的20多年时间里,人们对混沌的研究主要是从一些实验及数值模拟来观察和量化混沌。随着对混沌现象认识的不断深入,如何应用混
近年来,随着数据库技术以及数字化技术的不断进步,针对高维时间序列的数据挖掘研究引起了越来越多学者广泛的兴趣。然而,由于数据维度的增多,大大增加了数据挖掘算法的复杂性,使得
从上个世纪九十年代初期开始,基于内容的多媒体检索就开始成为了在多媒体信息检索领域中的一个研究热点。并且基于内容的多媒体检索的研究也一直是计算机视觉领域中的一个非
汉语依存关系解析是句法分析的重要方法,而句法分析是自然语言处理的关键技术。汉语依存关系解析是基于汉语依存文法来确定句子中词与词之间的依存关系。词是句子结构中的最
伴随着Internet规模的迅速增长和内容的不断丰富,同时也给人们进行有效访问资源带来了困难。由于提问的不专指和文献资源量巨大的矛盾,系统往往会返回数量庞大的检索结果。若
图的交叉数是衡量图的非平面性的一个重要参数,计算图的交叉数是非常困难的,Garey和Johnson在1983年证明了计算图的交叉数问题是NP完全的。目前只有很少的图的交叉数的精确值是
随着下一代网络技术的发展,传统PSTN网络上的语音业务将逐步迁移到IP网络上。VoIP技术为基于IP网络的语音通信提供了强大而有效的手段,以该技术为基础的语音通信将成为下一代网