结合可视化与机器学习的网络异常检测技术研究

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:pgzwoaini1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络技术的不断发展,互联网的普及率以及网民的数量的不断攀升,给人们的学习和日常生活带来了极大的便利。与此同时,针对网络的攻击手段日益复杂,网络攻击软件日趋多样,网络安全面临着十分严峻的挑战。异常检测技术可以检测网络中的异常行为,保护网络的安全。  现阶段机器学习方法是异常检测的主流,其方法本身固有的优势有:在数学上的坚实基础、较之人有相对快速的学习速度、便于知识积累、学习结果易于传播。基于以上原因,机器学习技术在异常检测方面具有先天的优越性。但是机器学习还存在可理解性不强、学习周期长、计算量大等问题。  另外一方面,可视化技术存在以下优势:首先是可理解性强,信息能够直接为大脑接受;其次是人眼可以高速并行获取外界知识,之后在大脑层面进行高速处理,对于图形的感知大大强于对数据的感知;最后是具有超强的模式识别能力。可视化技术的缺点是对过量数据的识别容易造成“过载”的情况,造成效果的不理想。  我们希望在使用机器学习技术的基础之上,增加方法的可理解性,便于对异常进行检测。  基于以上原因,本文结合机器学习与可视化技术,开展网络异常检测技术研究。具体创新点如下:  ?提出了一种结合平行坐标系和信息增益的异常检测方法。平行坐标能够将高维数据展示在平面中,基于信息增益的特征选择方法选择最有价值的特征来决定平行坐标系的若干条纵轴,减少了展示的轴数,使样本的空间表示更加简洁,使样本的可视化表示更加显著。通过实验验证了该方法的有效性。  ?提出了一种结合象素螺旋排列和主成分分析的寻找异常重要特征方法。象素可视化同样可以把高维数据展示在平面中,主成分分析可以将特征重组,形成对分类更有价值的特征,二者结合可以更有效地展示出网络攻击的特点。通过实验验证了该方法的有效性。
其他文献
随着数据挖掘技术的发展,人们对时态信息的关注日益提高。时态数据库中既反映被处理事件的历史信息又体现系统中元事件时态信息的双时态数据库日益受到人们的重视。随着双时
边缘是图像中重要的特征之一,边缘检测是计算机视觉、模式识别等的基础。然而,边缘检测又是图像处理中一个困难的问题,因为实际景物图像中的边缘往往是各种类型的边缘以及它
随着互联网技术的发展与应用的深化,各种数据呈爆炸式增长,数据密集型应用的负载特性与传统应用具有很大区别,传统处理器利用时空局部性提升性能的方法将不再适用。因此,针对
随着近年来互联网技术的快速兴起,在线社交网络作为一种现实社交在互联网中的投射物,越来越具有相当的研究价值。在现实社会关系中,以自然人为节点,人与人之间的各种直接联系为边
近年来由于计算机技术在工程设计领域的广泛应用,使CAD(计算机辅助设计)技术迅速发展起来。协同CAD系统是CSCW技术的一个典型应用。它支持不同地理位置的多个设计者通过分工
由于空间网络相较于传统地面网络具有长传播时延、高误码率、带宽不对称,连接易中断的特点,现有的传输机制难以满足其高效传输的要求。本文针对空间网络的特点,通过将链路状
近年来,随着信息技术的蓬勃发展,社交网络、电子商务,网络游戏等已经成为一种重要的市场行为,随之而来的是网域空间虚拟资产数据的巨大增长。虚拟资产保全系统旨在对这些海量
随着计算机及其相关技术的发展,通信能力和计算能力的价格正变得越来越便宜,各种新形念的传感器所占用的体积也越来越小。由于对生产效率、生活质量的不懈追求,人们开始希望能随
近年来,无线通信和电子技术的不断进步,促进了微型无线通信传感器节点的长足发展。由这些低功耗、多功能的节点所构成的无线传感器网络具有十分广阔的应用前景,目前已成为计算机
数据挖掘技术是从上个世纪80年代开始发展起来的一门新技术,就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是