网络数据流异常事件检测关键技术研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:simon_186
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多种异构网络的融合以及网络技术的持续进步,网络安全问题逐渐受到人们的重视,网络数据流的异常事件检测技术也得到了信息科学研究领域的广泛关注。在传统异常检测方法中,研究者们将信息论、数据挖掘、统计学等思想融入其中,并取得了一定成果。由于网络数据流的数据特征繁多,且其中的大部分特征是与类别无关的,因此在异常检测之前对特征进行挑选,再利用选择出的有效特征对数据进行建模能大大提高检测效率及准确度。综上所述,本文研究的重点是使用一种有效的特征选择算法对网络数据流的特征进行挑选,并提出一种有效的检测技术对网络数据流进行异常检测。  针对网络数据流的特征选择问题,鉴于 ReliefF特征选择算法速度快、能处理多分类问题、可处理多种数据类型等特点,本文主要对ReliefF特征选择算法进行了研究。首先,该算法计算特征权重公式主要基于距离公式,大量复杂计算必然对效率产生影响。其次是该算法通过计算同类之间距离和异类之间距离来估计同类数据与异类数据之间相似度,而在实际计算过程中,不同情况下计算权重过程也应有所变化,才能更准确的选择特征。针对以上问题,本文通过在不同情况调整特征权重的方式对算法进行了改进,保证了在特征选择结束后,所选特征子集中的特征与类别具有较强的相关性。实验证明改进后的算法选出的特征子集具有更好的分类效果且提高了算法运行效率。  针对网络数据流异常检测问题,本文采用基于隔离森林的异常检测算法。该算法对数据维数及数据量无限制,同时充分利用了异常数据流“少且不同”的特点。但由于隔离森林算法特征及特征值的选取是完全随机的,这会造成算法极大的不稳定性,且该算法对检测到的异常不能确定攻击类型。针对以上问题,本文首先将特征选择算法与隔离森林算法相结合,对选取的特征及特征值进行了优化,该过程在提高算法的稳定性的同时确定了异常数据的攻击类型。其次,本文结合异常网络数据流的特点对算法效率进行了优化。实验证明本文提出的异常检测方法能够快速准确的检测出网络数据流中的异常事件。
其他文献
近二十年来,人脸跟踪与识别技术已经成为计算机视觉与模式识别的一个重要研究方向,在商业和安全部门有着广泛的应用。目前的研究工作主要集中在静态人脸识别等方面,但由于静
本文在原有人事信息管理系统的基础上,依据国家人事管理政策和学院内下发的相关人事管理政策,结合实际业务需求,提出了合理、有效的功能扩展,包括考勤、绩效考核、培训、安全四个
目前,工作流技术是发展最快的技术研究领域之一。工作流系统是业务流程管理的重要基础,通过企业经营过程模型的建立、部署和实施,能够促进及监控经营过程的高效运行并且使其
传统机织工业生产流程中,试织是验证织物样式、结构设计是否正确,是否符合客户要求的重要环节。很多情况下试织需要反复进行,往往造成人力、物力的浪费,对机织物结构与外观的
人体生物特征识别技术(Biometric)是一种将信息技术与生物技术相结合,利用人体本身具有的生物特征进行身份识别的技术.包括物理特征和行为特征等在内的生物特征具有"人人拥有
随着Internet/Intranet的迅猛发展,B/S模式已经成为企业信息管理系统的主导模式,XML. ASP. NET、组件对象、分布式数据库等已成为信息系统开发的核心技术。作者在研究这些核
参数多项式表示方法被广泛的应用到CAD及CAGD系统和自由曲线曲面的表示中,例如Bemstein-Bézier,Schoenberg-B-Spline和Hermite-Coons等。Bézier曲线是CAGD中最基本也是最重
本文通过国家广播电影总局有关数字电视用户管理系统的入网测评要求规范和实际用户需求对数字电视运营网络的系统组成结构和具体业务开展模式进行分析,讨论一个基于J2EE体系结
空间数据挖掘或空间知识发现是指从包含空间信息的数据库中抽取隐含的知识、空间关系或非显式存储在数据库中有意义的特征或模式。此技术在理解空间数据、获取空间与非空间数
数据挖掘和数据发布是当前数据库应用的两个重要领域。一方面,数据挖掘和知识发现在各类数据应用范围中都起到非常重要的作用。数据挖掘的目的是从大量的无规律的数据中抽取出