基于Spark平台的网络入侵检测关键技术研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:nixijiunianzhi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
入侵检测作为一种动态的网络安防手段,可以有效地保护计算机系统和网络免受入侵,并与静态安防手段相辅相成,共同构成网络安全防线。近几年,基于数据挖掘的网络入侵检测技术逐渐成为研究的热点,然而在研究的过程中存在一些问题,如数据中存在冗余特征影响检测效果,算法难以处理异常数据且处理大规模数据速度慢等。因此,本文通过特征选择方法,以及结合分布式计算平台Spark对网络入侵检测进行深入研究。具体的工作如下:1.针对网络入侵检测数据中含有冗余和噪音特征影响检测效果,以及数据维度过高使得分类器训练和检测时间过长的问题,提出了一种基于自适应遗传算法的混合特征选择方法。首先,通过卡方(Chi Square,CS)过滤算法,删除冗余和相关性低的特征。其次,采用Light GBM分类器结合自适应遗传算法构成混合特征选择方法,搜索分类效果好的特征子集。实验结果表明,该方法相比于过滤和封装方法具有更好的特征约简能力,且选择后的特征子集在不同分类器上有较高的检测率和较低的误报率。2.针对K-均值算法在处理网络入侵检测中的线性不可分数据以及类分布为非椭圆分布时聚类效果较差的问题,提出了一种基于高斯核函数的并行K-均值优化算法。首先,利用高斯核函数把网络入侵检测数据映射到高维特征空间中,增大各类样本之间的差别。其次,通过优化后的核K-均值算法对网络入侵检测数据进行聚类,该算法可以在K-均值算法失效的情况下,仍能得到正确的聚类。最后,为了处理大规模网络入侵检测数据,将优化后的核K-均值算法在Spark上并行化实现。实验结果表明,该算法相比于K-均值算法具有更好的检测能力,且在处理大规模数据时有较好的加速比和扩展比。
其他文献
受到构件干涉、运动奇异等因素的影响,传统并联机构的工作空间一般比较小,某种程度限制了并联机构的应用范围。课题组通过匹配耦合支链以增大并联机构输出空间的方法,综合并获得了一批新型耦合并联机构——双并联耦合机构。本文主要针对该类新型大工作空间双并联耦合机构以及基于一种球面双并联耦合机构研制的4-RRR//RRR+R冗余支链混联球面仿人肩关节机构的部分性能特征进行研究。推导了双并联耦合机构的转动和移动叠
随着互联网行为式验证码技术的发展,以拖动滑块为代表的鼠标轨迹识别因其传输数据小、暴力破解难度大等特点,广泛运用于多种人机验证产品中。但是攻击者可通过黑产工具产生类
在传统的核酸检测研究中,往往需要加入特定的试剂、荧光剂或者探针等,同时也带来操作步骤繁杂、成本高、污染样品、污染环境等问题。本论文在不添加荧光剂或者探针进行标记的情况下,利用常规光荧光方法,对影响单链脱氧核糖核酸样品(ssDNA)荧光特性的多个因素进行了实验研究,并结合ssDNA的结构特点分析了造成这些影响的物理机制。在此基础上,还探索了不同影响因素下ssDNA样品的无标记鉴别方法。本文的主要内容
软件开发技术日益更替,由于开发的周期,项目的复杂性等原因很容易引入代码异味。研究表明代码异味会降低代码的可理解性和可维护性,致使程序出错,从而引发深层次的设计问题。
随着第五代移动通信(5th Generation Mobile Networks,5G)商用的快速推进,高带宽、低延迟和超密集连接等无线特性也越来越受到人们的喜爱。与此同时,无线信息的广播特性使得
小型飞行器一般适用于工作在城区、山地等复杂地形的空域中。由于其自身尺寸小、雷诺数低的气动特点,这种飞行环境下的突风扰动问题一直是严重制约其发展的关键性技术难题。
经济全球化加速全球服务外包产业发展,数据录入是外包业务类型之一,涉及多种数据类型。图像录入常用的方法OCR由于对如中文、日文这类字形繁杂,字形间差别较大的文字难以分辨
多标签文本分类一直是文本研究领域的研究热点之一,其在很多领域都具有广泛的应用价值,比如文本检索系统、推荐系统、情感分析以及对话系统等。在这些领域中,多标签文本分类
近年来,随着深度学习的兴起,各种深度学习方法被运用到语音情感识别的研究中。尽管语音情感识别领域有着许多研究工作,却依然存在一些挑战,本文针对其中的三个挑战开展了一些
当今社会,经济生活与医疗水平不断提升,人口老龄化已成为一个日益严峻的社会问题。由于身体协调能力会随着年龄增长而不断下降,老年人相对于青年人来说更容易发生跌倒行为,继