基于SOMTE+Tomek Link的CatBoost网络入侵检测模型研究

来源 :郑州大学 | 被引量 : 0次 | 上传用户:mj3140
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的蓬勃发展,人们的生活越来越便利,但与此同时,网络安全问题也随之而来,严重影响着网络的应用及各类用户的安全,因而对网络安全技术进行研究至关重要。入侵检测技术是一种主动式的防护技术,通过实时监测、收集和分析网络流量包,并在系统受到危害前识别和拦截攻击行为,能够高效保护网络系统的安全。论文通过分析NSL-KDD数据集的数据分布并联系实际情况,将网络入侵检测简化为二分类问题,即正常行为和攻击行为(Normal和Attacks)。考虑到实际的生产生活中,入侵行为的发生率往往远低于正常行为,这就造成了数据失衡。在传统入侵检测系统中,通常以模型整体预测精度作为其性能的评价标准,但却忽略了入侵行为(即少数类样本)的检测精度仍然很低,不能有效识别和处理入侵行为。因此本文提出欠采样与过采样结合的SOMTE+Tomek Link复合采样方法,并将其应用于CatBoost模型中,旨在解决数据类不平衡问题。论文提出了基于SOMTE+Tomek Link的CatBoost网络入侵检测模型,该模型首先对数据进行预处理和PCA特征降维,然后将经过SOMTE+Tomek Link处理的数据输入到CatBoost模型中进行训练,实验证明该算法可以有效提高入侵行为的检测精度,样本整体正确率也有小范围的提升。本文的主要工作如下:(1)针对网络入侵数据类不平衡问题,本文提出了基于SOMTE+Tomek Link的CatBoost分类模型。分析当前入侵检测领域中,常用的分类模型性能和采样方法的优缺点,并强调不能仅依靠Accuracy评估分类模型的性能好坏,而应采用AUC、F1-score、G-mean等综合评价标准。(2)选取数据集和预处理。通过深入分析KDD Cup 99和NSL_KDD数据集的优缺点,确定NSL_KDD的第四个文件KDDTest-21.txt作为本文数据集。数据预处理主要包括删除全为0的列、字符型转为数值型、标签转为数值型和归一化四个步骤;然后经过主成分分析法,将预处理后的数据由42维降至28维,为进一步验证模型的有效性奠定基础。(3)基于KDDTest-21.txt数据集进行了两组实验,以验证本文所提分类模型的有效性。第一,分别使用XGBoost、Light GBM和CatBoost算法建模,通过对比入侵行为(少数类样本)的预测精度和模型整体预测精度,说明三种算法中效果最佳的分类模型为CatBoost;第二,将经三种采样方法处理后的数据输入到三种模型中,即将原始数据集、SMOTE、SOMTE+Tomek Link分别在XGBoost、Light GBM和CatBoost模型上进行实验,分析对比各种情况的评价指标,说明了SOMTE+Tomek Link方法能有效处理类不平衡数据且具有一定的普适性。
其他文献
随着科技的发展和对微控技术研究的不断深入,对一次性使用低成本芯片的需求越来越多。但如何实现微流控芯片高效、低成本、大批量制造是微流控技术商业化所面临的关键难题。本文以COC-8007(环烯烃共聚物)为材料,对COC芯片的注塑成型及热压键合展开研究,提高芯片的加工质量,为微流控芯片的批量化生产提供一定的理论指导。论文基于注塑成型理论,以减小COC芯片的翘曲变形量为优化目标进行了数值模拟,优化了注塑成
根固混凝土桩是采用注浆、灌浆对桩底空隙进行充填、桩端周围土体进行加固的混凝土灌注桩、预制桩及扩体桩,其中全长扩体桩通过在预制桩外侧包裹水泥浆、水泥砂浆混合料等固结体,形成由内外两层或两层以上材料组成的桩,结合预制管桩与灌注桩的优点,且其施工工艺克服了管桩和灌注桩在各自施工中的不足。相比现场搅拌水泥土形成的劲性复合桩与水泥土复合管桩而言,根固桩桩身扩体材料质量可控,并且可做为桩基的一部分使用,其适用
锂及其化合物被广泛应用于工业领域中,我国市场对锂的消费量和需求量逐年递增,开发新的锂矿源尤为重要。在我国铝工业生产中,大量含锂的铝土矿被开采并用于制备冶金级氧化铝,在铝电解槽长时间运行后,锂元素因在电解质中难以析出而富集。从富锂铝电解质中提锂,不仅可以补充市场对锂资源的需求,也可以实现富锂铝电解质的资源化利用。在盐湖提锂技术中,尖晶石型锂离子筛H1.6Mn1.6O4是目前具有良好发展前景的离子交换
等规聚丙烯(iPP)具有良好的物理、化学和加工性能,广泛应用于日常生活、包装材料、汽车内饰等各个领域。但韧性差、低温脆性大等缺点严重制约了iPP的进一步发展和应用。幸运的是,iPP的多晶型特性赋予其极大的性能可调控性。添加成核剂是工业生产中改变iPP晶型最为简便的方法,其中稀土成核剂(WBG-Ⅱ)的应用最为广泛。为了实现iPP的高性能化和功能化,除了成核剂,往往会在iPP中添加第二相填料(例如氧化
背景听力损失(Hearing Loss,HL)是最常见的致残性疾病之一,占各类残疾的33%,严重影响人类的正常认知和交流,给患者及其家庭乃至社会造成了巨大的精神和经济负担。前庭导水管扩大(Enlarged Vestibular Aqueduct,EVA)是中国感音神经性耳聋儿童中最为常见的内耳畸形,SLC26A4基因变异在中国耳聋人群中检出率居第二位,仅次于GJB2基因,SLC26A4基因变异造成
螺栓在装配后会出现松动的情况,影响钢结构建筑、机械装备、航空器等设备的运行安全。目前关于螺栓连接状态的监测研究主要是利用压电陶瓷片或者压电探头等传感器进行监测,该方法单点激励、单点接收信号,受噪声以及环境温度的影响,可能对判定螺栓连接状态造成影响,并且对于某些边缘狭窄的零部件,不能布置压电传感器,从而无法检测。为解决上述问题,本文提出利用激光超声监测螺栓松动的方法。利用激光的扫描系统实现了被检测试
随着现代社会的发展,能源危机和环境污染两大问题已经成为提高人类生活水平的“绊脚石”。因此,开发清洁、丰富的能源取代传统化石燃料,同时减少有害气体排放是广大科学研究者目前要攻克的难题。氢能,因其能量密度高、环境友好等特点而受到广泛关注,如何高效地制备氢能成为当前科学研究的前沿。半导体光电催化(PEC)分解水制氢是一种极具前景和吸引力的太阳能捕获和存储技术。PEC分解水过程包含阳极的析氧反应(OER)
随着经济社会的不断发展,我国在电力供应方面的需求量迅速上升,对电网的智能化水平提出了很高要求。变电站作为输变电体系中的重要组成部分,其核心设备的状态判别和故障事件的及时发现、决策与处理是保障电力系统正常稳定运行所需解决的关键问题。变电站设备运行状态复杂,故障类型和原因多样,出现设备故障时,通常波及众多相关装置和设备,但由于监控系统能够捕获的故障信息不完整、故障数据之间相关性弱,仅通过运维人员来发现
近年来,“毒驾”导致的交通事故呈上升趋势,严重威胁人民生命财产安全和交通道路安全。由于临时道路毒检形成的试纸图像受室外环境影响较大,常常因光照不均匀、试剂弱反应状态引起毒检试纸图像存在阴影、伪影等情况,产生图像弱边界问题,导致采用常规图像识别技术无法得到准确结果。因此,本文以临时道路毒驾检测为应用背景,对弱边界毒检图像的识别与分类展开研究。针对实际场景下毒检试纸图像的特点,将图像识别过程按模块划分
在智能手机的生产过程中,表面缺陷检测是不可或缺的一部分。针对当前手机生产过程中,人工缺陷检测成本高、效率低等问题。本文设计并实现了一款基于机器视觉的智能手机表面缺陷检测系统。根据不同的功能需求分为了表面缺陷检测模块、图像标注模块、深度学习模型训练模块。针对这三个模块,本文的主要研究工作包括:1.针对智能手机表面缺陷检测的具体需求,结合传统图像缺陷检测方法和深度学习目标检测算法设计并实现了表面缺陷检