一种改进随机森林算法及在入侵检测中的应用

来源 :武汉邮电科学研究院 | 被引量 : 0次 | 上传用户:hellokitty420
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
入侵检测(ID)是保障网络安全的有效手段之一,为了提高入侵检测系统的检测率,降低误报率,越来越多机器学习算法被应用到了其中。随机森林算法因其原理简单,分类准确且泛化性强等特点被广泛应用在各种网络关键设备的入侵检测模块中。然而,网络报文数据具有很高的不平衡性,且数据的特征维度很高,使得随机森林算法在使用时的分类性能大幅度降低。另外,由于随机森林算法需要建立大量的决策树,导致建模时间过长。针对以上问题,本文研究提出了一种改进的随机森林算法,并基于此搭建了一个入侵检测系统来验证改进算法的防护效果。文章主要研究内容如下:(1)针对网络报文数据不平衡和特征维度高的特点,提出了一种基于混合采样和特征预排序的随机森林算法MS-FPR-RF(Mixed Sampling and Feature Pre-ranking Random Forest)。改进算法将数据划分为多数类样本和少数类样本,对少数类样本进行边界判定,若为边界少数类则多次采样。另外,使用特征预排序方法将特征按分类能力进行定性的排序,删除分类能力较弱的特征以训练出较高精度的决策树。在构建众多高精度决策树后使用双次失败度量DF作为树之间的距离,使用k-means++算法选择出多样性较强的决策树,组成最终的随机森林模型。实验表明,改进的随机森林算法在多个数据集上都较传统算法有更高的检测率。特别是在数据类别不平衡的CSE-CIC-IDS2018数据集上,改进算法的正确率达到了81.3%,而准确率则达到了93.4%。(2)针对网络报文数据量过大,随机森林建模时间长的问题,本文使用Spark分布式框架对算法进行了并行化处理。在18万条数据上进行对比实验,5节点并行化处理后的运行时间由原来的200秒降低至42秒。(3)在改进随机森林算法和Spark分布式框架的基础上,本文设计搭建了一个入侵检测系统验证改进算法的防护效果。实验数据来自采集到的家庭网关日志文件以及扫描软件发出的扫描报文。此系统主要分为算法建模和入侵检测两个部分。实验结果表明改进算法将检测的准确率由82.2%提升至86.5%,68341条数据的检测时间由183秒降低至42秒。
其他文献
学位
图的能量来源于理论化学,是图谱理论的重要分支,应用价值广泛.最近几十年,许多学者借助矩阵的方法对图的能量进行了广泛的研究.本文主要研究的是当删除一条边之后,完全多部图
在泰国对外汉语语音教学过程中,声母教学是十分重要的环节,同时也是泰国学习者学习汉语的难点之一。笔者在泰国廊磨喃蒲府Anubanpubadin学校任教期间,发现泰国学生的声母发音有许多偏误现象,为了探究泰国学生汉语声母发音的具体表现,研究选取了十名汉语水平为初级的泰国学生作为发音对象,在实验语音学和对比分析理论的基础上对泰国学生的声母语音材料进行了收集、处理,将泰语和汉语的辅音系统进行系统比较,意在
学位
幼儿阶段是身体发育和各项机能快速发展的时期,协调的动作、强健的体魄、积极乐观的情绪是幼儿身心健康的重要标志。力量与耐力素质是个体身体素质的重要指标,是体能训练的基础,合理的力量与耐力训练有利于增强幼儿的体质,提高幼儿身体健康水平。本研究依据《3-6岁儿童学习与发展指南》中健康领域对大班幼儿力量与耐力所列五个项目的目标要求(单手投掷、单脚跳、双手悬吊、快跑25米、1.5公里连续行走)编制《大班幼儿力
学位
本文对高中学生思想政治教育方法的多样化进行有效的探讨,并以洛阳市高中学生为例做小范围探索研究。思想政治教育方法作为教育实施的媒介,是沟通教育者与受教育者之间的桥梁,是为达到高效教育目的的手段。通过实践探究发现应用单一的思想政治教育方法应用很难对高中学生思想素质进行有效地提高。因此,高中学生思想政治教育方法的多样化应用研究具有重大意义。伴随着教育体制的不断改革与发展,以及国家对思想政治教育的愈发重视
学位
学位
中学思政新课程标准明确规定,思政课要具备育人功能,要注重学生综合能力的提升和学科核心素养的培养,要符合新时代的教育理念。调查表明,传统初中思政课教学往往忽视了学生的主体地位,教学方式刻板,教学内容枯燥。导致学生学习兴趣较低,课堂效率不甚理想,难以形成良好的师生交流互动,影响学生的综合素质养成。初中生正处于思维形成的关键期,引导学生掌握学习方法和形成正确的价值观是初中思政课的重要内容。所以,如何将学
学位
在日益增长的能源和工业产品需求下,以生物基产品替代传统的化学品的生物经济备受关注。随着基因组学、合成生物学的发展,利用重组微生物生产生物塑料、生物燃料等生物基产品
二项式定理是高中数学学习的一个重要定理,是高中学习概率统计的预备知识和课程教学的基本内容。二项式定理对学生的逻辑推理能力和数学运算能力的提高具有很大的帮助,本文主要针对人教版教科书中的二项式定理内容,结合相关文献以及国内外早期教科书的阅读研究,通过在创新性思维研究的视野下,进行二项式定理教学,旨在研究出一系列更加适合学生逻辑思维发展的课堂。第一部分主要叙述二项式定理国内外研究现状及研究背景、意义。
学位