基于随机森林算法的入侵检测技术研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户：zwf1979

【摘要】

：

随着网络空间安全形势日益复杂,网络入侵手段更加多样化,这些入侵行为给网络生态环境带来了巨大危害,如何对网络入侵实现更加精准快速的识别检测是目前研究入侵检测的重点。

【作者】

：

宋江龙

【出处】

：

国防科技大学

【发表日期】

：

2004年期

【关键词】

：

入侵检测随机森林特征选择不平衡数据

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着网络空间安全形势日益复杂,网络入侵手段更加多样化,这些入侵行为给网络生态环境带来了巨大危害,如何对网络入侵实现更加精准快速的识别检测是目前研究入侵检测的重点。得益于人工智能近些年来的快速发展,机器学习技术在网络完全领域也崭露头角。它通过在真实的网络环境下采集的数据集上训练分类模型,实现对异常网络流量样本的智能判别,打破了传统的基于特征知识库的检测手段限制,因此,机器学习算法在入侵检测领域合适应用,对实现高效能轻量级的入侵检测系统大有帮助。但是,基于机器学习的入侵检测技术仍然存在一些问题,比如模型检测时间长,误报率高以及通用性不好等问题。针对目前基于机器学习的入侵检测技术研究不足的现状,本课题从研究机器学习中随机森林算法、网络流量特征选择算法以及不平衡数据分类技术出发,以降低入侵检测模型的时间开销,提高入侵检测准确率和入侵检测模型泛化性能为目标,对网络入侵检测数据的特征选择算法,入侵检测模型进行改进。本文的主要研究内容包:(1)设计简单易实现、低开销的混合式特征选择算法目前较为流行的特征选择算法分为过滤式和包裹式。过滤式特征选择算法利用数据的基本数据特性,采取独立于分类器的方法评估特征之间的相关性,时间开销小,但由于独立于分类模型,选出的特征有可能是冗余特征,甚至不利于数据分类的特征。包裹式特征选择算法因为和具体的分类算法相结合,在保证优异的分类性能的同时,选出最优特征子集,由于这种方法与特定分类器相关,往往计算开销大,导致入侵检测模型的响应时间较长。为了克服单纯使用两种方法带来的准确率低以及时间开销大的缺点,本文提出一种基于卡方检验和随机森林算法的混合式特征选择算法。(2)提出基于混合特征选择和随机森林算法的入侵检测方法针对网络入侵类别多,网络数据维度高以及检测率低等问题。本文结合设计的混合式特征选择算法与随机森林算法的优势,提出基于混合式特征选择与随机森林算法的入侵检测方法,并建立入侵检测模型。该模型利用上混合式特征选择算法挑选出最优特征子集,结合随机森林算法一起训练分类模型,实现入侵检测,在保持高检测率的同时降低入侵检测模型的时间开销。(3)提出面向不平衡网络流量数据的入侵检测方法针对真实网络流量数据中不均衡的入侵类别分布,以及目前的入侵检测方法对少数入侵类别检测率低的局限。本文改进SMOTE数据不平衡处理技术,将SMOTE算法与KNN算法相结合,对少数类入侵样本实施过采样。并基于此方法在已经提出的基于混合式特征选择和随机森林算法的入侵检测模型中引入不平衡数据的处理方法,构建新的检测模型,提高对入侵类别的细粒度检测性能。实验结果表明,和常用的几种特征选择算法相比,本文设计的混合式特征选择算法简单易实现,在两个测试集模型的训练时间分别降低了29.48%和15.76%。这有助于实现更加轻量化的入侵检测系统。本文利用提出的基于混合式特征选择和随机森林算法的入侵检测方法建立模型,相比常用的机器学习算法建立的模型,入侵检测准确率提高了12.38%。最后,本文通过改进SMOTE算法,并将设计的不平衡数据处理方法引入基于混合式特征选择和随机森林算法的入侵检测模型中,能够大幅度提高对特定入侵类别的细粒度识别,提高了模型的泛化能力。这有助于提高入侵检测系统的通用性。

其他文献

让中国大飞机自由翱翔

<正>9月25日,"最美奋斗者"表彰大会在北京召开,授予马凤山等278名个人、西安交通大学"西迁人"爱国奋斗先进群体等22个集体"最美奋斗者"称号。马凤山生前系原上海飞机设计研究

期刊

大型客机总设计师

小陇山林区不同密度油松人工林林下物种多样性研究

【目的】研究油松人工林密度对林下植物多样性的影响及二者的关系,提出维持植物多样性、人工林生态系统稳定性及其健康状况的合理林分密度。【方法】以小陇山林区5种不同密度

期刊

油松人工林林分密度物种多样性

早期断奶并补饲代乳粉对羔羊生长性能、消化性能、血清生化指标及肉品质的持续影响

本试验旨在研究早期断奶并补饲代乳粉对羔羊生长性能、消化性能、血清生化指标及肉品质的持续影响。选取60只体重[(8.26±2.14)kg]、日龄[(20±1)日龄]相近的健康湖

期刊

早期断奶补饲代乳粉羔羊生长性能消化性能血清生化指标肉品质

海洋氮循环中稳定氮同位素变化与地质记录研究进展

海洋氮稳定同位素信号包含了关键的生物地球化学信息,是辨识海洋氮来源、了解海洋氮循环过程的重要途径和手段,该信号通过海洋沉降传递可保存在海洋沉积物中,用以追溯地质历

期刊

稳定氮同位素硝酸盐颗粒氮海洋沉积物古海洋记录

铁路工程建设中房建工程在限定工期下的进度控制原则

针对铁路工程中房建工程的施工特点，对比分析几种典型房建工程的延期案例，总结铁路工程建设中房建_Y-程在限定工期下的一般进度控制原则，为今后铁路工程中房建工程的监理与施工

期刊

铁路工程房建工程限定工期进度控制监理

水下气液同轴喷管的射流特征研究

水下气液同轴高速射流既包含液相淹没射流与气相非淹没射流的典型流动特征,又由于同轴的两股射流之间的相互作用,会带来新的射流结构与流动现象。为了探究布局方式对水下气液

会议

两相射流同轴射流水下射流边界

浅谈作为国际经济法重要分支的国际金融法

(一)国际金融法是调整国际金融活动关系和国际金融组织机构的法律规范的总称,即关于调整国际金融活动中的货币生产、运送、销毁、管理、存贷、买卖、借贷、信托、保险等方面

期刊

国际金融法国际经济法金融法律关系

诗意眷想·直面人生·荒诞感受——评叶尔克西小说创作的浪漫、写实、现代之旅

哈萨克族女作家叶尔克西在小说创作领域不懈探索,走过了从传统到写实又达现代的创作道路。在这个现代之旅中,叶尔克西从对本民族传统文化的诗意眷想,进入到对民族在现代社会

期刊

叶尔克西小说诗意写实现代

关于仪表自动化工程质量控制的讨论

工业生产涉及到很多安装工程项目,而在所有的项目当中,仪表自动化工程的施工情况对于整个工业生产所起的作用是非常重要的,仪表自动化工程建设的质量很大程度也由这一工程的

期刊

仪表自动化控制工程质量

现代诗阅读“四环节”

现代诗歌，是一种主情的文学体裁，它高度凝练集中地反映社会生活，用丰富的想像、富有韵律美的语言、分行排列的形式，来抒发思想情感。在现行初中语文教材中，现代诗歌有了明显的量增

期刊

基于随机森林算法的入侵检测技术研究

与本文相关的学术论文