基于机器学习的入侵检测算法设计与实现

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:hcjw248
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
入侵检测系统是一种对网络传输进行即时监视,在发现可疑传输时发出警报或者采取主动反应措施的网络安全设备。入侵检测系统对网络、系统的运行状况进行监视,尽可能发现各种攻击企图、攻击行为或者攻击结果,以保证网络系统资源的机密性、完整性和可用性。如何通过对这些警报有效并且高效的分析,最终达到对攻击行为的处理和防御,是关键的问题。本文对基于机器学习的网络入侵检测算法进行研究。首先,对常用的机器学习算法、入侵检测KDDCup99数据进行分析,构建基于机器学习的入侵检测算法框架,主要包括数据预处理与特征选择、入侵检测算法以及误报消除三个部分。其次,采用卡方检验、互信息以及随机森林对特征进行选择,并提出基于AutoEncoder的特征处理方法。第三,设计了三层Stacking集成学习模型,第一层由随机森林模型组成,第二层由GBDT以及BP神经网络组成,第三层由支持向量机组成,并采用遗传算法对模型参数进行优化。第四,本文对不同模型以及特征数据集进行实证分析,研究本文提出模型的有效性。最后,本文基于Kmeans以及FCM聚类算法实现误报消除。本文的研究结论如下:(1)本文提出的三层Stacking模型的准确率为95.36%,误报率为8.07%,漏报率为0.56%,模型的AUC值为0.784。可以看到,三层Stacking模型具有最高的准确率、最低的误报率以及漏报率,同时模型AUC值最高,说明三层Stacking模型具有最好的入侵检测性能。同时,该模型对比任一单一模型在性能上都有了提升;(2)采用AutoEncoder进行特征处理后,模型的性能有所提升,对比卡方、互信息以及随机森林方法的特征处理,准确率更高、误报率以及漏报率更低,同时模型的AUC值更高;(3)误报消除方面,Kmeans算法的消除率为77.95%,误消除率为5.62%,漏消除率为3.45%。FCM算法的消除率为79.15%,误消除率为5.492%,漏消除率为3.36%。
其他文献
社交媒体是互联网上基于用户关系的内容生产与交换平台。近几年社交媒体的迅速扩张使人们可以实时便利地了解世界上正在发生的事情的信息。基于社交媒体的事件检测是一种从海量社交媒体内容中挖掘出有价值信息的技术。基于社交媒体中检测出的事件,国家管理机构能够及时了解现实社会的重大突发事件并采取相应措施,个人能够及时了解社会上出现的热门话题并参与讨论。社交媒体事件检测方法中,在线事件检测由于其时效性较高,最受研究
复杂网络作为一个新兴的研究领域其研究方向在很大程度上依赖于大规模互相关联的结构化数据集。科学学(Science of Science,SciSci)是复杂网络研究在学术界的一个延申领域,其本身就是一个由学者、项目、文献和思想等学术主体自组织而形成的一个复杂网络体系。通过对该网络体系进行采样研究,以复杂网络作为理论基础,以大规模的学术主体作为关联对象,由网络的拓扑结构特性表征出科研领域本身的发展机理
新闻媒体是人们在互联网上获取信息的重要客体之一,分析新闻媒体网络中人物的影响力有助于社会科学研究者或经济政治研究者了解国际或社会型事件动态,对新闻中的信息进行传播动力分析。为了高效处理新闻中的复杂信息,常把问题转化为复杂网络相关问题进行解决。在现有的针对复杂网络节点影响力的研究中,仅利用了节点局部信息或全局信息,忽略了节点影响力贡献以及局部与全局信息的联系,从而导致影响力评估效果不佳。并且现有方法
随着互联网、大数据等技术的快速发展,数字化办公已经成为了现代企业最基本的资源配置。日常办公过程会产生大量电子文件信息,呈现出指数级增长趋势,所以需要开发档案管理系统来集中管理分散于不同地方的电子档案。中国移动公司作为通信行业的支柱企业,每个地市分公司能根据自身需要,构建统一的、标准的电子档案数据中心,可以集中、规范地管理所有的档案信息,确保数据的安全存储、高效查找与借阅,能够提高企业管理效率。本文
新媒体时代的到来,越来越多的媒体出现在公众的视角下,每天的新闻报道量也与日俱增。如何帮助读者快速了解新闻热点事件,是一个具有研究价值的课题。现在主流媒体基本采用文字、视频等非结构化的数据形式记叙新闻事件,同时新闻平台的研究热点主要是基于用户兴趣和当前热点的智能推荐。不论是搜索结果还是推荐界面,信息碎片化与非直观化问题突出,对于新闻核心信息的提炼与结构化处理不足,因此无法高效的将热点新闻的核心信息传
作为21世纪重要的信息采集技术之一,无线传感器网络(Wireless Sensor Network,WSN)技术为人类获取物理世界中各种目标信息提供了基础支撑。传统WSN受制于电池供电节点的续航能力,难以长期有效运行,限制了WSN的广泛应用。近年来,国内外研究学者相继提出了能量收集型无线传感器网络(Energy Harvesting Wirlesss Sensor Network,EHWSN)技术
新闻一直是人们获取信息的重要途径,特别是随着移动智能终端的普及,微博、微信公众号等诸多新兴媒体逐渐代替了传统的纸质媒体。这些新媒体为了引人注目,往往将标题起的非常夸张,但新闻内容可能和标题毫不相干。当下快节奏的生活方式决定了阅读往往是碎片化的,人们急需一种方法能在短时间内快速了解新闻的重点内容。自动文本摘要技术可以对新闻进行压缩和总结,提取重点内容,过滤冗余信息,提高人们阅读效率。本文主要结合强化
随着互联网和移动设备的蓬勃发展,理解和研究社交网络中的信息传播过程,在近些年得到了学界和业界的广泛关注。规模预测或流行度预测的目标是对信息进行初期观测,然后预测其在网络中传播的范围和规模。如何在复杂、快速变化、受各种内外部因素影响的社交网络中准确地预测信息级联的规模,成为该问题的主要挑战之一。大多数已有的信息级联规模预测模型依赖于人工设计的特征工程和随机过程,或者通过神经网络来对其进行端到端的学习
电荷耦合器件(Charge coupled device,CCD)图像传感器作为主流的成像器件的一种,主要就是把光电信号变成电流电压信号,然后经过放大器放大,把目标物体显示出来的一种微型高端芯片。CCD的应用十分广泛,民用上比如家用卡片照相机、手机摄像头、行车记录仪、物业安防等;在军事上比如远程定位系统、红外遥感系统、隐形目标探测等;CCD在现代武器装备上应用也特别的多,尤其在卫星、航天器、微光夜
网络科学作为一门新兴的交叉学科,涉及到数学,物理学,计算机科学,社会学等不同学科领域。来自各个领域的数据呈现出指数式增长,这为基于数据的分析建模带来了极大的挑战。伴随数据量的增加,数据之间的关联复杂性也随之增加,复杂网络为有效刻画数据复杂关系提供新的方法,并为各个领域数据的分析挖掘提供了新的视角和工具。其中在科学学领域,已经出现了很多优秀的成果。比如预测论文未来的引用次数一直是研究的热点方向,很多