Web服务器样本不平衡的入侵检测反向选择算法

来源 :武汉大学 | 被引量 : 0次 | 上传用户:jun13632594162
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网发展迅速,网站增多,Web服务器的安全性愈发重要,因而对Web服务器进行入侵检测迫在眉睫。本文将构建基于误用的入侵检测算法,检测入侵行为并定位类型,做出合适的防御行为,减少入侵造成的损失。基于误用的入侵检测算法的重要功能是解决多类不平衡问题。多类不平衡样本要求分类算法能够同时处理数据量大的样本和数据量小的样本,且受不平衡比影响较小。现有该领域的分类算法均有各自的优缺点:部分机器学习算法如神经网络需要大量训练数据,处理负类样本效果差,有些算法如决策树则受类间不平衡影响较大。反向选择算法借鉴生物体胸腺T细胞阴性选择过程,通过学习自我样本的特点来区分非我样本。因其单类学习的特点,受不平衡比的影响较小,处理数据量小时有极佳的准确率,处理数据量大的样本也不会出现性能问题。但多类不平衡问题也会为反向选择算法带来检测器数量分配问题,同时要求反向选择算法能够更好地拟合边界样本,从而实现更高的检测效率。受不平衡样本处理方式的启发,本文尝试将反向选择算法用于构建Web服务器入侵检测中的误用检测算法,并进一步构建针对不平衡样本的反向选择算法以提高检测效率。首先总结入侵检测领域的特点与研究现状,分析现有方法存在的缺点。并介绍人工免疫系统及其中的反向选择算法,指出反向选择算法用于此问题的优势,并分析需要改进的地方。接着将反向选择算法用于处理不平衡问题,并提出优化方法。提出借鉴不平衡样本中代价敏感的思想,使用MetaCost方法,为反向选择算法中不同类别指定误分代价,结合先验概率,调整检测器在类间不同的分配,使检测器的数量分配更加合理,从而提高检测效率。再结合已有的克隆选择思想优化检测器分布,提高检测器对样本空间的覆盖,降低检测器重合。再提出结合Borderline-SMOTE中边界界定的方式,找出边界“危险”样本点生成检测器拟合边界,提高检测器对样本的覆盖从而提高检测准确率。最后使用KDD99网络入侵检测数据集作为实验数据集,通过设计对比实验,使用多类不平衡样本的评价指标F-Measure、G-Mean和ROC曲线及AUC值对算法进行评价,证明反向选择算法比其他经典算法更适合用于解决服务器入侵检测中的多类不平衡,而提出的代价敏感的改进方式与边界界定的方式均能够有效提高反向选择算法用于多类不平衡样本的分类效率,而综合代价敏感、边界界定和克隆选择优化的算法则拥有最高的分类效率。
其他文献
随着各种人工智能、便携式设备、虚拟现实、增强现实等新型视觉系统的不断涌现,光学系统朝着微型化、功能化、集成化方向发展。而传统光学元件通过光在传播方向的逐渐积累对
我国西北地区分布着数条铁路干线。近年来,兰局管内数条铁路线在运营过程中,部分路基出现不同程度的下沉,为研究下沉原因及采取合理的整治工程,对部分路基沉降整治工点进行了
矿尘是矿井生产过程中最主要的职业危害与自然灾害之一。泡沫具有湿润性好、覆盖面积大、耗水量低等优势。近年来,虽然在部分矿井降尘实践中取得了较好的效果。然而,由于矿井
光学单边带调制可以避免长距离微波光子链路中光纤色散效应对微波毫米波信号功率的影响,可以用于光载无线技术、光控相控阵等系统中。本文研究了四种光学单边带调制链路的性
信息时代的今天,数据的获取越来越容易,在数据挖掘领域,需要面对的数据量也更加庞大.在二分类任务中,我们常常遇到维度高达几百上千的数据,要利用这些数据构建有效的分类学习
智能手机已经成为人们生活的主要部分,Android占据全球大部分市场份额,超过36%。但是,Android系统面临隐私泄露的严重问题,现有的权限机制很难保护用户的隐私数据不被恶意代码窃取。论文提出了一种面向Android应用程序的基于静态污点分析的上下文敏感隐私泄露方法,基于跨方法控制流图(ICFG)定位并跟踪污点源(Source)和敏感调用点(Sink),针对直接泄漏、传递变量和方法调用三种情况
近年来,全球经济的持续低迷与世界贸易的缓慢增长直接影响着国际集装箱班轮运输市场,使得班轮公司之间的竞争日益激烈。在班轮实际运营过程中,由于干扰因素所造成的船舶延误,
重金属镉(Cd)污染土壤的修复目前主要聚焦于超富集植物的筛选、提高Cd富集效率及解毒机理等方面的研究,有关植物-土壤生态系统中养分交换及植物体内养分分配规律与植物富集Cd能
随着移动互联网时代的到来,互联网中的信息成指数增长,与此同时人们获取信息的方式也更加的便捷。但随之产生的问题是在大量的信息中,我们在获取的时候通常会感到疑惑,我们找到自身所需要信息的时间越来越长。推荐系统的出现帮助用户去发现适合自己的资源,使得用户可以更加关注资源本身的内容而不是将时间花在寻找资源上。随着在线课程的爆发,各类课程从三尺讲台搬到了屏幕上,学习者有更多的选择去学习自己想学的内容,但由于
无人机因成本低、损耗低、可重复使用和机动性高的特点,广泛应用于现代生活和军事的多种领域。为了设计Z字形无人机的飞行控制律,研究半实物仿真在无人机上的应用,形成一套从