基于不均衡数据集和决策树的入侵检测分类算法的研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:oooweizhano
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的快速发展,网络安全曰益成为信息社会人们所面临的一个挑战性难题,入侵检测系统的研究和实现随之成为计算机研究和应用领域的重要课题。数据挖掘技术可以对海量数据进行自动高效的分析处理,并能从中挖掘出潜在的规律、规则、模式等知识,已被引入到入侵检测研究领域中。分类技术作为一种有效的数据挖掘方法,在基于数据挖掘的入侵检测中得到广泛应用。由于入侵检测数据集存在类分布不均衡的问题,传统分类方法应用到入侵检测中存在不足,需要引入新的策略来解决类分布不均衡的数据集分类问题。C4.5算法分类原理简单易懂,很容易被理解和接受,具有简单有效的特点。特别在不均衡数据集分类问题上,经典的C4.5算法似乎已成为比较的基准。本文分析了入侵检测训练集的特点和当前不均衡数据集的分类方法,提出了基于欠抽样处理器和C4.5算法的二级分类器CCBCE。欠抽样处理器采用聚类算法GCA和K近邻算法对训练集中大类进行欠抽样,旨在更加准确地去除大类中的边界、噪声和冗余样本,降低训练集的不均衡程度,同时采用Adaboost算法,以C4.5作为基分类器,构造集成分类器C4.5BCE进行二次分类,避免了大类在欠抽样时丢失有用分类信息,从而提高了整体的分类性能。将本文提出的二级分类器CCBCE在UCI学习库中的入侵检测数据集KDDCUP99 DATA的实验结果与经典的C4.5算法以及基于欠抽样处理器的C4.5算法的实验结果进行了分析比较。另外,针对集成分类器C4.5BCE,采用不同的集成规模进行了实验,并对实验结果进行了分析。发现随着集成规模的增加,分类检测性能不断得到增强,当集成分类器中个体分类器数目达到一定数量后,集成分类器的性能趋于稳定。
其他文献
自从1995年清华大学研制的第一台轻型电动车问世以来,近年来,电动自行车已成为我国家庭常用的代步工具。在国家提倡低碳环保发展经济的背景下,电动自行车在节能环保、社会和
目的:通过对相关的文献进行研究,同时结合问卷调查和访谈的分析结果,确定适用于A公司的员工援助计划(Employee Assistance Program,以下简称EAP)服务模式、服务内容以及找出
林业保护是生态保护的关键,只有将林业保护做好,才能保证林业经济的平稳运行,林业经济的平稳运行可以让林业经济可持续发展。现在的林业经济已经得到了迅速的发展,但是由于我
Fe_3O_4是一种传统的磁性材料,由于其高的磁响应、生物相容性和低毒廉价等特性,在化工、环境、电子以及生物医学等领域得到了广泛应用。然而Fe_3O_4纳米粒子易团聚、稳定性差,使其在一些领域的应用受到了限制。近年来,对Fe_3O_4的保护受到了研究工作者的广泛关注,多数对Fe_3O_4的保护措施是将无机物或有机物包裹到Fe_3O_4表面形成核壳微球。聚酰亚胺(PI)具有优异的耐热性能和机械性能,
目的评价探究中医康复方案对早期脑卒中偏瘫患者运动功能和神经功能的影响分析。方法样本抽选来黑龙江省康复医院接受康复治疗的早期脑卒中偏瘫患者80例进行研究,按照抽签法
我国进入老龄化社会的趋势已不可逆转,由此养老问题也逐渐受到社会各界的广泛关注。党的十九大报告提出,加强社会保障体系建设,按照兜底线、织密网、建机制的要求,全面建成覆盖全民、城乡统筹、权责清晰、保障适度、可持续的多层次社会保障体系[1]。这为我国社会养老保障制度建设提出了新要求和新目标。目前,我国主要的养老模式依旧是家庭养老,老年人的晚年生活主要依托于子代所提供的经济支持、生活照料和精神慰藉。但随着
氨基酸通透酶(AAP)在植物吸收和转运氨基酸的过程中发挥至关重要的作用。拟南芥AtAAP1是植物中发现的第一个氨基酸转运蛋白,在水稻、玉米、马铃薯、豌豆、蚕豆、菜豆等农作物中也有较多报道。目前,关于大豆GmAAP的研究却较为少见,AAP能提高豆科植物对外源氮的吸收与利用率,增加种子内贮藏蛋白含量,进而提升大豆品质。本研究从大豆中成功克隆出GmAAP基因,对其进行生物信息学分析和亚细胞定位,明确该基
本研究目的是总结和提炼南国农先生的学术思想和理论,研究选取南先生公开发表的期刊论文为研究样本,借鉴扎根理论编码策略,采用NVivo软件进行文本分析,提炼出教育技术(电化教
背景与目的 胃癌是我国常见的恶性肿瘤之一。近年来的统计资料表明,胃癌的发病率有下降趋势,但其死亡率依然居我国恶性肿瘤的第一位,对人类健康危害极大。因此,探讨胃癌的发病
目的:本文旨在通过研究冠心病患者不同糖代谢水平对冠状动脉病变程度的影响,并通过心率变异性指标变化对冠心病合并糖代谢异常的患者冠脉病变程度进行相关性分析。方法:收集2017年11月至2018年10月青海大学附属医院行冠脉造影检查患者,符合纳入和排除标准并确诊为冠心病患者111例,根据OGTT将冠心病患者分成单纯冠心病组(CHD,n=33例),血糖调节受损组(CHD+IGR,n=41例),糖尿病组(C