半径可调的覆盖聚类算法在入侵检测中的研究

来源 :太原理工大学 | 被引量 : 2次 | 上传用户:lxh272787054
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机网络技术的迅猛发展和广泛应用,特别是Internet的快速普及,促进了计算机与互联网技术的不断创新与升级。社会信息化程度的提高使人们的日常生活与网络的关系越来越密切,同时大量的网络系统面临攻击和入侵。入侵检测是继防火墙、数据加密等传统安全保护措施后的更为有效的安全保障技术,它广泛应用于识别和响应恶意使用计算机和网络资源的行为。当前多数入侵检测方法是使用大量的标记数据来训练入侵检测模型的,然而很多情况下并没有已准备好的可供使用的标记数据。如果对收集到的数据进行手工标记,由于数据量十分庞大,将会耗费大量的时间和精力。而基于聚类的入侵检测方法以一组没有标记的数据作为输入,进而发现其中存在的攻击数据,这与传统的检测方法相比,免去了手工标记数据的繁琐性,因此具有一定的应用优势。本文分析了传统聚类方法在入侵检测领域中的优势和不足,以提高对异常攻击的检测有效性为目标,分别从检测率和误报率两个重要指标出发,提出了半径可调的覆盖聚类算法(Radius Adjustable Covering Clustering Algorithm,RACCA),将其应用于入侵检测,并通过大量的仿真实验验证了该检测算法的有效性。本文的主要工作集中体现在四个方面:1.在深入分析入侵检测技术和聚类技术的基础上,探讨了运用聚类算法解决入侵检测问题的方法。由于聚类的方法可以在未标记数据集上找出异常,因此可以采用聚类方法对数据集进行标记,以便于关联规则、序列规则、分类等数据挖掘方法在这些已标记好的训练数据集上进行模式挖掘,进一步更新规则库;也可以直接利用聚类算法在训练数据集上生成检测模型,并进行实时入侵检测。2.在入侵检测中使用了不需要进行初值选择且聚类速度快的覆盖聚类算法(Covering Clustering Algorithm,CCA),同时针对CCA存在误报率高的问题,设计了用于入侵检测的高效聚类方法RACCA。为了降低误报率RACCA对CCA的两个方面做了改进:一是增加两个改变覆盖半径的参数,使覆盖半径变得可调;二是在确定下一步覆盖的中心时,选择离当前所有剩余未聚类样本点重心最近的样本点为下一步覆盖的圆心。3.用KDD Cup 99数据集对RACCA的效率进行了评估,实验结果显示本算法在入侵检测误报率上和CCA相比有很大程度的降低。4.通过实验反复精简特征属性集,构造出一个在检测率和误报率方面部有一定改善的重要属性集,并对利用重要属性集实现的聚类进行实验及结果分析,证实采用RACCA检测入侵能有效提高检测率,同时降低误报率。
其他文献
当数据在工作流中流动时,执行操作的用户在改变,用户的权限也在改变,这与数据处理的上下文环境相关。采用传统的访问控制技术,如DAC,MAC,则难以做到这一点,若采用RBAC,也需要频繁地更
本文基于面向对象的思想给出了图形系统的各种模型,主要讨论了图形类库,通用图形编辑系统,以及动画制作技术,针对动漫设计中各种基本图元的数据描述的数据结构进行了定义,也对各种
随着多媒体网络应用数据流在Internet中的增加,使Internet的“尽其所能”的服务难以满足新数据流的服务质量的需求,加上单根光纤的通信速率有多个数量级的提高,网络节点(路由器/
作为互联网的一大应用,电子邮件一直受到人们的青睐,并已成为人们日常生活中通信、交流的重要手段之一。但是近些年来垃圾邮件问题日益严重,中国网民平均每周收到的垃圾邮件数量
随着互联网的普及和规模的急剧扩张,作为网络80%以上信息的主要表达方式,各种各样的电子文本得以迅速膨胀,往往造成大量无用信息淹没了有用信息,出现了信息极大丰富知识却相对贫乏
最近,随着生物免疫学的丰富和完善,一个全新的免疫理论——危险模式理论(Danger Theory),对传统SNS模式的现代免疫学基本理论提出质疑,打破自体耐受,从空间概念上改变了传统模式的
随着计算机技术和网络技术的发展,分布式实时系统在信息家电、医疗仪器、智能汽车、工业控制以及通信设备等各个领域已经比较成熟了。一直以来,实时任务对时间的特殊要求使得实
目前,企业资源计划(ERP)已经越来越广泛的应用在制造业车间。如何提高 ERP 在生产管理中的实用性,真正把车间调度纳入其中,帮助企业科学的规划生产,已是摆在新一代制造业ERP开发
中国的书法艺术历史悠久,博大精深。书法字应用也极为广泛,牌匾就是其中重要的应用之一。本文主要研究利用计算机技术自动生成书法牌匾,用户只需提供牌匾的内容,系统从书法家字库
随着电信业的迅速发展,其用户基数迅速增长,同时用户欠费的现象也日益增长,如何在改善客户感知的同时提高客户欠费催缴效率,成为电信运营商急需解决的难题。为此,可以应用数据挖掘