基于聚类的网络入侵检测方法研究

来源 :广西大学 | 被引量 : 0次 | 上传用户:zj280078064
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet技术的迅猛发展,网络安全问题也显得日益突出。入侵检测技术作为一种主动的安全保障措施,有效地弥补了传统网络安全防护技术的缺陷,已经成为网络信息安全的一个重要研究领域。由于数据挖掘技术能够从海量数据集中挖掘出人们感兴趣的特定模式,所以人们十分重视将数据挖掘技术应用到入侵检测的研究与开发中。基于聚类的无监督异常检测方法可以在无标记数据集上发现异常数据,克服了传统数据挖掘方法的缺陷,使标记数据集和入侵检测建模过程自动化,逐渐发展成为一类重要的入侵检测技术。本文将信息熵理论应用于入侵检测的聚类问题,给出在混合属性条件下数据之间距离、数据与簇之间距离、簇与簇之间距离的定义;采用划分聚类算法将数据集的数据划分到类中,以整体相似度的聚类质量评价标准作为聚类合并的策略,通过凝聚层次聚类的方法将聚类进行合并;合并后清除噪音簇以提高检测效率,并根据划分出的大小簇的边界来标识正常簇和异常簇,最后给出算法参数选取的方法,进而提出一种基于划分和凝聚层次聚类的无监督异常检测算法。算法分析和实验结果表明,该算法具有较好的检测性能并能有效检测出未知入侵行为。本文引入克隆选择算法对划分聚类进行优化,提出了一种应用于入侵检测的基于克隆选择的聚类方法。该方法通过比较数据到簇心距离和簇半径的大小来划分数据,得到初始聚类,并给出簇半径阈值的计算方法;针对入侵检测所处理的数据具有混合属性的特点,改进数据差异度度量,定义适合混合数据聚类的目标函数,实现具有混合属性的入侵检测数据的聚类分析;通过引入克隆选择算法优化聚类,得到更好的聚类结果,解决了聚类算法在入侵检测应用中所遇到的混合属性差异度计算和最终聚类数目未知以及易陷入局部极值的问题;并在基于克隆选择的聚类基础上进行增量式聚类,提出了一个可增量更新的聚类模型。算法分析与实验结果表明所提出的方法具有较好的检测性能,可以获得较高的检测率和较低的误报率。
其他文献
数据仓库是计算机信息化不断发展的产物,它将大量用于事务处理的数据库数据进行清理、抽取和转换,并按决策主题的需要重新进行组织,以达到快速有效支持决策的目标。物化视图
计算机网络的可靠性一直以来都是人们比较关心的问题,而提高网络可靠性的一个主要方法就是及时诊断出网络故障的具体原因。网络故障诊断专家系统在实际中应用较为广泛,但是存在
随着计算机技术和网络技术的飞速发展,特别是我国信息化建设的日益普及,电子政务应用日益广泛。电子政务是一个将政府工作信息化、网络化、公开化、标准化的系统工程,涉及到国家
随着Internet的普及和发展,图像数据飞速膨胀,使得如何有效地检索所需要的图像数据已成为当前图像应用领域的一个研究热点,为了便于图像的检索和识别,基于内容的图像检索技术应运
目前多核处理器已成为服务器和桌面的主流,不久将广泛地运用在高端嵌入式领域。以往嵌入式系统的实时性研究主要集中于任务调度和切换、实时任务的通信和容错性等,未涉及到实时
随着互联网的不断发展,数据量日益增大,问答系统在我们的生活中发挥了越来越重要的作用。当前问答系统知识库主要是人工构建为主,耗费大量的人力物力,影响问答系统从单一领域
随着数据挖掘技术的发展,人们对时态信息的关注日益提高。时态数据库中既反映能被处理事件的历史性信息又能体现系统中元事件的时态信息的双时态数据库日益受到人们的关注。随
随着各种信息科学技术在消防领域的广泛应用,目前消防领域内部产生了大量的异构信息。本体技术能够更好的利用这些异构信息,实现消防领域知识的全面集成,以获取更好的知识服
随着计算机科学技术和电子信息的巨大发展,各个企业也都建立起了各自的信息系统。而数据库作为信息系统的核心和基础,也被越来越广泛的应用。数据库的性能一直受到业界的普遍关
网络已经改变了人们的世界,并且正在产生更大的改变,现在人们越来越喜欢去网络获取帮助,完成自己的任务。Web服务的出现提供了一种企业之间互相自动的进行通讯的能力,使得网