论文部分内容阅读
随着计算机科学和网络技术的发展,人们对网络的需求程度呈逐步上升趋势,然而网络安全问题一直是关注的焦点问题。目前较为成熟的安全防护措施主要包括:防火墙、数字加密等相关技术,但这些技术作为静态的防御保护措施不能满足人们对网络安全性能的要求。入侵检测作为保护网络安全的新兴防护手段,是一种主动的安全防御技术,成为网络安全领域研究的重要部分。为了及时有效的发现各种入侵行为,入侵检测产品正向分布式、智能化的方向发展。由于入侵检测系统中的检测方法的诸多问题,本文提出将聚类分析和分类分析相结合并应用于入侵检测系统。首先介绍了信息安全的相关问题,以及研究入侵检测的必要性。本文总结和概括了入侵检测相关内容,以及入侵检测系统面临的问题和未来的发展方向。其次,本文概述了聚类分析和分类分析的数据挖掘知识,详细介绍聚类分析技术中的K-means算法和聚类分析技术中的决策树算法,其中决策树算法主要讨论了ID3算法和C4.5算法。针对K-means算法的缺陷,本文给出了相关的解决方法,主要解决K值的确定问题、初始聚类中心的选择问题以及对孤立点和噪声点敏感的问题。在决策树算法中,提出的类似模糊处理的方法,在噪声点处理问题上有较好的效果。本文提出的入侵检测模型:通过聚类分析技术和分类分析技术相结合,生成入侵检测规则并应用于入侵检测系统,在对未知的入侵行为的检测方面能够表现出良好的检测率,并能对其进行正确的分类。模型主要是根据聚类分析能够发现数据的相似性和相异性的特点,从而对数据进行正确的分类。分类技术主要是针对网络上的数据特征对数据进行分类。通过两者的结合,提高了入侵检测系统的检测率并且降低了误检率,同时在发现新入侵行为方面表现出很好的效果。本文提出的改进算法和入侵检测模型采用入侵检测标准数据集KDD CUP1999作为测试集验证其工作性能。改进的K-means算法能够自动增长K值,并找出新的聚类中心。决策树算法在使用K-means算法给出的聚类中心时,能够在入侵检测过程中对网络数据行为正确的分类。与单独使用聚类分析技术或者分类分析技术相比,本文提出的基于聚类分析和分类分析混合的入侵检测模型的整体检测效果有显著的优势。