论文部分内容阅读
随着信息和网络技术广泛而深入地渗透到商业、金融、科研、教育、军事以及人们日常生活的各个领域,网络和信息安全对人们生活和国家安全的影响越来越重要。防火墙技术是较早发展起来的网络安全防范技术,其不足在于防范的被动性。而入侵检测系统针对防火墙的这一不足应运而生,成为防火墙的合理补充,在网络安全防范中担当重要角色。数据挖掘作为新兴的知识发现技术,在解决目前网络入侵安全技术中存在的问题方面,发挥了强有力的作用。
本文在研究数据挖掘技术和入侵检测技术的基础上,重点研究聚类算法和关联分析算法在入侵检测中的应用,以及分析了最小二乘支持向量机和神经网络在入侵检测中的优势与作用。主要内容如下:
1、介绍了有关入侵检测的基本内容:如入侵检测概念、分类、基本模型等等,同时,介绍了数据挖掘技术的定义及分析方法,并且对于如何将数据挖掘技术应用于入侵检测中等问题进行了相关分析及解释。
2、详细分析了入侵检测经典数据集KDDCUP99,并详细介绍了两种特征提取算法(PCA、KPCA),并给出了相关的仿真实验,也充分体现了KPCA优秀的降维能力。
3、从关联分析和聚类分析两个方面,分别讨论入侵检测中数据挖掘技术的应用,同时详细分析了基于关联规则的Apriori算法和基于聚类的模糊C均值算法,指出两种算法各自的优缺点。在此分析基础上,提出一个基于关联规则和聚类分析的混合模型,利用关联规则算法来修正聚类算法结果,利用KDDCUP99数据源进行实验仿真,结果证明此混合模型的性能良好。
4、详细介绍最小二乘支持向量机与BP神经网络各自在入侵检测中的应用,并利用最小二乘支持向量机与神经网络分别构造分类器,利用KPCA算法处理后的数据作为输入进行仿真实验,结果证明两种分类器在入侵检测中的性能良好。同时比较了三种算法在入侵检测中的优缺点。