论文部分内容阅读
随着网络的发展,网络安全问题日益突出。为了迅速、有效地发现各类入侵行为,保证系统和网络资源安全,入侵检测系统成为当前研究的热点。入侵检测实质上是模式识别问题。支持向量机(Support Vector Machine,SVM)从理论和应用上提供了控制学习机器复杂性和提高学习机器推广性的有效手段,克服了“维数灾难”问题,通过内积核函数将原低维空间变换到一个高维的特征空间,在高维特征空间中构造线性判别函数来实现原空间中的非线性判别函数。因此,利用支持向量机进行入侵检测,不仅可以解决入侵检测推广性能差的问题,而且还可以提高入侵检测率,降低漏报和误报率,提高系统的实用性。然而,在实际应用中支持向量机存在着样本训练时间长,预测速度慢等问题,这些因素制约着支持向量机在入侵检测中的广泛应用。因此,为降低样本训练时间,提高样本的检测速度,本文采用了一种基于多阶段聚类SVM的入侵检测算法,该算法首先对原始样本数据进行密度聚类,去除样本中的噪声点,然后再对密度聚类后的样本数据进行K-均值聚类,使聚类后的同类样本数据具有较高的相似度,而不同类别的样本之间相似度较低,这样有效地减少了大规模数据的训练时间,并在保证分类精度的前提下提高了SVM的判别速度;对经过聚类后的样本采用最近邻方法(Nearest Neighbor-NN)进行修剪来去除分类界面的干扰点。从而提高分类精度。采用了一种初始聚类中心优化的K-均值算法有效地降低了K-均值算法对初始值的选择依赖性。为测试基于多阶段聚类支持向量机算法的有效性,通过仿真各种入侵检测算法,并进行结果分析比较,样本数据选用了美国国防部高级研究计划署DARPA(Defense Advanced Research Projects Agency)评估数据集,结果表明基于多阶段聚类SVM运用于网络入侵检测中取得了良好的效果。