论文部分内容阅读
入侵检测是一种用于检测计算机网络系统中入侵行为的网络信息安全技术,目前已成为网络安全领域中的重要研究方向之一。以机器学习为基础的异常检测技术,通过对样本的学习分析检测已知甚至未知攻击,渐渐成为入侵检测主要研究的方向。但传统机器学习的入侵检测存在误报、漏报及实时性差等缺点,且无法适应数据量增大的趋势,使机器学习时间越来越长。
本文侧重于研究基于支持向量机的入侵检测系统中需要解决的两方面问题,一是入侵检测评估样本集KDDCup99的关键特征的选择;二是解决入侵数据增多,导致支持向量机训练时间过长问题。
在KDDCup99关键特征的选择方面,提出了一种基于免疫算法的特征选择方法。免疫算法(IA)作为一种新的全局优化搜索算法,在算法实现上兼顾全局搜索和局部搜索,吸取了遗传算法(GA)并行搜索优点,使得算法快速收敛,同时保持一定的多样性,抑制了早熟现象,加快搜索到最优特征子集的速度。对KDDCup99数据集进行大量实验结果表明,免疫算法能有效降低样本特征维数且训练预测精度得到提高,与基于遗传算法特征选择的结果相比较,在有限代数内,该算法能收敛到更优的特征子集,从而验证了算法的有效性和潜力。
在解决训练时间过长方面,提出增量学习方法。现有标准增量支持向量机(SISVM)算法虽然有效解决训练时间过长问题,但其过多的丢失对分类有用的样本,导致训练得到的模型分类精度下降。因此本文提出新的改进增量支持向量机算法(RISVM),该算法提出概率最大样本、邻近样本的概念,目的是有选择的增加有用的样本,提高模型的分类精度和泛化能力。实验通过RISVM、SISVM和批量学习算法(BASVM)三种算法的对比,结果表明,RISVM在训练时间上比SISVM和BASVM低,且测试时间和测试精度都比SISVM和BASVM两者优秀,因此本文提出的算法更符合入侵检测系统要求。