论文部分内容阅读
网络入侵检测技术是保障网络安全的方法之一,在现有的各类网络入侵检测方法中,以基于机器学习算法的方法效果最为突出,即使用机器学习算法作为分类器来对相关数据进行归类以检测出入侵行为的方法。最小二乘支持向量机作为分类器具有检测精度高、泛化能力好等优点,而且相对于标准支持向量机,由于简化了算法中待解决的问题,在计算效率上也有一定程度上的改进,但由于其分类性能很大程度上受到自身参数选择的影响,因此如何更好的去选择合适的参数成为提高该类方法检测精度的关键。当前对于模型参数选择的方法主要分为两类,一类是基于人工后验经验的选择,该方法具有较强的主观性,会由于研究人员在对待目标问题上相关经验的不同而导致选择的参数对分类结果产生潜在的影响;另一类是基于智能优化算法对分类器作参数寻优的方法,但由于智能优化算法自身存在的一些缺陷会导致参数寻优精度欠佳,应用智能算法寻优得到的参数后也会影响分类器的分类准确率,因此该类方法仍存在一定的改进。针对智能算法对分类器作参数寻优的方法,本文在现有理论基础之上首先结合反向学习理论提出了一种改进的综合学习粒子群优化算法,并通过改进后的算法对最小二乘支持向量机进行参数寻优,提出了一种改进的网络入侵检测模型。随后,针对改进后的综合学习粒子群算法中存在大量迭代、解决复杂问题时收敛时间较长的缺陷,结合目前已有的并行化模型,提出了一种改进的并行化混合粒子群算法。并行化混合粒子群算法分为整体种群和子群两部分,整体种群中每个粒子又作为一个子群独立进化。通过在整体种群中使用标准粒子群算法并且在子群中混入融合反向学习机制的综合学习粒子群算法,可以有效减少算法进行参数寻优的时间。此外,针对最小二乘支持向量机在处理多分类问题上需要构造多个相互独立的二值分类器特性,结合改进的并行化混合粒子群算法,将网络入侵检测模型整体进行了并行化改进,在检测效率和准确度方面都有所提高,同时在网络入侵检测的实时性方面也有所改进。本文实验部分基于KDDCUP99数据集进行研究,首先通过人工筛选明显无意义的特征维度,再通过PCA主元成分分析计算各个剩余特征维度的贡献率,通过筛选累计贡献率大于98%的特征进行主成分提取,从而达到特征选择目的。模型的并行化实验验证主要借助于Spark分布式计算框架来实现,通过相关实验比较证明本文提出的模型具有较好的效果。