论文部分内容阅读
随着互联网技术的不断发展与日渐成熟,网络交互在人们的日常生活当中扮演着越来越重要的角色。如何对历史网络连接数据进行建模分析,并在此基础上对新产生的数据进行入侵检测,成为当前的一个研究热点。本文设计并实现了一种基于改进的主动学习支持向量机多分类算法,而后基于该算法设计实现了网络入侵检测应用软件,提供了对代表性样本建立分类模型、对待检测的网络连接数据进行入侵检测以及显示检测结果等功能。在选取学习样本的过程中,传统的主动学习支持向量机分类算法仅考虑样本与分类边界的距离,而并未考虑样本间的冗余度。针对这一缺陷,本文通过改进学习策略,提出了一种改进的主动学习支持向量机二分类算法。该算法定义了样本的选取度,综合考虑样本与当前分类边界的距离,以及样本与已选样本间的冗余度,使得选取的样本更具有合理性;另外,该算法通过引入样本选择宽度的概念,分析了算法每次迭代过程中,样本选择个数对算法性能的影响。实验结果分析表明,相比于传统的主动学习支持向量机分类算法,本文提出的算法在预测准确率一致的情况下,需要更少的已标记样本,并且算法的收敛速度更快。传统的支持向量机分类算法通常用于进行数据二分类处理,难以满足网络连接数据中攻击类型多样化的需求。本文在支持向量机二分类算法的基础上进行了扩展,实现了基于支持向量机的多分类算法。进一步,在支持向量机多分类算法的基础上,结合改进学习策略的主动学习算法,实现了改进的主动学习支持向量机多分类算法。通过实验分析,在多类别样本的情况下,改进的主动学习支持向量机多分类算法能够用少量的已标记样本,达到高预测准确率的效果。本文在设计并实现了改进的主动学习支持向量机多分类算法的前提下,从项目整体性出发,设计并实现了网络入侵检测应用软件。该应用软件能够通过提供的训练样本建立入侵检测模型,然后采用检测模型对用户上传的文件数据进行入侵检测,之后将检测结果以表格的形式进行展示,并提供按关键字进行结果筛选等功能。