论文部分内容阅读
随着计算机技术的不断发展,网络安全的问题也越来越受到人们的关注,其中网络漏洞的存在是影响到网络安全的根源之一。对网络安全来说,如何规范、合理的对漏洞进行分类就显得尤为重要。而支持向量机就是一个解决分类的好工具,它是一种建立在统计学理论基础上的机器学习方法。其最大的特点是根据Vapnik的结构风险最小化原则,尽量提高学习机的泛化能力,即由有限的训练样本集得到小的误差。因此,本文通过对网络漏洞和支持向量机(SVM)的研究,给出了一种新的基于支持向量机的网络漏洞分类方法。本文首先介绍了网络漏洞的一些概念以及统计学理论和支持向量机的基础理论;其次,全面总结了目前存在的基于支持向量机的多类别分类方法,包括一对多方法、一对一方法、一次性求解方法和决策有向无环图等方法,比较了它们的优缺点及性能。并针对它们存在的问题以及缺点,如一对多训练速度慢、一对一分类速度慢,提出了一种新的基于二叉树的多类SVM算法。在此算法中,结合了聚类分析中的最短距离和漏洞的特征来构造二叉树的结构,缩短了分类的时间;接着,为了提高漏洞分类的精确度,还采用了一种对在漏洞分类过程中起到重要作用的特征进行加权处理的方法;最后,在建立的小型漏洞库上进行实验,采用建立哈希表的方法进行数据的预处理。实验结果表明,本文所做的改进在缩短了分类时间的同时,也提高了分类的精确度。