论文部分内容阅读
孪生支持向量机(Twin Support Vector Machines, TWSVM)是在支持向量机(Support Vector Machines, SVM)的基础上提出的一种新的机器学习方法。和SVM相比,TWSVM要寻找的是一对不平行的超平面,其中每个超平面都应该尽可能的靠近其中一类样本,而远离另一类样本。TWSVM在形式上完全类似于SVM,但算法最终归结为求解两个SVM型问题,计算开销缩减到标准SVM的1/4。鉴于TWSVM优秀的学习性能,目前其已成为机器学习领域的研究热点。然而,TWSVM在算法效率、参数寻优等方面还存在着改善的空间,针对这些问题,本文做了系统的研究,以下是主要研究内容:自TWSVM被提出以来,许多研究学者对其算法进行了改进,进一步提出了最小二乘孪生支持向量机,投影孪生支持向量机等,并将其应用于生物医学、说话人识别等领域。在深入的研究了TWSVM的基本思想和算法流程的之后,为了进一步提高其分类效率,本文首先考虑对其进行预处理的优化,提出了一种基于粗糙集的孪生支持向量机(Twin Support Vector Machines based on Rough Sets,RS-TWSVM),该算法利用基于属性重要度的属性约简方法对TWSVM做预处理优化。最后,通过在MATLAB平台下的实验,验证了该算法的可行性。在对TWSVM和RS-TWSVM进行研究和实验的过程中,发现TWSVM存在着参数难指定的缺点,因此本文继续探索如何对TWSVM做参数选择的优化,提出了一种基于粒子群优化算法的孪生支持向量机(Twin Support Vector Machinesbased on Particle Swarm Optimization, PSO-TWSVM),该算法使用粒子群算法迭代寻找TWSVM的最优参数,目的是为了避免TWSVM参数选择的盲目性。最后通过MATLAB平台下的实验,证明该算法确实有效。为了探讨不同的群智能优化算法对TWSVM进行参数选择优化的利弊,本文又提出了一种基于果蝇优化算法的孪生支持向量机(Twin Support VectorMachines based on Fruit Fly Optimization Algorithm, FOA-TWSVM),该算法使用最新的群优化算法——果蝇算法来优化TWSVM中的参数,同样可以避免TWSVM参数选择的盲目性。最后,在MATLAB实验平台下对该算法的有效性进行了验证,并对比分析了两种优化方法的优缺点。