论文部分内容阅读
支持向量机(SVM)作为数据挖掘中的新方法,已经成为解决机器学习问题的新技术.由于它是基于结构风险最小化,且具有全局最优、推广能力强以及解的稀疏性等优点,能较好地解决小样本、非线性、过学习、维数灾难和局部极小等实际应用中的难题,从而越来越受到人们的重视,并且广泛地应用于分类问题、回归问题和函数逼近等领域.本文给出一种改进的半监督支持向量机模型,以及支持向量机训练的一些有效算法,具体内容如下:第一、基于U-支持向量机和半监督两类分类问题的LIAM支持向量机算法思想,提出一种改进的半监督LIAM支持向量机(NPLIAM)其完全具有PLIAM支持向量机所具有的诱导性,训练速度快,准确率高等优点,并且也只需通过求解一个(n+1)×(n+1)矩阵的逆即可得到最终分划超平面.最重要的是NPLIAM算法克服了一般LIAM半监督支持向量机的两个缺点:1)考虑未标记点的所有正类与负类的约束情况,增加了二次规划的求解复杂度;2)当未标记点距离标记点太远,这样就使得该未标记点所提供的信息在训练中无法被利用,从而影响了分类的准确率.第二、针对最近Roger和Gaetano提出的支持向量机的一个新的标准问题以及对其求解的类SQP训练算法,通过对该类SQP算法子问题的几何意义进行分析,提出一种改进的QP子问题,以及相应的改进类SQP算法,并对本文算法与原算法进行比较.关于算法的初步的数值实验也验证了本文分析的正确性.实验结果表明,当算法迭代点接近最优点时,本文的改进算法可以直接搜索致局部最优点,并且终止.而原SQP算法可能会搜索到局部最优点仍要进行下一步的迭代,以确保其局部最优性才可终止.同时,本文还给出了另一种关于原SQP算法中参数θ的选择策略,该选择策略同样具有原策略所具有的优点,但较原策略,特别是在不可分的情况下(即h<0),具有更好的数值稳定性.第三、对于多类分类问题的K-SVCR算法,本文将其转化成一个带有半正定矩阵的仿射箱式约束变分不等式问题(BVI).事实上,该转化所得的BVI问题也是一带有P0-函数的箱式约束的半分不等式问题(P0BVT).同时由于一般的变分不等式问题能够转化成一非光滑的等式系统,本文基于[40]提出的求解P0-NCP的正则光滑牛顿法的思想,通过引入相互独立的单变量光滑参数μ和单变量正则参数ε,提出一个新的求解P0BVT的正则光滑牛顿算法来间接训练K-SVCR支持向量机.由于上述参数μ和ε均为单变量,且互不相关,这就使得本章所提算法更为简单易行,可以有效地在实际中执行.算法产生一无穷序列,在无需假设聚点存在的条件下,证明了算法全局收敛.同时,在CD-正则但不要求严格互补的条件下,证明了算法的超线性收敛和二次收敛.最后,对于上述支持向量机模型及训练算法进行数值实验,实验结果表明了本文所提出改进的半监督支持向量机模型及支持向量机训练的相关算法的有效性.