论文部分内容阅读
支持向量机(SVM)是当前公认的解决分类问题和回归问题的有效工具,已被广泛应用于很多领域之中.非平行超平面支持向量机作为支持向量机的拓广和延伸,因其适应能力强和运算量少,受到了学者的广泛关注,已成为支持向量机方向一个新的研究热点.本文以支持向量机和非平行超平面支持向量机为研究背景,以挖掘和利用训练样本中潜在结构信息和判别信息为前提,构建更为有效的改进模型,使之能适用于不同情形的实际问题.具体工作包括以下四个方面:1.受启发于线性判别分析,本文提出了投影非平行支持向量机.此方法需要两个步骤才能获得最优的中心超平面.第一个步骤,通过最小化类内距离和最大化类间距离策略来获取两个投影方向;第二个步骤,以所得的投影方向作为非平行中心超平面的法向量,然后通过选取基于样本空间分布的特定几何点来确定中心超平面的确切位置.此外,为了提高本方法的求解速度,本文利用超松弛算法求解其模型,最后通过人工数据和标准数据集实验验证了所提方法的合理性和有效性.2.注意到传统的双子支持向量机并没有考虑到训练样本的潜在空间分布信息和判别信息,为了克服此缺点,本文提出了基于改进成对约束信息的双子支持向量机.此方法在修改的成对约束基础之上,针对非平行超平面分类器,设计出了改进的判别正则项,即类内判别正则项和类间判别正则项,并把它们引入双子支持向量机之中,从而得到了基于改进成对约束信息的双子支持向量机模型.在数值实验部分,利用人工数据和标准数据集进行实验验证了所提方法的合理性和有效性.3.注意到标准支持向量机并没有考虑到训练样本间潜在的高阶关系和判别信息,本文通过引入新设计的判别正则项,提出了基于超图和成对约束信息的支持向量机.此方法不仅挖掘出了训练样本间潜在的高阶复杂关系,而且还利用到了它们之间先验的判别信息,从而提高了标准支持向量机的分类性能.4.注意到传统的利用结构化数据的SVM+的分组方法具有很大的随机性且仅仅考虑了训练样本的部分结构信息,为了克服此缺点,本文提出了基于特征选择和聚类技术的SVM+.此方法首先通过特征选择方法选出部分特征,然后再通过聚类技术依据所选特征进行聚类,把所得的聚类结果作为分组信息引入SVM+之中,从而得到了基于新的分组方法的SVM+模型,并设计出了相对应的算法,最后通过数值实验验证了所提方法的有效性.