论文部分内容阅读
支持向量机(SVM)是一种机器学习算法,它建立在统计学习理论的基础上。具有成熟坚实的理论基础和直观的几何解释。支持向量机算法寻求的是类与类之间的最大间隔,支持面仅与少数的支持向量有关,因而具有稀疏性,但是同时也忽略了训练样本的数据结构。在现实的数据集中都含有大量的噪声点和野点,针对这一情况,本文引入模糊的方法,给噪声点和野点赋以小的模糊因子,从而减轻对训练效果的影响。本文考虑了训练数据集的数据结构,在最小二乘支持向量机中引入了类内离散度,同时为了减轻噪声点和野点对算法的影响,加入了模糊因子,并利用KFCM来构造惩罚项中的模糊因子。主要创新如下:(1)提出了基于类内离散度的最小二乘支持向量机。将Fisher判别分析(FDA)里面的类内离散度引入到了最小二乘支持向量机中,形成新的基于类内离散度的最小二乘支持向量机(WCSLS-SVM)算法,并给出了在特征空间的对偶问题和求解方法。传统的支持向量机算法寻求的是最大间隔,与传统的相比,该算法将训练样本的数据结构考虑进去,实验结果表明该算法分类准确度较高。(2)提出了基于组合特征映射的FCM算法。将生成局部核函数和全局核函数的特征映射在特征空间进行正交化处理,然后将它们进行线性组合成新的特征映射,生成新的核函数,同时给出了FCM在特征空间的模糊隶属度的求解方法以及核函数的组合权重的求解。(3)提出了基于组合特征映射FCM的模糊WCSLS-SVM算法,为了减轻野点对WCSLS-SVM算法的影响,在惩罚项中加入模糊因子,将基于特征映射的FCM算法构造的隶属度代入其中,构成基于组合特征映射FCM的模糊WCSLS-SVM算法。实验表明在原有WCSLS-SVM基础上分类精度进一步提高,鲁棒性更强。