论文部分内容阅读
在智能模式识别领域中,当待处理数据呈现高维特征时,往往首先使用有效的特征降维方法对数据进行所谓的降维预处理,以提高智能识别的有效性,因此近年来特征提取和特征选择这两类主要的特征降维方法得到了广泛深入地研究,且被较为成功地运用到解决具体的模式识别问题中。然而,目前一些经典的特征降维方法以及部分改进方法在处理具体的智能识别问题时在一定程度上表现出鲁棒性不高、泛化能力不强的特点。所以本课题针对上述不足,通过结合其它智能处理技术研究新的特征降维方法。所研究内容主要涉及如下三个部分。第一部分由第二章和第三章组成,这一部分分别讨论两种新颖的特征选择方法。具体来说,第二章主要针对势支持向量机P-SVM存在的泛化能力不强的问题,通过引入Fisher判别分析方法中的类内散度矩阵,重新构造P-SVM的目标函数,从而形成具有较强泛化能力的广义的势支撑特征选择方法GPSFM。GPSFM方法不但在一定程度上继承了P-SVM的优点,而且还具有特征选择冗余度低、选择速度快和适应能力强的特点,从而使得该方法表现出了较之于P-SVM更好的特征选择和分类效果。第三章针对经典的模糊聚类方法FCM存在的对噪音数据和噪音特征敏感的问题,采用对样本点和样本特征同时加权的方式,重新构造FCM方法的目标函数,从而得到具有特征排序功能的鲁棒性模糊聚类方法FCA。FCA方法不但具有较为稳定的聚类功能,同时可以通过特征权值和样本权值来反映不同特征和不同样本对聚类的贡献程度,从而实现特征排序,达到特征选择的目的。该章中我们还根据一定的几何含义去确定特征权值和样本权值参数合理的取值范围,并从理论上加以证明。第二部分由第四章和第五章组成,这一部分分别讨论两种新颖的特征提取方法。具体来说,第四章针对线性拉普拉斯判别准则LLD方法存在的小样本以及如何确定原始样本空间类型的问题,通过引入语境距离度量并结合最大间距判别准则的基本原理提出一种基于语境距离度量的拉普拉斯最大间距判别准则CLMMC。CLMMC方法不但在一定程度上避免小样本问题,而且由于语境距离度量更关注输入样本簇内在的本质结构而不是原始样本空间的类型,从而降低了该准则对特定样本空间的依赖程度。同时通过引入计算语境距离度量的新算法并结合QR分解的基本原理使得CLMMC在处理高维矢量模式数据时更具适应性和效率。本章还从理论上讨论CLMMC准则具有的基本性质以及与LLD准则的内在联系。第五章针对最大散度差判别准则的效果很大程度上依赖参数η选取,以及该准则的划分属于硬划分,在一定程度上不能客观地反映现实世界的问题,通过引入模糊技术,重新构造一种新的模糊最大散度差判别准则,并根据这一新准则提出一种模糊聚类方法FMSDC。FMSDC方法通过迭代优化过程中实现聚类的同时还可以得到最优鉴别矢量,实现特征降维。并依据一定的原则合理地设定参数η,从而一定程度上降低了该参数对划分结果稳定性的影响。第三部分由第六章和第七章组成,这一部分主要研究和讨论两种基于类内散度的支持向量机的方法。具体来说,第六章针对最小类内散度支持向量机MCSVMs面临的小样本问题,通过引入张量理论,重新构造MCSVMs支持向量机的目标函数,从而提出基于矩阵模式的最小类内散度支持向量机MCSVMsmatrix以及相应的非线性核方法Ker-MCSVMsmatrix。MCSVMsmatrix方法不但克服了MCSVMs方法所面临的小样本问题,同时降低了算法本身具有的时间和空间复杂度。而且Ker-MCSVMsmatrix方法首次实现了矩阵模式的非线性化。第七章针对经典SVM方法不能充分地反映样本内在几何结构以及所蕴含的判别信息的问题,通过同时引入线性判别准则中的类内散度和局部保持投影LPP的基本原理,重新构造SVM的目标函数,提出基于全局和局部保持的半监督支持向量机GLSSVM以及非线性核方法Ker-GLSSVM。GLSSVM方法较为充分地考虑了样本间内在的全局和局部结构,同时还满足作为半监督方法必须依据的一致性假设原则。