智能识别中的降维新方法及其应用研究

来源 :江南大学 | 被引量 : 0次 | 上传用户:moowoo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在智能模式识别领域中,当待处理数据呈现高维特征时,往往首先使用有效的特征降维方法对数据进行所谓的降维预处理,以提高智能识别的有效性,因此近年来特征提取和特征选择这两类主要的特征降维方法得到了广泛深入地研究,且被较为成功地运用到解决具体的模式识别问题中。然而,目前一些经典的特征降维方法以及部分改进方法在处理具体的智能识别问题时在一定程度上表现出鲁棒性不高、泛化能力不强的特点。所以本课题针对上述不足,通过结合其它智能处理技术研究新的特征降维方法。所研究内容主要涉及如下三个部分。第一部分由第二章和第三章组成,这一部分分别讨论两种新颖的特征选择方法。具体来说,第二章主要针对势支持向量机P-SVM存在的泛化能力不强的问题,通过引入Fisher判别分析方法中的类内散度矩阵,重新构造P-SVM的目标函数,从而形成具有较强泛化能力的广义的势支撑特征选择方法GPSFM。GPSFM方法不但在一定程度上继承了P-SVM的优点,而且还具有特征选择冗余度低、选择速度快和适应能力强的特点,从而使得该方法表现出了较之于P-SVM更好的特征选择和分类效果。第三章针对经典的模糊聚类方法FCM存在的对噪音数据和噪音特征敏感的问题,采用对样本点和样本特征同时加权的方式,重新构造FCM方法的目标函数,从而得到具有特征排序功能的鲁棒性模糊聚类方法FCA。FCA方法不但具有较为稳定的聚类功能,同时可以通过特征权值和样本权值来反映不同特征和不同样本对聚类的贡献程度,从而实现特征排序,达到特征选择的目的。该章中我们还根据一定的几何含义去确定特征权值和样本权值参数合理的取值范围,并从理论上加以证明。第二部分由第四章和第五章组成,这一部分分别讨论两种新颖的特征提取方法。具体来说,第四章针对线性拉普拉斯判别准则LLD方法存在的小样本以及如何确定原始样本空间类型的问题,通过引入语境距离度量并结合最大间距判别准则的基本原理提出一种基于语境距离度量的拉普拉斯最大间距判别准则CLMMC。CLMMC方法不但在一定程度上避免小样本问题,而且由于语境距离度量更关注输入样本簇内在的本质结构而不是原始样本空间的类型,从而降低了该准则对特定样本空间的依赖程度。同时通过引入计算语境距离度量的新算法并结合QR分解的基本原理使得CLMMC在处理高维矢量模式数据时更具适应性和效率。本章还从理论上讨论CLMMC准则具有的基本性质以及与LLD准则的内在联系。第五章针对最大散度差判别准则的效果很大程度上依赖参数η选取,以及该准则的划分属于硬划分,在一定程度上不能客观地反映现实世界的问题,通过引入模糊技术,重新构造一种新的模糊最大散度差判别准则,并根据这一新准则提出一种模糊聚类方法FMSDC。FMSDC方法通过迭代优化过程中实现聚类的同时还可以得到最优鉴别矢量,实现特征降维。并依据一定的原则合理地设定参数η,从而一定程度上降低了该参数对划分结果稳定性的影响。第三部分由第六章和第七章组成,这一部分主要研究和讨论两种基于类内散度的支持向量机的方法。具体来说,第六章针对最小类内散度支持向量机MCSVMs面临的小样本问题,通过引入张量理论,重新构造MCSVMs支持向量机的目标函数,从而提出基于矩阵模式的最小类内散度支持向量机MCSVMsmatrix以及相应的非线性核方法Ker-MCSVMsmatrix。MCSVMsmatrix方法不但克服了MCSVMs方法所面临的小样本问题,同时降低了算法本身具有的时间和空间复杂度。而且Ker-MCSVMsmatrix方法首次实现了矩阵模式的非线性化。第七章针对经典SVM方法不能充分地反映样本内在几何结构以及所蕴含的判别信息的问题,通过同时引入线性判别准则中的类内散度和局部保持投影LPP的基本原理,重新构造SVM的目标函数,提出基于全局和局部保持的半监督支持向量机GLSSVM以及非线性核方法Ker-GLSSVM。GLSSVM方法较为充分地考虑了样本间内在的全局和局部结构,同时还满足作为半监督方法必须依据的一致性假设原则。
其他文献
电影胶片数字修复技术是以图像视频处理技术为基础,对数字胶片电影损伤进行有效检测和修复的一种技术,是计算机技术在电影修复领域的成功应用。该技术的目标是把严重降质的老
批判性思维能力与创新能力、问题解决等并列为现代社会的基本能力,同时它也是渗透在其他能力之中的,因此批判性思维能力的培养需求在国际上普遍达成了共识。本研究尝试探讨高
目的:研究针刺对大脑中动脉阻断(MCAO)所致局限性脑缺血大鼠海马CA3区微血管数目及神经元死亡率的影响.方法:采用穿线法阻断大脑中动脉复制大鼠脑缺血模型,研究针刺人中、内
产品配置技术是实现面向大批量定制开发设计的关键技术,在制造业领域应用广泛。本文在较全面分析产品配置技术研究和应用现状的基础上,重点研究了面向制造业的产品配置知识表
甘肃马家塬墓地是战国晚期至秦初的西戎墓地,本研究以该墓地M4出土的料珠为研究对象,以期通过分析其成分和结构特征,讨论其工艺特征,以丰富对战国时期费昂斯的相关认识。研究
电子、信息技术飞速发展,医疗设备种类日渐增多,精密度和智能化程度越来越高,已成为医疗、科研、教学、机构、临床学科工作最基本要素,在医院应用日趋广泛,涉及临床各个学科。医疗
作为一名媒体记者,当面对诸如“穷人医疗”方面的问题时,我们应该怎么做才能不违背常规道德,不违反“生命伦理”的相关准则呢?这是一个值得深思的问题。很多情况下,我们处于两难的
电力档案管理工作的实际目的与企业的经济效益息息相关,然而目前我国大多致电力企业的档案管理工作存在着很大的问题。没有正确的认识、需要强化的管理制度、需要加强的专业素
对于档案来讲,其是高校开展教学活动的真实记录,同时也见证了高校的发展历程,在学校的建设及发展过程中发挥着重要的作用。所以,相关工作人员应对档案的管理工作予以重视,加大档案
目的:分析临床抗菌药物使用过程中存在的问题,了解其中的不合理因素,进一步指导临床合理用药。方法:对2005年1月至2006年12月的住院患者按内、外、妇、儿科随机抽样1000例,对