基于模糊偏最小二乘的特征抽取方法研究

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:liuyw0825
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
特征抽取在模式识别中占据着至关重要的地位,其方法有很多。本文基于偏最小二乘(PLS)的建模思想,深入探讨了将PLS方法和模糊PLS(FPLS)方法用于特征抽取的理论和方法。本文主要研究和创新性工作如下:(1)详细探讨了PLS方法的基本思想及其线性和非线性的建模过程,综合比较PLS各种方法的优缺点,说明了PLS方法的应用范围,并结合模糊数学相关理论,探讨了其应用在PLS方法处理非线性问题的理论可行性,讨论了PLS方法与CCA等线性抽取方法之间的区别与联系,研究了基于线性PLS和基于核PLS的特征抽取技术,深入探讨了其理论和算法,并与其他经典的线性子空间特征抽取方法作了对比实验和分析。(2)利用模糊数学具有较强的数据结构表征能力,来处理非线性问题以期其具有良好表现,探讨了将模糊技术应用到PLS方法中,即将TSK模糊模型嵌入到PLS回归方法的框架中,利用TSK模型的解释性克服经典非线性PLS算法的一些不足。本文研究的FPLS算法在将高维数据向低维空间投影的同时消除共线性的问题,TSK模糊模型能够较好地捕捉被投影数据的非线性结构,并且加入相关模糊规则,从而提高了模型的适用范围。(3)研究基于奇异值分解的FPLS算法。经典的NIPALS算法虽然能使得PLS的变换过程比较清楚,但是该方法由于在迭代过程中得分向量u选取的任意性,使得算法不稳定,从而将可能导致结果的不确定性,基于奇异值分解的FPLS算法通过将奇异值分解法应用到FPLS算法中,有效的解决了这个问题。实验证明了基于奇异值的FPLS算法比传统的FPLS算法更稳定。(4)提出了基于样本标号的FPLS算法。传统的类标号不能反映数据的分布特点,其认为类中心区和类交界区的样本在分类中的作用相同,本文设计了一种样本编码方式——基于样本标号的FPLS算法,为每个样本赋予得一个标号该样本附近的样本分布情况决定,这样每类样本不使用一个统一的类标号,从而得到了更理想的识别效果。最后在人脸和掌纹数据库上的实验验证了这两个算法的有效性。
其他文献
近几年,关于神经网络的研究取得了令人瞩目的进展,引起了包括计算机科学、脑神经科学、人工智能等学科领域内的科学家的巨大热情和广泛兴趣。神经网络是人类对其大脑信息处理
事件信息抽取(Events Information Extraction: Events IE)目前是信息抽取(Information Extraction: IE)中的一个重要领域。本文提出了一种跨文本事件信息融合方法,该方法在
近年来,网络以及硬件的快速发展使得人们被淹没在信息海洋之中,因此,基于内容的视频检索成为一个研究热点,体育视频检索作为其中一部分也得到了广泛的研究。足球比赛深受广大
在当代非线性科学中,非线性方程的可积性是广大学者的重要研究方向之一.本文将结合著名数学家吴文俊的数学机械化思想,并以计算机代数系统Maple为工作平台研究非线性微分差分方
词义消歧在自然语言处理的许多应用领域中具有重要的理论和实践意义,是一个影响着自然语言处理领域中许多其他应用问题的“中间问题”,在机器翻译、信息检索、主题内容分析和
P2P网络存储的网络资源也越来越多,如何在海量的网络资源中精确定位所需资源(P2P的资源定位模型)成为当前P2P研究领域的热点。P2P的资源定位模型决定着资源查找的准确率以及
物联网是通过信息传感设备采集物理世界中物的信息,并将物的信息上传至互联网,其本质是在互联网上实现物理世界的信息共享。物联网的传感设备时时刻刻采集处理现实世界信息,以便
随着计算机技术的不断发展,手势识别已经成为人机交互领域中的一项关键技术。现今,作为一种新型的人机交互技术,手势识别已经成为涉及图像处理、模式识别、计算机视觉等领域
随着当今信息技术和Internet技术的迅猛发展和广泛应用,时时可学、处处可学和人人可学的学习型社会正在形成。网络远程教育逐渐成为一种重要的教学模式。各种教育理念也逐渐
基于SIP的下一代网络(NGN),能够无缝融合3G、WLAN、PSTN、互联网等各种类型的网络,这使得SIP在NGN网络中将占据主导地位。基于SIP的网络融合平台提供了基于SIP的网络服务项目