论文部分内容阅读
特征抽取在模式识别中占据着至关重要的地位,其方法有很多。本文基于偏最小二乘(PLS)的建模思想,深入探讨了将PLS方法和模糊PLS(FPLS)方法用于特征抽取的理论和方法。本文主要研究和创新性工作如下:(1)详细探讨了PLS方法的基本思想及其线性和非线性的建模过程,综合比较PLS各种方法的优缺点,说明了PLS方法的应用范围,并结合模糊数学相关理论,探讨了其应用在PLS方法处理非线性问题的理论可行性,讨论了PLS方法与CCA等线性抽取方法之间的区别与联系,研究了基于线性PLS和基于核PLS的特征抽取技术,深入探讨了其理论和算法,并与其他经典的线性子空间特征抽取方法作了对比实验和分析。(2)利用模糊数学具有较强的数据结构表征能力,来处理非线性问题以期其具有良好表现,探讨了将模糊技术应用到PLS方法中,即将TSK模糊模型嵌入到PLS回归方法的框架中,利用TSK模型的解释性克服经典非线性PLS算法的一些不足。本文研究的FPLS算法在将高维数据向低维空间投影的同时消除共线性的问题,TSK模糊模型能够较好地捕捉被投影数据的非线性结构,并且加入相关模糊规则,从而提高了模型的适用范围。(3)研究基于奇异值分解的FPLS算法。经典的NIPALS算法虽然能使得PLS的变换过程比较清楚,但是该方法由于在迭代过程中得分向量u选取的任意性,使得算法不稳定,从而将可能导致结果的不确定性,基于奇异值分解的FPLS算法通过将奇异值分解法应用到FPLS算法中,有效的解决了这个问题。实验证明了基于奇异值的FPLS算法比传统的FPLS算法更稳定。(4)提出了基于样本标号的FPLS算法。传统的类标号不能反映数据的分布特点,其认为类中心区和类交界区的样本在分类中的作用相同,本文设计了一种样本编码方式——基于样本标号的FPLS算法,为每个样本赋予得一个标号该样本附近的样本分布情况决定,这样每类样本不使用一个统一的类标号,从而得到了更理想的识别效果。最后在人脸和掌纹数据库上的实验验证了这两个算法的有效性。