论文部分内容阅读
诞生于20世纪20年代的模式识别所关注的是通过计算机算法自动地发现隐藏在事物或现象中的规律,并利用这些规律对事物或现象进行描述、辨认、分类和解释的过程。作为模式识别研究领域的重要研究内容,特征提取不仅从原始模式中提取出最有利于模式分类的特征,而且还能极大地降低原始模式样本的维数。模式识别通常可分为无监督的分类以及有监督的分类两种类型,作为模式识别过程中关键的一步,特征提取相应地可分为有判别信息的特征提取方法的和无判别信息的特征提取方法。有判别信息的特征提取在训练的过程中往往需要提供训练样本所属的类别,但是在解决实际问题过程中,有时候事先提供训练样本所属类别是有一定困难的,因此深入研究无判别信息的特征提取方法就变得非常有必要了。在现实世界中,很多物体都可以用张量表示,如人脸图像可用二阶张量表示,人类行为的剪影序列可用三阶张量表示,而且由于基于张量的特征提取方法在特征提取的过程中能保持原始样本的时空特性,张量分析在计算机视觉、特征提取中已经成为一个热门的研究领域。本文以行为识别和人脸识别为应用基础,对无判别信息的、基于张量的图像特征提取方法进行了深入的研究。本文首先介绍了特征提取的研究意义以及人脸识别和行为识别的研究现状。接着介绍了张量表示的相关知识,并用图形化形象地、直观地描述了张量表示中的相关概念。随着科技的飞速发展,收集数据的技术也随之而发展,因此如何有效地从数据中挖掘出最有用的信息受到人们越来越多的关注。统计建模无疑是处理这一问题最有效的手段之一。本文用糖尿病的例子引出了线性回归模型,深入讨论了最小二乘法、岭回归、lasso回归、弹性网络四种回归模型各自的优缺点,并给出各自的实现步骤。通过阅读大量的国内外文献发现,从视频中提取出的人动作的剪影序列的维数往往都很高,在用分类器识别之前,对其进行特征提取(降维)是非常有必要的。本文通过把张量主成分分析用于原始样本的特征提取,以提取原始样本中对分类最有用的信息。而且张量主成分分析算法是无监督的特征提取方法,在特征提取过程中不需要知道训练样本所属的类别。而后用张量距离度量两个投影后张量之间的相似度,并构造一个基于张量距离的最紧邻分类器来识别待测试行为。通过在有名的Weizmann人体行为数据库上的实验,本文的方法能够达到较高的识别率,而且在针对不同走路姿势的鲁棒性上也能达到较好的识别率。给定一副有很强的噪音污染或被缩小的人脸图像,我们还是能够轻而易举地把它识别出来,这就说明我们不需要感知图像中所有的像素,只要感知其中一部分就能完成识别任务,这也就是说人类的视觉系统具有对图像的稀疏表示特性。为此本文结合张量表示和稀疏表示,在张量主成分分析的基础上提出了一种基于稀疏张量的特征提取方法——稀疏张量主成分分析。该方法通过把MPCA(multilinear principal componentanalysis,多线性主成分分析)算法中求特征值特征向量问题转化为一系列的线性回归问题,不仅使投影后张量之间的距离尽可能的远,而且还使得到的投影矩阵是稀疏的。通过在AR人脸库上的大量实验表明,相较于原有的MPCA算法以及带判别信息的DATER(Discriminant analysis with tensor representation,张量表示的判别分析方法)和GTDA(General tensor discriminant analysis,常规张量判别分析方法)算法,STPCA算法能更有效地降低遮挡对特征提取效果的影响。