人脸识别中若干特征优化方法研究

来源 :东北师范大学 | 被引量 : 8次 | 上传用户:gichurn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的快速发展,生物特征识别技术正在被大范围地应用到金融、安防等领域并受到了社会各界的广泛认可。与其它生物特征识别技术相比,人脸识别技术具有友好、直观、可靠等特点,所以人脸识别技术已成为生物特征识别技术中比较具有代表性的一项技术。人脸图像易受光照、表情等因素的影响,因此在实际应用中仍然存在很多挑战。在人脸识别模型中涉及到图像预处理、维数约简以及分类判决三个主要组成部分,如何有效利用特征与分类器之间的关系,从而增强特征判别力并且提高特征简洁度成为了当前研究的热点问题。本文从基于表示的分类器(Representation based Classifier,RC)角度出发,在有监督信号的情况下分别通过特征增强和特征提取方法实现了特征与分类器间的相互影响和相互制约。另外,本文以特征自表示模型为基础,通过特征间的线性表示及内积约束等实现了无监督的特征选择。有关这三种特征优化方法的具体工作总结如下:1.提出了一种新的滤波器学习方法,即基于表示的有监督滤波器学习方法。该方法通过有针对性地学习得到滤波器,并使滤波后图像的局部特征判别力增强,从而实现减小同一个人不同图像间差异,并且增大不同人间图像差异的目的。该方法的特点有:(1)在监督信号下,从局部二值模式(Local Binary Pattern,LBP)角度出发设计滤波器,从而使滤波后图像的LBP特征具有判别能力;(2)利用线性回归方法刻画图像像素点间的类内和类间表示误差,并在线性判别分析的约束下得到滤波器,从而使滤波后特征在稀疏表示分类器和线性回归分类器下得到更好的识别结果;(3)与采用固定模式的传统滤波器(如均值滤波器)不同,该方法是在数据驱动情况下有针对性地学习滤波器;(4)在单模态和多模态人脸数据库上均验证了该方法的有效性。通过大量的实验可以看出,该方法可以有效提高特征的判别力,并且在RC下可以得到更好的分类结果。2.结合字典学习提出了一种新的特征提取方法,即基于判别字典与投影联合学习的稀疏表示分类方法。该方法通过同时学习带有约束的字典和投影矩阵,不仅得到了更具表示力和判别力的字典,还得到了维数更低且更具判别力的特征,从而提升了人脸识别模型的分类性能。该方法的特点有:(1)通过对稀疏表示系数矩阵加入线性判别分析约束得到了具有判别能力的字典,并且通过对降维后样本加入线性判别分析约束得到了具有判别能力的投影矩阵;(2)通过联合学习使得字典和投影矩阵能够更好地相互配合,进而得到更好的识别结果;(3)提出了一种有效的迭代优化求解算法,并分别从理论分析和数值实验两方面验证了算法的收敛性;(4)在人脸图像和视频数据库上均验证了该方法的有效性。通过大量的实验可以看出,该方法可以有效提高特征简洁度并增强特征的判别力,即使在训练样本数较少的情况下仍然可以取得较好的识别性能。3.提出了一种新的无监督特征选择方法,即基于内积正则化非负自表示模型的无监督特征选择方法。该方法通过特征自表示模型和内积约束等去除了不相关特征及冗余特征,从而使特征子集具有较高的稀疏性和较低的冗余性。该方法的特点有:(1)利用特征的自表示模型来描述特征的显著程度,从而获得特征的权重矩阵;(2)采用内积正则化对特征权重矩阵进行约束,由此可以获得具有较高稀疏性和较低冗余性特点的特征子集;(3)采用非负约束对特征权重矩阵进行约束,从而保证所选特征的实际意义;(4)提出了一种有效的迭代优化求解算法,并分别从理论分析和数值实验两方面验证了算法的收敛性。实验结果表明该方法不仅可以有效提高特征的简洁度,而且可以得到更好的分类和聚类结果。综上所述,本文主要围绕人脸识别模型中特征优化问题展开了广泛而深入地研究,针对如何增强局部特征(LBP)的判别力、如何通过学习投影矩阵提高特征的简洁度和判别力以及如何提高特征子集有效性的问题,分别提出了三种特征优化方法。从实验结果可以看出,本文提出的方法对人脸识别研究有一定的推动作用并具有较好的应用前景。
其他文献
旨在探讨舞动治疗对于辅导员职业倦怠干预的效果,为辅导员缓解职业倦怠提供方法和依据。采用简单随机抽样方法,从三所高校中抽取60名辅导员进行研究,分为两组,通过舞动治疗与普通
十一世纪是人类追求健康的世纪,但世界卫生组织(WHO)调查显示,全世界的人能真正称为健康的仅5%,处于疾病状态的占20%,剩余的75%均处于亚健康状态,
近年来研究发现,Mitsugumin53(MG53)蛋白是存在于心肌和骨骼肌中的一个新靶点,作为Tripartite motif-containing(TRIM)的家族成员之一,它被认为通过作用于伤口加快组织修复。MG53
通过对大样本数据进行有效的表征、学习和推理,实现对图像、视频等在内的多媒体信息的自动理解是计算机视觉的主要研究内容之一。不同的视觉分析处理过程具有天然的层次特性
2003年3月22日,河北电视台卫星频道播出了《发明空间》栏目第17期。在那期节目里笔者表演了心算√200'617'094'819=8539。朋友们问道:“怎么算得那么快?”应当说,这
研究目的:目前轨道板与CA砂浆层离缝损伤是我国CRTSⅡ型板式无砟轨道主要损伤形式,本文为研究砂浆层离缝损伤机理,制作混凝土和砂浆复合试件进行劈拉和剪切模型试验,采用数字
学生的课堂问题行为是中小学教师在课堂管理中迫切需要解决的问题。通过对近20年来国内外研究进行梳理分析,发现学生的课堂问题行为具有普遍性。教师和学生知觉到的问题行为
近年来高清及超高清视频不断出现,使得以H.264/AVC和AVS为代表的第二代视频编码标准已无法满足实际应用的需要。为了提高编码效率,国际JCT-VC工作组于2013年完成新一代视频编
目的:探讨无精子症患者精液常规、精浆生化与生精细胞检测在无精子症鉴别诊断中的价值。方法:通过改良巴氏染色法分析70例无精子症患者精液中的生精细胞,根据精液中生精细胞