黎曼度量学习及其在视频人脸识别中的应用研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:my_lyb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在机器学习领域,越来越多的研究者认识到当数据具有非欧氏结构时,采用开发于欧氏空间的机器学习方法通常会由于忽略数据的这一特殊的几何结构而产生次优的结果。为了克服这一缺陷,目前有一类新的机器学习方法假设用于表示输入数据的黎曼流形是显式已知的,通过开发已知流形的黎曼度量来在训练数据上学习有效的判别模型。本文将这一类机器学习方法称为黎曼度量学习。近年来,基于传统统计模型的黎曼度量学习方法已经被成功应用于诸多计算机视觉与模式识别领域的分类问题。以具体的基于视频的人脸识别任务为例,人脸视频序列通常包含非常丰富的人脸动态时序信息和多视空间信息。为了解决视频人脸识别问题,一些传统的统计模型(如线性子空间、协方差矩阵和高斯概率模型)通常可以用来有效编码视频序列中的人脸变化模式,从而成为一种鲁棒的视频特征。由于这些统计模型通常位于一个特定的黎曼流形上,现有的黎曼度量学习方法可以为这一问题提供一种有效的判别学习策略。因此,本文针对视频人脸识别问题,从对视频序列的统计建模出发,围绕黎曼度量学习研究展开以下四个主要工作:  (1)基于视频序列的线性子空间建模,提出了一种在格拉斯曼流形上的投影度量学习方法来解决视频-视频人脸识别问题。为了在以线性子空间为基本元素的格拉斯曼流形上进行判别学习,该方法提出一个从原始的格拉斯曼流形到一个新的、更具判别性的格拉斯曼流形的映射学习框架。为了求解这个度量学习问题,该方法采用类Fisher准则来定义相应的目标函数,并开发黎曼共轭梯度优化算法。  (2)基于视频序列的双阶统计量建模,提出了一种跨欧氏-黎曼度量学习框架来同时解决三种不同的基于视频的人脸识别问题,即视频-图像、图像-视频和视频-视频人脸识别。该方法采用双阶统计量(即均值和协方差)对视频数据进行建模,进而将这三种视频人脸识别问题统一形式化成欧氏数据和黎曼数据的匹配/融合问题。为了解决这一问题,该方法提出了一个统一的基于多视判别学习的异质度量学习框架将异质数据映射到一个公共子空间,从而实现了跨异质空间的距离计算。  (3)基于视频序列的高斯分布函数建模,提出了一种在对称正定矩阵流形上的对数欧氏度量学习方法来解决视频-视频人脸识别问题。该方法借鉴经典的信息几何理论将高斯概率模型所在的空间嵌入到一个特定的对称正定矩阵流形上,并在此流形上推导出一个基于切空间映射的对数欧氏度量学习框架来学习更具判别性的对称正定矩阵对数。该方法通过优化所提出的基于LogDet散度的目标函数来学习新度量学习问题对应的类马氏矩矩阵。  (4)基于视频序列的多种统计建模,提出了一种混合欧氏-黎曼度量学习框架来有效融合样本均值、样本协方差和高斯模型这三种统计模型,从而更有效地解决视频-视频人脸识别问题。为了减少高斯模型所在的空间与其它两种统计模型的空间之间的异质性,该方法同样首先将高斯分布的空间嵌入到一个对称正定矩阵流形上,然后通过设计一个基于LogDet散度的目标函数来学习多个马氏矩阵,从而达到多统计模型的有效融合的目的。  综上所述,本文针对基于统计建模的黎曼度量学习在视频人脸识别上的应用开展了广泛和深入的研究,提出了一系列在特定黎曼流形上的黎曼度量学习方法。大量实验结果表明,本文提出的方法可以有效地提升视频人脸识别的性能。
其他文献
JEFC义务教育新材料,强调教学以学生的发展为宗旨,重视学生的听、说、读、写综合素质的培养,强调对学生的素质教育。而师生间的情感是英语素质教育中的一个重要组成部分。它
实时功能磁共振可以通过采集BOLD信号快速获取和分析脑功能图像。实时功能磁共振成像的特点就是即时处理已获得的数据从而达到在线分析。作为脑-机接口的一种形式,通过它可以
为了改变教学习题配置的滞后性,走出数学解题教学的低效状态,有关教育专家纷纷呼吁“解决问题”配置考题,以问题解决为主导,引领学生经过分析、讨论将实际问题建成数学模型,
数列是高中数学的重要内容之一,也是高考的考查重点.而数列的通项公式,是研究数列的第一个环节,也是最重要的一个环节.有了数列的通项,问题研究起来就方便多了.数列通项公式
城市公共交通是与人民群众生产生活息息相关的重要基础设施。从我国人口密集、用地紧缺的国情出发,优先发展客运效率最高的公共交通是我国城市客运交通的主要发展方向,是解决
《普通高中课程标准实验教科书数学(A版)》已试行两个循环,深受好评.新教材紧跟时代发展,以生动活泼的呈现方式,激发学生学习兴趣,以恰当的问题引领、培养学生问题意识和探索
记者:目前,许多报刊出现了“滑坡”现象,听说(《资料卡片》今年的发行量却上升了,请介绍一下详情。郝耀华(《资料卡片》杂志社总编辑):《资料卡片》是一份资料性文摘半月刊,
本文介绍了一种新型舱体式防渔拖海床基,可布放在200m以浅海域进行长期、定点、连续、综合观测。该型海床基由坐底平台、浮体仪器舱和释放器等配件组成,可以搭载多种观测传感
语义Web和Web服务是当前热门的应用技术,而两者的结合——语义Web服务将在未来几年具有极大的应用前景。语义使得Web服务的自动发现和自动组装变得非常容易、高效,但是随之而来
虚拟现实技术是一门综合计算机图形学、多媒体技术、人际交互技术、人工智能、仿真技术等多门学科而发展起来的新技术。虚拟现实技术作为信息时代广泛应用的新技术近年来发展