基于深度学习的人脸及行人识别算法研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:zhezhe_1207
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人脸与行人识别是生物识别与安全技术领域中的关键技术。实际应用中,由于光照、姿态、模糊、低分辨率、遮挡等因素的影响,人脸与行人数据往往包含着多种噪声,并由此带来较大的类内差异,给识别性能造成重大影响。  本论文的主要工作集中于解决人脸与行人识别中存在的这些困难问题。具体来说,本文主要对基于深度学习的人脸识别算法和行人再辨识算法进行改进并提出相关新方法,其主要贡献点可归纳为以下几点:  基于自编码算法,提出了将自我重建的训练目标推广至同类样本之间的相互重建,称之为类编码算法。该算法为网络的训练提供了高维特征空间中更有效的类内约束。此外,还将类内的相互重建从数据层改进至特征层,从而使得训练过程对图像噪声和平移具有鲁棒性;并与深度卷积神经网络结合组成深度类编码网络,从而学习到兼具鲁棒性和鉴别性的人脸特征,用于非限制人脸识别。  针对监控视频条件下人脸识别中存在的人脸图像异质性以及标记的训练数据量太小的问题,提出了基于多网络多任务的深度学习算法用于监控人脸识别。首先在大规模的非限制人脸数据上进行网络预训练,然后在目标监控人脸数据上进行微调。其次,网络结构全部采用卷积层,去除全连接层,从而将网络参数量控制在一定范围内。因此,过拟合问题得到很好的解决。此外,多网络的输出在特征层进行融合从而获得更具鉴别性的特征。同时,采用人脸姿态虚拟生成对注册集数据进行增广,从而增强对姿态的鲁棒性。基于以上改进,该算法在监控人脸识别上取得较好的性能,并且在ICB-RW2016竞赛中获得第三名。  针对跨模态人脸识别中显著的异质性,提出了异质联合贝叶斯度量学习算法。该算法通过对异质人脸数据的注册集和待验证集的数据分布分别建模,能够学习得到非对称的度量,适用于像近红外对可见光的跨模态人脸识别。由于注册集和待验证集的不同分布建模,数据的异质性能够充分参与计算。该算法在多个跨模态人脸识别数据库中超越了现有算法的性能。  行人再辨识中,行人数据存在较大的类内差异,导致深度学习的训练受到较大影响,限制其最终性能。针对这一问题,提出了温和正样本挖掘算法,在训练的过程中对训练集难度适中的正样本进行挖掘,从而使得网络收敛更稳定,性能得以提升。另外,还提出了训练中的权重约束,有效地防止了网络的过拟合。基于这些改进,该算法在多个行人再辨识公开库中显著地提升了现有算法的性能。  总结而言,本论文主要贡献在于,提出多个基于深度学习的人脸识别和行人再辨识算法,对现有算法在理论和实际应用上提出创新方法和改进方法,提升了算法性能。
其他文献
电子罗盘能够利用地磁场来精确测量方位角,因此它在航空航天、航海、浮标、水下定向、钻井设备、机器人定向、陆地天线、气象中的风向仪、地震监测等领域有着广泛的用途。目
学位
随着大数据时代的发展,音频内容分析对海量数据的存储和利用有着越来越重要的作用,但目前存在的声学特征已经无法很好地表征日渐复杂的音频内容,也无法满足人们越来越高的分类精
多尺度几何分析也称后小波分析,是图像系数分解发展的一个分支,包含了目前最新的调和分析和稀疏逼近的发展趋势。在数学分析、计算机视觉、图像处理、模式识别中多尺度一直扮
减摇鳍自1889年问世以来,无论是在船舶减摇上还是在水下机器人作业中其优越性能是显而易见的。为此对于仅依靠改变壁面形状就能提高升力的变形减摇鳍升力模型的建立对今后减
精细化短临降雨预报(约1公里×1公里空间分辨率、6分钟时间分辨率,0-2小时预报)对奥运会、阅兵等大型公务活动、航天器发射等科研活动、农业灌溉、水利发电、洪涝灾害预警等方面
运动目标的检测的研究内容包括视频或图像序列的采集、图像处理、目标位置的确定、目标的识别、目标运动的跟踪等。运动目标检测需要分割前景目标和背景图像,检测图像中的运
经过近二十年的发展,我国的医疗机构信息化建设已经取得了长足的发展,各地已建成了不同规模的医疗信息系统以实现医疗信息的数字化管理。然而由于医疗系统的主要功能是提供医
本论文研究了Hammerstein系统的子空间辨识方法(SIMs),主要的问题集中在秩的限制及相关的维数问题。本论文分析了秩的限制对子空间辨识方法统一框架的三个步骤所产生的影响:
多率现象在过程工业,特别是化工过程中普遍存在。由于技术、资金或环境等条件的限制,过程数据的采集常呈现出多频率的特性,采用常规的单率控制策略无法快速抑制来自输入信号、过
融合了移动机器人可移动性和机械臂可操作性的移动机械臂,比非操作型的移动机器人或工作范围受限的机械臂拥有更多的自由度和更广的操作空间,是近年来机器人领域的研究热点。移