基于多任务级联CNN与度量学习的人脸识别研究

来源 :新疆大学 | 被引量 : 0次 | 上传用户:xiaomi1028
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会的不断进步和快速有效的自动认证的迫切要求,生物识别技术近几十年来发展迅速。人脸识别是一种基于人脸特征信息的生物识别技术。它在可靠性和稳定性方面优于其他生物识别技术,并且被侵犯的可能性较小。传统人脸识别算法中的特征提取主要有主成分分析法(principal component analysis,PC A)、局部二值模式(Local Binary Pattern,LBP)、Gabor变换、HOG方向梯度直方图特征等。这些特征提取算法都有不错的实验效果,但这些算法采用人工设计的特征,不但介入了主观因素,而且在大数据条件下,难以提取人脸特征,导致泛化能力下降。经验所知,传统算法只能适用小型人脸库。现今处于大数据时代,要识别的人脸是成千上万张,且每个人的人脸千差万别,复杂多样,而深度卷积神经网络(Deep Convolution Neural Network,DCNN)具有非线性描述能力,因此,人们将深度学习引入人脸识别技术领域中。然而,当今社会的人脸识别技术又面临了许多挑战,主要有:由于光照、遮挡、姿态、表情、尺度等非限制性的复杂场景下导致的人脸类内差距增大,类间差距缩小问题;计算复杂度高、模型收敛速度慢等问题。针对以上问题,本文做了以下研究:第一,人脸检测算法研究。在人脸识别系统的前端通过各种图像预处理(把人脸检测与对齐也当作图像预处理的一部分)来矫正人脸的姿态、位置,去掉人脸图有背景环境的部分,把各个人脸图大小统一化,这样使类内距离缩短,使类间和类内区分度加大。实验表明,和原始数据集相比人脸检测对齐之后的数据集识别率有所提高,且用mtcnn算法做人脸检测对齐比用DLIB效果要好。第二,人脸识别算法研究。在人脸识别模型的损失函数部分采用度量学习的方法(通常用欧氏距离)进行类间类内距离计算,通过L2和三元组损失函数的相结合反向BP传播来训练以及优化人脸识别模型,之后用embedding嵌入学习来降低模型输出的特征维数。实验表明,人脸识别模型通过度量学习使特征更具有区分能力。第三,两种度量学习的对比研究。由于用三元组损失训练的模型收敛速度较慢,为了降低三元组运算量大的问题,提出了用softmax损失函数和中心损失函数的相结合反向BP传播来训练以及优化人脸识别模型。和三元组损失相比,用中心损失可以达到同样的实验效果,且容易实现。
其他文献
<正>传统的哺乳母猪饲喂方式是在其断奶前减少日喂料量,理由是防止母猪发生乳房炎;而现代的瘦肉型哺乳母猪饲喂方式是断奶前不减少日喂料
传统的图像增强算法在增强图像的同时不可避免地也提高了噪声,因此需要进行降噪处理。小波分析是目前国际上最新的时间频率分析工具,它可以将交织在一起的混合信号分解成不同
<正>今年2月底,教育部"破天荒"地在一所高中现场召开了月度例行发布会,面向中央媒体专题介绍了北京十一学校的教育改革。之所以"破天荒",是因为教育部从以往自上而下地发布和
汽车现在已经成为人类社会必不可少的、便捷的交通工具和一个国家现代化程度的重要标志。我国汽车工业的发展速度非常惊人,近几年以20~30%的增幅增长,与此同时我国的汽车保有
风量是煤矿主要通风机性能的关键技术指标之一,也是煤矿日常通风管理的重要参数。提出了静压差法测试煤矿GAF型主要通风机风量的方法,介绍了静压差法测试方法的原理和关键量
目的:⑴探讨2型糖尿病(T2DM)患者轻度认知功能障碍的特点和认知功能下降领域。⑵探讨T2DM合并轻度认知功能障碍的影响因素。⑶探讨胰岛素抵抗程度、血清IDE、ADP水平对糖尿病
针对混凝土泵车臂架3严重开裂原因进行了综合分析,结果表明,该臂架开裂属于低应力疲劳开裂。疲劳开裂主要来源于泵车结构件在长时间下承受交变载荷以及其不合理的结构。经过
本论文所依托国家高技术研究发展计划863项目《新一代智能化交通控制系统关键技术研发》(课题编号2006AA11Z228),《山东省公路网智能化信息管理系统研究》的子课题“山东公路
阻塞性黄疸(OJ)是指由于肝外胆管或肝内胆管阻塞所致的黄疸,常见原因包括结石、肿瘤、炎症、寄生虫与先天性畸形等;其可导致机体多器官的损害以及相应的病理改变,最常见的是肝
毛泽东农民教育思想是毛泽东教育思想的重要组成部分,具有丰富的内容和严密科学的体系。毛泽东农民教育思想诞生于半殖民地半封建的旧中国,立足中国国情,历经新民主主义革命、社