基于深度卷积神经网络的人脸基准点定位研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:lvchao222
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人脸识别在安防、访问控制、人机交互和数字娱乐产业等领域有广泛的应用前景。目前,无约束人脸识别,即识别存在姿态、表情、光照和遮挡等变化的人脸图像,还没有完全解决,阻碍了人脸识别的进一步应用。无约束人脸基准点定位(UFLL:Unrestricted Facial Landmark Localization)或称为无约束人脸对齐,通过定位人脸基准点将人脸图像变换至一个标准姿态,能显著地降低识别难度,提高识别精度,是无约束人脸识别的重要处理步骤。无约束人脸基准点定位的关键是综合利用各个人脸基准点局部的纹理特征和全局的形状约束。深度学习,特别是深度卷积神经网络(DCNN:Deep Convolutional Neural Network),通过层级结构能有效地提取数据的高层语义特征,已经成功应用于多个计算机视觉领域。然而,因为训练耗时和有效的训练数据缺乏等原因,DCNN目前在人脸基准点定位领域的应用还相对较少。本文以无约束人脸识别为应用背景,以非特定人的无约束人脸基准点定位为研究对象,探索如何采用新的DCNN元素和训练方式进行人脸基准点定位,在提高训练速度的同时不降低性能,主要研究内容和创新性成果包括:(1)首次采用修正线性单元(ReLU:Rectified Linear Unit)、填充卷积层(PCL:Pad-ding Convolutional Layer)和局部响应归一化(LRN:Local Response Normaliza-tion)等新的模型结构元素构造DCNN应用于稀疏人脸基准点定位问题。并提出了基于同一数据增强程序的简便有效的多模型平均方法。采用直接回归方式训练各个DCNN。利用多层级联方式组合多个DCNN提升定位精度。该方法解决了已有DCNN级联算法训练耗时的问题,在不降低预测精度的前提下,相比同等规模的方法训练速度提升了五倍。并通过细致的实验说明了ReLU响应具有分布稀疏和生命周期稀疏的性质。(2)提出了迁移DCNN特征的算法框架,将人脸辨识任务上训练的DCNN迁移至稠密人脸基准点定位问题,将DCNN作为特征提取器嵌入至局部正则化的级联回归框架,解决了带标签的稠密人脸基准点数据较少,无法直接训练DCNN的问题。基于源域和目标域的相似性对迁移性能有巨大影响的假定,提出了级联迁移的DCNN特征迁移方法以充分利用级联框架的特点,并通过与直接使用、普通精调两种迁移方式对比,验证了该假定。级联迁移方法在300-W数据集上获得了和当时最好方法相当的性能。进一步,基于参数化修正线性单元(PReLU:Parametric Rectified Linear Unit)构造DCNN应用于提出的迁移框架,验证了该框架对不同模型结构具有适应性。(3)为了解决级联DCNN框架结构复杂和计算复杂度高的问题,采用批归一化(BN:Batch Normalization)构造DCNN以抑制训练时DCNN各层输入的数值范围的变化,从而更快速地训练网络;采用多任务学习方式,联合优化稀疏人脸基准点定位和头部姿态估计等问题,在多任务监督信号约束下学习表达能力更强的特征。然后将DCNN迁移至稠密人脸基准点定位问题。最终可采用单个网络直接进行稀疏或稠密人脸基准点定位,从而大大简化了算法框架,获得了较快的预测速度,并获得了和级联DCNN方法相似的定位精度。(4)实现了基于DCNN的人脸检测、人脸确认和人脸辨识算法,与本文提出的人脸基准点定位算法构成了完整的人脸识别系统。通过该系统在标准数据集上验证了本文提出的人脸基准点定位算法对人脸识别的促进作用。为后续继续研究基于DCNN的人脸识别算法提供了基础平台支撑。
其他文献
航空公司运营模式的演化可以从产品差异化角度来认识。航空运输需求的变化和增长,使得提供单一的同质性产品在市场竞争中难以获得竞争优势。航空运输业的演变呈现了从提供同
爱情是诗歌中一个永恒的主题,无论东方还是西方,诗歌中对爱情的吟唱回旋往复,不绝如缕。然而,不同时间,不同地域的爱情诗感情基调和表现手法却有着不同的风貌。本文以李商隐
目的探讨苯扎溴铵在体外对人膀胱癌T24细胞增殖和细胞周期的影响以及对细胞凋亡的诱导作用。方法采用MTT法、倒置相差显微镜和流式细胞术,研究不同浓度的苯扎溴铵干预24 h,对
随着信息技术的飞速发展,无线传感器网络正成为传感器领域内一个新兴的研究方向,它是一种全新的信息获取和处理技术。同时,随着无线传感器网络技术的成熟,普适计算也渐渐成为
本论文先从自读课文教学的三种错误的做法出发,然后结合部编版新教材关于自读课文教学建议,深入探究自读课文教学四大要点,同时结合自我的教学思考与实践,归纳出五种教学模式
本文探讨了现代美国传播学中“使用与满足说”的理论发展的深层意义。本章认为 ,这一模式的产生及其演变反映出与媒介效果研究紧密相关的受众问题的一个变化 :从以传播者的意
<正>今年再教六年级数学,转眼又到了百分数这一章节。那什么是百分数?书本上是这样定义的":表示一个数是另一个数的百分之几的数叫做百分数。"这样的定义既表明了百分数是表
4月6日,尚德机构公布一季度的营收为4.42亿元,尚德机构创始人欧蓬表示,2014年尚德机构的年营收是3亿元,减去获客成本,亏损2亿元。2015年尚德机构年营收是5.5亿元,2016年的年营收是8
报纸
白癜风是常见的皮肤色素脱失性疾病,目前尚无治愈方法。临床主要治疗方式有药物治疗、光疗、脱色、遮盖疗法和手术治疗。本文综述白癜风临床常用治疗药物以及新药应用评价进
本文通过对一则案例的分析,对进口商在信用证支付方式下面临的各种风险进行归纳说明,并提出了避免和解决买方面临风险的若干措施。