基于热图回归的人脸关键点检测算法研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:onlymeley
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人脸关键点检测是计算机视觉领域一个很重要的课题,诸多人脸分析任务都依赖于精确的人脸关键点定位,比如表情识别、头部姿态估计、人脸合成等。随着近年来深度学习的发展,人脸关键点检测已经取得了极大的进展,但是在无约束环境下,由于姿态、遮挡等挑战的存在,人脸关键点检测依旧是个难题。目前基于深度学习的人脸关键点检测算法可以进一步细分为两类:一类基于坐标回归,由神经网络实现从图像到数值坐标的直接映射;一类是基于热图回归,实现从图像到热图的映射,再从热图推断数值坐标。基于热图回归的检测方法空间泛化能力强,精度较高。本文基于热图回归,对人脸关键点检测算法进行了深入研究,主要提出了:(1)一种基于改进沙漏网络和样本均衡的人脸关键点检测算法。使用了一种改进的堆叠沙漏网络结构,可形变卷积的采用使得网络具有自适应的感受野;设计了一个新的基于样本均衡的逐像素焦点损失函数,根据头部的姿态角来对样本赋予不同的权重,使得该算法具有姿态鲁棒性。(2)一种基于轻量级网络和形状约束的人脸关键点检测算法。设计了一种轻量级的网络结构,同时结合了注意力机制和由粗到精的中间监督方式。设计了一个基于形状约束的数据后处理模块,对人脸关键点检测结果做进一步校正,依据基于热图回归的输出概率来将关键点划分为可靠和不可靠两种,并利用训练集所构建的精简的形状字典,根据检测结果中可靠的人脸关键点来重新推断不可靠的人脸关键点,使得该算法具有遮挡鲁棒性。公开数据集上的实验结果表明,与具有代表性的同类型方法相比,上述两种算法在约束环境和无约束环境下均取得了良好的效果,验证了算法的有效性。
其他文献
传统方法一般将通信物理层问题建模成特定的数学模型,使得通信过程具有一定的可解释性。但在有些复杂场景下,通信问题难以精确建模,或者建立的模型过于复杂,增加了算法复杂度,难以支撑低时延的约束。而近年来,基于数据驱动的深度学习技术在通信系统中的应用也逐渐成为当前的研究热点。深度学习技术具有强大的表征能力,可以从大量的训练数据中学习到数据分布间的复杂关系,且分布式和并行计算的架构保证了其高效的计算处理能力
运动捕捉技术是一种将被观察目标的运动姿态信息转化为具体的数字化信息,通过数字化信息还原姿态的技术。可应用于康复训练、智能机器人和虚拟现实等人机交互领域。本文采用基于微机电系统(MEMS,Micro-Electro-Mechanical System)的惯性传感器研究和设计了一套运动捕捉装置,本次设计的运动捕捉装置从结构上分为三部分:传感节点、数据汇聚节点以及计算机终端。整体的数据传输网络结构采用改
人们对通信传输速率和系统容量的需求持续增长,给有限的频谱资源带来了巨大压力。目前主流的解决方案有两种,一种是探索更多的频谱资源,另一种是提高频谱效率。全双工(Full-Duplex,FD)通信技术能够使通信设备在同一频段上同时进行通信,理论上能够实现频谱效率的倍增,在第五代移动通信(The fifth generation mobile communication technology,5G)和未
水声传感器网络(Underwater Acoustic Sensor Networks,UASNs)作为获取大规模海洋信息的重要手段,已广泛应用于海洋监测、资源勘探、灾难预防和战术监视等诸多领域。由于水声信道的长传播时延、高误码率、链路频繁中断等特点,UASNs在数据传输可靠性方面一直面临着重大挑战,传统的传输控制协议/网际协议(Transmission Control Protocol/Inte
集成电路工艺制程十分复杂,在整个制造过程中会出现很多系统性工艺故障,及时地定位和解决这些故障能够保证集成电路的良品率和产品质量。不同的系统性工艺故障会在晶圆图上形成不同的故障图案,因此,可以通过对晶圆图故障图案(Wafer Map Defect Pattern,WMDP)进行分类来定位工艺故障。这也一直是学术界和工业界关注的一个热点,这种方式也被称为晶圆图故障图案识别(Wafer Map defe
近年来,深度卷积神经网络(Convolutional Neural Network,CNN)在计算机视觉任务方面取得了显著的成功。然而,CNN通常会产生大量的计算和存储消耗,从而阻碍其在移动和嵌入式设备上的部署。为了解决这一问题,许多研究工作都集中在压缩CNN的规模上。模型压缩作为一种可以通过降低深度神经网络冗余度来减少网络模型的存储大小、加快其运行速度的新兴研究领域,被广泛应用于诸如物体识别、分
表型数据是虾育苗优选过程中重要的观测指标,目前主要采用人工方法测定,测量过程不仅效率低,而且采集的表型数据有限。如何高效地获取虾的表型数据一直困扰着育种界。另外,虾类育种优选过程中需要分清楚每只虾的家系,目前只能采用人工方式来进行家系的分类,这严重限制了虾类的育种优选过程。近年来,深度学习算法以优异的性能和应对复杂场景的鲁棒性,在各个工业领域都发挥了巨大作用。因此,本论文以南美白对虾为研究对象,致
本文以民法典第五百三十六条为中心,以债权人的债权是否到期、代位权是否经人民法院认定为标准,将破产程序中债权人代位权行使划分为4种类型。无论是哪种类型,债权人均可以自己的名义申报破产债权;破产程序中债权人代位行使之债权的性质、数额和范围,与通常情况下债权人代位权行使的范围并无本质差别;在代位申报债权确认方式的问题上,因代位权诉讼是一种独立的诉讼类型,破产程序关于债权的确认程序无法吸收合并代位权诉讼程
期刊
随着移动设备应用程序的日益复杂和处理器功耗密度的不断增加,功耗和热问题已经成为了智能移动端的处理器设计中的主要问题。动态调频调压技术(Dynamic Voltage and Frequency scaling,以下简称DVFS)是现代处理器中最常用最有效的系统级电源管理方法之一。但目前智能移动设备操作系统中的DVFS策略考虑的因素较为单一,大部分只考虑处理器当前的负载,这很难实现高效全面的电源管理
随着5G技术的逐步普及以及6G技术的深入研究,越来越多的高速移动场景开始对移动网络提出了更高的要求,即通信链路既需要满足低误码的高通信质量,又需要满足高速率的高通信效率。对此,自适应链路相关的技术逐渐成为研究者们日益关注的研究热点。然而,高速移动场景下的信道与低速信道有着很大的不同,信道各项参数在短时间内快速变化,传统的信道估计难以以低代价实现对快变信道的准确跟踪。而自适应链路技术的重要基础之一就