基于深度学习的人脸关键点定位方法研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:fuzhuyuansu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人脸关键点定位目的是自动定位出人脸至关重要的部分,例如眼、嘴、鼻、眉毛、脸型轮廓等,其也是人脸跟踪、姿态估计、3D人脸重建、表情识别、人脸美颜、人脸识别等人脸应用的重要前提。尽管人脸关键点定位有很长的研究历史,但人脸关键点定位的性能仍受遮挡、光照、表情、姿态等不利因素的影响,为解决以上问题,本文提出了基于卷积神经网络的人脸关键点定位方法和基于沙漏网络的人脸关键点定位方法。本文的主要工作如下:(1)本文提出了基于CNN的人脸关键点定位方法,该方法以残差网络为基础,对其核心部分残差模块进行改进,提出了一种基于空洞卷积的瓶颈残差模块和一种基于注意力机制的瓶颈残差模块。通过基于空洞卷积的瓶颈残差模块融合不同感受野的特征图,扩大感受野并增强卷积神经网络的表征能力。通过注意力机制筛选人脸图像上重要信息,并抑制无用干扰信息。其次,本文采用堆叠基于空洞卷积的瓶颈残差模块和基于注意力机制的瓶颈残差模块的方式来进一步增强网络的性能,提高人脸关键点定位的精度和准确率。实验结果表明,利用300W公开数据集上的数据进行人脸关键点定位,该方法比原残差网络定位精度提升了6.45%,且超过了目前一些关键点定位方法。(2)本文提出了基于沙漏网络的人脸关键点定位方法,该方法借鉴在人体姿态估计中取得优异性能的沙漏网络来进行人脸关键点定位,由于原沙漏网络输入输出尺寸不一致会带来量化误差,本文对原沙漏网络进行一些修改,通过降低网络输入尺寸和增加上采样的次数来避免量化误差。进一步,本文改进了原沙漏网络的上采样方式,采用反卷积代替原始沙漏网络的最近邻插值。实验结果表明,利用300W公开数据集上的数据进行人脸关键点定位,该方法比原沙漏网络定位精度提升了5.2%,且超过了目前一些关键点定位方法。
其他文献
网格系统由大量异构资源组成,具有复杂、动态和自治等特点。高效的调度算法可以充分利用网格系统和处理能力,从而提高应用程序的性能。本文提出Segment Qos Min-Min RR任务调
成都电焊机研究所经过调整,其下属实业开发公司,制定了以研发脉冲微束等离子焊机及焊接工艺为主,以辅机具及工装夹具设计加工为辅的发展方向。确定了“技术专业、产品可靠、工艺
扇形文心兰(Erycina pusilla)是文心兰亚族原生种兰花,植株娇小,叶片扁平细长呈扇形排列,生长快速,幼年期短,成苗能够一年不间断的开放大而且形状特别的亮黄色花朵,花期终年
小儿胃食管反流 (GER)是由于小儿食管下端功能障碍引起的胃内容物及十二指肠内容物反流入食管。其常见并发症有反流性食管炎、食管狭窄和上消化道出血等 ,临床特征为顽固性呕
C4光合作用是很多重要的粮食及能源作物固定碳的方式。研究发现,C4植物的光能利用率比C3植物高50%。将C4光合途径引入水稻中,可以使水稻的光能利用率和产量提高50%,并且能够潜在
本文进一步研究文[1]中Ω单一化稳定性定理的无环条件。证明了(1)公理A自覆盖映射本身就满足无环条件的两个要求之一,即W~u(Ω_i)∩W~s(Ω_i)=Ω_i;(2)Ω单一化稳定的公理A自
随着互联网技术水平的不断提高,Web应用发展成为软件开发的一个主流方向,同时其本身存在的一系列安全漏洞也开始不断暴露,埋下了严重的安全隐患。鉴于此,本文基于Web安全性测
<正>远洋邦舍青年路项目位于北京市朝阳区平房桥,建筑面积12000平方米,是一个共享公寓和办公的集成项目。原有建筑为办公园区中的会所,但是建成后一直闲置,建筑空间的中央是
当今时代,翻译活动作为一种跨语言和跨文化的交际活动,得到了众多学者的广泛认同。而作为一种交际活动,就必然带有某种交际目的,达到某种交际活动的功能。因此,在20世纪80年代,功能翻译理论被德国的两位翻译理论家弗米尔和莱斯提出和创立,基于功能翻译理论而产生的目的论则作为其中最重要的理论之一,为翻译理论界开辟了一条崭新的道路。由于翻译研究方法的多样性和翻译对象的多元性,本文将文学作品中人物对话的翻译作为