基于生成对抗网络的人脸表情合成研究

来源 :河北工业大学 | 被引量 : 0次 | 上传用户:yy4733
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人脸表情合成作为图像处理领域的重要技术,广泛应用于电影、虚拟现实、游戏以及刑侦等各大领域。传统的人脸表情合成算法系统复杂,需要表情获取和跟踪设备以及大量的计算力进行运算,基于深度学习的人脸表情对抗生成网络解决了传统方法存在的上述问题,但存在合成的人脸图像表情撕裂、模糊,合成的人脸视频表情不连续、视频闪烁等问题。本文研究了深度卷积神经网络框架和生成对抗网络相关理论,针对人脸表情合成领域的一些挑战性问题,提出了相应的解决方法,本文主要研究内容和创新点如下:(1)对于人脸表情图像合成中出现的表情撕裂、模糊等问题,提出了人脸表情图像合成框架Face GAN和基于视觉注意力机制的结构相似性度量指数损失函数。首先提取驱动人脸的面部特征并构造表情特征图,然后将表情特征图与原始的目标人脸图像共同输入到Face GAN网络,并在Face GAN中分别用两个特征编码器对表情特征图和目标人脸图像的特征进行编码,以便融合二者特征进行表情图像的合成;最后利用基于视觉注意力机制的结构相似性度量指数损失函数计算图像的训练损失,用以减少表情撕裂和模糊的问题。(2)对于表情视频合成中表情不连续的问题,提出一种基于递归双生成对抗网络的人脸表情合成框架,Face GAN用于生成种子图像,Fine GAN用于保留视频特征。在递归合成时,首先进行深度人脸特征的提取并合成表情特征图,将其作为监督信号,利用Face GAN合成人脸表情种子图像;然后使用合成的种子图像和原始目标人脸一起作为输入,在Fine GAN中合成特征保持图像,作为当前帧的输出,同时该特征保持图像也作为下一帧种子图像生成的输入;最后,使用串联的Face GAN和Fine GAN递归进行下一帧图像的生成,多次递归得到与原始输入表情一致的特征保持人脸表情视频序列。在CK+和MMI数据集上的实验证明,本文提出的图像合成方法能够合成真实感强的表情图像,同时能够避免表情撕裂和模糊的问题,在视频合成中,本文提出的方法能够合成清晰自然的人脸表情视频帧,解决了表情视频帧合成中出现的表情不连续或视频帧间闪烁的问题,且在目标人脸形状和驱动的情特征图像有较大形状差异时具有鲁棒性。
其他文献
数据的相似度计算是大数据分析技术的一个最常见的操作。目前,传统的相似度计算的相关模型主要有,向量空间模型、主题模型、潜在语义LSA(Latent Semantic Analysis)模型以及H
随着时代的不断进步,人们对图像的要求越来越高,快速获取高精度的图像已成为当前的发展趋势,因此,对光学CT图像重建的要求也不断提高。近年来,将BP神经网络算法应用于光学CT
秦皇岛市作为全国著名旅游胜地,地理环境优越、气候适宜,为休闲农业发展带来了得天独厚的条件。发展休闲农业有利于拓展秦皇岛市旅游业的发展潜力,是实现乡村振兴战略的有效途径,能进一步提高农村人居环境水平、增加农民收入、提高乡村知名度,不断增强农民的幸福感和获得感。本文根据秦皇岛市休闲农业发展的现状,结合国内外发展经验,分析秦皇岛市休闲农业发展存在的问题,通过理论分析和实地调研提出发展秦皇岛市休闲农业的对
随着CT重建技术应用越来越广泛,对其重建速度和精度要求不断提高,所以对其算法要求也不断提高。特别是对于复杂场,改进的联合代数重建算法,虽有较高的重建精度,但它需要反复
本文主要研究下列带外力项Euler方程与Vlasov-Fokker-Planck方程耦合方程组(EVFP方程组)的柯西问题,文章共分三章.第一章介绍了方程组的物理背景,研究意义及已有的相关模型的
由于世界各地的化石燃料资源枯竭和环境问题,社会正将目光投向可再生能源。其中,生物质是一种较为廉价的能源。通过生物质的热解可生产生物油,而生物油的催化改质可生产液体燃料。木质素衍生的酚类化合物的催化加氢脱氧(HDO)是用于生产液体燃料最有前途的途径之一。本论文利用蒸氨(AE)法合成了具有层状硅酸镍(Ni-PS)的二氧化硅负载Ni的双功能催化剂(Ni/SiO_2)。考察了不同还原温度对催化剂催化性能的
在中国东南部的福建沿海存在一条与内陆许多变质地体明显不同的变质带——长乐—南澳变质带。前人研究已表明长乐—南澳变质带是一条大型的中生代韧性剪切带。该构造带南段的
电力系统包括发、输、配、用四个环节,变压器是输电与配电环节中的主要设备,其功能是对电能的电压进行转换,使得电能在输送和分配过程中更加的高效和经济。近年来,国民经济的快速发展使得居民和工业用电量不断地增长,变压器的容量和损耗越来越大,随之而来的变压器过热问题也引起越来越多的关注。过高的温度导致变压器损耗进一步增加,加速绝缘材料老化,带来安全风险的同时也降低了电能传输效率,影响电力系统运行的经济性。片
局域表面等离子体共振(LSPR)因为其独特的性质,如表面局域和近场增强,可广泛用于生化传感、数据存储、薄膜太阳能电池、以及纳米尺度的光学器件等领域。本文根据LSPR的基本特
【目的】外伤导致的周围神经损伤,在接受手术重建后功能恢复效果常不理想,寻找有效的辅助治疗方法十分必要。低强度脉冲超声被证明能通过促进营养因子表达而促进坐骨神经损伤的再生及功能恢复。4-氨基吡啶作为一种钾离子通道阻滞剂,被证明能促进坐骨神经损伤再生及功能恢复。本研究将低强度脉冲超声联合4-氨基吡啶应用于坐骨神经损伤大鼠模型,来评估二者对坐骨神经损伤再生的联合治疗效用,并初步探讨其作用机制;【方法】1