论文部分内容阅读
在虚拟现实、图像处理等技术快速前进的情况下,表情移植技术也逐步吸引图像及视频领域研究者的目光。本文主要研究基于特征点差向量的表情移植方法,其中涉及到卷积神经网络、递归神经网络及表情映射算法等技术。特征提取是表情移植过程中非常重要的一步,相比传统算法,卷积神经网络在处理特征提取时可避免由初始人脸引起的定位误差,但目前的卷积神经网络普遍以越深的网络提取更为精确的特征点的趋势搭建,这将导致较大的计算复杂度。此外,卷积神经网络无法预测存在时序关联的特征,如:头部、眼神特征信息,而递归神经网络可提取时序关联的特征信息,因此本文着重研究如何充分结合二者优势解决同时提取时序关联和非时序关联特征的问题。为了实现人脸移植效果,将提取出的3D特征数据重建为人脸三角网格,并根据三角网格计算控制动画人脸表情变化的形变系数。针对整个实现过程存在的问题,本文在标准卷积网络中引入一种轻量级结构并将其改进为三维模型,并且提出一种新的复合型结构以解决如何结合两大模型的问题,同时提出使用一种表情移植算法实现将初始人脸的表情移植到某个动画人物模型面部的效果。在实验环节,由于目前公开的面部、头部、眼神的3D数据集较少,本文标注了训练及测试模型所需的数据集,实验结果证明本研究提出的算法可快速实现较为真实的追踪效果。本文主要内容如下:(1)本文梳理了人脸表情移植技术的实现方法及近几年的发展情况。阐述了人脸表情移植技术的基本流程,分析和研究了现有的面部特征提取技术、头部及眼神的特征信息提取技术以及数据映射技术的研究现状与可改进之处。(2)通过对人脸特征提取技术的分析,本文设计出一个轻量级卷积神经网络(Light-Weight Convolutional Neural Network,LW-CNN),该模型基于可分离卷积结构搭建,能以较少的参数提出较为精确的特征,计算复杂度大大降低,主要用于人脸3D特征点的提取。为增强特征提取的精确度,在模型提取特征之前先采用一个基于倒三角结构的人脸检测方法对训练集中的图像进行人脸框检测。(3)考虑到表情移植效果的真实性,本文基于LW-CNN模型搭建出一个复合模型,即复合型递归卷积神经网络(Hybrid Recurrent Convolutional Networks,HRCNs),该模型考虑到LW-CNN在提取非时序关联信息上的精确性与快速性以及LSTM模型在处理时序关联信息上的有效性搭建而来。为评估HRCNs模型的性能,本文从两个角度对算法的精确度展开测试,分别为归一化均值误差和均方根误差,最终实验结果证明本算法可以提取出较为精确和稳定的特征点。考虑到算法应用的广泛性,本文采用基于特征点差向量的表情映射算法实现表情移植,最终被映射人脸可清晰展示出较为细微的表情变化。(4)由于公开的3D人脸数据集较少,本文标注了训练模型所需的3D人脸数据集,其中标签文件包括面部68个特征点、左右两眼及头部姿势特征信息,最终共准备了4万张左右的人脸数据。