面部表情建模及映射技术合成研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:skyfis
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在虚拟现实、图像处理等技术快速前进的情况下,表情移植技术也逐步吸引图像及视频领域研究者的目光。本文主要研究基于特征点差向量的表情移植方法,其中涉及到卷积神经网络、递归神经网络及表情映射算法等技术。特征提取是表情移植过程中非常重要的一步,相比传统算法,卷积神经网络在处理特征提取时可避免由初始人脸引起的定位误差,但目前的卷积神经网络普遍以越深的网络提取更为精确的特征点的趋势搭建,这将导致较大的计算复杂度。此外,卷积神经网络无法预测存在时序关联的特征,如:头部、眼神特征信息,而递归神经网络可提取时序关联的特征信息,因此本文着重研究如何充分结合二者优势解决同时提取时序关联和非时序关联特征的问题。为了实现人脸移植效果,将提取出的3D特征数据重建为人脸三角网格,并根据三角网格计算控制动画人脸表情变化的形变系数。针对整个实现过程存在的问题,本文在标准卷积网络中引入一种轻量级结构并将其改进为三维模型,并且提出一种新的复合型结构以解决如何结合两大模型的问题,同时提出使用一种表情移植算法实现将初始人脸的表情移植到某个动画人物模型面部的效果。在实验环节,由于目前公开的面部、头部、眼神的3D数据集较少,本文标注了训练及测试模型所需的数据集,实验结果证明本研究提出的算法可快速实现较为真实的追踪效果。本文主要内容如下:(1)本文梳理了人脸表情移植技术的实现方法及近几年的发展情况。阐述了人脸表情移植技术的基本流程,分析和研究了现有的面部特征提取技术、头部及眼神的特征信息提取技术以及数据映射技术的研究现状与可改进之处。(2)通过对人脸特征提取技术的分析,本文设计出一个轻量级卷积神经网络(Light-Weight Convolutional Neural Network,LW-CNN),该模型基于可分离卷积结构搭建,能以较少的参数提出较为精确的特征,计算复杂度大大降低,主要用于人脸3D特征点的提取。为增强特征提取的精确度,在模型提取特征之前先采用一个基于倒三角结构的人脸检测方法对训练集中的图像进行人脸框检测。(3)考虑到表情移植效果的真实性,本文基于LW-CNN模型搭建出一个复合模型,即复合型递归卷积神经网络(Hybrid Recurrent Convolutional Networks,HRCNs),该模型考虑到LW-CNN在提取非时序关联信息上的精确性与快速性以及LSTM模型在处理时序关联信息上的有效性搭建而来。为评估HRCNs模型的性能,本文从两个角度对算法的精确度展开测试,分别为归一化均值误差和均方根误差,最终实验结果证明本算法可以提取出较为精确和稳定的特征点。考虑到算法应用的广泛性,本文采用基于特征点差向量的表情映射算法实现表情移植,最终被映射人脸可清晰展示出较为细微的表情变化。(4)由于公开的3D人脸数据集较少,本文标注了训练模型所需的3D人脸数据集,其中标签文件包括面部68个特征点、左右两眼及头部姿势特征信息,最终共准备了4万张左右的人脸数据。
其他文献
百年前的五四运动,标志着中国民主革命进入了一个崭新的历史阶段,这一时期不仅是近代中国历史上思想最活跃的时期,也是中国先进知识分子寻求救国救民道路的历史时期,先进的知
多传感器标定技术作为计算机视觉中的一个研究分支,在许多需要三维重建的领域有着重要的应用价值。在计算机视觉中,为了从采集图像中获得待测物的三维几何数据,需要建立图像像点和物体表面的三维位置关系,即需要对视觉传感器标定以获得成像系统模型参数,因此标定的精度对后续的三维数据处理和重建精度影响巨大。此外,在进行目标物体全表面三维信息采集时,需要搭建多传感器的视觉系统,而多传感器标定过程如何降低标定误差,提
离线手写签名认证是一种利用个人书写习惯中的特有规律进行身份认证的方法,具有方便、可靠且易于被人们接受等特点,在司法、金融、商务以及政务等领域具有广泛的应用前景。近年来,离线手写签名认证领域的研究取得了众多成果,但由于真实签名与熟练伪造签名之间的差异较小以及训练样本库规模受限等难点,离线手写签名认证算法研究仍具有较大的挑战性。本文针对熟练伪造签名与真实签名的认证进行了深入研究,在此基础上提出了一种基
科技基础设施作为科技活动的重要物质基础条件,同时也是科技研究开发的物质、信息保障。近年来,在经济增长和国际竞争力的提升中,科技创新的核心作用日益突出,科技基础设施建设也日益重要。跟科技发达国家相比,科技基础设施发展滞后严重制约着我国现阶段科技创新的发展。因此,在当前新技术革命发展趋势下,改变我国技术创新现状,则需要不断加强科技基础设施建设,加快技术和技能积累,不断提升自主创新能力。由于大多数科技基
行人再识别,是指在多摄像头无重叠域的监控环境中,通过一系列的图像处理和模式识别技术,在多个摄像头下寻找某个感兴趣的目标。但是由于视频监控中的一些限制,如摄像头得到的
柏拉图的城邦规划是一种理性方案。各异的习俗代表了人类各种主观意志的集合,与理性至善方案背后的普遍性价值理念相斥。在《理想国》中,柏拉图就明确拒斥各种习俗性意见,反
无线体域网(Wireless Body Area Networks,WBANs)又称体域传感器网络或生理医疗传感器网络,是多种远程医疗监测应用的核心组成部分。在面向医疗卫生相关领域中,利用WBANs对人
目的:系统评价和比较宫腔镜检查和经阴道超声检查对子宫内膜增殖症的诊断价值。方法:检索Pub Med、Medline、中国知网、生物医学文献数据库、万方中文数据库、维普数据库、we
研究背景与目的腰痛(Low Back Pain,LBP)是现阶段临床上最为常见的几种慢性疾患之一,严重影响患者的日常生活,对患者造成生理和心理的损伤,并且给社会和患者带来巨大的经济负担
随着移动通信和智能终端的快速发展,通信网络的覆盖广度和深度不断升级,网络节点的部署密度日益提高,这导致网络的能量消耗呈爆炸式增长。因此,采取有效的节能措施来降低通信