基于运动捕捉的轻量级人脸动画实时驱动研究与实现

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:sduheaven
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
面部动作追踪与动画驱动已经广泛的应用于影视、游戏、娱乐等行业中,主要依赖硬件设备捕捉并提取面部的动作,包括头部姿态、面部表情和眼球方向等,将这些运动参数映射到3D模型中,从而实现人脸动画的驱动。在影视行业中,对准确度的要求非常苛刻,依赖十分复杂的图像采集设备,例如多目或深度摄像头等,并且有需要人工操作的前后期处理过程;相反,应用于娱乐行业的方法,对实时性要求非常高,使用精简的方法仅提取极少的面部动作特征,虽然保证了实时性,但对动画细节的处理十分粗糙。针对以上问题,本文提出了一种基于运动捕捉的轻量级人脸动画实时驱动方法,使用单目摄像头同时提取头部姿态、面部表情与眼球朝向三个面部运动特征,并实时的驱动3D面部模型,完美的平衡模型的准确性、实时性、稳定性和模型的大小,能够在消费者级别的设备中实现实时的动画效果。首先,本文提出了一种基于注意力机制的多任务学习方法,同时对头部姿态、面部表情和眼球朝向三个特征进行学习,额外增加了共享层进行特征提取,每个子任务使用注意力机制提取当前任务关心的特征,并且提出了一种多任务权重动态分配方法,动态计算各个子任务损失值的权重,很好的平衡了特征提取的准确度和速度;其次,为了提升模型计算与动画驱动的速度,提出了一种新型的轻量级网络模块,有效降低了模型参数的数量,并且在驱动3D面部模型时,利用计算着色器加快Blendshape的计算速度;针对眼球追踪稳定性差的问题,提出了一种基于视频的眼球追踪矫正模型,有效的保证了相邻视频帧眼球朝向的稳定性。基于上述三个创新点,本文构建了一个轻量级的人脸动画实时驱动框架—RDLFA,该框架提供了基于运动捕捉的轻量级人脸动画实时驱动的完整解决方法,使用该框架本文设计并实现了人脸动画实时驱动系统。通过系统测试,该系统可以实时、准确、稳定的实现面部运动追踪与动画驱动,具有较好的消费者级别应用价值与娱乐色彩。
其他文献
边缘缓存技术通过在无线网络的边缘节点缓存部分业务内容对象,可以实现部分用户请求的本地响应,减少请求内容的传输时延,提高用户体验,均衡网络负载。内容推荐技术根据各用户对不同主题内容的兴趣和偏好设计个性化的内容推荐列表,引导用户对特定内容进行请求,提升用户对相关业务的依赖性和满意度。因此,将无线网络边缘缓存和内容推荐进行联合设计,能够通过内容推荐引导用户对缓存内容进行请求,从而进一步提升边缘缓存效用和
差分进化算法(DE)作为一种新兴的基于种群的随机优化算法,由于其操作简单、鲁棒性强和控制参数少等优点,自从出现以来便快速吸引了来自不同领域的研究人员的关注。然而,传统的差分进化算法在解决复杂问题时往往会表现出早熟收敛和收敛速度慢等缺点。因此,开发了许多DE变体来改进其优化性能。反向学习(OBL)是机器学习中的一种新概念,其灵感来源于现实世界中实体之间的对立关系。许多软计算算法的性能通过使用反向学习
自改革开放以来,我国市场经济日益繁茂,各类市场主体数量迅速增长。然而目前的市场监督管理体系还在沿用传统流程,不仅难以应对如此庞大的企业数量,还包含一些不必要的人工环节,如制订检查方案、抽取企业和执法人员等等环节,其抽取结果由人为操控,因而存在徇私舞弊、选择性执法、执法扰民等等问题。除此之外,如何对企业进行筛选,使得检查更加高效、有的放矢,也是一个亟待解决的问题。随着网络信息技术的高速发展,许多传统
现有的关系抽取方法大多使用关系分类模型,其无法有效获取文本中蕴含的新型关系。为了缓解这一问题,开放式关系抽取应运而生。这种抽取方法不需要预先定义待抽取关系的类别,能有效的发现实体间新的关系。但随之带来了两个新的问题:一是,主流的开放式关系抽取模型受制于专家“经验”的局限性,并且预处理工具会导致误差传递,影响抽取精度;二是,开放式关系抽取无法贴合领域进行抽取,抽取出的关系元组不能体现领域背景。本文基
图像篡改是一种恶意破坏网络中传播的图像信息内容的攻击手段,通过多种图像处理技术的综合应用将原本图像中想要表达的信息篡改为有意制造的虚假信息,被篡改的图像被用于视觉欺骗或伪造事实。在网络环境日益便捷的时代背景下,图像被广泛作为信息的载体在网络中快速传播,某些情况下图像甚至作为事实真相的证明在司法领域和生产生活中发挥重要的作用。图像篡改技术的快速发展对网络信息安全产生了极大的威胁,传统的图像篡改检测技
模数转换器(Analog to digital converter,ADC)是连接模拟信号与数字信号的桥梁。在信息处理过程中,模数转换器扮演着非常重要的角色,尤其在高速通信、雷达系统以及医学成像等领域,发挥着重要作用。然而,由于时间抖动以及比较器模糊等局限性,传统的电ADC很难满足现代通信系统对高采样速率和高转换精度这两个主要方面的需求。为了克服这些瓶颈,借助光子技术的模数转换方案成为模数转换领域
随着我国城市化建设的不断演进,事关老百姓日常生活方方面面的电力、燃气、给水、通信等地下管线愈发错综复杂。管线事故频发、故障定位效率低下等问题直接影响了城市基础设施服务的质量,管廊可谓是城市的地下“生命网”、“供给网”。巡检作为管廊运维的重要日常工作,是保证设备正常运行和生产安全的一项基础工作,担负着提前发现隐患、及时做出响应的重要职责。随着人工智能的发展,机器学习等技术给预测性巡检带来了新的机遇。
车辆到车辆的通信在现代通信系统中起着十分重要的作用,车联网系统及智慧交通系统不断发展并需求新的技术,对于车辆通信信道特性的了解程度需求增加,因此对车辆间的通信信道进行合理的建模对于未来的相关研究提供了重要的帮助。在本文中,提出了一个适用性广泛的可应用于sub-6GHz频段的3D非平稳MIMO信道模型,该模型是一个可应用于包含坡道的道路情景的基于几何的随机模型,且该模型在化简后可应用于一般的水平道路
随着信息技术的飞速发展,网络成为了日常生活中重要的数据形式。对网络数据进行分析能够提升节点聚类、社交推荐以及社区发现等现实任务的性能。然而,现实生活中的网络结构稀疏且规模巨大,这使得存储和处理网络数据变得十分困难。因此,学者提出网络嵌入技术来解决数据存储和处理困难的问题。网络嵌入旨在使用低维稠密的向量来表示节点。随着深度学习的不断发展,基于深度学习的网络嵌入算法的性能远优于传统的网络嵌入算法。然而
近些年来,人工智能技术发展迅速,机器人,无人驾驶等领域逐渐走到人们的生活中。同时定位与建图(SLAM,simultaneous localization and mapping)是这些领域的关键技术之一,它尝试解决无人设备的定位以及环境的感知等方面的问题。然而在现实的场景中,存在着一些复杂的场景,比如移动物体较多的动态场景,经常发生变化的场景等,这些环境会使SLAM系统的定位和建图精度下降,从而会