基于Blendshapes的语音驱动三维人脸动画技术研究

来源 :东北石油大学 | 被引量 : 0次 | 上传用户:mailabc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着三维数字虚拟人的发展,语音驱动三维人脸动画技术已经成为虚拟人交互的研究热点之一,在虚拟现实、电影制作、游戏娱乐等方面有广阔的应用前景。语音动画具有自动化、批量生产、成本低等优点,但人脸的生理结构复杂,人们对面部运动和视听同步的细微异常非常敏感,因此与语音情绪一致且表达准确自然的表情是真实感语音动画合成的关键。本文设计基于Blendshapes的语音驱动三维人脸动画方法,分别从基于不同语音情绪的三维人脸控制参数预测、基于样例表情的表情基构建、基于Blendshapes方法的语音动画合成三方面对语音驱动三维人脸动画技术深入研究,研究内容如下:1.设计并构建语音到视觉映射网络模型。不同语音情绪预测三维人脸控制参数时,要保证眉眼、脸颊、嘴角等表征情绪的三维人脸控制参数符合语音情绪的表达,因此提出CSE-Mogrifier Net模型。首先利用语谱图构建语音情绪空间,确保语音情绪信息的丰富性;其次构建基于SENet通道注意力机制的CNN语音特征提取网络,从通道的角度,对语音帧级别的频域和时域特征加权,增强帧级语音情绪细节特征表达能力;最后构建基于Mogrifier LSTM交互运算的Bi LSTM音视觉映射网络,从交互的角度,增强语音情绪与三维人脸控制参数的时序关联性建模能力,提高三维人脸控制参数的精度。该方法不需要借助韵律特征等表征情绪的语音特征,能够实现多种语音情绪的三维人脸控制参数预测,在保证动画流畅度的同时,提高三维人脸模型运动的空间精准性。2.设计并构建表情迁移网络模型。利用样例表情构建基准身份的表情基时,要保证表情基在眉眼、嘴角等细节部位的迁移形变精度,因此提出Sim AM-GCNet模型。首先利用形变梯度算法提取样例表情特征;其次构建基于Sim AM的GCN表情迁移网络,在不增加额外子网络的前提下,从神经元的角度增强样例表情到基准身份迁移的表情细节特征;最后使用迁移得到的基准身份的表情特征,利用最小二乘的方法构建基准身份的表情基。该方法不需要借助人工标记的特征点,自动化生成与样例表情语义信息一致的基准身份表情基,实现基准身份的Blendshapes构建。3.合成不同情绪下的语音动画。利用三维人脸控制参数合成动画时,要保证面部各部位的协调运动以及动画的流畅度,因此使用Blendshapes方法完成基准身份模型的运动控制。首先使用中值滤波对控制参数序列进行平滑处理;然后构建基准身份模型,并使用第二部分的方法构建基准身份的Blendshapes;最后使用Blendshapes方法控制基准身份模型不断运动,合成三维人脸语音动画。设计并完成了实时性实验、语音情绪与表情的关联性实验、动画重定位实验、说话人独立性实验,评估合成方法的实用性及动画实现效果。通过实验表明,本文提出的语音驱动三维人脸动画方法,具有较高的真实感和拟人度,并且可以应用在实时场景中,有较高的实用价值。
其他文献
由于光学衍射极限的存在,光学显微镜成像系统分辨率一直受限在半个波长的范围。发展超分辨显微成像技术以突破光学系统的衍射极限是光学成像领域中最主要的问题之一。近年来,各种超分辨显微成像技术应运而生,其中利用微型球体作为超分辨率透镜(微球超透镜),将物体表面信息放大然后投射到传统显微镜的物镜中,能在白光照明下突破衍射极限,为纳米结构的超分辨成像提供了一种简单、直接的方式。为了加快微球透镜显微成像技术的发
学位
伴随着社会不断进步,先进医疗、增强现实、工农业等行业的快速发展,移动通信接入设备的数量和数据规模呈现指数级增长,为了满足这些需求第五代移动通信技术(The 5th Generation Mobile Communication Technology,5G)被快速推进,稀疏码多址接入(Sparse Code Multiple Access,SCMA)技术作为5G通信的第二个空口技术,由于采用了基于码
学位
空天往返飞行器具有高飞行速度与高可重复利用率,因此得到了国内外的广泛关注。飞行器相关技术中,轨迹规划与制导控制是两种重要技术之一。飞行器轨迹规划算法可以使飞行器规划出满足相关约束的期望轨迹,通过飞行器制导使飞行器按照期望的轨迹飞行,并到达指定区域执行飞行任务,并利用飞行器姿态控制技术完成飞行器的控制与抗扰动。本文通过对飞行器上升段与再入段轨迹规划、制导与控制进行研究,主要包括飞行器的上升段与再入段
学位
<正>中共中央、国务院《关于全面加强新时代大中小学劳动教育的意见》(以下简称《意见》)明确提出,普通高中要注重开展服务性劳动和生产劳动。城区普通高中要到什么场域开展劳动教育?如何上好劳动课?要达到什么样的育人目标?……这些问题困扰着教育工作者。我们依托劳动基地,进行了5年农业生产劳动实践探索,逐步构建了多维教育新样态,破解了劳动教育中的难题。一、缘起:加强劳动教育,补齐教育短板党的十八大以来,习近
期刊
随着智能时代的到来,软件工程已从最初的人工模式迈入智能化模式,大型软件平台作为软件工程的智慧结晶,在功能和开发技术日迭更新的当下,如何实现智能化已然成为一项重大挑战。作为国家科技重大成果,同时也是国内成功大型软件平台的代表,CIFLog——测井处理解释一体化平台,除包含近百项先进的单井、多井、水平井解释方法和功能,还包含大量“冲锋陷阵”的软件开发知识。这些软件开发知识的高效利用通常要求开发者拥有一
学位
随着航天任务的越来越复杂,卫星朝着大尺寸的方向发展,而受火箭运载能力的约束,要求其满足轻质量特性,这就使卫星带有大型挠性结构。本文以大型桁架式卫星为研究对象,对其大惯量、低频模态密集特性导致在动力学建模和主动振动控制应用时表现出不同于典型挠性卫星的特点,从动力学建模、有限元分析,到挠性结构主动振动控制中作动器/传感器位置优化、抑制高阶模态溢出,以及路径规划和多时间尺度控制等多角度进行了研究,实现了
学位
夜间行车安全一直是一个重要的命题,夜间环境光照条件不足,驾驶员视野范围较小,降低了驾驶员对周围环境的观察能力,增加了应急情况下驾驶员所需的反应时间。因此夜间环境下驾驶员一般倾向于开启远光灯以获得更宽更远的视野范围,然而传统的远光灯开启时,会对前方其他车辆的驾驶员造成眩目影响,干扰其他驾驶员的正常驾驶,由此带来安全隐患。近年来智能汽车概念的不断发展,通过技术解决传统车辆存在的问题,改善驾驶员体验,提
学位
高超声速飞行器在遂行高空域、高马赫数的飞行任务过程中,对气动力参数的大范围变化十分敏感,发生损伤和故障的可能性极大,同时,由于具有飞行范围跨度大、飞行环境复杂多变等特点,高超声速飞行器的控制系统也将面临强时变、强耦合性、强非线性和严重不确定等难题,如何设计出可靠的控制系统成了一项严峻的挑战。因此,如果能够在线辨识与估计出精准的气动力参数,将会大幅度缓解控制系统的设计压力。针对上述问题,本文主要开展
学位
随着Web3.0技术的蓬勃发展以及社会网络的兴起,社会网络分析逐渐成为热门研究领域。链接预测作为社会网络分析的一个重要研究分支,旨在通过已知的网络节点以及结构等信息预测网络中尚未产生连边的两个节点之间产生链接的可能性,这种预测包含了对未知链接和未来链接的预测。目前,有关链接预测的研究工作主要集中在无权社会网络上,本文关注加权社会网络。加权网络中的链接预测研究不仅可以帮助理解链接权重分配机制,为加权
学位
胶囊神经网络凭借其特殊的神经元结构,自问世以来就在机器学习领域获得了非常广泛的关注。胶囊神经网路中,一组标量神经元矢量化形成向量神经元。实体或特征存在的几率以及姿态、方向等空间信息由向量的长度和方向表示,并采用动态路由算法替换池化操作使得高层胶囊可以整合低层胶囊中最为活跃的特征,这些改进弥补了卷积神经网络在捕捉特征空间层次上的不足,以及当实体姿态发生改变时,无法有效识别的缺陷。胶囊神经网络在一些数
学位