基于单张相片的人脸重构与驱动动画的设计与实现

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:SoDoLa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,对三维人脸重构和动画的探索持续升温,已成为虚拟现实领域的研究热点。进入21世纪后,伴随着通讯技术、娱乐影视产业的蓬勃发展,计算机人脸重构和动画有着越来越广泛的研究意义,且具备极高的应用价值。研究的难点和重心主要集中在两方面,即如何快速重构具有高真实感的三维模型,以及如何驱动产生带丰富表情的人脸动画。针对上述问题,本文首先从建模、动画、驱动技术三方面对三维人脸动画的发展进行总结,探讨了各种方法的优缺。继而整合一些较为分散的研究点,借助一个中性人脸模型,设计并实现了一个基于单张正面人脸相片的三维人脸重构及驱动动画系统。本文的主要成果体现为以下几方面:1.人脸整体对齐。通过求解特征向量的放射变换矩阵,得到两组特征向量的最小距离差,从而对齐模型特征点和图形特征点。模型特征点为手工选定,图像特征点通过主动形状模型(ASM)算法自动提取。2.局部五官对齐。提出了一种区域网格平滑移动算法,进一步对准重构模型与输入图像中人脸的面部五官细节。3.基准模型网格扩展。利用贝塞尔曲面和贝塞尔曲线,平滑延伸基准中性人脸模型的网格,生成背景板,增加动画真实感。4.生成基本唇形和表情。使用肌肉向量模型,通过配置分布在人脸的多条肌肉,合成基本的16种嘴形和10种人脸表情,为驱动动画提供便利和基础。5.实现语音驱动动画。建立语音字典和文法规则,利用基于隐式马尔可夫模型训练得到的语音识别器转换音频信息为汉字音节。再通过音节和唇形对应表得到语音对应的口型序列。最后,本文展现了整个系统的实现效果,该系统将三维人脸重构与动画相结合,能够快速完成三维建模,并通过语音或文本进行驱动,产生具有较高真实感的动画。
其他文献
作为一种呈现信息的新颖方式,增强现实(AR)使人们能够以直接和直观的方式与物理世界进行交互。通过增强现实应用,用户可以在不需要额外硬件媒介的情况下,进行直观的具体的操控。
为了提高无线胶囊内窥镜拍摄到的图像的质量,降低总体功耗、延长胶囊内窥镜连续工作时间,本文提出了一种新型的无线胶囊内窥镜设计方案。通过采用集成了硬件压缩引擎的图像传感
随着互联网应用的不断创新与发展,网络蠕虫等高性能网络安全事件的性能也日益复杂,造成网络异常事件频频发生。网络安全问题已经不仅仅只涉及到用户个人的利益,有时甚至会对
随着互联网的发展,越来越多的人开始在网络上互相交流。BBS作为一种受到广泛欢迎的互联网应用,极大的方便了人们的网络交互。可是,随着BBS中包含信息量的不断增长,人们也越来越难
同步电路系统以其结构简单、实现方便等优势始终占据着VLSI设计的主流位置,然而当CMOS工艺进入到深亚微米乃至纳米时代,同步电路的时钟偏差和片上波动日渐严重,功耗问题越发突出
素数的研究已经有两千多年的历史,从古希腊数学家欧几里得(Euclid)开始,无数的数学家为此付出了毕生心血,也取得了一个又一个巨大的成绩,而信息技术和密码学的迅猛发展给它带
改革开放以来,我国大力引进利用国外资金、先进技术和先进管理。为了鼓励外商投资,我国设立了进出口加工区和保税区,区内的外商投资企业享有购买设备、零件和生产所需材料等
如何有效的管理和利用互联网上快速增长的信息资源是现代网络亟待解决的一个问题。随着现代加工技术和硬件技术的发展,P2P在现实生活中的大规模应用成为现实。它通过尽可能利
在信息时代,所有事物都变得更快捷和动态,传统的科层组织往往难以对迅速变化的外部市场作出及时的反应,组织内关注的焦点也从垂直的职能或部门转换到组织内运作的各种水平的
越来越多的新型网络呈现出长链路延迟、高链路差错率、端到端的路径断开频繁、存储能力有限、缺乏连续的能量供给等特点。这些网络在网络体系结构和性能特征等方面都和Intern