基于MPEG-4的三维人脸动画合成研究

来源 :北京工业大学 | 被引量 : 3次 | 上传用户:yxzapricot
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人脸的计算机模拟长期以来一直是计算机图形学以及人机交互中非常活跃的研究领域,逼真的面部合成是计算机图形学中最根本的问题之一,同时也是最困难的问题之一。随着计算机图形学在建模、渲染和动画等方面的发展,人脸建模和人脸动画在电影、广告、远程会议、视频电话、数字娱乐、人机交互、虚拟现实、计算机辅助教学、医疗诊断等领域得到了广泛的应用。因此,作为当前计算机视觉和计算机图形学领域的研究热点,人脸动画不但具有理论研究意义,同时也具有极大的应用价值。在人脸动画研究的三十多年中,众多学者做出许多创造性的研究工作,并实现了一些人脸建模和动画系统。但在算法的复杂度、获取三维数据的易用性、实现可变姿态的便捷性和鲁棒性等方面还存在许多需要进一步研究和改进的地方。本文结合国内外关于计算机三维人脸动画的研究现状,主要研究基于MPEG-4标准的人脸动画生成算法以及融合口型和表情多种面部运动元素的人脸动画合成方法,力求在标记文本的驱动下,通过较低复杂度的实时计算,获得富于变化的真实感人脸动画。在基于MPEG-4标准的动画合成方面,本文主要研究了人脸建模和FAP(Facial Animation Parameters)数据提取的方法。利用工具建模,转换成分部件描述的VRML格式,并对FDP(Facial Definition Parameters)进行手工设定,得到了兼容于MPEG-4标准的人脸模型。在数据采集方面,本文提出了一种FAP分析提取算法,通过对视频序列中人脸标记点位移进行分析计算来求解FAP值,得到了可以再现真实面部运动的FAP参数。在实现具有丰富面部动作的人脸动画方面,本文针对汉语语言发音的特点,建立了FAP参数序列表示的三维口型库。通过对JAFFE人脸表情数据库的统计研究,总结出基本表情的情感组合模型,并用于对采集的原始基本表情进行校正,完成人脸基本表情库的建立。最后,本文基于FAP参数的特点,提出了一种口型动画和表情动画的融合模型,实验表明,该融合模型可以真实的模拟人脸非线性的复杂复合运动,同时计算可以满足实时性的要求。
其他文献
在玻璃的生产线上,不允许玻璃上出现大量的明显的缺陷,否则会影响其质量。因此,开发一套低成本的玻璃检测系统便有极大的科研价值。本文所做的工作就是为一厂家开发检测系统
一般地,在进行对象建模时通常有两种模式:基于统计的方法和基于结构的方法。在统计模式识别中,研究对象常表示为特征向量。特征向量的表示形式具有数学运算上的优势,但另一方
网络的快速发展,网络设备的增加和拓扑结构的复杂,使网络安全问题变得日益突出。网络安全管理技术需要进一步的发展,网络安全管理平台就是在这种情况下出现的一种新型的网络
自动人脸识别是当前模式识别领域中的一个极具挑战性的研究课题,因其在法律、商业、军事等领域具有广泛的应用前景而日渐受到各国政府以及科研单位的广泛关注和高度重视。如
随着XML相关标准的推广与应用,Web上出现了大量的XML文档。为了有效的管理,有必要将XML文档存储到数据库中。存储方案已成为XML数据管理领域研究的一个重要课题。纯XML数据库充
在多Agent系统中,单个Agent的功能非常有限,Agent之间需要通过频繁的信息交换和密切的协同工作以完成复杂功能,通信是Agent需要具备的基本功能。因此通信安全就成为多Agent系统
人类社会正迈向一个高度信息化、数字化的时代。在这种形势下,大量的信息被数字化并由信息系统统一维护和管理。随着信息系统的不断完善,信息系统管理着越来越多重要的数据,
钉螺的分布直接影响着血吸虫病的分布,有效控制钉螺也是目前最有效控制和预防血吸病的措施,而钉螺的分布与其孽生地环境的自然因素密切相关,并具有一定的空间特征,因此研究钉
随着社会的进步和互联网技术的发展,网络信息量的频繁剧增,当今社会面临着信息大爆炸。每天都有大量信息以电子文档的形式出现在人们面前。如何在海量信息中搜寻所需要的信息
无线传感器网络是一项新兴的技术,拥有广阔的应用前景,将在人们生产实践的诸多方面发挥越来越重要的作用。对于带有安全性要求的传感器网络而言,如何提高节点间的连通性一直