面向MPEG-4模型基编码的人脸分析与合成

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:qf0909
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
MPEG-4作为集中各种多媒体应用于一体的新一代压缩标准得到广泛应用,而其中基于内容的编码标准因其应用的优势成为MPEG-4标准的重要特色之一。本文选择视频信息中频繁出现的视觉对象--人脸作为编码内容,开展面向MPEG-4模型基编码人脸分析与合成的理论和方法研究。该项研究工作涉及到三个主要环节:面向MPEG-4的人脸建模、以人脸动画参数提取为目的的人脸分析,以及利用人脸动画参数进行模型驱动的人脸合成。 在人脸建模方面,本文提出一种面向MPEG-4基于三维形变模型进行自动化人脸重建的方法。该方法针对基于重采样的规格化人脸数据进行网格简化,以便适用于MPEG-4模型基编码应用下的人脸重建,最终采用三维形变模型得到用于人脸运动分析和动画的人脸模型。 在人脸分析方面,结合状态预测的解析优化,本文提出一种基于图象配准原则提取人脸动画参数的算法。针对有表情图像的面部跟踪,通过引入预测模型来约束优化搜索范围,更加合理地描述搜索空间,以指导搜索的正确进行,加快速度,提高效率。为综合考虑整体残差和局部残差表达的合理性,提出一个新的衡量图像配准的相似度准则,计算面部特征点的刚性和弹性位移,并最终转化为可供合成端进行人脸动画驱动的面部动画参数。另外,针对有较大刚性运动图像的面部跟踪,提出结合头部姿势估计进行面部特征跟踪的方法。引入头部姿势估计调整人脸网格模型进行全局移动,通过对图像之间的刚性运动进行补偿,使跟踪在新的位置上继续,以便加快迭代速度。 在人脸合成方面,本文提出基于局部训练的控制点运动扩散算法和基于独立分量分析(ICA)的人脸全局动画驱动模式。为了进行人脸动画的全局调整和运动特性分析,本文基于局部训练建立面部动画参数控制点与非控制点之间的运动关系模型,基于独立分量分析抽取人脸动画基本模式,构建可以组合表达真实人脸运动的独立分量主元,给出更加紧致准确的一般人脸动画表达模式,改善人脸动画的真实性。 在以上各项研究的基础上,本文最终构建了面向MPEG-4模型基编码,针对人脸视频进行人脸分析和合成的原型系统。该系统可以完成从特定人脸建模,基于视频分析的人脸动画参数提取,到基于动画参数驱动的人脸视频合成等各部分功能。
其他文献
协同设计是计算机支持的协同工作的概念和技术在产品开发过程中的应用。必须在对协同设计进行分析的基础上,结合计算机支持技术,来建立协同设计系统。 审图是设计过程中的
中国互联网数据平台的相关数据显示,网络视频是用户人均单日访问时间最长的应用,同时在线视频已成为互联网第一大应用。对于网络运营商而言,其主要收入来源于向用户销售使用时长
近年来,随着移动通信技术和计算机网络技术的不断进步,ad hoc网络得到快速发展,其组播路由和拥塞控制技术受到越来越多研究者的关注。本文在比较和分析国内外现有组播路由和
本文主要研究一种时间确定性安全关键实时网络协议——时间触发以太网(Time Triggered Ethernet,TTE)。涉及内容包括TTE的网络体系架构、控制协议以及关键构件的设计;然后在仿真
软件再工程自动化是现今软件工程发展的主流。软件再工程过程是软件逆向工程与软件正向工程交替进行的过程。但是,软件逆向工程与软件正向工程相比,无论在分析策略还是在算法复
随着越来越多的网上办公、电子商务的应用,安全问题已经成为Internet进一步普及的一个关键问题。而基于密码学基础的VPN是有效解决在公用网上数据安全传输的一个有效手段。
J2EE是SUN公司定义的一套规范,提供了基于组件的方式来设计、开发、组装和部署企业应用。J2EE平台提供了一个多层次分布式的应用模型,包括了可复用的组件、基于XML的数据交换、
关联分类法将关联规则挖掘技术应用于分类领域,构建了一种新的更准确的分类器。由于关联规则挖掘在挖掘大量数据之间的并发的潜在相关性方面的优势和良好的扩展适应性,使得在其
由于城市交通的迅速发展,道路及其它交通设施的管理水平急待提高。近年来,随着人们对智能交通系统(Intelligent Traffic System,ITS)越来越重视,以及Internet技术、WebGIS技
随着电信业的迅猛发展,用户对各种业务的需求不断增长,原有的电信网络远远不能满足。以软交换为核心的下一代网络技术正是在这种背景下产生并发展起来的。 本文首先概述了NG