基于文字驱动的人脸动画及其人脸模型的快速重建

来源 :浙江大学 | 被引量 : 0次 | 上传用户:kenlixin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人脸的造型和动画作为计算机图形学中一个独特分支已将近30年了,随着影视特技、电子游戏、可视电话、虚拟会议等应用的发展,这一研究领域越来越受到人们的关注。本文致力于研究基于文本驱动的个性化人脸的动画。其作用是,对输入的文本进行分析,并自动生成一张个性化人脸,讲述这些文字的动画序列。这里的个性化,是指人脸可以定制到不同的用户上。 在本文的第一章我们将阐述人脸造型和动画技术的重要性及困难所在等相关问题。在第二章,我们概括了人脸动画的几个基本思想,并回顾已有的计算机人脸造型和动画技术,分别对它们的强项、弱势,及性能给出描述。并按内容的相似性进行分类。在第三章,我们介绍了MPEG-4里支持的脸部动画系统。 本文所采用的人脸模型个性化算法是基于正交两幅图像的自动人脸三维重建,这种方法的优点是成本低,速度快。它的算法细节是本文第四章的主要讨论内容。这种重建的基本过程是,在两幅图像上,分别自动检测出特征点的二维坐标,综合得到这些特征点的三维坐标。根据这些点的坐标,进行模型变形,获得通用模型中的非特征点的位置,从而获得了人脸三维模型的重建。在这里,特征点的检测的自动化和精确性是一个关键,这也是本文的一个研究重点。纹理映射,可以增强模型的真实感,他的实现算法也在第四章里介绍。 在获得定制好的人脸模型基础上,本文初步研究了基于文本驱动的人脸动画。通过分析普通话拼音的特点,我们定义了普通话里的基本口形集,并提出一个基于肌肉的嘴唇参数化模型,以实现人脸的动画尤其是嘴唇的动画。
其他文献
期刊
期刊
人们对宽带无线通信的需求推动了无线局域网的发展。但以前各个厂商推出的无线局域网产品都互不兼容,这使得市场发展缓慢而且产品成本昂贵,仅用在不适于走线或无法采用有线组网
期刊
声码器是移动通信系统中的一个重要组成部分.IS-96 Qcelp8k声码器是CDMA2000系统的语音编解码标准.Qcelp8k声码器是基于码激励线性预测编码(CELP)算法,但它不同于传统的CELP,
该文中针对台湾LEADTEK公司的客户需求,详细介绍了linux操作系统的优点及其在局域网环境下的视频点播系统的方案进行设计和实现.文章首先在第一章中介绍多媒体通信和视频点播
光隔离器是光通信系统中关键的光无源器件,论文对其实现原理、组成元件、目前的各种结构类型进行了综述,并在此基础上设计出了一种具有监视功能的两级反射式光隔离器,对这种
期刊
该论文的研究主要集中于接入平面.所研发的媒体处理平台通过多种接入手段集中用户业务,将多种信息格式转换成为能够在网络上传递的信息格式后传送至相应目的地.论文主要完成
WCDMA是最具竞争力的3G标准之一.许多国家和公司对WCDMA的研究和发展作出了巨大的投资.相比传统的第二代移动通信系统,WCDMA的主要区别在于它能同时以不同的速率提供多种业务