文本驱动的人脸动画合成关键技术研究

来源 :北京科技大学 | 被引量 : 0次 | 上传用户:kingly1988
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本论文是以北京市自然科学基金“软件人与Linux融合技术研究”项目(4072018)为研究背景的子课题——有形软件人的研究与应用。   在三维人脸建模上,本文利用3D建模软件Maya制作了一般的人脸几何数据和纹理图像;然后由特定人脸的几何数据和纹理图像,可以获得人脸模型的特征点的三维坐标,最后使用纹理映射的方法将纹理图像映射到人脸模型上,经过渲染可以得到具有真实感的人脸模型。   在模拟人脸表情和动作方面,本文给出了一种新的基于MPEG-4人脸动画的方法。该方法首先根据MPEG-4人脸模型规范对人脸模型进行功能区域的划分,每个功能区域都有一些与FAP相关的控制点。   在大量学习语音和动画同步方面的知识和深入研究微软TTS技术基础之上,结合本论文的研究背景——文本驱动产生表情,本文将FAML和Bookmark功能引入到系统设计中,实验结果表明这两种技术的引入较好地提高了语音和动画的同步性,提高了虚拟人脸动画的真实性。   丰富的人脸表情配以真实感的发音是计算机人脸动画技术领域一直追求的目标,为了实现真人发声功能,在本文中将MicroSoft提供的TTS语音引擎与Digital Future公司提供的真人语音库相结合,实现了计算机动画的真人发声。   最后,我们实现了一个与MPEG-4兼容的三维人脸动画系统——TalkingHead。
其他文献
随着IT技术的发展使得各种信息电子化,从而使信息更加方便地获取、携带与传输。这样在现代的信息存储与传播过程中,相对于传统的信息安全保障,需要更加有力的技术保障。因此无论
随着网络规模的扩大、应用产品技术日渐多样和复杂,为了保证系统的稳定运行,发现潜在的问题,改善内部管理流程,企业对更加智能和高效的网络管理软件的需求越来越迫切。数据采集是
信息技术融合了计算机技术、通信技术和控制技术,成为社会生产、生活的最重要的组成部分之一。信息在存储、交换、使用中的保密性、一致性和不可否认性,已成为普遍关注的重大问
随着航空货站设备自动化和智能化的提高、航空物流信息系统建设的发展,作为航空物流重要环节的航空货站,也必须采用先进,快速、准确、高效的信息化手段提高业务服务质量。在
大学生创业是我国乃至全世界的发展趋势,1998年世界高等教育大会宣言《21世纪的高等教育:展望与行动世界宣言》第七条重申:“为方便毕业生就业,高等教育应主要关心培养创业技
学位
云数据库以其低成本,高扩展,管理方便的特性,得到了广泛的应用。然而,用户将自己的数据直接上传到不完全受自己控制的云数据库中,会存在安全隐患。以CryptDB为代表的基于同态加密
随着网络和多媒体技术的发展,数字视频的应用越来越广泛,视频作品遭到恶意攻击和非法侵权的问题也越来越严重。如何有效地对数字视频进行版权保护,成为多媒体技术发展中迫切而现
本文以国家自然科学基金项目“凝胶注模成型医用多孔钛及合金植入材料”(基金号50774010)为科研背景,以计算机图像学、图像图形处理、人种等相关知识为理论基础。在理论与实际
VLAN(Virtual Local Area Network)技术是一种将局域网设备从逻辑上划分成一个个网段,从而实现虚拟工作组的新兴数据交换技术。该技术的出现可以有效解决传统以太网中广播风暴
在信息化社会的今天,交换数字媒体已成为广泛的现象,然而数字作品极易被非法拷贝和复制,使得网络信息的安全保护问题日益突出。保护数字作品的知识产权,仅靠注册其所有权已无法有