视频驱动的三维唇动合成

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:goddesslee
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
嘴唇动画作为人脸动画中最重要的部分之一,可以应用在影视特效,动画制作,游戏娱乐以及视频会议等诸多领域,具有很大的应用价值和商业价值。本文研究的内容是如何利用视频驱动嘴唇,大致分为两个部分:如何从视频中捕捉到嘴唇特征点,以及如何利用捕捉到的嘴唇信息驱动嘴唇模型。本文采用的嘴唇模型是基于CANDIDE-3面部模型的,它的驱动机制以面部行为编码系统作为基础,根据面部行为编码系统定义的动作单位,驱动人脸模型。利用它的驱动机制,可以将跟踪得到的嘴唇信息转换为驱动嘴唇模型的参数,最终根据这些参数得到嘴唇动画。本文采用了两种不同的方法对嘴唇进行跟踪,一种是基于表观的方法,另一个种是基于运动的方法。基于表观的方法,存储跟踪目标的纹理,通过改变目标模型的位置参数和形状参数,使其和视频中的嘴唇相吻合。由于希望不使用训练样本就可以对嘴唇进行跟踪,因此纹理模型从第一帧获取,然后从后续的帧中获取形状无关纹理,将纹理模型和形状无关纹理进行比较,得到嘴唇模型的最优参数。该方法可以直接得到嘴唇模型的参数,最终合成的嘴唇动画在大部分情况下是令人满意的,但是当嘴唇变化过大的时候,跟踪器会跟丢,因此一些比较明显的口型变化无法在合成的嘴唇动画中重现,影响了合成动画的质量,但跟踪器可以在没有外界干预的情况下重新恢复对嘴唇的跟踪。基于运动的方法采用比较成熟的Lucas-Kanade光流法跟踪嘴唇的四个特征点,由于下嘴唇特征点在嘴唇运动过大的时候会跟丢,本文利用嘴唇的几何形状和嘴唇的边缘信息对下嘴唇特征点进行约束,得到了不错的跟踪效果;利用基于运动的方法跟踪到的4个嘴唇特征点,本文用最小二乘法求取嘴唇模型的参数,最终合成的嘴唇动画具有一定的逼真度。
其他文献
网络环境下,多样化的传播途径和复杂的应用环境使网络蠕虫发生频率增高、潜伏性变强、覆盖面更广。不断给网络造成的巨大危害表明,传统的防病毒技术已不能满足网络蠕虫防治的
与文本无关的说话人识别的研究,由于其实用性,成为当今语音识别领域中的热门课题,经过几十年的发展,已经取得了巨大进展。尽管在实验室环境下,说话人识别系统已经取得了比较
学位
在生物信息学研究中,蛋白质二级结构预测是重要的研究内容之一。从氨基酸序列来预测蛋白质二级结构,这本身就是我们理解蛋白质结构和功能的重要一步。在分子生物学中,若能成
随着无线射频识别(Radio Frequent Identification, RFID)和传感器等电子数据采集设备(Electronic Data Gathering Equipment, EDGE)的广泛应用,产生了空前海量的事件类型数
近年来,随着互联网的普及,音频流媒体以其低成本和方便性得到了广泛的应用。但是现在的因特网只能提供被称之为尽力而为(best-effort)的服务,网络的拥塞将导致丢包和延迟现象
互联网信息技术和电子商务的日新月异,使得方便快捷的网络购物成为一种不可或缺的购物方式。网络上的服饰商品数量类型繁多,怎样从中有效地搜索到目标商品是决定消费者是否发
随着网络技术的发展和普及,计算机系统的安全性越来越受到人们的关注。由于计算机系统存在多种安全性缺陷,所以在计算机系统的设计和开发过程中,如何测试系统的安全性,是开发
本课题来源于国家自然科学基金资助项目——“基于Ontology的文本中空间关系的三维可视化研究”(简称文景转换),该项目以基于Ontology的自然语言文本到相应的三维动态虚拟场
从大量繁杂的文本信息中获取有用的信息是信息处理的一大任务,而文本分类是实现这个任务的最重要的方法之一。向量空间模型是进行大规模文本处理常用的表示模型,而类中心分类