语音驱动的口型动画同步算法

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:lianglianghepan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,如何生成与输入的语音信号同步的、真实自然的三维口型动画,已经成为了计算机图形学领域中一个富有挑战性的课题。现阶段,生成口型动画的方法主要分为五种类别,分别为程序式的方法、基于物理的方法、数据驱动的方法、基于机器学习的方法以及其他方法。在上述方法中,有些方法需要在预处理阶段采集大量的数据,有些方法在运行时具有很高的时间消耗,而另外的一些方法得出的结果则具有较低的精确度。本文提出了一种不需要大量数据作为支撑、运行时效率较高并且可以生成精确度较高的口型动画的口型动画同步算法。本文的方法分为预处理阶段与运行时阶段两个阶段。在预处理阶段,本文将英语中的46个音素分为15个类别,并且利用主成分分析方法选取8个基本口型动作,组成基本口型动作集合,然后令一名设计师设计一系列不同长度的音素序列对应的口型动画片段。在运行时阶段,根据输入的音素序列,通过最优匹配查找算法对该音素序列进行匹配,将其转化为一个由口型动画片段构成的序列,然后对该序列进行曲线拼接与后处理,即得到最终的完整口型动画。本文的方法可以应用于多个领域,比如三维影视制作、游戏制作以及虚拟现实等。本文进行了一系列实验来对本文的方法进行耗时分析与精确度分析。实验的结果表明,本文的方法具有较高的效率,可以在较短时间内生成口型动画,并且最终生成的口型动画具有较高的精确度。
其他文献
<正> 笔者运用剧毒中药川草乌治疗诸痛症已20余年,取得了显著的效果,现介绍一种较好的应用方法。取川草乌各100g,加清水适量浸泡7~10d(天)至内无干心,捞出,另取麻黄、桂枝、甘
通过剖析隐喻的推理机制,来理解隐喻的认知功能.论述了隐喻推理的一般理论,并分析隐喻的表层结构与深层机制.强调了隐喻推理机制中两对话域对话、选择及整合的开放性、双向性
行政垄断没留神就是腐败,不想腐败也得腐败。郭东升就是行政垄断的烈士。 Administrative monopoly without attention is corruption, do not want to corrupt corruption.
<正>迄今为止,大多数师范院校都是通过开设《现代教育技术》公共课来培养师范生的信息化教学能力,但多年的实践证明,效果并不理想。为了适应信息化时代对教师
中国红军由国内战争到抗日战争的战略性转变 ,自红军长征到达陕北至抗战初期 ,历时两年有余 ,涉及诸多复杂问题。在这一巨大转变的过程中 ,时任中共总负责人的张闻天运筹主持
精对苯二甲酸(PTA)是化纤的重要基础原料,生产过程会产生大量的废水,对环境造成很大影响。中水回用工艺可减少废水的排放量,节约运行成本,在PTA企业中得到广泛应用。本论文设计了以超滤-反渗透双膜法为核心的中水回用工艺用于PTA的实际生产,主要研究内容和结论如下所述。根据石化企业生产的给排水状况和中水回用的水质要求,设计和搭建了以膜分离技术为核心的中水回用系统:包括预处理单元、污泥脱水单元、UF超滤
相控阵雷达即为电子波束扫描雷达,在现代军用民用各领域得到广泛应用。当电磁波频率提高到W波段(75-110 GHz)时,相控阵雷达具有高空间分辨率、障碍穿透性、设备小型化等一系
近年来我国消防部队时有报道消防员发生心源性猝死事件,本文通过简要介绍心源性猝死的定义及引起心源性猝死的常见病因,结合消防员的职业特点,分析引起消防员心源性猝死的可
武术,即打拳和使用传统兵器的技术。武:勇猛;猛烈,气势。术:技艺,方法,动作。目前,武术的概念表述为,以技击动作为主要内容,以套路和格斗为运动形式,注重内外兼修的中国传统体育项目。
报纸
α-溴代异丁酰溴(α-Bromo-isobutyryIbromide)是合成噻甲羧肟头孢霉素(Ceftazidime)侧链[(z)-2(2-t-Butoxycarbonylprop-2-oxyimino)-2-(2-triylaminothiaz ol-4-y1)acetic