基于肌肉模型控制的口型可视化研究

被引量 : 0次 | 上传用户:baobaolan1007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
与语音对应的口型可视化技术是现在语音可视化领域的热点和难点问题之一。目前该技术仍存在以下三个问题亟待解决:第一,在表达口型动画的嘴部模型中,多数研究者没有考虑舌头部位的运动模拟;第二,在协同发音现象中,音素静态视位受其他音素影响后存在一定的变化规律,但大多数研究者缺乏将该规律与协同发音模型中的视位权重控制函数曲线的几何特性相关联,在部分字的口型动画上存在着较明显不真实的现象;第三,在动画插补算法中,大多数研究者采用线性、三角函数作为过渡帧插值函数,虽然能满足过渡效果平滑的效果,但存在一定的局限性,中间过渡帧过多,口型动画不能突出关键帧。针对以上问题,以及可视化语音以及虚拟说话人系统中对唇部和舌部动画的高逼真度要求,本文首先提出了一种基于运动轨迹分析的三维唇舌肌肉控制模型。该方法首先根据解剖学原理,建立起基于网格和纹理的唇部、舌部模型。然后,根据分析唇部的运动轨迹,将口轮匝肌分解成两部分来联合控制唇部的运动,可以获得各种口型。在舌部的运动模拟中,将它的运动轨迹分解成一些机械运动的组合,通过使用四种肌肉模型来控制这些运动。最终实现了人脸嘴部说话时的各种口型,实现了卷舌、舔嘴等动作。实验结果表明,该方法能逼真地实现出唇部、舌部的运动动画。然后,针对汉语中的协同发音现象以及语音可视化技术中对唇型动画自然、连续的要求,采用了一种新的口型动画生成方法。一方面,本文在协同发音建模中,采用了基于微分几何学描述的多音素协同发音模型,该模型通过分析邻近音素间影响关系的几何学上的特征,充分描述出音节中的多个音素之间的重叠发音现象,能使得虚拟人口型动画更贴近现实。另一方面,本文在口型动画的自适应生成中,采用了基于分段抛物线插值生成过渡帧的方法,解决了口型动画中关键帧显示时间过短、用户不易分辨的问题,且还不影响口型动画的流畅性。
其他文献
目的:探讨儿科出院保健中应用护理延伸服务的效果。方法:选取本院2012年8月-2014年8月正常出院的患儿160例作为研究对象,所有患儿家属皆签署知情同意书愿意配合本次研究,随机
"以学生为本"是当前高等学校思想政治教育贯彻落实以人为本的具体体现,也是新时期高等学校思想政治教育的正确价值取向、目标选择和实现路径。高等学校思想政治教育"以学生为
随着科学技术的发展,科技英语在传播科学技术方面起着举足轻重的作用。本文以忠实、通顺原则为指导,以地质英语为研究对象,分析地质英语词汇和句子的特点及其在汉译过程中出
根据厄瓜多尔CCS水电站结构布置、工期要求等特点,经过前期充分对现场地质情况的掌握与经验判断,加之前期初步方案研究与基本论证而采用了正在施工的双护盾TBM,该TBM在实际施
目的:探析松弛素、盆底电生理与女性盆底功能障碍性疾病之间相关性,为疾病预防提供指导。方法:选择本院2012年5-8月收治的拟行全子宫切除术的妇科良性疾病住院患者100例进行
世界一流大学建设,这是中华民族的坚强信息,在此背景下的高等教育改革,尤为重要。文章主要关注中国的高等教育机构在人力资本产权理论下的内部治理结构的创新研究上,文中选取了美
<正> 经济理论是制定经济政策的依据,而经济政策又是推动经济发展的动力。因此,经济政策在一国经济发展中起着至关重要的作用。经济理论之所以发展、之所以深化,其直接目的都
可持续增长率是企业现有财务资源所能够支持的销售收入的最大增长率,代表企业最适宜的增长速度。企业的财务管理目标是企业价值最大化,而决定企业价值的重要因素是由销售收入
地下输水隧洞(特别是有压隧洞)是我国水利水电工程建设中常有的施工项目,输水隧洞的永久性支护通常采用喷射混凝土和混凝土村砌。混凝土工程施工质量的好坏,既对结构物的安全
按照计划.美国国家航空航天局要对哈勃空间望远镜(HST)进行第5次维修。维修之后.人们估计它至少能够再工作5年,HST一时还不“退休”,”继任者”詹姆斯&#183;韦伯空间望远镜(JWST)只