【摘 要】
:
在多媒体技术迅速发展的今天,多种媒体之间的信息融合越来越受到人们的重视.对可视语音(Visual Speech)的研究正是这样一种综合考虑了语音和发音时各可视部分器官动作的多媒
论文部分内容阅读
在多媒体技术迅速发展的今天,多种媒体之间的信息融合越来越受到人们的重视.对可视语音(Visual Speech)的研究正是这样一种综合考虑了语音和发音时各可视部分器官动作的多媒体技术.可视语音是指人们在用语言交流时所表现出的看得见的各种面部动作,它能在一定程度上传达人们想要表达的思想,帮助人们加深对语言理解.该文研究了文本驱动可视语音技术,并给出一个原型系统——TalkFace的实现.首先,从语音学角度对语音的视觉特征进行分析,给出了一种视位分类的方法,并采用MPEG-4的FAP参数集对这些视位进行描述.随后,分析协同发音现象,提出音素的特征动作的概念,并在其基础上提出了发音器官动作模型,对协同发音现象进行了较好的描述和解释.接着,研究了已有的面部参数动态生成模型及算法,针对实时环境对其算法进行了一些改进.最后,该文实现了一个文本驱动可视语音系统的原型.
其他文献
该文首先介绍了移动IP出现的背景,分析了传统路由协议在解决节点移动性问题方面的不足,指出了移动IP技术出现的必要性和设计移动IP应达到的要求.接着,简要介绍了移动IP协议的
近年来,云计算技术快速发展,其安全问题也日益突出并得到了越来越多的关注。云计算将存储能力、计算能力等资源以类似水电的方式、按用户的需求提供给用户。在这一过程中虚拟化
逻辑程序设计作为一种描述性的程序设计范例,目前已经成为人工智能领域中进行知识表达和推理的一个有力工具。回答集语义在非单调的逻辑程序语言中占有重要地位。作为一种处理
在加权关联规则挖掘的研究中,主要的工作是从事务数据库中产生加权频繁项目集.由于加权频繁项目集不具有向下封闭性,也就是,加权频繁项目集的子集不一定加权频繁.因此,不能用
论文结合智能代理的特点和典型的商务交易模型,设计了以智能代理为基础的分布式电子交易市场及其系统的结构.提出了基于多智能代理的撮合交易思想,设计了市场撮合代理动态匹
我们在开发吉林省自然科学基金项目《移动IP关键技术的研究与软件实现》的过程中,利用Linux内核代码的开放性,在网络层嵌入操作系统内核编码,给出了移动IP中移动节点的注册应
该文研究目的是面向对象的动态辅助测试工具(OODT,Object-Oriented Dynamic Testing Tool).OODT是我们小组针对C源程序研制的动态辅助测试工具系统,该文的重点是根据源程序生
该文主要论述了开发PDM系统中系统管理的主要方法,并基于J2EE平台,参考国外先进软件经验,采用UML设计,开发了启明星PDM系统中的系统管理部分.该文共分7章,第一章介绍了产品数
该文首先提出了提高组件可靠性要解决的具体问题,参考了Meyer[1]的"按契约设计"(Design By Contract)的思想来提高组件的实现及设计上的正确性.但这一思想只适用于Eiffel语言
在网络安全方面,人们以往大多针对诸如口令入侵、特洛伊木马术等研究较深,对嗅探器(Sniffer)的研究却是近一两年的时间里才引起了人们的重视.因此,该文将重点讨论关于嗅探器