基于语音语义控制人脸表情动画的实现方法

来源 :上海大学 | 被引量 : 0次 | 上传用户:huxiangye
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
研究和开发人脸表情动画控制的方法和技术,特别是基于语音和语音语义的人脸表情动画的实现方法和技术,是近年来计算机仿真和计算机动画领域的研究热点之一,其技术和产品在影视动画制作、虚拟主持人、可视通信以及远程教学等领域有着广泛的应用前景。本文在分析和综合了国内外计算机人脸表情动画技术领域的研究成果的基础上,就基于语音语义控制人脸表情动画的实现方法进行了研究与实现。在3DS Max和 Maya动画制作软件平台上,通过语音识别技术获取输入语音的语义,开发了基于语音语义实现人脸表情动画控制的插件。 本文首先介绍了听觉机理和心理、语音信号处理方法、人脸表情动画的特点以及方法等。设计了基于HMM模型的语音识别系统,以获取语音的语义信息,如字符和情绪词语等,讨论和论述了语音信号预处理、特征提取、识别模型等相关关键环节的技术问题。然后,在3DS Max软件平台上,提出和建立了一种通过字符串参数交互控制人脸口型动画的实现方法。利用MAXScript语言的节点动画控制,开发和编写了插件,通过输入字符参数,实现了对人脸模型口型动画的控制调节。在Maya软件平台上,提出和建立了一种基于情绪词语控制人脸表情动画的方法,利用Maya C++API中的节点控制方法,建立了一套简单易行的自定义节点的插件开发流程,开发了通过输入的情绪词语实现人脸表情动画控制的插件。 仿真实验结果表明,本文所建立的利用语音识别后获取的语音语义在3DSMax、Maya平台上实现人脸表情动画控制的方法较好的解决了手动调整设置动画的问题,所建立的插件只需要对单一人脸模型进行操作,简单易行,避免了繁琐的重复劳动,且适用于同类型的不同人脸模型。这不仅大大提高了影视动画制作的效率,同时也为虚拟主持人和虚拟演员的语音交互控制提供了一种途径。
其他文献
双基前视SAR作为一种特殊体制的双基SAR,将发射机与接收机分别放置在两个不同的运动平台上并且使得接收机波束指向平台正前方,不仅具有灵活的空间配置,强的隐蔽性,丰富的目标散射
随着计算机技术的发展和多媒体信息的广泛应用,语音信号处理技术已经成为计算机界研究的热点.说话人识别始于20世纪30年代,从20世纪60年代开始日益成为当今的一个研究热点。
生物认证技术已经越来越多的被应用到日常生活,如考勤、登记、远程控制、自动查询、门禁控制等等。由于指纹识别技术的高实用性和可行性,指纹识别已成为目前市场占有率最高的生
从20世纪90年代的移动Ad hoc网络的研究在世界范围内方兴未艾到21世纪最新兴起的无线传感器网络(WSN)的研究热潮,移动自组网络已经从无线通信领域中的一个小分支逐渐扩大到相
现代深空通信的快速发展对深空通信实体在材料、体积、功率、容量存储等方面都提出了更高的要求,同时对深空通信可靠传输技术的要求也越来越迫切,由于现代深空通信距离比以前更
在新一代无线通信系统中,智能天线、多载波调制、软件无线电、MIMO、空时编码等一系列最新技术得到广泛应用,新一代系统整体的算法复杂度和传输性能较上一代系统有一个数量级
超宽带(UWB)通信技术是一种全新的短距离无线通信技术。它利用极窄脉冲传输数据,具有传输速率高、功耗低、抗多径能力强等许多优点。本文以IEEE 802.15.3a为信道模型,设计了
OFDM由于其良好的抗多径时延性能,已经被用在许多宽带无线系统中,而MC-CDMA是将OFDM和CDMA有机的结合起来,具有高频谱利用率、高数据传输速率、很强的抗窄带干扰以及抗符号间
作为由中国提出,并已经成为国际第三代移动通信三大主流标准之一的无线传输技术,TD-SCDMA在2005年、2006年两年间取得了飞速的发展,受到了包括设备制造商、网络运营商和业务提供
随着多媒体通信技术的发展,人们开始极大程度的享受着通信技术带来的便利和丰富内容,然而通讯手段的多样性,给多媒体的发布、传输和使用带来了新的困难和挑战,多媒体自身的多