汉语语音信号驱动虚拟人的研究

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:xhh2010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着虚拟现实技术的发展,对三维虚拟人的研究成为虚拟现实领域的热点。在电视动画和计算机游戏中,逼真的模型给人以良好的视觉效果。近些年来,越来越多的学者对虚拟人的建模以及虚拟人的驱动方式的研究表现出极大的兴趣,并分别提出了自己的方法。三维虚拟人驱动方法的研究不仅减少了开发商的投资,而且让用户有更大的选择范围,所以,它的商业价值与实用价值都是不可估量的。由于语音与口型有明显的映射关系,可以通过这种映射关系实现语音信号对虚拟人口型动画的驱动。而语音与虚拟人的动作之间则没有直接的对应关系,很难通过语音信号直接驱动虚拟人动作。虽然目前研究者们已经提出了许多方法,实现了对虚拟人的驱动,但是方法的复杂度较高,有必要对其进行进一步改进。针对上述问题,本文提出一种基于汉语语音识别的方法驱动虚拟人,该方法通过语音识别,可以分别驱动虚拟人的肢体动作与面部动画。首先,建立语音识别模块,将语音信号转化为文本信息;其次,将语音识别模块加入到虚拟人聊天系统中,实现语音信号对虚拟人动作的驱动和聊天系统的控制;接着将语音识别模块加到三维人脸口型动画的系统中,实现语音信号对虚拟人口型动画以及表情细节的驱动,并通过TTS技术,得到与输入语音同步的三维人脸动画。本文使用微软语音开发包,首先通过构建语音识别类,从而建立语音识别模块,完成语音信号到文本信息的转换,接着将语音识别模块分别添加到虚拟人聊天系统和三维虚拟人脸动画的系统中,实现了汉语语音信号对虚拟人动作和面部动画的驱动。最后,实验结果表明该方法简单实用,识别的准确率也能被用户所接受。
其他文献
计算机网络和多媒体技术的迅速发展,使得大量的图像数据信息通过网络进行传输,这些信息的安全性逐渐成为人们所关心的问题。由于传统技术无法对数字图像这样数据量大的信息进行
城市交通问题是困扰城市发展、制约城市经济建设的重要因素。针对城市交通拥堵问题的解决途径主要有交通诱导和交通控制,而实现交通诱导和交通控制的关键则是能否对交通流进
随着信息时代的到来,无线通信业务和需求的快速增长,频谱资源的缺乏日益严重。如何进一步提高频谱利用率,从而进一步提高系统容量和通信服务质量是下一代无线通信亟待解决的问题
随着人们对无线通信业务的需求的不断提高,尚未普及的3G移动通信系统已经无法满足用户的需求。因此,越来越多的人开始将注意力集中到下一代的(Beyond3G或4G)移动通信技术的研究上
TETRA数字集群系统是ETSI推出的新一代数字集群通信标准,该标准在2000年前后进入中国后,TETRA数字集群系统在我国获得了较大规模的应用。然而我国集群产业仍处在初期发展阶段,国
期刊
呼叫中心是一种充分融合现代通讯技术和计算机技术,为客户服务、市场营销、技术支持和其他的特定商业行为而接收和发出呼叫的服务性实体。这种成功的技术融合与应用,在为商业企
认知无线电(Cognitive Radio,CR)技术能够有效地缓解当前频谱资源匮乏的现状,旨在不干扰授权用户(主用户)正常通信的前提下,使得感知用户(CR用户)能够充分利用空闲频谱,以提
2008年早春的异常冰冻使我国南方地区的电力与通信系统大面积中断,5月的汶川震灾更严重破坏了震区的通信,一种需求被迅速提到日程:在重要场合,如指挥,应急救灾通信,电力调度系统等
在过去的几十年间,人们对通信质量的要求不断提高,宽带、高速成为通信技术发展的必然趋势,这就要求通信系统必须具有良好的纠错性能,并能够充分利用有限的频谱资源。   信道编