数字波导网格模型及语音网格参数估计

来源 :苏州大学 | 被引量 : 0次 | 上传用户:num184015922
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数字波导网格是一种精确描述说话人发音器官的声学模型,它最早应用于声音的合成。通过数字波导网格,人们能够合成出自然度更高的语音。从语音中估计出数字波导网格的参数,是当前研究的热点和难点。波导网格参数中包含了语音的内容、说话人的个性特征等诸多信息,因此,从语音中估计出精确的参数,在语音识别、说话人识别等研究方面有很重大的意义的。然而,目前的参数估计研究中,仍存在着许多问题,比如需要借助某些照相设备或者假设一些与真实状况不符的条件等等;核磁共振成像(MRI)技术的使用,人在发音时声门、声道的状态能够被更精确地观测到,但是实际操作起来难度很大。针对以上问题,本文做了以下几方面工作。一、根据语音产生的声学模型,详细介绍了一维数字波导模型,并在传统的离散化声道长度的模型上作了改进,合成了可变声道长度的语音,丰富了语音合成的理论。二、引入了声门声道滤波器(GVTF)的概念,比较了它和传统声道滤波器(VTF)的关系和区别。介绍了一种从元音中提取GVTF、VTF和声门波的算法,和传统的LPC参数做了比较。本文首次在数字波导网格模型的基础上提出了运用计算机程序自动提取GVTF参数的方法,并讨论了其作为说话人识别参数的可行性。实验证明,GVTF参数能够较好的反映说话人的个性特征。三、验证了提取到的参数的有效性。首次将提取到的GVTF参数应用于说话人识别,在相同的GMM识别模型下,与传统的MFCC参数作了比较。实验证明,随着信道的变化,GVTF参数比MFCC具有更高的识别率。
其他文献
国外已经将基于数字微镜器件(DMD)的动态红外景象投影技术应用于红外成像制导仿真系统。该技术采用二进制脉宽调制技术来控制生成的红外景象的灰度级,它能够产生高空间分辨率
随着物联网、智慧地球等概念的提出,遥感影像在人们的日常生活中扮演着越来越重要的角色。然而,由于遥感影像内容复杂丰富的特点,从遥感影像数据中快速获取感兴趣信息是一个公认的难题。基于内容的图像检索为遥感影像的检索提供了很好地解决方案,它通过分析图像的内容(包括颜色、纹理、形状、对象及空间关系、上下文及语义等)实现图像检索。空间探测技术和通信技术的发展使得目前可获取的高分辨率遥感影像数据每天都在以惊人的
多天线技术因其在提高系统容量和系统分集能力等方面的优越性,越来越受到人们的重视,已成为新一代移动通信技术研究的关键所在。在实际传输环境中,通常存在一些非理想因素,这
21世纪是海洋的世纪,联合国《21世纪议程》指出海洋是全球生命支持系统的一个基本组成部分,也是一种有助于实现可持续发展的宝贵财富。研究海洋生物对人类发展有着非常重要的
本学位论文的研究课题来源于国家科技重大专项“新一代宽带无线移动通信网”(项目编号2010ZX03005-001-01),主要进行超高速无线局域网(WLAN)无线接口关键技术的研究和验证,通
摘 要:本文主要是根据大连国家石油储备基地的建设情况,对10×104双盘浮顶油罐的标准化施工进行概述。  关键词:标准化 施工 方案    该基地工程总库容量为300万立方米,共建10×104双盘浮顶油罐30座及配套装置,该工程由大庆油田工程建设有限公司PC总承包。以下叙述内容以单台罐施工为例。  一、主要施工方案  1、安装部分:  1.1底板安装  a.绘制底板排版图。  b.确定油罐安装方
半导体制造设备以及电子产品加工设备越来越趋向于小型化,响应速度越来越高.为此,其驱动用的伺服电动机也要求体积小,节省占用空间,低惯量以提高其响应速度.多年来,富士电机
天波超视距雷达(OTHR)利用电离层对电磁波的传播实现超视距探测,因其拥有特殊的工作频段和特殊的工作方式,使其具有探测距离很远、超视距探测、反隐身和抗电磁干扰能力强等特
随钻测量MWD(Measurement While Drilling)一般指钻井工程参数如井斜角、方位角和工具面角等测量参数,在钻井过程中用数据遥测系统将测量结果实时送到地面进行处理。所测得的
随着通信技术的迅速发展,其涉及的领域也越来越广,以模式识别为基础的通信信号调制模式识别技术是软件无线电领域中的重要研究课题,经过多年的研究和发展已经取得了很多研究