基于子词分割的语种辨识系统研究

来源 :上海大学 | 被引量 : 0次 | 上传用户:liangzi_li1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语种辨识就是用计算机来自动识别一段语音属于哪种语言的一项技术,它是在语音识别基础上发展起来的。随着语音识别技术的不断发展,语种辨识作为语音识别的一个方面和它具有的重大意义,也越来越受到人们的广泛重视。从上个世纪七十年代到现在,语种辨识虽然只经历了短短的几十年的发展,但识别方法己有多种。这些方法虽然各有特点,但比较成熟的方法还不是很多。目前,我国对语种辨识的研究较少,尚处于起步阶段。 语种辨识与传统的语音识别虽然有一些相似之处,但也存在许多不同的地方。语种辨识主要是要寻找不同语言之间的差异,而不用具体判断每段语音中的内容是什么,这种差异体现在几个方面:不同的语言发音方式不同;不同的语言的韵律不同;不同的语言词法、句法不同。充分利用这些差异才能达到更好的语种辨识效果。 本文提出窗移美尔倒谱最小失真的方法,对语音进行子词分割处理,对切分后的语音子词提取声学层次上的信息,即计算其美尔倒谱参数(MFCC),并结合其一阶差分特征一起作为子词系统中语音的声学特征。利用聚类的方法将它们聚成Ⅳ类,并对每一类的子词建立一个隐马尔可夫模型(IIMM)。用国际标准语种库OGI-TS中的语料,在六种语言和10s测试语音的子词系统下识别率为71.67%,取得了较好的语种辨识结果。实验结果说明基于子词切割的语种辨识系统是一个易于分割和实现的有效语种辨识系统。 本文进一步提出利用超声层次上的韵律信息建立模型来进行语种辨识。在子词分割的基础上结合元音/辅音检测模型将语音分割为CV的假音节模型,然后对每个假音节提取一个五维的特征P={D<,v>D<,c>N<,c> E F<,O>}的韵律参数。分割结果比传统的分割方法更适合韵律信息的提取,在韵律系统中,对所有的语言建立一个高斯混合模型(GMM),并从两个方面去考察模型建立的好坏,即研究模型的离散度和模型之间的干扰程度。在五种语言10s测试语音条件下韵律信息的平均识别率为65%。实验表明,对每种语言建立GMM的韵律模型对不同的语言、不同的语系和同一语系中不同语言均具有一定的区分效果。本文将以上两个系统进行两级判决形式的融合研究。两个系统融合后识别率提高至75%。实验表明,通过这种融合获得了比单利用子词系统或者韵律系统更高的识别率。 最后,本文通过具体实验对影响系统识别性能的因素进行深入分析,并加以归纳和总结,指出今后努力的方向。
其他文献
智能交通系统是将先进的信息技术和系统工程技术集成,建立起全方位、实时准确、高效的交通系统,以使现有交通基础设施发挥出最大的效能,提高服务质量。 研究讨论了架构网络的
期刊
随着数字显示技术和芯片技术的快速发展,主流的数字电视的刷新频率和图像分辨率越来越高,然而由于视频源固有拍摄频率低或传输带宽受限等原因很多视频的帧率较低,低帧率视频
在一些特殊的环境中,由于受衰减、遮挡以及强干扰等因素的影响,会使得接收到的卫星导航信号的可用性和完好性发生显著地降低,进而影响到最终的导航定位结果,因此需要对这些情况下
目的:探究消化科老年患者压疮的护理措施极其应用效果.方法:抽取本院2016年3月~2017年4月消化科收治的50例老年患者作为研究对象,将其随机分为两组,其中给予常规护理一组作为
本文对基于IEEE 802.16d OFDM载波同步技术进行了研究。重点探讨了SS物理层同步算法、相关系统原理和系统的设计。主要内容包括: (1)基于导频的载波和采样频偏的联合跟踪算
流密码也称序列密码,它是对称算法的一种。其具有历史悠久,软硬件都便于实现,加密解密速度快,有限传播错误等特点。因此在实际运用中,特别是在军事、外交等机密领域有着重要
随着IP协议由IPv4向IPv6的过渡,各种路由选择协议也要进行相应的改进。边界网关路由协议BGP4+是目前在IPv6网络中部署最广泛的域间路由信息交换协议,是当前在连接AS域中使用
下一代网络NGN是基于分组技术的网络,能提供多种业务,它是适合提供实时语音和多媒体业务的软交换网络。但是由于IP地址不足,在软交换网络建网后到部署IPv6之前,大量的终端不得不
随着计算机和网络技术的迅速发展,以Internet为代表的信息网络给人们的生活带来了巨大的变化,而移动IPv6协议的提出又为移动用户提供了很好的服务。移动IPv6协议使得移动节点