云南民族语口音汉语普通话语音识别研究

来源 :云南大学 | 被引量 : 0次 | 上传用户：quickz

【摘要】

：

非母语口音、少数民族语口音是汉语普通话连续语音识别应用中必须面对的问题，论文研究民族语口音普通话的口音识别和语音识别。论文以傣语、傈僳语和纳西语口音为实例，研究如何

【作者】

：

杨鉴

【机构】

：

云南大学

【出处】

：

云南大学

【发表日期】

：

2009年期

【关键词】

：

民族语口音口音识别连续语音识别说话人自适应特征参数集 MAP声学模型

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

非母语口音、少数民族语口音是汉语普通话连续语音识别应用中必须面对的问题，论文研究民族语口音普通话的口音识别和语音识别。论文以傣语、傈僳语和纳西语口音为实例，研究如何利用民族语口音的发音变异规律，在低成本和易于扩展的前提下，实现由标准普通话识别器到民族语口音普通话识别器的变换。　　论文的主要工作如下：　　 1.设计、构建“云南少数民族语口音普通话语音数据库”，为系统研究民族语口音普通话的口音识别和语音识别奠定基础。该语音库包括傈僳语、傣语和纳西语等三种民族语口音普通话，共有52位发音人，语音数据量为32.63小时。　　 2.基于支持向量机研究民族语口音识别，比较多种特征参数集的识别率。基于单个SVM的实验结果表明：在基音频率(F0)、短时能量(En)、MFCC和第一共振峰(F1)等4种特征子集中，基音频率参数集的性能最好；超音段特征(F0、En)的性能都优于音段特征(F1、MFCC)的性能。探索分类器集成方案，提出一种新的基于决策模板的SVM口音分类器集成方法。分别利用三种特征参数组合进行测试，结果表明：该集成方法的识别率都高于传统的多数投票法的识别率；基于F0+En+MFCC+F1，该集成方法有最高识别率，达96.1％。　　 3.比较研究MLLR、MLLR+MAP声学模型说话人自适应方法应用于民族语口音普通话的有效性，探索有监督/无监督、自适应语句数等对识别率的影响。实验结果表明：采用MLLR，当自适应语句数为30时，傈僳语和纳西语口音的不带声调的音节识别率都超过52％，带声调的音节识别率都超过37％；进一步增加自适应语句数依次到100、500时，其识别率的提高幅度逐渐减小。采用MLLR+MAP，当自适应语句数为500时，两种民族语口音不带声调音节识别率都到达了基线系统识别标准普通话的水平(82.4％)，而带声调音节识别率已经明显超过基线系统识别标准普通话的水平(63.8％)。　　 4.采用专家知识指导下的数据驱动方法，研究民族语口音普通话的声母、韵母和音节的变异规律；提出一种新的具有易于扩展性的多发音词典生成策略，以实现用某种口音的音节混淆矩阵自动构建该种口音的多发音词典。实验结果表明：引入二元语言模型后，采用多发音词典，三种口音普通话的识别率都高于采用单发音词典的识别率。

其他文献

基于流水线模型的Ad Hoc网络信息传递技术研究

在ad hoc网络中,对网络性能的分析往往简化成一个单链拓扑下的端到端网络的分析。流水线模型即是在单链拓扑情况,基于路径时钟节拍对端到端的数据进行理想的调度,以达到最大

学位

ad hoc网络流水线模型802.11DCF路由协议网络吞吐量

分布式频谱共享系统的动态p坚持CSMA接入算法研究

由于无线网络接入的便利性,现在人们十分偏爱无线通信,激发了无线业务的不断增长,而频谱资源的匮乏成为制约无线通信发展的瓶颈。频谱共享系统是一种利用认知无线电技术能够

学位

认知无线电动态频谱接入生成树动态p坚持CSMA

县域农业生态系统健康评价及其调控

本文以山东省桓台县作为研究区域，通过理论探讨、资料收集、实地调查和模型分析对其农业生态系统健康状况进行评估，并提出农业生态系统健康的调控对策。主要结果如下：①通过分析

学位

高产粮区农业生态可持续发展

基于几何双环RICE衰落MIMO信道的研究

与有线通信相比较，无线通信的传输环境比较恶劣。信号在无线信道中传播需要不仅要经过频域、时域上的衰落，而且还要经过空域上的衰落。采用分集技术来能够有效地克服衰落效应，从

学位

无线通信信道容量多输入多输出技术网络架构

低轨卫星DS-OQPSK信号同步中的数字滤波技术研究

本文以低轨卫星上行突发DS-CDMA信号接收为主要对象，针对其中的PN码同步技术，重点研究了基于信号插值的内插滤波器的设计。　　对于全数字接收机而言，AD采样大多采用与数据无

学位

低轨卫星

转Bar基因小麦根际微生物区系分析及风险性评价

Bar基因是从土壤吸水链霉菌(Streptomyce hygroscopicus)中分离出来的,它编码膦丝菌素乙酰转移酶(phosphinithricin acetlyltransferase, PAT),对草丁膦有很高的专一性,转Bar基因小麦具有抗除草剂的作用。根际是微生物发育的一个特殊生境,不同植物甚至同一植物在不同的生育期,其根系分泌物都会不同,而植物对根际微生物的影响主要是通过根系分泌物

学位

根际微生物转Bar基因小麦区系分析风险性评价

符合ISO18000-6C标准的RFID基带关键技术研究

随着RFID技术在社会众多领域内的大规模应用，其对改善人们的生活质量、提高企业经济效益、加强公共安全以及提高社会信息化水平都产生了重大影响。RFID是一种对目标进行非接触

学位

射频识别读写器射频识别读写器ISO18000-6C标准ISO18000-6C标准数字基带数字基带防冲撞算法防冲撞算法

快速行进算法在基于弥散张量成像的纤维连接中的研究与应用

磁共振弥散张量成像（Magnetic Resonance-Diffusion Tensor Imaging，MR-DTI）技术是目前能够无创的研究人脑纤维的唯一手段。DTI技术通过探测水分子的弥散特性，可以全面的描述白质

学位

磁共振弥散张量成像纤维连接阿尔茨海默病纤维结构快速行进算法

白桦种群间纤维性状与分子标记的遗传变异与相关

本文以东北五个地区的白桦天然种群为材料,利用方差分析对木材的纤维形态性状(纤维长度、纤维宽度、纤维长宽比)的变异进行了分析,同时运用ISSR、RAPD分子标记对五个种群的遗

学位

白桦纤维性状RAPD标记ISSR标记遗传多样性遗传相关

基于自适应动态规划的波形选择方法研究

自适应波形选择在雷达、声纳和认知无线电等领域中有着广泛的应用。尤其在近几年,加拿大Haykin教授提出“认知雷达”概念以后,波形自适应选择方法受到国内外众多学者的关注。

学位

波形选择部分观测马尔可夫决策过程模型贝尔曼最优方程反向动态规划算法Q-learning

云南民族语口音汉语普通话语音识别研究

与本文相关的学术论文