中文方言语音识别的研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:wangxq198
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文的主要工作包括了两个方面的内容:·广东话识别:嵌入式广东话语音识别系统中声学模型的建立;·北方方言识别:声调识别在北方方言中的作用.汉语普通话连续语音识别技术已经发展得比较成熟,而且近些年来广东话语音识别系统已经逐步跟上.但是将广东话语音识别引擎集成到嵌入式移动设备——手机上还是鲜有涉及.本文的工作之一就是为嵌入式移动设备上的广东话语音识别系统进行声学建模,其难度在于嵌入式移动设备所特有的内存容量少和计算能力低.因此本文对两种数据库采用了不同的基元进行建模:·针对数字,采用了音节作为模型的基元;·对于控制命令集或连续语音识别采用了上下文右相关的声母(right context dependent initial,RCDI)和上下文无关的韵母(context independent final,CIF)作为模型基元.这种建模方法既考虑了音节内的协同发音,又降低了训练基元的数目,在声学模型规模、计算速度和识别率之间达到了平衡.汉语是带调语言,声调是汉语的主要属性之一,具有构词、辨义等功能.汉语由很多方言组成,以北方方言为主,占总人口的70﹪以上.普通话以北方方言为基础,他们之间存在着很多相似的地方,我们通过在特征矢量中增加声调特征的方法提高普通话连续语音识别系统的识别率.那么当我们的系统的用户群是具有北方口音的说话人时,我们是否需要在系统中增加声调的识别来提高识别率?声调在北方方言识别中起什么作用,我们不得而知,而且也没有文献尝试过这种研究.因此本文的工作在这个方面做了开拓性的研究.通过对比普通话、北京话、武汉话和西安话,我们得出结论:·精确的基音提取算法对声调识别非常重要;·声调特征对于普通话识别是有帮助的.在我们的实验中得到了大约10﹪的错误率下降;·从识别效果上看,针对普通话设计的语音识别器是可以用于北方方言的识别,每种方言都获得了较好的识别率;·尽管与普通话有着相同的音节结构,但基于普通话的声调识别方法对识别北方方言没有任何积极的作用,反而会降低识别率;·发音与普通话相差越多的方言,声调特征对它的影响越大.
其他文献
共享发展理念是中国特色社会主义的本质要求,有着深厚的理论和现实基础.全民共享、全面共享、共建共享、渐进共享是逻辑严密的辩证统一体,其中共享的全民性是建设目标,共享的
学位
超(超)临界火电是目前我国能源发电的重要方向,是涉及国家经济发展命脉的重大基础产业。随着发电机组向大容量、高参数方向的发展,对机组设备关键材料的性能要求也越来越高。因此
随着我国石油、天然气资源的开发和利用,用于制造石油、天然气输送管线用的宽厚钢板的需求量将不断增加。具有高强度、高韧性、良好的可焊性、低温下的断裂抗力和抗H2S侵蚀能
  血浆中TFPI含量很低,只有约50-70ug/L。为了得到大量TFPI用于功能研究及临床应用,利用基因工程的方法生产重组TFPI是较好的选择。然而TFPI结构复杂,在许多表达体系中都未能
在生物医学诊断与检测、细胞成像领域,传统的抗原-抗体反应灵敏度和特异性均较好,酶联免疫反应在各种生物分子的探测中发挥着举足轻重的作用,市场上的许多试剂盒就是基于此原理
1994年,21岁的杨彩虹踏上了西去的列车.rn初来兵团,坐落在阿拉套山山脚下的五师八十四团六连,也像她的家乡甘肃省张掖市华寨一样,是一个“小村庄”,目光所及处是低矮破旧的土
期刊
本文以双效冲击板加双孔单坝结构的FTSC中间包为研究对象,应用FLUENT商业软件,建立了中间包内钢液流动与传热三维耦合及夹杂物运动的数学模型,计算了中间包内三维流场、温度场、
氧化铈纳米粒子具有本体氧化铈的性质,如能快速产生氧空位,具有很高的储氧能力,同时又因为尺寸小而具备纳米材料的小尺寸效应、量子效应、表面效应和生物亲和效应,因而比本体氧化
本文提出了一种利用复旦大学已经设计出的具有自主知识产权的微处理器内核为起搏器的核心控制电路来设计DDD起搏器的设计方法。利用内置微处理器的程序控制功能进行起搏器设