汉语连续语音识别及其在移动机器人导航中的应用

来源 :西安理工大学 | 被引量 : 0次 | 上传用户:q3821713
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
汉语连续语音识别的研究已经进行了十多年,取得了一定的成果,但仍然有许多重大的技术问题亟待解决。首先,声学模型的鲁棒性和准确性有待进一步提高,需要深入研究语境相关的声学建模,特别是汉语三音子模型;其次,当训练和识别的环境由于信道和背景噪声的不同或者说话人自身原因而导致系统识别率下降,需要我们深入研究自适应的方法;最后,我们还需要研究技术的可移植性,即如何将识别结果二次利用,以期加快新领域的研究速度。本文的主要研究工作围绕这些关键技术问题展开。首先,研究了基于决策树的三音子建模技术。针对汉语语音识别,我们研究了决策树建模中必须解决的几个主要问题,包括汉语基本建模单元的选择、问题集的设计原则、决策树建模复杂度的优化。在建模单元的选择中,本文在比较以往汉语语音识别中用到的建模单元的基础上,提出了新的建模方法,该方法使用将六个零声母附加到标准声韵母序列的新的声韵母集合作为识别基元,并根据这种识别基元结合语音学和语言学的先验知识设计了问题集,利用基于决策树的状态共享策略建立上下文相关三元声韵母模型。在用基于HTK工具构建的识别系统上进行实验,结果表明,新的声韵母基元与标准声韵母相比,识别性能有了很大提高。其次,在说话人自适应模块中比较了最大后验概率(MAP)算法和最大似然线性回归(MLLR)算法各自的优缺点,提出一种优化的自适应方法。这种方法综合了MAP的渐进性和MLLR的快速性,在语音识别系统运行过程中逐渐调整系统参数,不断使用新的数据来自适应。经实验论证表明,优化的自适应算法性能较之以往的自适应算法识别效果更好。最后,通过使用ATK工具,在Microsoft Visual Studio.NET环境下编写应用程序,将识别的结果存储在一个变量中,继而用识别结果来导航一个移动机器人的行走。导航实验证明,本文的语音识别系统应用是成功的,并且识别率可以达到85%以上。
其他文献
该文着重于轻型飞机低空遥感中的速度校正.通过对轻型飞机低空遥感图像几何特征的研究,总结了轻型飞机低空遥感过程中对图像几何特征的影响因素.讨论了一些柢空遥感扫描图像
学位
该论文合成了LaSrMnO,LaBaMNO(0≤X≤1.8)LaBaCoO(0≤X≤1.5)LaBaCoO三个系列的稀 土过渡金属复合氧化物.其中La,,3-X>BaMnO及LaBaCoOLaBaCoO三个系列为首次合成.研究了样品
期刊
该文在总结国内外城市地质环境研究现状和进展、城市地质环境演化及其特性、城市规划和城市功能用地基本类型的基础上,系统论述了城市规划建设和地质环境的基本关系,即地质环
论文是选自中国地质大学工程学院与辽河油田"海南构造带地应力及裂缝分布规律研究"项目的一部分,该文首先讨论了地应力和裂缝概念、定量分析及在油田生产中应用.指出了目前所
大型挖泥船的整体设计中起到连接作用的人字架受力比较繁多;本身布置和几何尺寸极大影响了起升变幅机构的机构设计选型,也影响着转台上筋板布置及转台的弯矩分布,三套卷扬机
该文以华北东南部的石炭-二叠纪煤系和大别山北麓的石炭纪煤系为研究对象,研究煤系岩样和煤样的稀土元素特征,并探讨其构造及环境意义.得出主要结论如下:1.华北晚古生代煤系
期刊
康定温泉系统位于四川西部的鲜水河活动性断裂带的南段,是引人注目的水热活动带.其温泉中HCO平均含量高达1099mg/l,CO分压明显高于大气CO分压,温泉气体组分中高达90﹪以上为CO,