论文部分内容阅读
本文的主要工作包括了两个方面的内容:·广东话识别:嵌入式广东话语音识别系统中声学模型的建立;·北方方言识别:声调识别在北方方言中的作用.汉语普通话连续语音识别技术已经发展得比较成熟,而且近些年来广东话语音识别系统已经逐步跟上.但是将广东话语音识别引擎集成到嵌入式移动设备——手机上还是鲜有涉及.本文的工作之一就是为嵌入式移动设备上的广东话语音识别系统进行声学建模,其难度在于嵌入式移动设备所特有的内存容量少和计算能力低.因此本文对两种数据库采用了不同的基元进行建模:·针对数字,采用了音节作为模型的基元;·对于控制命令集或连续语音识别采用了上下文右相关的声母(right context dependent initial,RCDI)和上下文无关的韵母(context independent final,CIF)作为模型基元.这种建模方法既考虑了音节内的协同发音,又降低了训练基元的数目,在声学模型规模、计算速度和识别率之间达到了平衡.汉语是带调语言,声调是汉语的主要属性之一,具有构词、辨义等功能.汉语由很多方言组成,以北方方言为主,占总人口的70﹪以上.普通话以北方方言为基础,他们之间存在着很多相似的地方,我们通过在特征矢量中增加声调特征的方法提高普通话连续语音识别系统的识别率.那么当我们的系统的用户群是具有北方口音的说话人时,我们是否需要在系统中增加声调的识别来提高识别率?声调在北方方言识别中起什么作用,我们不得而知,而且也没有文献尝试过这种研究.因此本文的工作在这个方面做了开拓性的研究.通过对比普通话、北京话、武汉话和西安话,我们得出结论:·精确的基音提取算法对声调识别非常重要;·声调特征对于普通话识别是有帮助的.在我们的实验中得到了大约10﹪的错误率下降;·从识别效果上看,针对普通话设计的语音识别器是可以用于北方方言的识别,每种方言都获得了较好的识别率;·尽管与普通话有着相同的音节结构,但基于普通话的声调识别方法对识别北方方言没有任何积极的作用,反而会降低识别率;·发音与普通话相差越多的方言,声调特征对它的影响越大.