论文部分内容阅读
近年来,口语对话系统的应用越来越广泛,其中语音识别算法直接影响到整个系统的性能,但在某种程度上现有语音识别算法并不能满足需要。为了提高口语对话系统中语音识别的性能,本文对语音识别中的关键词识别方法进行了研究,内容主要包括如下几点:
1.声学模型参数共享的研究:为了解决训练数据的稀疏问题和加快关键词检出的搜索速度,本文对声学模型的参数共享策略进行了分析,提出了改进的合并分级聚类算法,并将其应用于模型状态级别的参数共享。语音识别器采用参数共享后,识别过程的时空消耗大大缩减,同时识别正确率仅有较小的损失。
2.关键词检出搜索策略的研究:针对关键词词表规模扩大后,关键词检出性能不佳的现实,本文采用了当前主题指导的关键词检出的搜索策略:利用当前主题及其对应的活跃词表生成识别有限自动机,指导关键词的检出。主题指导下的活跃词表规模减小,关键词检出算法的识别性能有了很大的提高,基本满足口语对话系统的需要。
3.语音确认方法的研究:本文对用于语音确认的各种置信特征进行了分析和比较,选择传统的基于垃圾模型的分段后验概率统计值和本文提出的线性预测编码二次识别结果作为置信特征;设计支持向量机分类器联合多种置信特征给出确认结果,取得了很好的确认效果。另外,本文对基于统计假设理论的似然比语音确认方法进行了改进,提出了一阶段的快速联合似然得分和似然比得分的连续语音识别确认方法,克服传统二阶段确认方法的待确认语音切分边界不准的缺点,提高了系统的效率和识别性能。
4.鲁棒语音识别方法的研究:为了提高关键词识别系统的鲁棒性,以克服训练和识别环境不一致导致的真实含噪环境下识别正确率过低问题,本文提出了基于邻接空间的后端贝叶斯预测识别方法。相对于传统的语音识别方法,该方法在保证干净语音测试集的识别率没有大的下降的前提下,对叠加高斯白噪声和有性别差异的测试集的识别率都获得了较大的提高。