论文部分内容阅读
本文主要研究在不同的语音识别应用场合中,在不同语法约束条件下,置信度的一般计算方法和相关具体应用。本文将置信度计算归结为纯声学和带语言两个部分,对这两部分置信度的一般方法进行了分析,给出了统一的置信度计算方法,并在该计算框架下,分别研究在弱语法、统计语法和强语法约束条件下,置信度的具体计算方法和应用效果。论文工作的主要内容和创新点如下:
(1)归结出语音识别中置信度计算的一般方法,将置信度分为纯声学和带语言两个部分,并给出各自的一般计算方法,使得在不同语法约束条件下的置信度计算得以在统一的框架下进行研究。
(2)以电话关键词检测系统为例,研究在弱语法约束条件下的置信度算法,在基于在线垃圾模型的声学置信度基础上,引入基于MCE准则的声学置信度优化方法,并利用局部语法信息提升置信度性能,使关键词检测系统的等错误率相对降低了13.8%。
(3)以大词汇量连续语音识别系统为例,研究在统计语法条件下的置信度算法,将基于词图后验概率的置信度计算方法归结为语言置信度的计算,并指出该方法与基于在线垃圾模型的置信度在引入竞争路径提高性能方面的一致性。在2004年度“863”连续语音测试集下,置信度的等错误率达到22.7%。
(4)以电话关键槽检测系统为例,研究在强语法条件下的置信度算法,主要说明槽语法的动态扩展技术对压缩搜索空间,降低搜索错误方面的应用,并给出利用置信度信息降低前垃圾词对关键槽检测系统影响的方法。通过这两种改进方法,系统的槽识别率从47.1%提高到了65.2%。