论文部分内容阅读
为了提高口语对话系统中语音识别性能,本文从识别算法和语音确认两个主要方面出发,在关键词搜索性能、语境知识对关键词识别的指导及新语音确认特征诸方面进行了研究,提出如下方法、策略:
1.关键词动态确认。针对关键词的漏检错误大多数都与另一错误关键词的误警错误有关这一现象,提出关键词动态确认的概念。在搜索过程中引入虚拟OOV模型来对产生的关键词候选进行确认,及早地将不正确的关键词候选剪除,从而避免其对正确关键词候选的干扰影响。实验表明:在误警率相同的条件下,误识率下降了约10%。
2.语境知识指导下的关键词识别策略。针对目前的各种语音识别方法在对话系统中性能不佳的现实,为改善对话系统的整体性能,提出对话语境知识指导下的关键词识别策略:利用对话管理器给出期待焦点信息,确定对应焦点下的活动词表、活动规则集,生成相应的识别自动机,并用其来指导关键词识别。实验表明:语境知识指导下的关键词识别算法具有很高的识别性能和鲁棒性,基本能够满足口语对话系统的需要。
3.上下文相关语音确认策略。通过分析识别结果中互相干扰现象的发生,发现待确认结果前后序词的确认度会对待确认词本身的确认度有一定的指示作用,提出上下文相关语音确认策略:引入上下文知识来指导语音确认,改善语音确认的性能。利用待确认词与其前后序词的确认特征组成待确认词的上下文相关确认特征,体现出识别结果中的前后序词对当前待确认词的影响。实验表明:该算法的拒识性能明显好于传统语音确认算法。