论文部分内容阅读
该文工作主要围绕语音识别中两个既独立又相互有联系的领域:非特定人语音识别和语音拒识算法研究.该文结合非特定人语音识别系统的特点,提出了一种新的基于音素的非特定人英语语音识别算法,并在此算法基础上构建了一个非特定人英语命令词识别系统.系统的实现采用了隐马尔可夫模型工具包(HTK)与Visual C++两种工具混和使用,提高了整个系统的开发效率.在识别阶段针对词汇量大小采用不同的音素串匹配算法,在一定程度上提高了识别的质量.同时,该文采用话音活性检测(VAD)算法和自动增益控制(AGC)算法实现了在不同环境下的线语音识别,提高了该系统的实用性.语音拒识技术是从实验室转向实际应用的关键.该文首先研究了当前应用最为广泛的在线废料模型(Online Garbage Model)和反词模型(Anti-word Model)的算法,分析了它们的优缺点.然后在此基础上提出了一种新颖的基于置信度的非特定人语音识别拒识算法,该算法同时考虑了备选假设模型和多候选的信息,适用于拒识不正确的识别结果和词表外(OOV)语音.我们在一个非特定人英语命令词识别系统中作了一些相关的实验来评估这个算法的性能.实验结果表明,该算法可以有效的去除识别不可靠的语音,提高系统的识别率和稳健性,与基线系统相比,误识率下降了19﹪到23﹪.