论文部分内容阅读
随着计算机软硬件技术和语音识别技术的发展,基于语音识别技术的计算机辅助发音训练系统(CAPT系统)在教育领域的应用越来越广泛,而如何为用户的口语发音提供准确有效的反馈是当今CAPT系统研究的核心课题。在这一背景下,本文围绕声学模型的建模方案及其在纠错算法中的应用,进行了系统而深入的研究,并且根据系统性能的实际需求,将神经网络模型引入到系统,同时也对系统的纠错算法进行了改进。
本文的主要工作包括以下三个部分:一、根据以往CAPT系统的评测结果和中国人英语发音的常见错误,划分易混淆音素集,以便于后期针对这些易混淆音素集进行更精细的评测;二、针对HMM模型对易混淆音素辨识能力较弱的缺陷,提出用神经网络为易混淆音素建立模型,进而提高系统对易混淆音素的辨识能力;三、分析传统的对数似然度纠错算法的缺陷和不足,将神经网络模型引入到纠错算法,进而提高系统的纠错能力,优化系统的整体系能。
经过以上三方面的改进,CAPT系统对用户发音的纠错性能得到了很大程度的提高。实验结果表明神经网络模型对易混淆音素的辨识能力远高于HMM对易混淆音素的辨识能力,将神经网络模型引入到传统纠错算法以后,在保证音素识别正确率不变的前提下,系统纠错性能有很大的提高。