论文部分内容阅读
在语音自动切分中普遍采用的声学模型是三音子模型。研究表明,以三音子模型为单元模型在语音自动切分中是存在局限性的。其原因在于连续语流并不是简单的音子串联组合,各音子结合的紧密程度或协同发音现象,在不同的环境下是不同的,从而导致不同的音变现象并影响切分精度。本文针对三音子模型在英语语音切分中的不足,根据语音学知识和实际训练数据,增加了一批较长的语音单元组成了不定长的语音单元,并在此基础上提出了基于不定长单元HMM 模型的语音自动切分方法。利用三音子模型的初始对不定长单元HMM 模型进行训练,可以获得令人满意的结果:长单元的边界切分准确率从79.6%提高到了89.1%,总体切分精度上较三音子模型也有了一定的提高。