论文部分内容阅读
从landmark处提取声学特征在发音偏误检测中取得了良好效果,然而确定landmark的位置需要研究发音机理和大量人工标注,效率不高。为此,本文提出基于CTC(connectionist temporal classification)的数据驱动的方法检测landmark,即以CTC训练的RNN声学模型估计的音素后验概率的尖峰位置作为lardmark。实验首先检验CTC提取的尖峰位置与TIMIT语料库中人工标注的landmark是否具有一致性,然后将CTC提取的landmark应用到发音偏误检测中验证其有效性。实验结果表明:基于CTC的lardmark与人工标注的landmark一致眭很高,CTC提取的landmark进行偏误检测整体性能与基于知识的landmark系统相当。