论文部分内容阅读
在语音识别领域,针对具体的任务进行分析进而挑选自适应数据,往往能够获得更好的自适应效果。本文提出一种基于任务分析的声学模型自适应方法,该方法针对特定任务,分析任务相关语音单元特性(覆盖度、混淆度);并采用贪婪算法在候选语音数据挑选一定量的数据,对声学模型进行自适应。实验表明,与使用全部候选数据进行自适应相比,基于任务分析的自适应数据挑选在仅使用10[%]的数据时即可获得相同或更好的自适应效果,通过进一步考虑混淆度,自适应性能能够得到进一步改善。