论文部分内容阅读
语种识别技术作为信息处理系统的前端和多语种交流领域的接口,可以辨识语音的语种信息,为后续技术处理和交流者提供必要的条件,有着巨大的应用需求和价值。本文重点研究语种确认系统算法,主要围绕PPRLM(并行音素识别器接语言模型系统)语种确认基线系统中的三个问题进行:语种辨识系统中的语言模型改善、系统分类器融合策略、开集测试中系统性能。
语种确认系统的语言模型是其核心之一,为了提高语言模型的精度,本文采用段长作为置信度,提出了“基于段长的语言模型修正算法”,该算法结合段长置信度信息对语言模型进行估值,并与无段长置信度语言模型一起给出“修正因子”,用于修正语言模型估值,以此改善语言模型精度,提高系统性能。
本文研究了分类器的加权平均线性融合策略,利用“MCE权重优化训练算法”(Minimum Classification Error,MCE)估计分类器权重。研究了训练中各关键参数的影响,并分析了该训练算法存在的问题,提出改进措施,改善了融合系统性能。
针对开集测试,本文构建了“跳跃式”语言模型,得到多个时间层次上的模型,然后提出“多层语言模型融合算法”,提高了系统在开集测试的精度。在多层语言模型融合的基础上,本文提出了“基于背景模型的两阶段语种确认算法”。算法在不同阶段采用鉴别能力不同的背景模型,第一阶段采用“有限背景模型”,第二阶段采用“通用背景模型”,两阶段算法最终有效地降低了系统在开集测试中的错误率。
最后论文采用2005年国际NIST(American National Institute of Standardand Technology)语种技术评测数据库对采用本文算法的系统进行整体测试,分别对30s、10s语音进行闭集和开集测试,采用本文算法的系统均获得了等错率的降低,从而验证了算法的有效性。