论文部分内容阅读
语种辨识是计算机通过分析处理一段语音信号以判别其属于何语种的过程。该技术是近年来语音识别领域的一个新的研究热点,可广泛应用于多语种信息服务和军事安全领域。
目前大多数的语种辨识系统都是基于连续语音识别的,以音素及音位配列信息来对语言建模。基于音位结构学方法的基线系统PPRLM在语种识别评测中具有较好的识别性能,但是系统扩展性差。
本文主要研究与文本无关的语种辨识方法,利用高斯混合模型和语言模型建立语种辨识系统。论文的主要工作有:
(1)利用高斯混合模型的声学系统近似的表示音素识别器,建立了基于高斯混合模型符号标记器和语言模型(GMM-LM)的语种辨识系统。这种方法不需要掌握各语种的专业语言学知识,系统扩展性比较好。GMM-LM语种辨识系统结合了声学方法和音位结构学方法。
(2)语音特征信息分为低层声学信息和高层语言学信息。近年来,特征信息的选用成为语音处理领域研究者不断关注的热点问题。本文提取动态的高层语言学特征建立了改进的语种相关的、联合的GMM-LM语种辨识方案,改进的语种相关的联合的GMM-LM系统减小了高斯混合模型和语言模型之间的相关性。
(3)提出了基于特征提取层和判决层融合技术的语种辨识系统。该系统利用了不同类型的特征对区分不同语种的贡献来增加不同语种语料之间的差异,并使相同语种的语料之间的差异减小。
实验表明,本文设计的基于高斯混合模型和语言模型的语种辨识系统具有较好的扩展性。同时基于特征提取层和判决层的融合系统能够有效的提高系统识别率。