论文部分内容阅读
说话人识别系统根据语音自动识别说话人的身份,是一种基于生物特征的识别系统。本文从统计的角度出发,研究并确定了构成识别系统的各个基本环节和技术路线,建立了基于统计的与文本无关说话人识别系统的软件平台。在此基础上,本文深入研究了说话人识别系统的构造及基鲁棒性增强技术,并获得了以下成果和结论:
提出了基于通用字的GCB-HMM背景模型,并与GMM的说话人模型一起构成混合的识别系统。该模型一方面可以划分出输入语音中的语音段用于说话入GMM模型的训练或似然值的计算;另一方面还可以提供输入语音相对于背景的似然得分,用于归一化似然值。
提出了基于浊音的说话人识别系统,并针对不同的信噪比和噪声类别,与基于通用字的识别系统进行了比较。实验表明,采用基于浊音的说话人模型可以提高说话人确认系统对于噪声的鲁棒性。
建立了基于自适应GMM模型的说话人识别系统,并将非特定人的背景模型与特定人的cohort模型相结合,提出了似然得分混合归一化的方法。得分归一化技术可以减少话筒、信道等环境因素的影响,有助于在决策过程中采用统一阈值。电话语音条件下的说话人确认实验表明,在自适应GMM模型似然比得分的基础上,混合归一化的方法能获得最佳的识别效果。