论文部分内容阅读
说话人识别也称声纹识别,其目的是根据说话人的声音特征来完成说话人的辨认或确认。随着网络信息化技术的迅猛发展,身份验证的数字化、隐性化、便捷化显得越来越重要,说话人识别作为一种生物认证技术,在视觉监控、身份验证、司法刑侦及金融安全等领域有着广泛应用前景,成为当前语音信号处理领域的研究热点。说话人识别技术研究的关键是语音信号的特征提取和模式匹配等问题。本文在研究当前说话人识别主要算法的基础上,通过研究基于声学特性的倒谱特征提取方法和基于模板匹配及概率统计的模式匹配方法,研究实现了基于矢量量化VQ的说话人识别系统,重点研究设计了与文本无关的基于混合高斯模型GMM的说话人识别系统。论文主要研究内容如下:(1)总结归纳说话人识别技术的发展、研究热点和难点,分析讨论了现有说话人识别主要算法。(2)分析研究了说话人识别语音预处理,重点对减谱法语音增强算法进行了改进,通过实验分析了语音增强效果,提高了噪声环境下的说话人识别系统的鲁棒性;研究了说话人识别的特征提取原理和方法,仿真实现了说话人基音特征、LPCC和MFCC参数及差分倒谱参数等的提取。(3)在分析VQ基本原理、LBG算法和VQ码本初始化的基础上,设计实现了基于VQ的说话人识别系统,完成了模型参数训练和匹配识别过程,实验分析了不同模型参数及不同语音样本时长下的系统识别性能。(4)为了提高系统识别率和稳定性,在研究GMM模型参数估计期望最大化(EM)算法、模型参数初始化、训练和识别过程的基础上,研究设计了基于GMM的说话人识别系统,并完成了系统仿真实验,分析了不同模型参数、不同特征提取方法、不同语音样本时长和不同信噪比噪声环境下的说话人识别性能。(5)分析了开集说话人识别方法、说话人确认阈值选取方法,研究了一种先辨认后确认的开集说话人识别方法,分析了针对集外冒充说话人的“拒识问题”,并完成了基于VQ和GMM两种模型的开集说话人识别系统性能分析比较。