论文部分内容阅读
说话人识别是利用说话人的语音特征对说话人的身份进行辨认或确认。在说话人识别系统中,最重要的是能够从语音片断中提取代表说话人独有特征的稳定参数。 针对短时傅立叶分析在提取说话人特征参数时的缺陷,本文通过对小波理论和说话人识别技术的研究,借鉴了一种传统的基于听觉机理的特征参数MFCC(Mel频域倒谱系数),利用小波变换、小波多分辨分析和小波包变换,构造出了两种基于小波变换的说话人识别特征参数:IWPTC(不完全小波包变换系数)和WPTC(小波包变换系数)。通过在Matlab平台上构建的说话人识别系统(包括文本有关和文本无关),验证了这两种参数的有效性:它们的识别率均高于MFCC参数。理论和实验证明,利用小波变换提取的说话人识别特征参数相比于传统的短时分析方法确实具有更好的识别特性。