论文部分内容阅读
说话人识别是根据人的声音来识别说话人身份的生物认证技术。随着网络与信息技术的发展,其应用前景受到越来越多人的重视,并且已成为当今生物认证技术领域中的一个研究热点。本文在研究当前说话人识别中常用的特征参数提取算法的基础之上,提出了基于MFCC提取的改进算法和基于Gammatone滤波器组的听觉特征提取算法,并在MATLAB平台下进行了仿真实验。本文主要工作如下:1、本文首先对说话人识别技术的工作原理、系统结构与性能评价准则等相关知识进行了详细的阐述。分析了目前常用的话者特征参数提取,重点研究了LPC、LPCC和MFCC特征参数的提取算法,同时也对基于高斯混合模型的说话人识别系统进行了深入研究。2、提出了一种基于MFCC特征提取的改进算法。详细分析了MFCC和IMFCC各自的优缺点,并针对MFCC提取算法中所采用的Mel三角形滤波器组在高频区域的计算精度不足,而IMFCC提取算法中所采用的翻转Mel三角滤波器组在低频区域的计算精度不足,提出了将Mel三角滤波器组的低频区域与翻转Mel三角滤波器组的高频区域相组合的改进型滤波器组,然后在MFCC提取算法中用改进的滤波器组代替传统的Mel三角滤波器组,进而得到一种改进的特征参数NewMFCC。此外,还将NewMFCC与频谱质心特征进行组合,提取了它们的组合特征参数。最后在TIMIT语音库上进行仿真实验,证明了改进算法的有效性。3、提出了一种基于Gammatone滤波器组的听觉特征提取算法。分析了人耳听觉系统的组成与工作原理,深入研究了Gammatone滤波器组和听觉系统的非线性特性。在新的听觉特征提取算法中采用Gammatone滤波器组代替传统的Mel三角形滤波器组,用与频率相关的指数压缩代替固定的对数压缩,然后结合升半正弦倒谱提升技术,得到了一种新的听觉倒谱系数GFCC。最后通过仿真实验,比较分析了GFCC的性能,结果表明:与LPCC和MFCC相比,GFCC具有更好的识别率和噪声鲁棒性。