论文部分内容阅读
语音识别的一大难点就是识别系统在噪声环境下性能大幅下降,人耳具有良好的抗噪能力,如何让识别系统能像人耳一样具有选择性,建立符合人耳听觉特性的听觉模型是长期以来广大研究者的研究热点。本文针对识别系统中噪声鲁棒性的问题,将听觉滤波器应用到过零峰值幅度(Zero Crossing Peak Amplitude,ZCPA)特征提取过程中,得到新的特征,并将其应用到语音识别系统中。
本文首先对ZCPA特征提取过程进行了详细的介绍。该模型是用输入信号的上升过零率表征信号的频率信息,峰值幅度表征信号的幅度信息,最后将二者规整输出ZCPA特征。
此外,本文实现了Gammatone滤波器,该滤波器是一种基于耳蜗基底膜特性的较为理想的听觉滤波器。将16通道的Gammatone滤波器代替FIR滤波器用于ZCPA特征提取中,得到GTZCPA特征。实验表明,由于Gammatone滤波器在设计精度上没有做到FIR滤波器的各通道精确设计,没有达到理想结果。
针对Gammatone滤波器频响呈对称分布特性不符合人耳的听觉特性这一不足,本文在Gammatone滤波器的基础上,实现了Gammachirp滤波器。Gammachirp滤波器不仅体现了基底膜带通滤波器组带宽非对称分布的特征,还实现了对输入信号的强度依赖特性。首先将16通道频响非对称分布的不依赖强度的Gammachirp滤波器组应用到ZCPA特征提取中得到A GCZCPA特征。实验表明,频响非对称分布的Gammachirp滤波器组较频响对称分布的Gammatone滤波器组其识别结果有明显提高。其次,将16通道频响非对称分布的依赖强度的Gammachirp滤波器组应用于ZCPA特征中得到GCZCPA特征识别结果。实验结果表明,强度依赖的Gammachirp滤波器较不依赖强度的Gammachirp滤波器系统的噪声鲁棒性能更好。