论文部分内容阅读
随着生理学、声学、电子技术、信号处理等学科的快速发展,语音识别技术发展到了一个全新的高度,已经从实验室转到了实际应用中,但由于环境噪声的复杂性,实际应用中语音识别率还需进一步提高,这就需要从理论算法上深入研究,以提高准确率。传统的语音处理时频分析方法如短时傅里叶变换、小波变换等都是假定信号为平稳或分段平稳的,而语音信号是一种非平稳非线性信号,故上述方法不能在根本上解决傅里叶变换的弊端。所以,本文研究了以瞬时频率为基本单元的经验模态分解(EMD)方法,分析了在不同的信噪比下,检测数据端点,进一步识别信息的算法,对语音识别的应用具有现实意义。本文主要完成的工作如下:1、研究了Huang N E提出的经验模态分解算法的基本概念及其分解过程。将经验模态算法应用于语音信号,分解得到一组固有模态函数和一个剩余量。揭示了EMD算法的滤波特性、自适应性、多分辨性和局部特性。2、语音信号端点检测是语音识别系统的前端处理,用于检测信号中有效语音的起点和终点,检测结果会影响语音识别的准确性,分别结合短时平均幅度差函数和美尔频率倒谱系数,本文提出了两种适用于低信噪比环境下的语音端点检测方法:EMD+AMDF和EMD+MFCC。利用经验模态分解算法的滤波特性,滤除语音信号中的噪声部分。通过计算机仿真实验分析了EMD+AMDF和EMD+MFCC算法的语音端点检测性能,与传统的双门限法端点检测结果进行对比,证明了算法的有效性,实现了在低信噪比下的语音端点检测。3、针对语音识别率低以及噪声影响等问题,设计了结合经验模态分解和RBF的语音识别模型。该方法利用EMD算法对语音信号进行分解,提取固有模态函数的美尔频率倒谱系数作为语音特征向量,输入RBF神经网络模型进行识别,降低了噪声对识别结果的影响,仿真实验验证了该算法有效地提高了语音识别率。