论文部分内容阅读
语音识别由于其重要的理论价值与广阔的应用前景,受到人们的广泛重视。目前语音识别研究大部分以线性系统理论为基础,主要应用隐马尔可夫模型(HMM)与动态时间规整(DTW)等技术。由于语音是一个复杂的非线性过程,基于线性系统理论的语音识别方法的局限性越来越凸显,必须引入非线性理论和方法。本文分别针对语音识别预处理、特征参数提取和识别等几个方面进行了研究,主要内容有:1、研究了基于线性预测美尔倒谱系数(LPMCC)与美尔频率倒谱系数(MFCC)组合的语音信号特征参数提取方法。实验表明,在不同信噪比的情况下,该方法较其他特征参数提取方法具有更高的识别率。2、针对语音信号预处理阶段,在噪声背景下直接进行端点检测和特征参数提取易对语音识别结果造成偏差的问题,研究了具有尺度自适应的改进小波阈值函数去噪算法。实验表明,该方法能有效地去除噪声,同时重构信号能较好地表示原始语音。3、综合利用隐马尔可夫模型(HMM)能够有效提取时序特征和小波神经网络(WNN)能进行细分类的特点,将HMM与小波神经网络模型相结合,研究了基于HMM与小波神经网络的语音识别方法。通过实验表明该方法在不同信噪比下较传统HMM识别率更高,在低信噪比的情况下效果更为明显。其中在小波神经网络的学习算法方面,引入PID控制原理,提出了一种基于梯度PID的小波神经网络训练算法,实验表明该训练方法较传统的梯度算法收敛速度更快。4、以实际机器人AS-R系统为平台,开发了机器人语音控制系统,主要包括语音识别、无线网络通信和机器人运动控制三部分,完成了软件系统设计,并进行了实际系统调试。