论文部分内容阅读
智能汽车电子牌照等电子设备在汽车内的应用使车内的人与设备之间的语音交互越来越显示出其重要性和广泛的需求。但车内人机语音交互由于容易受到车内环境噪声的干扰,语音识别的准确率与在纯净环境下相比将严重下降,难以达到实际人机语音交互的要求。研究和提出车内环境下的语音降噪方法,是提高语音识别率的基础和关键内容之一。
针对上述问题,本文提出了一种基于双径向基函数(radial basis function,简称RBF)神经网络的车内语音降噪算法。
论文给出了该语音降噪算法的基本原理、实现方法以及降噪效果。在对比了BP网络与RBF网络的非线性逼近能力的基础上,提出了一种改进的RBF网络时域降噪的方法。该方法有效地减轻了神经网络的负担并减少了训练时间。在MATLAB软件平台上的仿真结果表明,该方法能够有效地抑制噪声,大幅度提升信噪比(signalnoise rate,简称SNR)。
在变换域上,提出双RBF网络结合共振峰参数、线性预测系数与差分线性倒谱系数三组参数的降噪方法。在MATLAB软件平台仿真结果表明,该方法对语音信号的基音频率、共振峰等语音特征影响很小,能够较好的保留语音信号的频谱结构,改善语音的听觉质量,同时提高信噪比。
本文在TI公司生产的TMS320VC5416平台上对车内语音降噪系统进行了实时实现。采用了TLV320AIC23作为语音编解码器,大大提高了编解码效率,以利于实时语音信号处理的实现。