论文部分内容阅读
本文在深入研究传统的盲目式和非盲目式音频频带扩展方法的基础上,基于非线性动力学理论和神经网络模型,实现了一套完整的宽带(0~7kHz)音频到超宽带(0~14kHz)音频的盲目式频带扩展算法,并进一步将该技术应用到实际编码器中。首先,在确定音频信号的非线性特征的基础上,本文分别采用RBF神经网络和BP神经网络对相空间重构后的频域序列进行细节谱预测。结合音频信号细节谱预测时的实际情况,引入了模糊理论优化RBF神经网络,以提高其泛化效果。此外,采用修正学习率和附加动量项等方法提高其训练速度,以适应线上预测细节谱的需求。其次,在高频子带能量估计方面,本文采用RBF神经网络拟合低频的特征参数与高频子带能量间的映射关系,实现对高频能量的准确恢复。利用超宽带音频现下训练RBF神经网络并实时估计高频子带能量,结合非线性预测得到的细节谱,构建了一套完整的宽带音频向超宽带音频扩展的盲目式频带扩展算法。最后,在实际编码器应用方面,本文将基于神经网络的音频频带扩展技术应用到ITU-T G.722.1宽带音频编解码器中,并与ITU-T G.722.1C超宽带音频编解码器得到的超宽带音频进行对比。主客观测试均表明,24kbps码率时G.722.1与所提频带扩展算法相结合得到的超宽带音频质量,与同码率下的G.722.1C编解码器得到的超宽带音频质量相当。