论文部分内容阅读
在当今信息社会中,多媒体技术和通信技术得到迅速发展,语音信号处理也随之广泛应用于各个领域。而实际中,由于背景噪声的影响,产生了许多不必要的信号处理时间,降低了语音处理的精度。语音端点检测(VAD),作为信号处理系统中的一个关键技术,其准确性在某种程度上直接决定了整个语音信号处理系统的性能。
本文以第三代移动通信中的自适应多速率(AMR)语音编码器的研发为背景,详细分析了AMR语音编码中VAD算法的基本原理。VAD算法作为AMR语音编码中的重要部分,对语音编码的变速率选择和节省语音通信系统的传输带宽起了很关键的作用。为了更好的完成理论结合实践的科研工作,文中在基于DSP的软件开发平台下,对AMR语音编码模块进行了软件实现,并考虑到数字信号处理器对语音编码实时性处理的要求,通过结合实际项目研发过程中的手工汇编优化C代码及直接优化汇编代码的方法,对编码模块中算法复杂度较高、占用时间较长的部分C函数进行优化,更好的满足了语音信号处理实时性的要求。同时对编码模块优化前后的各项性能参数进行比较,结果表明IPC和MCPS参数均得到较好的改善,优化后的代码执行效率大大提高,减少了语音编码的处理时间。
此外,以不同语音作为输入信号,对AMR语音编码中VAD算法进行软件实现。由实验结果得知,在纯净语音下语音端点检测效果较好,存在极小程度的语音帧的误判,连续快速的语音间隔拖尾处容易误判为语音帧;然而在强噪声环境下,语音端点检测存在一定的误判,容易将噪声帧误判为语音帧。并在对AMR语音编码中VAD算法研究基础上,结合语音信号的结构特点和特征参数以及语音降噪算法--谱减法的改进型,提出了在低信噪比环境下的两种语音端点检测新算法:分别是基于改进谱减法的结合能量与高阶差分的端点检测算法和基于改进谱减法的自适应子带谱熵的端点检测算法,通过MATLAB仿真软件对其改进算法进行仿真实验,仿真结果表明在低信噪比的背景噪声下,新算法既能达到良好的语音端点检测效果又能较好的保证语音端点检测的鲁棒性。