论文部分内容阅读
语音信号处理是数字信号处理的重要组成部分。语音通信过程中,由于背景噪声和传输中噪声的干扰,信号处理受到很大的影响,降低了语音质量。在保证语音可懂度和清晰度的基础上对语音增强算法进行改进,对语音信号处理有非常积极的意义。普通话作为汉语的必然发展趋势,也是国家重点推广的语言标准,具有广泛的受众。当前语音增强算法多针对外文环境,因此,针对普通话的语音特征,设计专用的语音增强算法,具有很高的应用价值。当前语音增强算法涉及方法多样,性能不一,但是多存在两方面的不足:一是对环境的适应能力差,表现为当背景噪声发生改变时,算法性能下降;二是对噪声能量要求高,表现为当信噪比下降时,算法性能不稳定。为了提升这两方面的不足,本文针对普通话的时频特征,结合人耳处理语音信息的机制,提出了一种过程简单、性能稳定的基于语音活动检测的语音增强算法。具体工作和创新点包括:1.通过阅读大量文献资料,对当前语音增强算法进行了分析和总结,对其算法理论和优缺点进行比较,并对语音增强的研究趋势进行了探讨。本文同时总结了人耳对于声音的感知特性,分析了不同类型噪声对语音造成的影响,并以此作为语音增强的基础。2.本文针对普通话的时频特征,结合噪声的特点,提出了一种适应变化环境和变化信噪比的语音活动检测算法-子带检测法。该算法结合基音检测,通过分析语音信号通过滤波器组后各个子带的能量变化,获得语音活动的检测结果。为了解决阈值判定时出现的模糊区域,提出双阈值判定的方法。为了适应多变的环境,设置参数更新模式。对该算法性能进行测试,获得了较高的准确率和稳定性,验证了算法的设计3.在语音活动检测算法的基础上,本文设计了基于侧抑制效应的语音增强改进算法。该算法对语音信号的低中频区域应用改进的侧抑制算法,加强基音和谐波所在子带的能量,保留其特征,并衰减其他子带的噪声能量;对语音信号的高频区域应用改进的谱减法,在尽量保留高频语音特性的基础上去除噪声。通过验证,该算法计算简单,可以达到在较低失真的前提下实现语音信号增强、降低噪声的目的。