论文部分内容阅读
随着信息社会的飞速发展,智能手机以及人机语音对话设备得到了广泛应用,从而语音信号受到越来越多的关注。然而语音信号在产生、传输、处理、接收的过程中不可避免因为周围环境和传输介质的影响而受到噪声的污染。污染严重的情况下会影响语音信号的质量和可懂度,导致人或者接收语音的设备无法听懂语音。因此,需要利用语音增强技术从带噪语音信号中分离出原始纯净的语音信号,滤除噪声。传统的语音增强方法都从语音质量方向入手,使增强后的语音具有较高信噪比。但是和带噪语音相比,增强语音的可懂度没有得到有效提高。这是由于传统增强算法在滤除噪声的同时也会滤除有用的语音信号,造成语音畸变失真。由于维纳滤波可以明显提高语音质量且使增强后语音含有较少音乐噪声,本文在维纳滤波算法的基础上提出一种具有较高可懂度的改进算法,旨在提高增强后语音的可懂度,使增强后的语音信号更容易被人或者语音设备听懂理解。本文首先介绍了语音信号的常识、人的听觉特性以及噪声信号的特征,然后系统的讲述了四大类语音增强算法。总结了对于增强语音进行评价的相关方法,包括主观测听评价方法,语音质量客观评价方法和语音可懂度客观评价方法。根据维纳滤波的推导过程,得到维纳滤波器的增益函数。之后详细介绍了基于先验信噪比估计的维纳滤波方法,此方法计算过程简单,且增强后语音的质量提升明显。通过对句子和辅音语料实验仿真得到此方法虽然提高语音质量,但没有真正意义上提高增强后语音的可懂度。分析增强语音未提高语音可懂度的原因,并从剩余信噪比出发研究得到增强语音幅度谱中存在衰减畸变和放大畸变,且幅度谱大于6.02dB的放大畸变会严重影响增强语音的可懂度。通过实验把原始纯净语音的幅度谱和增强语音的幅度谱进行对比,去掉幅度谱大于6.02dB的畸变区域,增强语音的可懂度和质量相比带噪语音得到明显提升。在现实处理语音的环境中不可能有纯净语音,这就需要通过对先验信噪比进行改进。修正先验信噪比小于-10dB区域进而修正滤波算法的增益函数,然后通过已有条件判定幅度谱大于6.02dB区域,并对此区域进行约束限制,最终得到具有高可懂度的改进维纳滤波增强算法。通过对句子和辅音语料的实验仿真证实改进的算法确实提高了增强后语音的可懂度。