论文部分内容阅读
语音是人与人沟通、人机交互的重要手段之一。在室内环境中除了噪声,由四壁和上下表面反射引起的混响是造成语音质量和可懂度下降的主要原因。期望信号与室内声学脉冲响应进行卷积,麦克风接收的信号为直达信号与混响成分的叠加。混响在时频域引起的拖尾,往往导致语音信号的包络和精细结构产生失真。同时噪声和潜在干扰的存在,以及语音自身的非平稳性使得室内语音增强问题更为复杂。本文将对室内环境下,麦克风采集的远程语音信号增强方法展开研究。考虑固定波束形成尤其是差分波束形成在室内时变声学环境中的局限性,在自适应波束形成的基础上,本文提出了基于传递函数广义旁瓣抵消器(Transfer Function-Generalized Sidelobe Canceller,TF-GSC)和改进极小值控制递归平均(Improved Minima Controlled Re-cursive Averaging,IMCRA)的远程语音增强框架,利用空-时联合处理方法对混响语音进行去混响和消噪,同时保证去混响方法在噪声存在下的稳健性。不以声源空间位置和声学传递函数信息为先验,本文将TF-GSC结构替换为多通道线性预测(Multichannel Linear Prediction,MCLP)盲去混响框架,介绍了最小绝对值和方法、基于组稀疏性假设的最小绝对值收缩和选择(Least Absolute Shrinkage and Selection Operator,LASSO)方法和基于最大化对数似然函数的归一化延迟线性预测方法。本文将IMCRA作为以上盲去混响方法的后置滤波器,讨论了非相干噪声对GSC和MCLP语音增强框架的影响。仿真和实验说明在混响占主导的室内环境下,多通道线性预测框架的语音增强性能优于GSC框架,后置滤波为两种语音增强框架的必要补充。本文设计搭建了一套多通道远程语音采集处理系统,实现实时语音数据的采集、处理和发送,同时以实录数据验证基于GSC和MCLP框架的远程语音增强方法的有效性。