论文部分内容阅读
现实环境下,语音信号经常受到其他语音或噪声的干扰,且麦克风拾取的信号为语音与干扰信号的卷积混合。因此,对受扰语音进行解卷积是语音增强的重要任务。盲源分离(Blind Source Separation,BSS)是指源信号和传输信道参数都未知,仅由观测信号恢复出源信号各个独立成分的方法。由于对先验知识要求低,盲源分离在语音增强中得到了广泛关注。现有的卷积混合语音信号的盲源分离分为时域方法和频域方法。当混合滤波器阶数较高时,时域方法需要学习的参数较多,造成计算时间长、难于收敛。相比之下,频域方法将时频卷积变换为多个频率段上的乘法运算,运算简单,速度快,因此成为盲解卷的主流方法。但是,频域算法必须解决BSS固有的顺序不确定性问题,否则影响分离性能,这正是本文研究的关键。针对卷积混合语音盲分离的频域算法,本文主要做了以下三方面工作:(1)研究了现有调序方法和语音信号的特性,提出了一种基于能量相关的调序方法,并应用JADE、KM、c-FastICA和CMN等四种复数BSS算法,对仿真和实际语音信号进行了盲分离,分析比较了分离性能,验证了本文调序方法的有效性。(2)在CMN算法和约束优化的框架下,将语音的能量相关特性直接引入盲分离过程,推导出了约束CMN的梯度算法和牛顿算法,将顺序不确定问题在BSS过程中一并解决,利用仿真和实际语音信号进行的大量实验表明,约束CMN算法的性能高于包括CMN在内的全盲分离算法。(3)研究了影响卷积混合频域算法分离性能的一些因素。主要针对不同的窗函数进行了仿真实验,分析了语音信号的短时平稳性和窗函数的作用;通过实验分析,探索了FFT长度和脉冲响应阶数的关系,为频域算法研究提供了有益的参考。