论文部分内容阅读
盲源分离是指在源信号和传输信道信息均未知的情况下,仅根据观测信号估计出源信号的过程。由于盲源分离中使用的先验信息很少,这使其在混叠语音信号处理中得到广泛的应用。目前研究的语音混叠模型主要包括瞬时混叠和卷积混叠两种情况。而在真实语音环境中由于声音存在延时和反射,更适合采用卷积混叠模型。所以,卷积混叠语音信号的盲源分离问题逐渐成为研究的热点之-针对卷积混叠语音的盲分离问题,主要有两类算法:一类是时域盲源分离算法,一类是频域盲源分离算法。由于频域盲源分离算法可以通过短时傅里叶变换将时域上复杂的卷积运算转换到频域上的线性叠加运算,这样便可以直接借鉴经典的瞬时混叠ICA算法,从而使得频域盲分离算法相对于时域盲分离算法来说,具有较小的计算量和良好的分离性能。但是频域盲分离算法也存在缺陷,即两个不确定性:幅度不确定性和顺序不确定性。其中,顺序不确定性对频域盲分离性能的影响至关重要。另一方面,在真实语音环境中,噪声的干扰是不容忽视的。在这种情况下,我们不能只考虑卷积混叠盲分离问题,还需要考虑噪声抑制的问题。所以对于真实采集的混叠语音信号,如何降低噪声干扰并实现分离,形成适用于真实环境的有效的分离系统,一直是学者们研究的热点和难点。针对以上问题,本文主要研究卷积混叠语音信号的频域盲分离算法。特别是针对顺序不确定性问题,提出了一种新的排序算法。为了验证算法的有效性,并将其进一步应用到真实环境中,提出了真实环境中的语音盲分离方案,并设计了演示系统。本文的主要贡献点:(1)研究了复值FastICA、快速峭度最大化算法(FKMA)、联合近似对角化算法(JADE)三种主要的频域盲分离算法,并通过实验对已有算法的性能进行了分析对比,总结了这三种算法所存在的问题。(2)提出了卷积混叠语音信号的频域盲分离算法。针对频域盲分离算法中的顺序不确定性问题,提出了一种多步骤的排序算法。它利用了基准频点对准的思想并结合到达角的估计和频点间的相关性,具有良好的鲁棒性和准确性。该排序算法可以概括为以下三步:第一步,选取基准频点进行对准;第二步,根据第一步中已经排序好的基准频点对剩余的频点进行排序;第三步,对出现排序错误的频点进行标记,并利用基于分离矩阵的DOA估计对这些频点进行补充性对准。通过仿真实验证明,本文提出的排序算法具有良好的准确性和鲁棒性。(3)将频域盲分离算法应用到真实语音环境中,设计了真实环境中的语音分离系统。通过研究几种常见的去噪算法,提出了更适合实际应用的非语音段自检测的去噪算法。并将其作为盲分离的后处理手段,进而提出了盲分离的系统方案。基于该系统方案,我们还设计了真实环境中盲分离的演示系统。通过模拟真实环境的实验,验证了系统方案的有效性。对于真实采集的混叠语音信号,通过演示系统显示混叠信号能够成功实现分离。由此可见,该系统具有广阔的应用前景。