论文部分内容阅读
盲源分离是指在信号的传输信道、混合方式以及源信号未知的情况下,仅从观测到的混合信号中来分离出各个源信号的过程。盲源分离在生物医学信号处理、图像处理、雷达与通信系统、语音信号处理,数据挖掘等方面具有重要的应用价值。在实际应用中,一般由于条件的限制,观测到的混合信号个数往往小于源信号的个数,也就是欠定条件下的盲源分离问题。针对欠定盲源分离问题,由于其混合系统的不可逆性,使得基于独立分量分析的传统算法不能直接用于欠定盲源分离问题。目前欠定盲源分离大多采用稀疏分量分析方法,该方法利用语音信号在时频域的稀疏特性。但在实际应用中语音信号的混合方式通常为卷积混合模式,其混合信号不一定具备稀疏特性,故而稀疏分量分析算法在卷积条件下并不适用。根据人对语音信号多模式的辨识机制——借助人脑学习特性和利用视觉信息加以辅助,进而提高对声音信号的感知能力。本论文提出了一种基于空间几何信息约束的欠定卷积盲分离算法。本论文的主要工作如下:针对欠定卷积混合条件下的语音信号盲源分离问题,提出了基于空间几何信息约束下的欠定卷积盲源分离算法。该算法利用自回归系数表示语音信号相邻时间帧的线性相关特性,以此构建状态转移矩阵,从而采用卡尔曼滤波实现源信号的分离。该算法是在每个频率下对源信号进行估计,因而在恢复时域源信号时,会因各频率下源信号的排列顺序不一致而出现排列置换问题。针对这一问题,本文算法通过视觉获取声源的空间位置信息,以此得到混合矩阵的初值,使得各个频率下混合矩阵列矢量的排列顺序一致,从而避免了排列置换问题。通过实验仿真,验证了本文算法的优越性。