论文部分内容阅读
盲信号分离技术是近年来信号处理领域的一个研究热点,由于其能够在对原始信号和混合系统的先验知识都比较少的情况下,从观测到的混合信号中恢复出原始信号,因此在无线通信、医学信号处理、图像增强和语音分离方面有着广泛的应用。
语音信号的盲分离问题是盲信号分离技术当中非常重要,同时也是难度很大的一个部分。如何从一个实际的未知环境中所观测到的混合语音信号里提取出说话人清晰的语音是一个典型的盲信号分离问题。在研究的早期忽略传输信道卷积效应的基于瞬时混合模型的语音信号盲分离技术已经相对成熟。但在实际的应用当中,环境中的传播延迟和反射效应以及语音信号自身的统计特性使得这个问题变得更加复杂。例如信道中的反射引入的卷积效应,语音信号的时断时续以及源信号数目随时间的变化,语音信号的不平稳特性和时间相关特性给传统算法带来的困难等等,这些都是我们在算法研究工作当中遇到的难点和挑战。
针对以上的问题,本文基于卷积混合语音信号的时域盲分离方法在以下几个方面进行了研究和探索。
(1)为了解决传统互信息算法中由于语音信号的非平稳和时间相关等特殊的统计特性和数学模型而产生的问题,本文结合分块处理方法和带遗忘因子的不完备约束条件,提出一种改进的基于自然梯度法的在线卷积混合盲分离方法。
(2) 针对基于二阶统计量的时域盲分离方法在迭代过程中的矩阵奇异问题进行改进,同时利用语音信号的AR模型和二阶统计量信息得到卷积混合深度M的盲估计方法。
(3) 传统的基于ICA理论的盲分离方法往往需要满足源信号数目不大于观测信号数目的前提条件,但是在实际的应用当中,这个条件往往显得过于苛刻。基于语音信号时频图稀疏性假设的time-frequency mask方法提供了一条新的解决思路,但是同时也存在二值mask带来的能量损失等问题。本文在这一类方法的基础上,结合在语音信号的AR模型,并利用时频图谱插值补偿的方法,提出改进后的时频域结合的分离方法。
(4)完成了智能发育机器人系统—“复旦1号”的工程化工作,以及寻求语音信号盲分离方法在智能机器人系统中语音前端处理模块中潜在的应用。