论文部分内容阅读
语音盲分离算法源于盲源分离技术,盲源分离技术是20世纪最后十年迅速发展起来的一个新的研究领域,其目的是仅从观测信号来恢复出各个源信号。到目前为止,盲源分离算法的研究大体上可以分为两个支系:一支是多通道盲源分离算法的研究;另一支是单通道盲源分离算法的研究。本文多通道盲源分离算法主要使用独立分量分析方法,例如自然梯度算法、信息最大化算法、全局最优算法、最大信噪比算法、灵活独立分量分析算法等;单通道盲源分离算法主要使用计算听觉场景分析方法,例如Wang-Brown模型、Hu-Wang模型。本文主要阐述了线性瞬时无噪混合独立分量分析模型的基本原理,在这个模型的框架下描述了自适应自然梯度算法、批处理自然梯度算法的基本原理并实现了这两种算法。本文在固定步长批处理自然梯度算法的基础上,提出了一种新的变步长批处理自然梯度算法,仿真结果表明,与固定步长算法相比,变步长算法有更快的收敛速度和较小的稳态误差。本文描述了信息最大化算法的基本原理,基本的信息最大化算法是建立在转换函数为Sigmoid函数的基础上的,这里提出了基于转换函数为双曲正切函数的信息最大化算法,仿真结果表明,转换函数为双曲正切函数的算法收敛速度快于转换函数为Sigmoid函数的算法,并且稳态误差小于转换函数为Sigmoid函数的算法。本文对基于全局最优、最大信噪比的语音盲分离算法也进行了研究并实现了这两种算法,仿真结果表明了两种算法的良好分离性能。本文还描述了灵活ICA算法的基本原理,灵活ICA算法的概念源于自然梯度框架下的广义高斯分布,本文针对广义高斯分布模型中的高斯指数的估计提出了一种改进的灵活ICA算法,本文还在广义伽玛分布模型的基础上根据峰度提出了基于广义伽玛分布的灵活ICA算法,仿真结果表明,与基本的灵活ICA算法相比,改进的灵活ICA算法有较快的收敛速度和较小的稳态误差,而虽然基于广义伽玛分布的灵活ICA算法的稳态误差稍大于其它两种算法,但还是能够保证算法良好的分离性能,并且收敛速度远快于其它两种算法。本文也阐述了基于Wang-Brown模型和Hu-Wang模型的CASA系统的基本原理,并实现了这两种模型在语音增强中的应用,通过输入输出分段信噪比以及恢复语音与原始语音的相似系数两个指标评价了两种模型的增强性能,仿真结果表明,Hu-Wang模型的CASA系统的增强性能优于Wang-Brown模型的CASA系统,Hu-Wang模型CASA系统还弥补了Wang-Brown模型CASA系统对语音高频区不能进行很好分离的缺点。