论文部分内容阅读
在现实生活的很多场景中,我们接收到的语音信号通常是受到污染的,这是由于空间中存在着各种干扰源和环境噪声。在严重的情况下,语音质量和可懂度可能会显著降低,导致人类听觉感受和自动语音识别性能变差。因此,在诸如助听器,免提电话和智能会议系统等多种语音通信应用中,就需要利用盲源分离技术从一个或多个观测信号中有效的恢复出感兴趣的源信号。其中,只有一路混合信号,而源信号个数不止一个的单通道盲语音分离问题一直是一项艰巨的任务。本文将重点研究单通道盲语音分离问题。近年来,自从压缩感知理论被提出来之后,稀疏表示和字典学习理论在信号处理领域已成为研究的热点,特别是基于字典学习的单通道盲源分离问题受到广泛关注。基于字典学习的单通道语音分离通常单纯地利用不同源信号的独特性实现对混合语音的分离,存在一定的局限性。本文以稀疏表示和字典学习理论为基础,从源信号的自身特性出发,分别对单通道下的说话人混合语音分离和语音降噪问题进行研究,提出了改进的的基于联合字典的说话人混合语音分离和语音降噪算法。相关实验证明,与现有算法相比,本文所提算法具有一定的性能优势。总结一下,本文的主要研究工作和创新点如下:(1)介绍了盲源分离问题的意义以及发展历程,阐述了现今盲源分离技术的发展近况。详述了稀疏表示和字典学习的概念,以及常用的稀疏表示算法和字典学习算法。介绍了基于字典学习模型解决单通道盲源分离问题的框架和实现过程,发现单纯地利用语音的独特性实现对混合语音的分离,会产生交叉投影而影响分离效果。(2)基于字典学习实现单通道说话人混合语音分离时,由于传统方法构建的联合字典区分能力较差,当混合语音信号在联合字典上表示时会产生“交叉投影”,导致分离性能较差。为了解决这个问题,本文提出了一种新的优化函数,并提出了基于此优化函数学习联合字典的语音分离算法。该算法可以同时训练联合字典中的身份子字典和公共子字典。源信号对应的身份子字典表示它的独特分量,公共子字典表示不同源信号的相似分量。优化函数在利用子字典之间相关性的同时,保证源信号的相似分量可以由公共子字典表示而不是干扰子字典,有效地抑制了交叉投影。实验结果验证了本文算法比现有算法有更好的分离效果。(3)针对单层字典学习算法中混淆成分的影响,本文提出了基于双层字典学习的单通道语音降噪算法。在第一层字典学习中,使用现有的区分性单层字典学习方法,同时不要求在这层学习中完全抑制语音信号和干扰信号之间的混扰。而在第二层字典学习中,通过目标函数的约束抑制前一层学习中产生的混淆成分。通过双层字典学习,可以使混淆的成分投影在第二层的联合字典上,减少单层学习字典中的语音信号和干扰信号之间的混扰,进而提高了语音的质量。并通过相关仿真验证了本文所提方法具有较好的降噪效果。