论文部分内容阅读
近几年,随着智能电子产品的广泛流行,语音技术尤其是自动语音识别技术也迎来了新的研究热潮。在现实环境中,语音信号通常会受到各种噪声的干扰,降低了信号的质量以及识别度,从而导致了语音技术不能很好的应用和推广。为了解决这个问题通常会考虑利用降噪技术,传统降噪技术虽然经过多年的发展,但大部分是基于统计特性的,并且被处理的语音需要满足一定的约束条件,因此仍然有很多难以解决的问题。人类听觉系统对语音信号的感知力远远超过了现在的声音信号处理水平,研究人员对人类的听觉系统进行了研究,希望用机器模拟人类听觉系统对语音信号的感知过程,计算听觉场景分析(Computational Auditory Scene Analysis,CASA)就是这类研究中的一种典型方法。研究人员利用CASA理论开发出了一些语音除噪系统,其中比较成功的系统是Hu-Wang系统,这些系统能够将语音信号从含有噪声的混合音频信号中分离出来。本文对CASA的相关理论技术以及基于CASA的语音分离系统进行了研究,并对具有代表性的Hu-Wang语音分离系统提出一些改进的方法,论文主要包括下面几项工作:1.提出了一种利用基于单位帧内高低频能量比来约束混合线索的分段算法。在高频区域,语音信号不会存在较高的能量,如果此区域受到噪声干扰,则分离线索也会受到相应的干扰,从而影响时频单元的分段效果。因此以提高时频单元在分段环节的合并效果作为改进方向,提出了一种基于单位帧内高低频能量比约束混合线索的分段算法。实验表明此算法能够有效提高系统的分离性能。2.将音质客观评价系统和CASA系统相融合。语音分离的性能评测标准通常是信噪比,但信噪比提高,并不意味着人对语音质量的感知效果会相应提高。因此本文尝试把音质客观评价系统和CASA系统相融合,以达到在提高语音分离信噪比增益的同时也能够提高音质感知的效果。实验表明此方法能够较好的提高分离结果的语音质量。3.基于CASA技术的改进语音分离系统设计与实现。将上述两种改进方法融入语音分离的相关环节,设计完整的分离系统,实现对目标语音信号的分离,达到语音降噪和提高语言质量的目的。