论文部分内容阅读
麦克风阵列可以弥补单个孤立麦克风在噪声处理、声源定位和跟踪、语音提取和分离等方面存在的不足,能够广泛的应用于各种具有嘈杂背景的语音通信环境中,以提高语音通信质量。麦克风阵列的研究是阵列信号处理的新方向,具有广泛的市场应用前景。本文介绍了一种基于麦克风阵列的说话人跟踪和语音分离方法,提出了将其在DSP 平台上实现的软硬件方案,尤其是软件实现方案。本文涉及的说话人跟踪以及语音分离,以近场麦克风阵列语音传播模型为基础,使用近场2D_MUSIC 算法完成说话人的定位和跟踪。再根据说话人的方位信息,使用近场最小方差波束形成技术(Near-Field Minimum VarianceDistortionless Response Beamforming)完成语音的提取和分离。提出的实现方案,包括硬件实现和软件实现两大部分。硬件方案是搭建一个以TI DSPTMS320C6711 为核心的通用阵列语音处理平台,为算法实现提供硬件基础。本文重点介绍了软件实现方案。对于这样一个运算量大、任务多的算法的软件实现,其主要难点是算法的实时实现,包括软件代码的优化和任务调度两大部分。代码优化的主要内容包括:(1)使用DSPLib 来完成各种操作,如FFT、矩阵乘法等等,以提高编程效率;(2)代码的手工优化;(3)各种折衷处理,如空间——时间折衷、处理效果——运算量的折衷、片内空间——片外空间的折衷等。在任务调度方面,本文主要给出了原理和实现方法。本文的任务调度算法主要根据各个任务的优先级,实时的分配各个任务的执行时间,从而使整个系统协调工作,从整体上满足实时性要求。通过采用本文提出的软硬件实现方案,实时实现了说话人跟踪和语音分离,其技术指标基本达到了实际应用的需求,从而验证了该算法的工程可实现性。最后,本文还对本系统实际测试的结果进行了分析,指出了存在的问题和不足,分析了它们产生的原因,并给出了相应的改进方案。