论文部分内容阅读
伴随着多媒体技术的快速发展,语音信号处理技术在接收和处理信息等方面得到了越来越广泛的关注,语音识别、语音增强、声源定位等应用方兴未艾。而声源的定位技术是语音增强、语音识别技术的前提和基础。基于麦克风阵列的声源定位技术已经成为一大研究热点,其广阔的应用前景得到了广泛的关注。当前基于麦克风阵列的声源定位技术主要分为:基于高分辨率谱估计的声源定位、基于可控波束形成的声源定位、基于时延估计的声源定位。而在这三种算法中,基于时延估计的声源定位算法计算复杂度低,实用性较强,是实时声源定位应用的首选。基于此,本文开展了基于时延估计的实时声源定位算法研究。本文主要从理论研究、软硬件平台搭建、实际场景验证三个方面进行研究。(1)本文第二章开展了针对时延估计算法的研究。在分析对比各种麦克风阵型的基础上,选取四元十字阵作为麦克风阵列的阵型,并推导了基于四元十字阵的声源定位算法的公式。在此基础上,研究了几种基于时延估计的声源定位算法,针对广义互相关算法在低信噪比、混响大的环境下鲁棒性较差的问题,提出了一种多通道加权联合算法。该算法先把信号进行多通道滤波分解,再分别计算各通道的互相关值,最后对各通道进行加权联合计算出时延。仿真实验表明,多通道加权联合算法的鲁棒性比广义互相关中的PHAT和SCOT加权算法强。(2)基于理论研究基础,设计了基于Cortex-A8嵌入式平台的声源定位系统,并进行了相应的硬件选型与调试及算法移植工作。首先,在硬件设计方面,选用S5PV210作为核心处理器、WM8960作为音频编解码芯片,并搭建了外围电路;其次,在软件开发方面,分别进行了系统搭建,WM8960音频驱动程序移植,定位算法编写、测试、及移植;最终完成了基于Cortex-A8嵌入式平台的声源定位系统。(3)为了测试本文系统的可行性,在室外环境下进行了一系列实验。实验结果表明,本系统的方案合理有效,能够较好的实现声源定位。此外,针对本系统在实际环境中存在的不足之处,文中也给出了相关的改进方案,为更有效的声源定位系统的研发提供了思路。