基于麦克风阵列的声源定位算法优化及实现

来源 :东南大学 | 被引量 : 0次 | 上传用户:jiguoqiang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
麦克风阵列在视频会议、语音增强、机器人控制等领域有着广泛的应用,而在其诸多应用中,声源定位处于基础和核心地位。本文围绕混响环境下的声源定位问题,深入研究了基于麦克风阵列的声源定位算法的关键技术和系统实现。   本文首先详细分析了基于相位变换加权的广义互相关(GCC-PHAT: Generalized Cross Correlation-Phase Transform)时延估计算法和基于相位变换加权的可控响应功率(SRP-PHAT:Steered Response Power-Phase Transform)声源定位算法的原理。在此基础上,根据声源定位系统硬件平台提供的应用程序接口,设计了定位系统的软件流程,在定位系统上实现了SRP-PHAT算法的优化版本SRP-PHAT-D(SRP-PHAT Algorithm Based on Discrete Time Delay)算法。在SRP-PHAT-D算法的实现中,本文利用FFTW(Faster Fourier Transform in the West)开源库计算所有麦克风对的GCC-PHAT函数值,并针对SRP-PHAT-D算法声源空间网格点搜索计算量大的缺点,实现了K-means算法对声源空间网格点的聚类优化,使搜索计算量降为原计算量的1%,大大降低了定位算法的计算量。最后,针对系统仰角定位成功率偏低的问题,给出了滑动窗平滑方案对其进行进一步的平滑处理,提升了定位成功率。   本文为声源定位演示系统设计了友好的软件界面,可以直观显示可控响应功率的功率谱。实际对演示系统的性能测试表明,该系统水平角和仰角定位成功率达95%以上,一次定位耗时仅为0.707ms,满足实时要求。
其他文献
ZigBee是一种低速率短距离传输的无线通信技术。在现今的生活中,ZigBee技术在家庭、医疗及工业控制等领域应用越来越多,为了实现实时性传输、低时延、低能耗及需要特定数据带宽
无线体域网(Wireless Body Area Network,WBAN)是当前物联网研究领域的重点方向之一,近年来WBAN在医疗领域的应用研究日益受到研究人员和企业的关注。通常,WBAN是由功耗低、轻便
异构网络架构下无线通信系统在不同无线应用场景中呈现出不同的特性。一方面,从数据传输所在的场景来看,引起异构网络环境下无线数据传输可靠性变化的主要原因是不同场景中的无
长期演进(LTE)已成为当今无线通信的主流技术,受到大众的一致推崇。正交频分复用(OFDM)、多输入多输出(MIMO)等物理层技术的应用让LTE系统在性能上有大幅度的提升,但同时也给无
随着移动用户数量的快速增长和移动终端的智能化,频谱资源日趋紧张,对无线速率提出了越来越高的要求,为了满足日益提高的通信需求,TD-LTE大规模的商用已经箭在弦上,为了实现到TD-L
随着移动通信技术的发展与成熟以及人们对移动通信需求的不断增长,国内外不少学者已经对面向下一代移动通信系统的相关技术作了深入的研究,它的目标是要获得较高的系统容量,并对
随着具有业务与网络分离特性的IP技术促成固定通信网和互联网的相互融合,移动通信与固定通信之间的融合成为研究的热点。3GPP R5版本定义的IP多媒体子系统,是将IP技术与移动通
TD-LTE移动通信技术方便了人们的生活,伴随着其高速的数据传输速率以及丰富的多媒体应用,更是对TD-LTE终端的功耗提出了新的要求。为了控制功耗国内外主流厂商都在增强电池性能
随着现代无线通信的发展,要求将认知无线电(Cognitive Radio,CR)应用到更宽的频段内,研究宽带频谱感知成为必然。但是基于奈奎斯特采样理论的宽带频谱感知技术(Wideband Spectru