基于麦克风阵列的声源定位与跟踪算法的研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:zhangzzxb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
声源定位与跟踪(ASLT, Acoustic Source Localization and Tracking)技术是人机交互研究中的一个重要环节,在数字助听器、多媒体系统、视频会议系统和移动机器人等领域得到广泛应用。比如,在数字助听器中,通过对声源进行定位可以检测到说话人的位置,从而指向说话人,同时定向放大说话人的声音,去除无关的背景噪声;在视频会议系统中,能够利用声源的定位与跟踪向摄像机传递实时的位置信息,控制摄像机对准讲话的人;此外,移动机器人在进行路径规划时也要用到声源的空间位置信息。基于麦克风阵列的声源定位与跟踪方法计算量比较低,并且可以完成全方位的跟踪,目前已经成为声源定位与跟踪问题的主要解决方法。在实际的房间环境中,往往存在着由墙壁、地面和桌面的反射带来的混响以及风扇、空调等产生的噪声,这些都有可能对声源定位与跟踪的精度造成影响。本文首先分析了麦克风阵列声源定位的原理,介绍了阵列信号处理的背景知识,并建立了麦克风阵列语音信号处理模型,详细讨论了两种传统声源定位方法,并在传统定位方法的基础上提出了改进的基于SRP-PHAT的声源定位算法,仿真结果表明,改进算法在计算量降低的同时能够获得和传统算法相近的性能。而后接着介绍了粒子滤波的基本理论,给出了标准粒子滤波的算法流程,并介绍了基于遗传算法改进的粒子滤波,在此基础上探讨了基于粒子滤波的声源定位与跟踪算法的一个通用框架,并分析了在该框架下的四种方法,并在框架中SBF-PL方法的基础上,结合遗传粒子滤波,提出了基于遗传粒子滤波的改进声源跟踪算法。实验结果表明,改进算法可以有效提高系统对说话人的跟踪能力。
其他文献
学位
期刊
近年来,随着全球通信的发展,宽带无线接入技术呈现出巨大的发展潜力。其中WiMAX技术以其传输速率高、建网速度快、建设成本低、覆盖面积广、频谱效率高等特点成为未来最富有竞
随着无线通信业务和技术的快速增长,对无线频谱的需求也日益增大,当前,无线频谱的匮乏是阻碍无线通信发展的瓶颈之一。认知无线电(CR)通过伺机地接入授权的空闲频谱以提高频谱利用
期刊
目前,电视系统已经进入由模拟电视向数字电视转变的过渡期。各国都在大力发展数字电视产业并制定了一系列的政策推进数字化进程。我国有4亿多台电视机,特别在大中城市,彩电普及
当前海量的数据存储在不同数据库管理系统中,但由于绝大多数数据源间的异构性,形成了所谓的“信息孤岛”。为了消除异构、检测数据的异常、提高信息综合利用率和准确率,本文提出
IPv6传感器网络融合了IPv6技术和无线传感器技术,符合未来网络发展方向。由于IPv6传感器网络节点数量庞大,各节点承担着种类繁多的应用服务,如何发现及使用这些服务是实现IPv
期刊
国道212线(兰州一重庆)是连接我国西北与西南地区的重要通道,是交通部西部大开发八条大通道之一。公路沿线陇南段是我国滑坡的主要发育区之一。据统计,国道212线甘肃陇南段公路