基于麦克风阵列实现声源定位

被引量 : 0次 | 上传用户:aoli668
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在电话会议、视频会议等系统中,可以通过麦克风阵列声源定位方法来确定说话人的位置,以控制摄像机和麦克风阵列波束对准正在说话的人。但由于混响和噪声的存在,严重影响现有声源定位方法的性能。现有方法一般将混响和噪声分开对待,所以精度较低。此外,现有声源定位方法一般运算量较大,难以实时处理。针对这些问题,本论文系统地研究了基于麦克阵列的声源定位方法,主要做了以下几方面工作: (1)总结归纳并比较了各种基于麦克风阵列声源定位方法的优缺点。主要介绍两种声源定位方法:基于可控波束的声源定位方法和基于时延估计的声源定位方法。此外,还介绍一种神经网络声源定位方法。 (2)简单介绍传统的基于可控波束的定位方法。给出了一种最大似然参数声源定位法,并将其与延迟-求和可控波束定位法的性能进行了比较。 (3)介绍了一种神经网络声源定位方法。 (4)研究时延估计方法。提出了改进的互功率谱相位时延估计方法;介绍一种基于高阶统计量的时延估计方法;最后给出基于建立信号模型和互功率谱相位的时延估计方法。该方法对噪声和混响均具有很强的鲁棒性。 (5)简单介绍了基于搜索的定位方法和基于几何定位的方法。对于前者,给出了三种不同的误差准则,并对其进行分析比较。对于后者,在现有球形插值法的基础上,给出了一种新的方法:线性修正最小均方声源定位法。另外,还给出了线性插值声源定位法。 (6)给出一种实际的声源定位系统——基于建立信号和互功率谱相位的定位系统。该系统运算量小,对噪声和混响均具较强鲁棒性。文中并给出了该系统实现框图及会议室实验结果。
其他文献
本文利用中国1997—2015年省级面板数据,建立了以人力资本为门限变量的门限回归模型,实证分析了贸易开放水平对以专利申请量为代表的区域创新的影响。研究结果表明:贸易开放水平
本文设计的虚拟频谱分析仪结合了虚拟仪器技术、频谱校正技术和软件编程技术,借助于数据采集系统将被测信号采集到主控计算机内,利用虚拟仪器进行测量和分析,并将结果输出到屏幕
拖拉法又名水平定向非开挖钻进技术。近几年拖拉法越来越多地应用于污水管道穿越河流、道路及不宜开挖的工程实践中。该技术具有对周围环境影响小,施工安全、高效、综合成本
<正>笔者在2008年8月,先后走访了河南鹤壁、中原油田、西安铁路公安局,与一线带犬民警进行座谈,了解各地巡逻犬使用情况;2009年8月到新疆和田公安局特警支队实地调研了解新疆
数据的平稳与否对计量经济分析有着重要影响,在计量经济分析之前必须进行平稳性检验。近年来,出现了不少检验数据平稳性的方法,每种检验方法都有其自身的特点。本文从检验模
以十六烷基三甲基溴化铵作为插层剂,采用阳离子交换法对钠基蒙脱土粉体进行有机改性制备有机蒙脱土(OMMT);采用熔融插层法制得聚苯硫醚(PPS)/OMMT复合材料并将复合材料进行热处理
国际货币体系的演变是一个自然的发展过程,历史上曾经历了由低级到高级、由单一到多元化的种种演变。从国际实物货币到国际金属货币,最后归于国际信用货币,国际货币的形成已不可
目的观察两种麻醉维持方式对合并原发性高血压病患者行鼻内窥镜手术出血量的影响。方法选择Ⅰ或Ⅱ期原发性高血压病患者40例,男25例,女15例,年龄35~54岁,ASAⅠ或Ⅱ级,患者随
在以互联网为发展基础的金融大时代背景下,各地商业银行纷纷对自身业务进行不断扩展,也给其投资、筹资等一系列财务活动带来了更多便利条件。但是网络金融时代给商业银行的财
本实验研究了五种氟喹诺酮类抗菌药环丙沙星、氧氟沙星、恩诺沙星、单诺沙星和沙拉沙星对金葡球菌标准菌株ATCC25923和大肠杆菌标准菌株ATCC25922的体外抗菌活性、体外抗菌后