基于双麦克风阵列的声源定位算法研究与硬件实现

来源 :蔡振宇 | 被引量 : 0次 | 上传用户:rwteng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
声源定位技术是语音信号处理领域的重要组成部分,受到研究者的广泛关注。对于麦克风阵列声源定位的研究主要集中在大孔径的固定阵列上,但近年来随着消费电子的发展,无线耳机、AR眼镜等带有小型麦克风阵列的嵌入式设备越来越普及,其采样率有限、孔径小、阵列间距不固定等特点导致了声源定位的精度有限,影响了实际的使用体验。为了解决上述问题,本文针对无线耳机设备的特点,搭建双麦克风阵列模型,对声源定位问题展开研究,提出了一种改进的时延估计算法和一种基于几何解算的阵列校准算法,利用提出的改进算法设计并实现了双麦克风阵列声源定位硬件系统。针对采样率有限、孔径小的问题,本文在GCC-PHAT的方法基础上提出一种改进的时延估计算法,通过引入局部的三次样条插值,对广义互相关函数进行二次峰值搜索,提高了低采样率下的时延估计精度,从而提高声源定位的精度。相比于传统TDOA算法,在相同条件下的平均时延估计误差降低了87%,平均定位误差降低了56%,而算法总耗时仅增加0.011ms,满足实时性需求。针对阵列间距不固定的问题,本文提出一种基于几何解算的校准算法,在时延估计的方法基础上选用两组特定的麦克风进行几何解算,解算过程中对子阵列内部麦克风的固定间距值加以利用的同时,避开了其误差相对较大的时延估计值,提高了几何解算的精度。相比于现有文献中的校准算法,在相同条件下的平均校准误差降低了51%。基于Xilinx FPGA平台实现了双麦克风阵列声源定位系统。针对MEMS数字麦克风设计了预处理模块和数字滤波器模块,结合本文提出的改进算法设计了时延估计和几何解算模块。结果表明,本文设计的硬件系统各项资源利用率均低于10%,在48MHz系统时钟下的电路总功耗为0.241W,完成一帧计算的时间为0.29ms;在无混响的室外环境下,阵列校准的平均误差小于1cm,声源定位的平均误差小于4°。
其他文献
溶菌酶(EC 3.2.1.17)又称胞壁质酶,能够水解肽聚糖N-乙酰胞壁酸和N-乙酰葡糖胺之间的β-1,4糖苷键,细菌失去细胞壁的支撑而裂解死亡。溶菌酶不仅是一种天然的、安全的且性能优秀的杀菌剂,也是身体内一种重要的非特异性免疫因子,被广泛应用于食品工业、生物医药、饲料制造等领域。真菌的生长环境复杂,体内溶菌酶或具有耐碱、耐高温等市售鸡蛋清溶菌酶不具备的优点。目前对于溶菌酶的研究主要集中于鸡蛋清溶
学位
随着网络通信技术和家用路由器的发展,越来越多的网络智能设备需要接入家庭网关。目前家用路由器的网络流量控制主要基于Linux内核实现,在网络接口发送数据包之前进行流量控制,存在缺少全局管理、流量整形策略单一、原有机制繁琐复杂等问题。本文基于Linux内核,设计并实现门槛低、通用性较强的网络流量控制功能,在实际场景中提升家用路由器网络服务质量,为用户提供更好的上网体验。本文首先介绍网络流量控制在家用路
学位
随着物联网的大规模部署,频谱资源变得愈发紧张,节点数目的爆发式增长使得为节点更换电池逐渐成为一项具有挑战性的任务,废弃的电池若处理不当很容易造成环境的污染。环境反向散射无源物联网不需要设置额外的射频源,节省了宝贵的频谱资源,节点具有从周围环境射频信号中采集能量的能力,摆脱了对电池的依赖,从而能够快速推动物联网的大规模应用。网络中的多个节点在传输数据时可能存在数据冲突问题,在无源物联网中同样如此。介
学位
本文的研究目的,就是设计出能在特定频段实现电磁透明的宽带天线。为了降低散射效应,在普通天线的偶极子上加载缝隙。通过引导和抑制高频感应电流,使偶极子产生的散射波相互抵消,同时幅度有所弱化。最终,散射电磁波将所剩无几。在偶极子的表面,U形槽加载的方式非常关键。无论是感应产生的高频电流,还是巴伦激励的低频电流,这些电流在偶极子表面的分布会受到U形槽加载的影响。在工作频带内,除了交叉偶极子提供的两个谐振点
学位
随着城市化的快速进程,密集的建筑形态改变了城市地表的空间结构,极端的人工环境引发了一系列气候环境问题,人类生态系统遭受前所未有的压力。而我国沿海湿热地区城市发展迅猛,所呈现的城市形态与气候条件的冲突愈演愈烈,造成了建筑能耗的大幅增加。另一方面,快速增长的人口与学位紧缺直接导向了校园增量建设与可建设土地不足的矛盾,高密度城市区域与校园空间也将影响校园热环境。而小学建筑相较于居住建筑,其体量、布局与空
学位
目前,除了历史文化名村与传统村落外,仍存在大量未法定保护但也具有文化价值与时代意义的村落,然而随着现代化建设节奏不断加快,开发建设往往忽略其中的历史文化要素,选择推倒重建。若此类村落不存在了,被保护的村落成为活标本,也不是未来发展的良好选择。一方面,此类村落发展是前提,需要自我经济平衡,具有开发重建的诉求;另一方面,文化资源类型丰富,全部拆除将造成不可弥补的遗憾。其实文化与经济是不冲突的,如何规划
学位
本翻译实践报告基于比利时语用学家维索尔伦(Verschueren,1995)提出的顺应理论,对儿童文学小说作品《笑猫日记:保姆狗的阴谋》第1章至第12章的内容进行日语翻译并对翻译工作展开研究。《笑猫日记》是儿童文学作家杨红樱的日记题材系列作品,以主人公笑猫的第一视角展开叙述,讲述了笑猫和家人朋友们的有趣经历和冒险故事。第一部《保姆狗的阴谋》讲述了保姆狗出于嫉妒心理,多次陷害善良的牧羊犬,最终自食恶
学位
香精香料与人民生活水平的提高、食品工业的发展密切相关,其中芳香族醛酮类香料化合物在香精香料领域占有关键地位。随着人们对产品安全意识的增强和健康理念的崇尚,大众更加青睐于通过物理方法从动植物原料中提取或者是通过生物法合成的天然香料。与传统的提取法和化学合成法制备芳香族醛酮类香料化合物相比,生物酶催化法具有专一性强、催化效率高和环境友好等特点,且基于生物酶催化法的级联反应允许在一个反应体系中进行连续多
学位
目标语音和噪声来自不同方向时,听者可以利用它们的双耳声线索的差异产生空间掩蔽释放(spatial release from masking,SRM),提高语言可懂度。这种掩蔽释放是相对于噪声和目标语音来自相同方向而言的。双耳时间差(interaural time difference,ITD)是重要的双耳声线索之一,ITD的变化可能会对噪声中的语言可懂度造成影响,不同听者对ITD利用的能力也可能存
学位
多输入多输出(Multiple-Input Multiple-Output,MIMO)技术是4G/5G乃至未来无线通信的重要技术之一。随着天线数目的增多,通信系统的频谱利用率大大提高,通信质量得到了极大的改善。但与此同时,不同天线间信号受到的干扰也会随着增多,这大大提高了信号检测的难度,也提升了检测系统的复杂度。因此,研究高准确性低复杂度的MIMO信号检测算法意义重大。本论文对基于长短期记忆(Lo
学位