基于麦克风阵列的声源定位技术研究

被引量 : 27次 | 上传用户:qingyong339
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,声源定位技术中多采用基于时延估计的声源定位算法,该算法定位精度不高。然而,在很多对定位精度要求较高的场合,比如,在实际会议室内,如果有多个说话人同时说话,声源定位精度高是对每个说话人的语音清晰拾取的保证。因此,提高声源定位精度也是一个很重要的研究课题。本文以基于大中型室内会议厅为场景,以对多个距离相近说话人的准确定位为研究背景,提高声源定位的精度为目的展开的研究。本文主要工作和创新点概括为以下几点:1.对语音信号预处理、预滤波进行仿真分析,目的是将非平稳性和宽带性的语音信号转变成平稳和窄带信号,便于后续定位算法处理。同时分析归纳了声源信号远、近场模型,为后续声源信号建立了空间入射信号模型。2.总结归纳了麦克风阵列的几种基本的拓扑结构:均匀线阵、均匀圆阵、十字阵、任意阵。从理论上给出了影响定位的空间参数。综合易于实现和定位效果两方面因素,选择均匀线阵和均匀圆阵作为研究的基本拓扑结构。同时,定性和定量的分析了阵元间距和外界环境误差对声源定位精度的影响,为后章节提供分析依据。3.为了满足大型室内会议室中,对说话人更为精确的定位,同时,也考虑定位模糊引起的定位失真。本文提出了一种具有两个不同阵元间距的麦克风阵列定位方法。该方法分别采用不同的阵元间距的线性组合,提取接收到的一帧最优化后的声源信号,对同一声源进行两次定位。后一次定位是依赖于前次结果而设置定位参数,此后采用2D-MUSIC算法进行精确定位。通过仿真分析,该方法不仅使得定位精度得到了有效的提高,同时,对空间相距很近两声源可以达到很精确的分辨。此外,为了后续方便研究,本文搭建了该方法的仿真验证系统,进一步验证了该方法的实用价值。4.基于上述麦克风阵列拓扑结构下,声源的二次定位算法在环境误差较大时,定位精度提高的同时可能会造成定位结果不准,因此,根据麦克风阵列校正的理论,本文最后对上面提出的二次定位算法做了进一步的修正,即对理想情况下,定位的空间结构乘以一个线性误差修正函数,使得麦克风阵列理想接收模型更加接近于实际接收模型,从而提高定位结果的可靠性。最后本文通过仿真验证了修正后可以达到较好的定位效果。
其他文献
教育资源拨配与享用中的诟病,似乎大都集中在政府资源配置不足与高涨的资源享用需求之间不相匹配的矛盾上,且这类矛盾始终处于满足与不满足的动态循环中,也成为教育发展缓慢
欧洲职业足球比较发达,很重要的一个原因就是制定和建立起了一系列有关职业足球的法规和制度。实践证明,这些法律的制定,符合职业足球发展的客观规律,保证了职业足球的快速发
在众多电视剧题材类型中,古装剧一直是大众喜爱的题材类型之一。而雍正题材因其所具有的特殊性在当下备受创作者青睐。受不同文化意识形态的影响,雍正题材电视剧在近几年中无论
本文探讨地震灾区社会工作、社会资本及经济发展之间内在逻辑联系的理论架构。影响现代经济增长的一个要素是社会资本;根源于人们基本的生存、发展和社交需求,社会工作有助于
当前,随着经济社会的迅速发展,社区治理环境已经发生了极大的变化。为了确保社区功能的发挥,进行社区社会资本的培育既有现代公共服务发展必然趋势和基层管理体制改革需要的
临终关怀是医务社会工作的一个重要领域,而儿童临终关怀是国内医务社会工作刚刚涉足的一个全新领域。本文以上海市某医院一个血液肿瘤科儿童临终关怀个案为例,探讨了儿童临终
<正>社会工作源于近代欧洲,在中国大陆是一门新兴的助人职业,社会工作作为一门新引进的职业,其内在的两种精神是我们本土传统文化土壤中缺乏的,一是科学操作精神;
美国海关的现代化进程受到"9·11"事件的巨大影响而发生了实质性的改变。它对自身职能和使命进行重新调整,并将进口安全作为海关的新职能;对边境管理的思路予以重新考虑;对有
近年来,中国社会工作发展迅速,取得了很大成就,但也遇到了不少问题,需要我们进行重新审视。回顾中国社会工作的发展历程,恰恰与转型期中国逐步进入风险社会是一致的。不过,看
林语堂尽其一生之力向西方世界介绍和传播中国文化,以此享誉海内外。《浮生六记》就是他诸多译作当中的一本,该书被认为是林语堂先生翻译的代表作,堪称中西的完美合璧。本文