基于麦克风阵列系统的声源定位技术研究现状

来源 :电脑迷 | 被引量 : 0次 | 上传用户:jimzhan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要 麦克风阵列信号处理是数字信号处理领域的一个热点问题,对麦克风阵列接收到的信息量,根据各个阵列之间信息的相关性,可以使用融合处理的方式实现对参数的估计,这种融合不仅可以在时间域处理,也可以在频域处理。麦克风阵列信号处理技术能够在统计意义上得到测量数据,该技术已应用在无线通信,雷达,声纳与工业控制等场合得到了广泛的应用。
  关键词 声源定位 麦克风阵列 数字信号处理 三维空间 可控波束
  中图分类号:TB51 文献标识码:A
  1麦克风阵列系统的声源定位技术研究意义
  输入的信息只有两个方向难以确定声源的位置,人类的听觉系统主要取决于头和外耳气压差声波实现声源定位。假使没有这个压力差,只能定位在平面上声源的位置,但就无法知道声音是从前面,或从后面传来的。因此,由人的听觉系统,科技研发人员得到了灵感,使用多个麦克风系统可以实现在三维空间中的声源位置的定位,麦克风的数量越多,所接收到的信息量也越多。
  声源的声源定位和声源增强是实现智能处理的两个关键问题,而声源定位是实现语音增强的前提和基础。一个麦克风的信息量较少,使得声源定位所需的信息缺乏,而麦克风阵列克服了上述缺点,充分利用每个麦克风信号之间的数据相关性,并加以融合,可以实现声源定位。
  麦克风阵列系统已广泛应用于许多领域的基础上,一些典型的应用:
  (1)视频会议
  传统的视频会议和大型会议,如果只在一个固定的位置放置一个麦克风,扬声器远离麦克风,语音信号的质量收集很差,为了得到增强的语音信号,有两种选择,一种是谁讲麦克风传给谁,这是最常用的方法,其成本低,但使用不方便。另一个方法是对每个人都配置麦克风,这种方法容易在参与者的数量较少的情况下实现,但其成本太高,不太现实。基于麦克风阵列的系统不仅成本适中,安装方便,使用者还可以自动将提高扬声器的声音,和周围环境的噪声抑制。
  在视频会议和视频监控,自动声源定位系统的麦克风阵列方向扰动摄像头的热点区域,以获得更好的图像和声音,大大地节省了人力。
  (2)移动电话系统
  当车辆在高速运行状态时,如果用手拿移动电话,可能会导致安全问题,免提电话由此应运而生。然而,当一些人在汽车中高声谈论事情时以及和当车辆高速运行时产生噪声的情况下,使用免提电话就比较困难。如果驾驶员位置使用麦克风阵列定位,加强在这个位置上的声音,消除其他方向上的干扰声音,通话效果就会有明显改善。
  (3)故障诊断
  故障诊断的第一步是确定故障的位置,在故障诊断中的声源定位是一种使用音频信号来实现无源探测定位的技术。声源定位系统采用被动方式工作,电磁辐射具有很强的隐蔽性,声源定位故障检测是在军事领域和民用领域得到了广泛的应用。
  2麦克风阵列系统的声源定位技术的各种算法
  (1)可控波束法
  可控波束的方法首次应用在雷达,声纳和通信,军事和经济领域,在这些应用领域中,声源模型是远场模型,目标是得到声源的方向角。一种最简单的可控波束的声源定位方法是基于延迟求和波束形成方法。麦克风的信号传播延迟的方法,用于麦克风延迟声源的补偿,这些信号通过时间延迟叠加后形成混合信号,每个信号补偿后,在时间上基本相同,而叠加信号输出能量是最大的。对麦克风求产生的信号求和来得到波束,然后通过搜索声源的位置来引导波束,最大输出能量的波束点就是声源位置。
  波束形成的基本思想是信号加权后每个数组元素集合的总和,利用麦克风阵列来调整最大输出功率的权重。在传统的可控波束的形式中,权值的确定取决于各阵元信号之间的延迟,而相位延迟与时延迟和到达方向有关系,所以它也被称为延迟求和波束形成器。在现代的波束形成器中,权值可以突破限制,根据调整权值的依据来获得相应的波速形成器,常用的依据为最小均方误差准则。一般来说,信号的加权求和过程可以被看作是过滤过程。所以称这种波束形成为滤波器求和波束形成器。
  (2)TDOA算法
  TDOA定位算法是一种对TOA算法的改进版本,他不能直接使用信号来到达时间,必须要与多个基站接收以确定移动站的信号位置,与TOA算法相比,不需要加入专门的时间戳,定位精度提高。2种TDOA值的采集:
  第一种形式是移动站到2个基站的时间,使用差值来获得,此时还需要基站的时间严格的同步,但是当基站移动信道特性相似时,可以降低由多径效应引起的误差,如图1所示。
  到达时间差的方法分为两个步骤,首先计算出声源在每个麦克风的相对时间差,再结合麦克风阵列的物理结构,得到声源的位置。时延估计中的第一步准确与否直接决定第二步定位精度。
  参考文献
  [1] 肖华.麦克风阵列的校正方法研究[D]. 电子科技大学,2008.
  [2] 崔玮玮.基于麦克风阵列的声源定位与语音增强方法研究[D]. 清华大学,2009.
其他文献
摘 要 随着计算机在人们生活中的普及,使得计算机的各项技术已经与人们的生活工作息息相关,而且计算机的发展在一定程度上代表了世界经济发展的脚步,到目前为止,计算机技术的快速发展,使计算机的图形技术和图像技术在日常生活和工业生产中得到了很好的运用,该技术的发明为人们的生产生活带来了很多的便利,而且通过图形图像技术的进一步发展应用,为人们带来的生活福音将会越来越多。  关键词 计算机技术 计算机图形 图
期刊
多核处理器当前风头正劲.在整个业界,到处是多核处理器的新闻.最新的半导体工艺已经为芯片设计者提供了足够数量的晶体管,足以制造出实用化的多核处理器,各种设计的数量激增,
摘 要 中国在80年代末开始对神经网络研究,主要开展了一些基础性的应用工作领域。人工神经网络的可塑性,自适应性和自组织性使得其具有很强的自学习能力与并行处理能力,保证了其能够快速处理问题。为了满足实时分布式存储的需求,它具有更好的鲁棒性和容错性。因此,人工神经网络已被广泛应用于模式识别,系统识别,图像处理,自动控制等领域。  关键词 神经网络 控制系统 控制科学 模型 机器人  中图分类号:TP1
摘 要 近年来,语音合成技术中的波形拼接算法被广泛地运用在各个国家的技术前沿。大多数的实验研究结果表明波形拼接算法具有可靠的实用性,所以在市场中已经具有许多语音合成产品,这些产品对人们的日常生活和工作的各个方面有很大的影响。  关键词 语音合成 发音 自然度 时域波形 语音库  中图分类号:TN912 文献标识码:A  1语音合成技术的发展历程  随着语音合成的要求越来越高,语音学家对语音合成的研
摘 要 目标声音识别逐渐将会在实际的日常生活中得以应用。在实验室环境下,对目标声音识别系统大多数识别性能也达到了一定的要求,但在实际噪声环境下的识别系统效果将大大降低。因此,在抗噪声语音识别的研究目标是非常重要的。研究发现,人耳具有良好的抗噪声能力,因此基于语音识别技术的听觉系统是一个很有前途的研究课题。  关键词 语音识别技术 听觉系统 仿生学 智能 机器人  中图分类号:TN912.34 文献
摘 要 云计算(Cloud computing)已经成为了IT界的热门技术,甚至被视为将根本改变生活方式和商业模式的革命技术。借助云计算,网络服务提供者可以在瞬息之间,处理数以千万计甚至亿计的信息,实现和超级计算机同样的效能。云计算可以被视为网络计算和虚拟化的融合:即利用网格分布式计算处理能力,将IT资源构筑成一个资源池,再加上成熟的服务器虚拟化、存储虚拟化技术,是用户可以实时的监控和调配资源。 
超壏芯片  为了满足OEM厂商对更多功能和更高性能的需求.德州仪器(TI)一如既往地利用其先进的数字信号处理器(DSP)技术为开发人员提供每MHz与每单位成本更高性能的解决方案。
嵌入式开发人员面临的最大挑战之一是如何为其下一个设计选择合适的处理器.在市面上大量现成的嵌入式处理器中,设计人员必须仔细挑选能够同时符合功能、性能和价格要求的型号
当论文的主体是以人为研究对象时,作者应说明其遵循的程序是否符合《赫尔辛基宣言》的基本原则,是否符合负责人体试验的委员会(单位性的、地区性的或国家性的)所制定的伦理学标准。作者须在文中标注伦理批文号,并提供该委员会的批准文件复印件及受试对象或其亲属的知情同意书副本。