基于麦克风阵列的声源定位与语音增强方法研究

被引量 : 0次 | 上传用户:bobby_hong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在免提电话、视频会议等语音通信系统中,由于受到混响和背景噪声干扰,麦克风接收到的信号通常为带噪语音。这样不仅影响语音的可懂度,而且影响语音处理系统的整体性能。因此需要对带噪语音进行增强处理。在复杂的声学环境下,单麦克风语音增强已无法满足需求,而麦克风阵列处理技术能够捕捉声源位置并对带噪语音进行空间滤波,从而取得明显的消噪效果。在此背景下,本论文研究了基于麦克风阵列的声源定位和语音增强方法,主要工作如下:(1)归纳并总结了各种时延估计(time delay estimation, TDE)技术,特别针对一些常用的TDE方法进行了深入讨论,包括对定源和动源的跟踪能力,不同混响和信噪比条件下的抗干扰稳健性,以及算法的计算量。通过仿真结果总结出了它们各自的优缺点及适用场合。(2)提出一种双麦克风2D平面定位方法:该方法通过同时考虑阵列接收信号的时延和能量信息,将传统双步定位方法中所需的3个麦克风减为2个,降低了设备成本。在此基础上获得的闭式解方便了算法的快速处理。进而针对该定位模型,在测量噪声服从高斯分布的假设下,本论文推导出位置估计方差的Cramer-Rao下界,并由此分析了不同参数对定位结果的影响。(3)提出一种基于搜索空间预估计的高分辨方位(direction of arrival, DOA)估计方法:本论文利用TDE结果来获得高分辨DOA估计的搜索空间。这不仅使得计算量小于现有算法的1/3,而且还能够部分地去除干扰噪声的方向。在会议室环境下,实际定位系统(包含7个麦克风)的测试结果表明:在加入和未加入搜索空间预估计时,DOA估计的最大误差分别为4.4?和11.4?。(4)提出一种基于一阶差分麦克风(first-order di?erential microphone, FDM)阵列的谱域语音增强方法:该方法利用双通道的FDM阵列,并结合单通道的谱增强技术,可以同时提取语音和噪声谱估计,并实时地修正噪声谱。与现有的双通道语音增强技术相比,该算法可以获得2dB~6dB的输出信噪比增益,且计算量减少了2/3。
其他文献
为运用概率分级和回归分析方法揭示普通丝瓜褐变度与总酚含量之间的相互关系,从而建立普通丝瓜基于褐变度正态分布的分级标准,研究测定38份普通丝瓜的褐变度和总酚含量。采用
目的:探讨集中式预约检查流程的干预对预约质量的影响。方法改变预约流程中的操作人员培训方法、对操作环节及电子信息系统进行流程改造,将流程改造后的2013年1月预约检查患者8
在企业发展及建设中,企业党群组织是党联系职工群众的基层组织,做好党群工作,对于促进企业经营管理各项升级具有重要的现实意义。党群组织如何在安全工作中履行好职责,围绕安
<正>由西安市纪委和西安文理学院主办、马克思主义学院(西安廉政研究中心)承办的习近平反腐倡廉思想学术论坛暨廉政研究成果推介会于2017年12月10日在西安文理学院召开。会议
数学是一门极具抽象性的学科,对刚刚接触数学的小学生来说,抽象的数学知识是难以理解的,倘若教师在组织数学教学活动的时候一味地使用灌输知识的方式,只会增加数学的抽象性,
<正>二次函数是刻画现实生活的有效工具,建立二次函数模型,利用二次函数的解析式、图像与性质解决实际问题是近几年来中考的一个热点,也是许多学生学习的难点。解决这类问题,
制造业信息化正逐步成为制造业发展的大趋势,云计算、物联网、大数据、移动互联网等新兴信息技术的飞速发展,引发新一轮科技革命和产业革命。“软件制造”作为对互联网的诠释
如今,在大规模定制环境下,产品设计技术己经成为国内外学术界和企业界研究与应用的热点。而零件库作为支撑其技术实现的重要工具,有利于企业在产品设计过程中使用零件库对已
ATSC3.0标准制定按原计划顺利进行,已开始其“启动的倒计时”,可望于2016年秋在美国启动下一代地面数字电视广播。届时,地面广播业者不仅可用发送系统增强其传统的广播功能,可在家
为提高太阳能热水器能源利用效率,降低热量浪费,本文介绍了一种基于太阳能温差发电的热水器系统。该系统通过改造储水箱的结构,采用间歇式上水方式,利用温差发电原理,可将太