混响环境下基于双耳信号的声源定位算法研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:healtw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
双耳声源定位是涉及人机交互、视频会议和语音增强等的重要技术。在工程应用场景中,特别是对于封闭环境,混响的存在导致声源定位性能下降,因此对混响环境下的双耳声源定位技术的研究具有重要的理论意义和工程价值。首先,论文介绍混响环境下基于双耳信号的声源定位算法的理论基础,对双耳信号的声源定位原理进行深入研究,分析双耳信号模型,并设计系统总体框架。其次,论文研究了常用时延估计方法的相关原理,针对声源信号各频率分量作同样的处理不能解决混响对不同频率语音的影响差异而导致定位误差的问题,提出一种分频的广义互相关的时延估计方法。该方法使用Gammatone滤波器对双耳信号进行分频处理,对每个子带信号进行倒谱预滤波的去混响处理后反变换到时域,左右耳各子带信号进行互相关运算,得到的每个子带的互相关值进行求和运算,获得最大互相关值对应的双耳时间差。通过实验证明,该算法对语音信号的各个频率分量作了充分地去混响处理,有效地减少了多频声源中混响带来的定位误差。接着,对方位估计方法进行深入研究,针对倒谱域中会丢失相位信息以致双耳时间差信息丢失,而造成定位误差的问题,提出基于倒谱双耳房间脉冲响应(Binaural Room Impulse Response,BRIR)的双耳互相关声源定位方法(CEP-BRIR-CC)。该方法通过从倒谱BRIR中减去混响分量,然后反变换到时域得到估计的脉冲响应,再与数据库中的头部脉冲响应进行互相关运算,最大互相关值相对应的位置就是所估计的声源位置。该算法通过比较两个脉冲的相似性,避免了双耳时间差的计算,实验证明,该算法能有效提高定位准确度。最后,构建了一个基于双耳信号的声源定位系统,并进行了实验测试和分析。实验结果表明,CEP-BRIR-CC算法相比文中其他基于时延估计的声源定位算法具有更好的定位准确度,实验结果和理论计算的趋势是一致的,在混响时间为0.3s和0.5s时的准确估计率分别为89.9%和87.7%,能有效解决工程环境下混响对声源定位的影响。
其他文献
小学班级中学生角色因素的相关性分析刘云杉,吴康宁,程晓樵,吴永军南京师大一、问题的提起班级是学校教育最主要的单位,是由相互作用的几十名学生共同组成的社会有机体。貌似平静
2015年高考马上到了,在这冲刺阶段,掌握解题方法和技巧相当重要,高考历史题目主要包括选择题、材料解析题、问答题三种题型,本文从这三方面给考生提供指导参考,以期帮助考生
目的:探讨乌司他丁对子宫切除术患者炎性细胞因子的调节作用。方法:125例子宫肌瘤需行子宫切除的手术患者随机分为治疗组和对照组,治疗组62例,对照组63例。所有患者均在气插全
在我国建立半市场半企业性银企关系制度,有利于银行发挥其"相机治理"的作用,从而整体上提高企业财务治理效率.
<正>广东省教育科学研究所所长、华南师范大学博士生导师郭思乐教授指出:"我们提倡的生本教育,就是以一切为了学生,高度尊重学生,全面依靠学生为旨的教育。""真正以学生为主
在GIS支持下,以OMI数据产品SO2e和NO2d为数据源,确定了SO2和NO2的质量浓度,并考虑干沉降速率时空变化特征,建立了可满足空间和时间研究需求的区域SO2和NO2干沉降通量估算方法
国家法和民间法遭遇冲突的情况下,如果法官单纯依照法律规定作出判决,而罔顾民间法的存在,即使该判决符合法律规定,在国家制定法层面上是公正的,最终也未必能够得到人们的认
本文以中国石化润滑油有限公司茂名分公司3.3×105 t润滑油、脂扩能改造工程为例,介绍了边施工、边生产的质量风险主要管理模式,总结了旧设施停用、新设施投用各类质量风险的
目的:观察复方独活寄生合剂抗炎、镇痛作用.方法:分别采用蛋清致大鼠足跖肿胀法、二甲苯致小鼠耳廓肿胀法观察抗炎作用,采用小鼠醋酸扭体法、热板法观察药物的镇痛作用.结果:
食指的诗《相信未来》包含巨大的内在分歧,它既是一首"灰色诗歌",也是一首"红色诗歌",前者体现了其中的普遍性与人性内涵,后者则体现了其中的历史性与时代特征,两者在"相信未