【摘 要】
:
当前,基于麦克风阵列信号处理的声源定位技术广泛应用于各种领域,如视频会议、语音增强、智能机器人、智能家居等。然而由于各种干扰,会使得声源定位性能降低,甚至无法定位,
论文部分内容阅读
当前,基于麦克风阵列信号处理的声源定位技术广泛应用于各种领域,如视频会议、语音增强、智能机器人、智能家居等。然而由于各种干扰,会使得声源定位性能降低,甚至无法定位,特别是室内环境下,常有混响、噪声等不利因素。因此,对于声源定位来说,如何能够提高恶劣条件下的鲁棒能力,提升定位准确性是一个研究重点。近年来,基于机器学习算法利用分类识别来进行声源定位开始得到关注,这类方法比起传统声源定位算法不仅有更强的鲁棒性,而且能够在麦克风无法收到直达声时依旧有效。本文基于机器学习算法研究如何在混响和噪声环境下更好地提升室内声源定位的性能。首先分析了声波传播模型和麦克风阵列信号接收模型,介绍了传统的GCC声源定位算法和SRP-PHAT声源定位算法,然后简要总结了机器学习算法。在此基础上,本文使用相位变换加权广义互相关函数作为特征,提出直接使用线性判别分析分类器去识别,仿真结果表明其定位性能在混响严重的情况下优于朴素贝叶斯分类器。接着利用线性判别分析对互相关函数进行特征变换,对投影后的特征使用分类识别的方式定位,在恶劣环境下其定位性能要大大强于未变换前。然后从单一分类器的研究推广到多个分类器的组合,使用Adaboost和Bagging方法对多个分类器集成,集成后定位性能比单一分类器更好。最后利用优化的Bagging方法进行声源定位,利用K均值聚类方法选择性集成个体分类器,进一步提高声源定位的鲁棒能力。
其他文献
<正>他用10年时间,把一个靠借款创办的药店培育成一个集医药、医院为一体的现代化企业,创造了西藏民营企业发展史上的奇迹;他专注于自己熟悉的医药产业,致力于西藏人民的健康
国际知识产权争端与其解决机制按不同的标准有不同的分类。WIPO 的国际知识产权解决机制呈现明显的二元结构。其国家之间的争端解决机制不够完善,而新发展的私人间争端解决机
采用复合字母材料结合正镜像判断任务,首次揭示了心理旋转加工中的整体优先效应。实验一延长复合字母材料的呈现时间,检验心理旋转实验常用的正镜像判断任务中的视知觉整体优
<正>广告传播的文化效应是巨大的。美国经济史学家戴维·波特说过,广告是很有限的几个起社会控制作用的机构中货真价实的一个。它对文化传播的正负效应促使广告传播者的传播
<正>成本管理作为企业管理的重要部分,决定着企业的生存和发展。随着经济的不断发展,企业竞争不断加剧,成本管理成为一个突出的课题,而我国现代企业的成本控制现状却不尽人意
<正>通过固定资产清查,能够确保高校的管理部门准确、全面地掌握固定资产状况,真实反映资产账面价值,能够全面掌握院校内的仪器设备使用效率及资产闲置情况,进而为高校大型贵
<正>远大住工,有别于2013年因"天空城市"项目引发各界关注的远大可建,是我国第一家以"住宅产业"行业类别核准成立的新型住宅制造工业企业,这一次,我们专访了远大住工北京公司
配气机构是发动机的重要组成部分,其作用是通过控制气门的开启与关闭而实现气缸的吸气与排气。配气机构的良好设计能保证气缸最佳的充气效率、燃料的充分燃烧,发动机良好的动
结合现代航线驾驶工作特性及CRM和TEM模型基础上,通过文献分析、专家访谈和开放式问卷调查,筛选出现代航线飞行员驾驶安全所必备的27种关键行为特征,构成中国文化背景下航线
玉溪市位居云南省滇中城市经济圈,是面向南亚、东南亚的区域性中心城市。玉溪城,天然与水有缘。一条玉溪大河“形似玉带,溪水清澈如碧玉”,横贯城区,玉溪市因此得名。域内包含云南