基于深度学习的一阶正交差分阵列声源定位方法研究

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:thp2860051
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
声源定位技术是麦克风阵列信号处理领域的重要研究热点之一。考虑到在某些实际情况下如视频会议中,感兴趣的声源位置仅限于某些预定义的离散区域,因此近年来基于深度学习的声源定位方法得到了广泛研究,该方法将声源定位问题转换为分类问题并取得了较好的效果。基于深度学习的声源定位方法关键之一在于有效的提取声源位置特征。现有的广义互相关相位变换加权特征由于能够在一定程度上抵抗房间混响的影响,从而被广泛的用于基于深度学习的声源定位方法中。但是,我们的研究结果表明该特征不适用于小尺寸麦克风阵列。另外,在网络结构方面,卷积神经网络采用局部连接、权值共享以及下采样方法,从而获得了很好的平移、旋转和收缩不变性,使得所提取的特征更有区分性。因此本文采用卷积神经网络作为分类器,研究了小尺寸差分麦克风阵列的声源定位方法。具体工作和贡献如下:1.首先针对现有的基于一阶正交差分阵列的声强特征提取过程中采用的平均处理方法造成局部时频点声强信息丢失的问题,本文对每个时频点的声强特征进行单独处理,并将所有时频点的声强信息作为网络的输入。另外,在网络构造方面,现有的方法采用浅层网络——最小二乘支持向量机作为分类器,从而无法精确的学习有关声源位置的信息,识别能力较差。本文采用卷积神经网络作为分类器,并在所提特征基础上给出一个合适的网络模型。与传统卷积神经网络相比,本文采用的网络模型卷积层后不包含池化层,因为研究结果发现池化层的使用会使定位性能下降。仿真结果表明,所提方法对混响、噪声、空间分辨率以及信号长度敏感度较低,具有较高的定位精度和鲁棒性能且能够有效的适用于小尺寸阵列。2.为了进一步提升现有特征在复杂声环境下的鲁棒性,提出了一种改进的鲁棒特征提取方法。首先对现有特征提取过程中所存在的问题进行理论分析,揭示其对噪声较为敏感的原因。然后在此基础上提出了一种改进的白化加权方法,该方法将声压与振速分量之间的相关性进行解耦,从而降低噪声在加权函数中的贡献,有效提高了算法对噪声的鲁棒性。另外考虑到差分阵列对阵元失配误差较为敏感,例如麦克风增益和相位误差。因此,本文研究了在不同失配误差影响下各方法的定位性能。仿真结果表明,对于小尺寸麦克风阵列,改进的鲁棒声强特征能够在混响噪声以及高空间分辨率情况下获得更高的定位精度,且对信号长度敏感度较低。另外,与基于最小二乘支持向量机的方法相比,基于卷积神经网络的方法受阵元失配误差影响较小,且由于特征提取的鲁棒性,本文提出的方法能够获得更好的定位性能。3.在实际室内环境下搭建平台并采集数据对本文提出的方法进行验证。与现有方法采用实测数据进行训练不同,本文采用仿真数据预训练网络模型并通过实测数据进行测试,从而可以更好的验证各种方法处理训练与测试环境之间不匹配的能力。实测结果表明,与仿真结果一致,与现有方法相比,本文提出的方法在实际环境下仍能在分辨率较高时获得较好的定位精度和鲁棒性能。
其他文献
约束条件下的人脸识别目前已日趋成熟并得到广泛应用,但是对无约束条件下的人脸识别依旧存在诸多挑战,主要表现为无约束条件下的人脸受模糊、偏转、遮挡以及光照等因素影响。视频监控是应用人脸识别技术的一种重要场景,在此场景下的人脸具有低质量和无约束的特点,此外,海量的视频数据以及重复的人脸信息导致过多的冗余计算。因此,本文针对监控场景下无约束人脸识别中存在的此类问题进行研究。论文工作如下所示:(1)论文所提
学位
实定法所确立的中央与地方立法权限的划分标准尚有缺陷,不能适应各地方因地制宜的治理需求。已有学理研究成果过于"重技术"而"轻理论",缺乏深层次的价值指引,难以回应以上现实困境。公共服务理论为解决央地立法权限的划分问题提供了全新视角。在公共服务理论下,国家长久执政的正当性前提在于向人民提供良好的公共服务,国家行使立法权的目的在于组织公共服务,央地立法权限的划分同样应以公共服务为中心。中央立法的定位系制
期刊
AC/DC变换器是电网、数据中心、车载充电等应用中的核心装置,其功率密度和效率对整个系统有着至关重要的作用。提高开关频率可以提高AC/DC变换器的功率密度,但与此同时高频硬开关带来的开关损耗降低了效率。通过AC/DC变换器的软开关技术可以解决这一问题,然而如何简单有效地实现AC/DC变换器的软开关成为一项挑战。本文首先研究了应用于图腾柱PFC的控制型软开关技术,利用电感电流在一个开关周期内反向流动
学位
本文阐述了茶叶萎凋加工的概念、原理作用、基本类型、配套设备设施和工艺技术,以期为不同茶类(白茶、红茶和青茶)的适度萎凋加工、提质增效提供参考借鉴。
期刊
该文简要介绍直升机的发展史,重点阐述活塞式发动机与涡轴发动机的技术特点,并对2类动力装置进行对比。随后,重点研究直升机动力装置的选择方法及动力装置与直升机的匹配。最后,对涡轴发动机的技术发展趋势进行展望。涡轴发动机以其显著的优势在各类直升机中得到广泛应用,但其经济性及制造成本等因素依然有待改善,尚无法完全取代活塞式发动机,而后者多用于小型直升机。
期刊
新能源汽车是目前汽车工业能源转型的重要研究对象和未来汽车的发展方向。作为电动汽车驱动系统的核心部件,高性能的驱动电机是提高电动汽车实用价值的关键。内置式永磁电机具有高功率密度、高效率、高控制精度、高可靠性、宽调速范围、低振动噪声等优点,在电动汽车驱动领域应用广泛。但是用于制造永磁电机的高性能稀土永磁材料是国家重要的战略资源,其昂贵的价格严重增加了永磁电机的制造成本,制约了永磁电机在电动汽车领域的进
学位
近年来蜂群无人机的军事威胁日趋提升,针对蜂群无人机的探测与反制引起各军事强国的高度关注,稳定可靠的探测技术作为反制蜂群无人机的前提已成为计算机视觉领域的研究重点。通过雷达引导的中远程光电设备拍摄可疑飞行物并进行在线识别检测,成为常用探测手段之一。本文以蜂群无人机为目标,重点研究中远程光电设备平台下的无人机集群目标检测技术。论文的主要工作如下:(1)基于改进YOLOv3的无人机小目标检测方法。针对中
学位
目的 总结慢性心力衰竭(CHF)患者开展居家心脏康复(HBCR)的最佳证据。方法 按照“6S”金字塔证据模型检索BMJ Best Practice、Up To Date、Google、澳大利亚乔安娜布里格斯研究所(JBI)循证卫生保健中心、美国国立指南库、苏格兰学院间指南网、英国国家卫生与临床优化研究所、国际网络指南网、医脉通、中华医学会等网站,Cochrane Library、Embase、Pu
期刊
高压母线目前广泛应用于船舶、高压系留无人机等场合以减小传输线损耗及线缆重量。相比于传统硅(Silicon,Si)器件,碳化硅(Silicon Carbide,SiC)器件禁带宽度高,热导率更高,且性能系数(Figure of Merit,FOM)更低,能实现更高的开关频率,更适用于1-k V高压应用场景。LLC谐振拓扑能够实现一次侧开关器件的零电压开通(Zero Voltage Switching
学位
为了简便快速提取植物内生真菌DNA,本试验对碱裂解法进行改进,以满足基于ITS序列的大规模内生真菌分类鉴定的需要。采用0.500 mol/L的NaOH为提取缓冲液,结合研磨珠、组织破碎仪,经高温裂解和Tris·HCl稀释,制备了PCR扩增的模板溶液。结果表明,此方法可用于白僵菌ITS1/ITS4引物的PCR扩增,且模板溶液稳定性好,室温下至少可存放14 d。将该法用于773个菌株的基于ITS序列的
期刊