基于神经网络的声源定位算法研究

来源 :北方工业大学 | 被引量 : 0次 | 上传用户:sandybobo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
声音作为人类最自然、最便捷、使用频率最高的沟通方式之一,在多种环境下包含了大量的信息,其重要性不言而喻,其应用范围同样涵盖了诸多领域。如今,随着人工智能技术的不断完善,将声音信息作为各种应用的输入也越来越常见。同时,许多系统和场景不仅对声音内容有需求,对于声源位置的分析同样十分重要。目前,声源定位技术已经在许多领域取得可观的成效,但是随着实际应用场景要求的不断提高,现有定位技术在发展的同时也产生了许多新的亟待解决的问题,例如在混响环境和外界噪声的干扰下,系统对声源定位的性能会有不同程度的下降,因此对于声源定位技术的深入研究依旧具有深刻的现实意义。本文首先分析了声源在房间内传播的真实情况,即房间冲激响应(RIR)对于声源定位的影响。提出一种改进的房间冲激响应仿真模型,并与单-多通道录音数据库(SMARD)进行对比,得到仿真的定位声学环境。随后针对传统的麦克风阵列声源定位技术的理论进行了研究,主要分析了三种传统的声源定位算法,分别为:基于最大输出功率的可控波束形成技术、基于高分辨空间谱估计技术的定位技术和基于到达时间差的声源定位技术,针对麦克风阵列的几何位置关系与麦克风接收信号的加权形成的波束的特点进行考虑,提出一种改进的基于相位变换(PHAT)与平滑相干变换(SCOT)相结合的定位算法。最后本文将神经网络与声源定位技术进行结合,针对神经网络与声音信号的特点,采用了残差神经网络(Res Net)作为神经网络模型,结合改进的RIR仿真模型,将麦克风阵列接收的声音信号进行GCC-PHAT-SCOT计算并将输出作为Res Net的输入特征进行训练,最终在测试集得到房间内声源定位的结果。实验结果表明,在不同混响条件和信噪比的环境下,基于神经网络的声源定位算法具有较高的定位准确率。
其他文献
目的:探索云南道地药材滇黄精中黄精多糖抗糖尿病的作用。方法:采用水提醇沉法提取滇黄精总多糖,分级醇沉法分离出均一多糖,再经DEAE-FF琼脂糖凝胶柱纯化。SPF级ICR小鼠雄性75只,随机选出15只作为空白对照组,正常饮食喂养。剩余采用高脂高糖饮食联合低剂量链脲佐菌素制备2型糖尿病小鼠模型,造模成功后,分为4组:即模型组,阳性组、滇黄精总多糖组(PPS)、滇黄精均一多糖组(PPS1)。观察各组小鼠
智能语音家居系统是利用语音识别功能来实现控制居民家庭中的各类电器设备,达到用语音控制各类家庭电器的目的。本文以计算机为服务器搭载科大讯飞的离线语音识别库,让其与终端设备处在同一个局域网中。终端可通过TCP网络协议访问服务器进行语音识别,根据获取返回的ID值来实现对家居设备的控制。
为全面建成小康社会,我国大力实施脱贫攻坚战略,精准扶贫档案由此产生,它是对精准扶贫工作最真实、最客观的记录,深刻、全面反映了精准扶贫工作的历史全貌,具有极为重要的保存和利用价值。现阶段,我国脱贫攻坚战已取得胜利,大量精准扶贫档案亟待得到更为规范化与系统化的整理,精准扶贫档案整理工作成为首要任务并深入展开。将精准扶贫档案整理工作推进落实到位,是充分发挥精准扶贫档案效用的前提与基础,直接关系到脱贫攻坚
随着工业发展、能源消耗和城市机动车保有量的日益增长,大气中氮氧化物污染问题逐渐成为大气污染治理工作的重点和难点,分析氮氧化物的污染过程和来源对大气污染的科学防治有着重大意义。该研究基于武汉市22个监测点在2021年5-11月时间段内的观测数据,针对期间的3次氮氧化物污染过程展开研究。结果显示,NO2污染过程从晚高峰开始,全市出现若干NO2污染源,之后逐渐扩散至遍布全市,形成市区整体污染态势。影响N
以六种不同产地黄精-云南、广西滇黄精(Polygonatum kingianum),湖南、安徽多花黄精(Polygonatum cyrtonema)和黑龙江、辽宁鸡头黄精(Polygonatumsibiricum)为原料比较主要化学成分差异,通过提取物对α-葡萄糖苷酶、α-淀粉酶抑制率及葡萄糖透析延迟指数分析其降血糖性能,筛选一种产地黄精与患病小鼠粪便体外发酵培养,通过16S rDNA测序,分析对
"文化是旅游的核心,旅游是文化的载体。"海南不仅拥有得天独厚的生态旅游资源,还拥有众多国家、省、市级"非遗"传统舞蹈文化资源。黎族舞蹈历史悠久、风格独特,是一种富含生命气息的活态文化,是反映黎族文化最直接的一种方式。海南文化旅游离不开本土文化的融合。本研究致力于积极引导、充分利用海南黎族舞蹈文化资源,打造具有本土特色的文化旅游新视野,为海南文化旅游增添更多新色彩。
由于参与建筑项目施工的单位较多,导致质量控制效果并不理想,为此,提出基于EPC模式的装配式建筑的质量控制方法研究。借助EPC模式的总承包机制,将多元化的建筑质量控制问题转化为单一施工单位的施工控制问题。在施工质量计划控制阶段,将整体化的施工项目拆分为若干个子工程,以划分结果为基础设置了对应的作业目标;在施工质量作业控制阶段,对具体的施工工序进行识别后,明确具体的施工人员和材料标准,并由管理人员进行
智慧型引导运输车(Intelligent Guide Vehicle,IGV)作为U型布局自动化集装箱码头的水平运输设备,衔接码头前沿与堆场装卸作业。其调度优化有利于提升码头装卸效率,减少集装箱船在泊作业时间。因此,本研究针对IGV调度优化问题,构建U型布局自动化集装箱码头IGV调度整数规划模型,并设计基于多智能体仿真和遗传-多元宇宙优化算法的模型求解算法。本研究可为U型布局自动化集装箱码头IGV
大学英语教育对于大学生个人英语素养培养以及综合能力有着十分重要的影响。基于此,本文对现阶段中西文化差异对大学英语教育的影响进行分析,并提出创新英语教学方法、提高教师教学水平、完善大学英语课程设计以及拓展英语教学方式等措施,希望能为基于中西方文化差异进一步完善大学英语教育提供有效建议。
高校是意识形态领域的前沿重镇,进入新时代,高校的意识形态工作面临纷繁复杂的形势和风险挑战。做好意识形态工作要坚持党的领导,完善体制机制,把牢高校意识形态工作领导权;要坚持守正创新、注重教育引导,把牢高校意识形态工作话语权,要坚持底线思维、强化阵地监管,把牢高校意识形态工作管理权。