基于深度学习的声源定位算法研究

来源 :哈尔滨理工大学 | 被引量 : 0次 | 上传用户:z992070002
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着智能设备的逐渐发展,对声音源的位置进行定位的技术已经成为大多数智能应用设备中最基本的功能。所以,对于声源定位系统而言,如何让系统更好的提升其环境适应能力是目前该领域中研究的主要内容。最近几年,随着高性能低成本的运算处理器逐渐地商业化和越来越多的软件程序以及资料库的开源,使得深度学习在大多数领域取得飞快的进展。基于深度学习的声源定位算法也开始得到相关研究人员的关注。与传统算法相比,基于深度学习的算法拥有更高的识别精度和更强的鲁棒性,它为该领域发展提供了研究条件。本文首先对声源定位的主要技术进行分析和研究,其中包括传声器阵列模型的种类、如何确定传声器之间的最小间距、语音信号采集之后需要进行的三部操作(预加重、分帧加窗和特征提取)以及端点检测方法。其次对多重信号分类算法和TDOA结合深度学习算法的定位原理进行深入理解,总结这两种算法的优缺点并针对缺点提出适当的改进方案。其中多重信号分类算法计算量大提出利用FPGA加快计算效率。TDOA结合BP神经网络的定位方法中网络规模较大,于是提出更换网络模型和优化输出标签的改进思路。然后为了提升多重信号分类算法的计算效率,利用FPGA进行优化设计,设计出相应功能所需的硬件模块。最后提出多重信号分类算法结合卷积神经网络的定位方法,利用多重信号分类算法中的互相关特征矩阵对神经网络的输入进行改进,根据特定环境设计神经网络特定的分类标签,并采用了残差网络训练提高学习速率。经过对比验证发现训练后的网络模型提升了复杂室内环境下的声源定位准确率。
其他文献
聚类作为一种无监督的分类技术,是数据挖掘领域的一个重要分支,被广泛应用于图像分割、模式识别等实际场景中。迄今为止,已有许多聚类算法被提出。这些方法通常通过优化单一
随着时代的进步,人类通过互联网获取信息的比重越来越大,网络中的每个节点都是一个对等体,自身在获取信息的同时,也被别人获取,就像一句话“你站在桥上看风景,看风景的人在楼
随着社会的进步,经济的发展,人们生活水平的提高,生活习惯病、癌症等的患病率也大大增高。随之人们的思维方式也慢慢地发生了变化,健康养生已成为大家越来越关注的话题。本次
水体中的重金属会对水生系统以及人类健康造成严重威胁,吸附法是处理重金属废水的有效途径之一。生物炭具有多孔结构、丰富的表面官能团,是一种廉价易得的高效吸附剂。为了实
本文中,我们研究了协同聚类,并将相关概念与信息安全中的聚类分析联系起来;在这个问题中,我们关注于纷繁复杂的网络攻击时代中,随着数据的数量和复杂性不断增长所带来的数据
日本儒学家贝原益轩一生勤于学术,在儒学、医学、本草学等领域影响深远。本稿旨在研究贝原益轩的女子教育思想。考虑到部分研究忽视他的生活时代背景仅以现代观点评判,部分研究忽视他思想的局限性而一味赞扬,这两方面视角都比较片面,所以,本稿着眼于贝原益轩的生活时代,从当时的社会背景,主要是政治制度、学问思潮、教育状况和女性认识等角度出发,了解贝原益轩思想形成的基础。另外,贝原益轩的女性认识和女子教育的主张与他
本论文以《旁塘目录》文本为研究对象,主要阐述公元7世纪佛教传入吐蕃以来,历代赞普高度重视佛经翻译,尤其是赤松德赞时期,吐蕃人从周边的印度、唐朝、尼泊尔等地区迎请了翻
本文首先围绕印、藏朵玛源流与苯教文化发展过程中朵玛即三种观点进行分别探讨,同时结合佛教的藏传过程中,内外密朵玛仪轨中的外朵玛仪轨进行主要研究。不但分析藏传佛教各教派形成与不同时段朵玛的形态与内容,同时探讨朵玛文化的起因与其必要性。从苯借鉴的佛教朵玛文化与从佛教借鉴的工艺文化是藏传佛教长期发展过程形成的特殊而丰富的成果。本文研究朵玛文化的理论,阐释朵玛文化的内涵。但是于朵玛文化博大精深,对其进行初步
供电市场中的多主体博弈问题一直被学者们广泛地关注。在寡头市场的研究中,市场假设由完全信息向不完全信息转变,其中天真理性、有限理性和将两者相结合的不同理性(异质)的博
在全球经济和科技快速发展的形势下,能源供应压力越来越大,且面临较大的温室气体减排压力和环境污染问题,严重影响了人类的可持续发展,能源转型迫在眉睫。随着社会发展及人类