基于双耳听觉及朴素贝叶斯理论的声源定位方法研究

来源 :东北大学 | 被引量 : 0次 | 上传用户:kenshingob
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
声源定位技术作为一个涉及到听觉生理学、听觉心理学、人工智能等多个学科的综合性研究领域,在语音的识别、分离、增强方面、人工智能以及军事领域具有广泛的应用价值。基于听觉特征的声源定位是其中的研究热点,而人工头作为模拟听觉系统的重要组成部分,对于声源定位和虚拟听觉等具有重要的研究价值。设计了一种基于双耳声源的人工头试验台,并在试验台的基础上进行头相关传输函数的测量、听觉特征提取方法和声源定位算法的研究。(1)针对声源定位情况的要求,设计基于双耳听觉的声源定位系统。该系统包括人工头、数据采集、和机械运动部分,实现双耳声信号的采集、保存和波形显示,为声源定位提供有效的数据保障。(2)对头相关传输函数的测量原理、测量信号的选取、测量流程和计算方法进行了研究,得到了较为准确的该人工头的头相关传输函数。并根据测量的头相关传输函数研究了双耳时间差和强度差。头相关传输函数表征的是人头生理结构对到达双耳的声波的综合滤波作用,它涵盖了多方面的综合信息,但是头相关传输函数具有特异性,是多个个性参数共同决定的,不同的人工头的头相关传输函数不完全相同,所以目前头相关传输函数的获得主要依靠实验测量。(3)针对双耳时间差和强度差作用频段的不同,并结合人耳耳蜗基底膜的带通滤波功能,提出了分频带的双耳时间差和强度差的听觉特征提取方法,从而筛选出对于该人工头双耳时间差和强度差表现较好的作用频段,并将这些频段的定位线索用于后续的定位。研究表明该人工头时间差的作用频段为300Hz-1kHz,强度差的作用频段为4kHz-5kHz。(4)针对双耳时间差存在前后方位混淆和双耳强度差同方位角对应关系复杂的情况,将分频段时间差和强度差组合为综合听觉特征,作为声源方位的特征参数,同时考虑到计算精度问题,可以认为声源定位是一种概率问题,所以提出了一种基于贝叶斯理论的概率声源匹配算法。验证表明该方法能有效避免前后混淆,提高声源定位精度。(5)由于语音信号不是连续的,一段语音中存在语音与语音之间的噪音段,这对定位性能造成影响,提出了一种使用MFCC系数的端点检测方法,该方法具有很好的噪声鲁棒性,能够有效的提取出语音段,实验表明有助于提高定位性能。最后使用测得头相关传输函数生成的虚拟声源信号和真实场景下测得语音信号进行声源定位性能的测试。结果表明该方法就有较好的定位精度和噪声鲁棒性。
其他文献
随着深度学习的广泛应用,目标检测识别技术越来越多地应用到了很多人工智能的系统中。智能监控系统就是该项技术的典型应用场景。目前许多基于深度学习的目标检测识别模型虽然可以大幅地提升检测的准确率,但是计算速度还是无法达到实时。同时,这些模型无法很好地检测到较小的目标物体。本文针对以上目标检测和识别方法出现的问题,研究利用深度学习的解决方案,具有很强的科学意义和应用价值。本文首先以在学术界和工业界广泛应用
近年来,因磁制冷技术的潜在应用,探索新的具有较大磁熵变的磁性材料备受关注。在本文中,我们合成了蜂窝晶格化合物GdCrTeO6和GdMnTeO6,并对其晶体结构、磁性和磁热效应进行了系统的研究,主要内容如下:1、简要概述了研究背景、磁制冷基本原理、磁热效应、样品制备手段、晶体结构和磁性表征设备。2、利用高温固相法制备了化合物GdCrTeO6和GdMnTeO6多晶样品。X-射线粉末衍射结果表明,样品为
故障诊断作为制造业的重要问题之一,目前正朝着智能诊断的方向发展。由于数据可用性的提高,以及近期人工智能算法在各个领域都起到重要作用,基于人工智能算法的故障诊断研究也越来越活跃。然而在工程实践中,很难获得高质量的带标签数据;同时,由于机器工作条件不断变化,导致不同时期的数据分布往往不同。这些都给故障诊断提出了较大挑战。因此,本文针对机械设备故障诊断数据的特点,结合深度学习与迁移学习,改进并将其运用于
学位
从全球视角看,随着互联网、人工智能等为代表的新科技革命浪潮袭来,全球迎来以网络化、数字化、智能化为代表的工业革命4.0时代,工业革命将会改变经济发展模式,甚至重塑世界经济格局。而湾区经济凭借特有的开放性、创新性、高效性成为世界经济发展的亮点,成为当前全球经济发展的新形态。故本文以粤港澳大湾区为研究对象,从剖析湾区经济、城市群竞争力、城市群国际竞争力入手,并对粤港澳大湾区城市群概况进行阐述,以发现问
对移动机器人来说,在空间环境中运动并且完成更高级的任务,规划移动路径是最基础的功能,这就是机器人学研究中的路径规划问题。路径规划是移动机器人导航系统的关键问题。首先,移动机器人要自主的完成路径规划、避障和更高级的任务,需要实时地计算出自身在外部世界的位置,即全局坐标和位姿。研究人员应用了各种定位传感器,研究出了许多定位方法。本文提出了基于摄像头的机器人定位技术,利用机器人的摄像机采集到图像,通过特
深度信息的获取是计算机视觉领域一项重要的研究内容。现阶段,机器人通常使用激光雷达对未知空间进行深度感知,但是激光雷达价格高昂,无法获得广泛的应用。结构光深度感知方法精度高,但噪声干扰是一个亟待解决的关键问题,严重制约了结构光技术的发展与应用。本文基于结构光深度测量原理,利用折反射全景相机视场大的优点并结合环带结构光,搭建主动式全向深度测量系统,实现一次拍摄获取场景360度方向深度信息。首先,设计一
同时定位与地图构建(SLAM)问题被认为是移动机器人实现自主导航的关键,基于视觉传感器的SLAM以其低成本、获取场景信息丰富等优点逐渐引起研究人员的关注。视觉SLAM是典型的计算密集型任务,传统的解决方案依靠机器人机载的计算资源求解,具有执行效率差、对机器人硬件设备要求高等缺点。云机器人概念的提出,为解决上述问题提供了新的思路。本文借助云平台强大的计算和存储能力,针对基于RGB-D的云机器人SLA
站台单柱雨棚作为一种在中小型铁路客站的设计中使用广泛的基础设施,因其在柱列平面外方向上为缺乏多余约束的静定体系,相比自身类似于空间框架结构的柱列平面方向,该方向上的结构无法满足我国现行相关规范对于结构在罕遇地震作用下设立多道抗震防线的延性抗震设计要求,因此可能存在不可忽视的结构安全隐患。为改善单柱结构柱的受力性能,解决该类结构柱列平面外方向抗震性能不佳的问题,本文创新性地提出了“混凝土核心分离柱”
非扩张映像的不动点问题在近代数学分支中有着广泛的应用,如非线性半群,遍历定理和单调算子理论中.最小范数不动点是满足最小范数性质的不动点,它的应用也非常广泛,如在最小二乘法问题,有界线性算子的伪逆是用最小范数解定义的,同时它也应用于最小化问题中,因此研究非扩张映像的最小范数不动点的重要性是不言而喻的.全文的主要研究内容及取得成果如下:1.介绍非线性泛函分析的发展及不动点的概况,同时给出国内外对不动点