基于数字麦克风阵列的声源定位技术研究

来源 :西安理工大学 | 被引量 : 0次 | 上传用户:liuhu986
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
得益于人工智能技术的快速发展和语音交互市场的火热,麦克风阵列在近几年逐渐兴起;并被广泛应用于语音识别及控制、车载系统等领域。麦克风阵列作为一种物理接口,其对语音信号的增益有限,且要实现其它功能,比如对语音信号进行增强,还需要其它算法与其配合。声源定位技术近年来已经受到关注,并吸引了大量的科研人员对其进行研究。传统的声源定位系统具有体积大、实时性差、所采用的声源定位算法抗噪性差等缺点,为提高声源定位系统的准确性,还需要进行更深、更广泛的研究。本文以数字麦克风阵列为基础,对麦克风阵列的结构、声源定位算法以及语音信号的解码方法等进行了研究,具体内容如下:(1)实际采集到的语音信号含有噪声,这将对语音信号的处理结果造成很大的影响,因此要对其进行预处理。本文对常用的语音信号预处理方法进行了介绍和仿真,以常规波束形成算法为基础,对四种常用的麦克风阵列的性能进行了仿真分析。基于仿真结果,本文以矩形麦克风阵列为研究对象,并推导了四元矩形麦克风阵列的声源定位公式。(2)在声源定位算法方面,以phat函数加权的广义二次互相关算法为基础,为降低噪声对算法性能的影响,对phat函数进行了改进,并分析了以改进的phat函数加权的广义二次互相关时延估计定位算法在不同信噪比下的时延估计精度。计算结果表明,改进后的算法在稳定性和抗噪性方面都有所提升。之后将改进的广义二次互相关算法与常规波束形成算法相结合,提出了一种搜索区域划分的波束形成算法,并对其定位的实时性进行了理论分析。结果表明,该算法相比于常规波束形成算法,计算耗时大大降低。(3)以FPGA为基础,完成了四元矩形麦克风阵列的数据同步采集、打包和发送。由于本文所采用的数字麦克风输出的语音信号为PDM编码,此语音信号不能被播放器直接播放,本文研究了基于FPGA的PDM语音信号的解码方法,并在Modelsim下进行了仿真,验证了其在FPGA上实现的可行性。(4)以理论仿真为基础,搭建了声源定位系统并进行了相关实验。研究结果表明,所设计的改进phat函数加权的广义二次互相关时延估计定位算法相比于传统时延估计定位算法具有更好的抗噪性,所提出的搜索区域划分的波束形成算法计算耗时小,能满足声源定位系统在日常使用时对实时性的要求。
其他文献
随着数据传输量的大幅度增加,人们对于信息安全的要求也越来越高,保护数据的方法多种多样,如水印、身份验证、图像隐藏以及密钥交换等。这些方法将秘密信息隐藏在单一的载体中,如果隐藏信息丢失,则秘密无法恢复。相较于传统的密码体制,视觉密码一直以共享图像的形式进行信息传输,它隐蔽性强,安全性高,解密时无需复杂的数学计算。为此,本文基于视觉密码方案结合信息隐藏技术、光学处理技术以及半色调技术提出了图像加密算法
近年来,信息在传递、存储过程中的安全性变得极为重要。起初,研究者提出用加密技术对秘密信息进行保护,针对加密后凌乱无序的密文容易引起攻击者的注意这一问题,研究者提出用信息隐藏技术来保护秘密信息的安全。信息隐藏技术主要分为嵌入秘密信息和提取秘密信息两个阶段,根据嵌入率和峰值信噪比衡量两个阶段的算法效果。本文通过对现有的SMSD图像信息隐藏算法进行研究,并在其基础上进行改进,在保证载体图像质量良好的前提
命名实体识别任务作为构建领域知识图谱的基础支撑,目前的相关研究主要集中在开放领域,针对垂直领域的研究进展比较缓慢,无法有效解决低资源、无完整领域词典和缺乏实体分类体系带来的垂直领域问题。本研究面向轨道交通工程设计规范,以《地铁设计规范GB53157-2013》为例构建命名实体识别任务的数据集,具体的研究内容如下:(1)本研究在低资源的情况下基于RoBERTa800K-CRF实现了领域自适应预训练。
随着物联网和可穿戴式设备等应用的兴起,功耗逐渐成为集成电路设计者必须考虑的重要因素。乘法器作为微处理器和数字信号处理器中的核心部件,广泛应用于物联网和植入式生物芯片等极低功耗领域,因此对乘法器进行低功耗设计有着重要的理论意义和应用价值。本文针对物联网和植入式生物芯片的低功耗应用需求,采用基-16 Booth编码算法和电源门控技术,设计实现了一种低功耗电源门控基-16 Booth乘法器。首先分析了竞
对人类进行的身体活动的自动识别称为人类活动识别(HAR)。有多种技术可以测量身体活动期间的这些运动特征,例如惯性测量单元(IMU)。IMU在这种情况下是基础,其特点是使用灵活、成本低和对隐私的影响较小。通过使用Notch传感器,可以对一些测量值进行采样,例如身体的加速度和角速度,并使用这些信息来学习能够将活动正确分类到相应类别中的模型。在本文中,我们建议使用卷积神经网络(CNN)对人类活动进行分类
【案例背景】除数是两位数的笔算除法——五入法试商(调商),是人教版数学四年级上册第六单元的教学内容。通过前面的学习,学生能够进行两位数除以两位数、三位数除以两位数的笔算除法的计算,懂得了两位数除以两位数和三位数除以两位数四舍法求商的笔算除法的算理,在此基础上来学习三位数除以两位数五入法求商的笔算除法,学生容易领会和把握,能理解三位数除以两位数五入法试商调商的算理,并能正确掌握三位数除以两位数
期刊
微液滴喷射技术由于其响应快、精度高等优点,在喷墨印刷、增材制造、LCD制造、微流体芯片、太阳能电池、和纳米技术等多个工业领域具有广泛应用。压电喷墨印刷具有控制精度高、印品质量好、能源消耗少及绿色环保等优点而成为数字印刷技术的重要发展方向。其工作原理是对压电打印头中的压电元件施加电压脉冲,由于压电材料具有逆压电效应,压电元件振动并在墨水通道内并生成压力波,导致流体在压力作用下从喷孔喷出,经射流断裂形
随着互联网技术的发展,个人计算机应用和USB设备在人们日常生活中越来越普及。但目前计算机应用和USB设备之间普遍未支持网络传输,也未能为计算机的外部设备提供一种有效的共享机制。为了满足用户工作共享性需求和提升设备时间和空间利用率,USB设备必须突破个人计算机空间限制,从而能够在不同计算机之间实现共享,同时在2015年,多个国家将“共享经济”评选为年度热词,可见共享模式已经在全球蔚然成风。此时研究开
近年来,随着科技水平的提高,数字印刷技术获得了巨大发展。其中压电喷墨印刷技术因其精度高、稳定性好和适应性强的特点,被广泛应用于大型喷绘、生物医药、增材制造等众多工业领域。压电喷墨中墨滴的驱动生成、墨滴喷射的状态都对印品质量起着重要的作用。因此,本文以弯曲式压电驱动系统为研究对象,深入研究了打印头结构参数、及系统驱动波形参数等对墨滴喷射动力稳定性的影响。具体内容如下:(1)优化打印头结构参数,分析其
随着网络技术的发展和终端设备的普及,全球数据的爆炸式增长使得各种数据难以保管且存在泄露威胁。为了节省本地存储空间,越来越多的企业将数据外包给云服务器进行存储与共享,然而云服务器是一个半可信的实体,总会有意或者无意地窥探数据信息,数据的管理面临严峻的挑战。为了保证数据的安全,在存储前需要对数据进行加密,数据共享时也要保证数据的完整准确。事实上,现存方案仍然存在以下问题:第一,由于云服务器的计算能力和