基于深度学习的小尺度麦克风阵列多语音源辨识方法研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:wyoo00oo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音交流是人类沟通交流最有效的方式之一。多说话人场景下噪声、混响和多声源之间的混叠,使得对多语音源的混合信号进行声源定位和语音分离变得更具有挑战性。本文针对小尺度麦克风阵列,对含有多个语音源的远场语音信号进行定位和分离研究。为了提升小尺度麦克风阵列上的语音信号定位性能,提出基于卷积神经网络(Convolu-tional Neural Network,CNN)的多语音源到达角(Direction of Arrival,DO A)估计算法,以及多语音源计数和DO A联合估计算法。联合估计算法通过多任务学习(Multi-task Learning,MTL)模型实现同时估计声源个数和DOA。仿真和实验数据处理结果,证明了本文所提出的基于深度学习的多语音源DOA估计方法比传统的高分辨率DOA估计算法有更好的定位性能。为了提升远场环境下单通道多说话人语音分离效果,提出基于时序卷积网络(Temporal Convolutional Network,TCN)的多通道语音分离方法。实现了基于空间特征的多通道时域语音分离网络(Time-Domain Audio Separation Network,Tasnet)和基于固定波束的多通道时域语音分离网络。最后,基于声源数目检测和DOA联合估计,实现在未知说话人个数情况下的多通道时域语音分离算法。仿真和实验结果证明了本文所提出的多通道时域语音分离算法的有效性。本文设计了一种用于多语音源感知的应用系统,将声源定位和语音分离算法级联起来进行处理。实时处理结果进一步验证了本文提出的基于小尺度麦克风阵列的多通道语音分离算法的有效性。
其他文献
智能卡设备作为一种保障用户信息安全的产品,其内部实现的密码算法都是满足理论安全要求的商用密码算法,如DES,AES,RSA等,以确保恶意攻击者无法获取内部的关键信息。这些密码算法都是经过了一系列理论验证和筛选,以及传统密码分析方法实际攻击后被证明安全的算法。但是,这些密码算法实现在具体的物理设备上时,设备运行过程中的泄漏信息提供了关于设备中关键信息的先验知识,使得攻击者能够通过旁路攻击这种手段恢复
电弧故障已逐渐成为住宅建筑电气火灾事故的主要成因之一。由于电弧故障拥有因其复杂、随机和不确定等特性,传统的空气开关断路器无法及时响应切断电源并因此失效。针对这种情况,本文对电弧故障特征进行了初步分析。提出了基于时间片的电弧故障特征检测算法,结合该算法和离散小波变换(Mallat算法),实现了一个数字硬件检测电路。该电路与高速ADC一起协同工作,对电弧故障信号进行分析和计算,克服了传统MCU软件实现
水声传感网络(Underwater Acoustic Sensor Networks,UWASNs)是探索、观测及利用海洋的重要基础设施,媒体接入控制(Medium Access Control,MAC)协议是其中的关键技术之一。MAC协议负责分配信道资源,保证网络节点尽可能合理地共享信道。论文以数据收集为应用场景,研究水声传感网络的MAC协议。针对现有协议存在多应用适应或分区域服务质量(Qual
用户的用水类型是供水企业对用户用水收费的重要标准。用户用水类型标签作为供水企业对用户定价的关键凭证,在用户的用水类型申报、供水企业的运营减负及利润保障上起着极为重要的作用。然而随着供水产业改革以及用户规模扩大,用户用水标签错标、标签无法随用户用水性质自动更新等问题日益加剧。供水企业客户基数大、用户长期流动、变动频繁,同时运营资金投入少、人工维护困难等问题使大数据量下用水用户标签的更新和清洗难以实现
鱼类及其相关产品是人类饮食食谱上蛋白质的重要来源之一,渔业的健康发展与人们的生活密切相关。优良的鱼种资源是渔业可以持续健康和快速发展的基础,育种和优选是渔业养殖过程的关键环节。鱼苗的优选除了依靠一些生化指标外,鱼苗的表型数据也是鱼种优选的重要参考指标。目前鱼育种的研究机构多采用人工测量方法获取鱼苗的表型数据,这个过程费时费力且易出错,同时难以获得全面的表型数据。为了帮助研究人员快速准确的测定鱼苗的
敏捷成像卫星具有较强的姿态机动能力,相比于普通成像卫星具备沿俯仰轴侧摆的能力,对于地面观测目标可产生更长的可观测时间窗口。随着敏捷成像卫星应用领域的不断扩大和用户任务需求的不断增加,如何对输入的用户任务序列进行规划,制定出合理有效的任务执行序列,充分发挥敏捷成像卫星的运行效率,对实现敏捷成像卫星在轨运行的自主化、智能化具有重要的意义。本文围绕敏捷成像卫星任务规划问题,建立了带有时间窗口约束的敏捷卫
近年来,由于计算机算力的快速发展,深度学习(Deep Learning,DL)算法已经成功地应用于各式各样的场景中。其中,卷积神经网络(Convolutional Neural Network,CNN)的提出使得图像领域的许多复杂问题得到了解决,例如图像分类、图像分割等问题。然而,对于一个分类任务而言,一个模型在某个数据集上表现出色并不代表其在其他数据集上表现同样出色。随着数据量的急剧增长,神经网
近年来,智能手机相机已经成为人们日常生活的必备工具之一,获取高质量的照片也逐渐成为了人们追求的目标。然而,在诸如夜晚或者照明昏暗的低照度场景下,相机捕获到的图像往往存在噪声大、对比度低,细节和色彩大量丢失的问题。这不仅会严重影响人眼的视觉效果,还会影响很多计算机视觉相关的应用,如人脸识别和安防监控。本文的研究目的是针对低照度图像进行去噪和对比度增强算法的研究。基于深度学习算法和一些经典的低照度图像
随着无线网络的应用、芯片集成度的提高与计算能力的增强、以及信号处理技术的进步,基于无线传感网络(Wireless Sensor Network,WSN)的分布式信息处理技术受到学者与产业界的关注,成为了研究热点。分布式自适应算法因结构简单且易于实现的特性,被广泛地应用于解决分布式参数估计的问题。分布式自适应网络是由一组具有数据处理和通信能力传感器节点组成,通过自适应算法和节点间协作进行目标参数的估
随着人工智能和传感器技术的发展,移动机器人在仓储物流、家庭服务、教育科研等领域的应用越来越广泛,室内定位与路径规划技术是移动机器人应用于具体领域的重要基础。对于空间相对较小的室内场景,基于麦克纳姆轮的移动机器人可以全方向无约束地运动,具有良好的机动性和灵活性。因此,本文研究麦克纳姆轮结构移动机器人的室内定位和路径规划对移动机器人在室内场景下的应用具有重要的意义。本文的主要工作如下:首先搭建了麦克纳