基于特征融合与软注意力机制的环境声识别技术研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:weilonglee
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在音频识别领域研究中,环境声识别指计算机通过模拟人耳的听觉功能,对一段短暂的音频信号进行学习与分析,进而赋予相应的类别标签。此外,环境声音本身可以传递出很多重要的信息,通过对这些声音进行分析,可以帮助人们监测环境中的状况,从而有助于分析声学的场景。目前,环境声识别分类研究在医疗保健、安全监控、生态环境变化预测等领域的应用需求尤为突出。由于语音信号的结构性强且界限清晰,而环境声信号没有共同结构且容易受到其他噪声的干扰,所以为语音识别开发的模型不适用于环境声音分类任务。随着人工智能技术的不断发展,深度学习技术被用于环境声音分类。通过选取适当的声学特征来训练神经网络,从而解决环境声音识别分类任务。尽管该领域目前有大量的研究成果,但目前仍存在许多挑战。在现有方法中,一方面,大多数采用单一语音特征作为模型的输入,并且这些特征都是逐帧表示,忽略了环境声音特征的时序性,从而导致了一定的环境声信息的损失。另一方面,较少从模型的角度进行考虑,简单的神经网络模型难以完整的提取环境声音特征中全局的深层特征。因此,本文针对这两个方面提出了如下解决方法。(1)针对单一环境声音特征难以全面反映环境声特征,本文提出了一种基于多特征融合的环境声识别分类方法。该模型框架分别提取了环境声的时域特征与频域特征。通过对比实验,选取在相同分类器的情况下,识别结果较好的时域特征与频域特征,并进行融合。最后,我们将其与不同分类器进行对比分析,依据分类评估标准,对融合效果进行探讨。(2)为了提高模型对环境声音特征的全局提取能力,本文对不同的卷积方式进行分析对比。在此基础上,使用不同的注意力机制对不同卷积层中提取出的特征进行注意力实验,并对得出的实验结果进行综合分析。最后,我们将其与主流算法进行对比,得出本文的方案。实验结果表明,将时域特征、频域特征以及时频特征进行融合,其分类效果优于单特征,以及双特征。在此基础上,使用卷积的方式取得的效果优于其他卷积方式。并且通过对注意力机制进行研究,发现在卷积神经网络第一层嵌入软注意力机制能够更好的关注到融合特征中的深层信息。
其他文献
随着移动互联网和物流行业的快速发展,电子商务平台成为用户主要的购物渠道,用户可以随时随地通过电子商务平台购买品类齐全的商品,并可享受相对快捷的物流服务。但随之而来的挑战是:随着商品品种的不断增加,如何在海量商品中,快速找到用户期望的商品。推荐算法逐渐成为电子商务平台中不可或缺的一部分。它让用户快速定位到用户期望的商品,在提升平台体验、增加用户粘性、吸引商家入驻平台、提高平台竞争力的同时创造巨大的商
<正>人力资源研究中心是石家庄邮电职业技术学院落实中国邮政集团有限公司人才强邮战略,支撑人力资源转型创新、加速人才赋能的科研机构。中心以服务邮政人才发展为宗旨,重点研究领域包括:前沿理论与最佳实践、邮政人力资源管理、人才培养开发、人才评价发展技术和学习技术等。近年来,中心研究实践成果丰硕,多个项目获ATD"卓越实践奖"、ISPI"杰出人类绩效干预奖"、亚太邮联区域"最佳人力发展项目奖"、国资委企业
期刊
目的 探讨抗Xa因子活性和活化部分凝血活酶时间(APTT)在新生儿体外膜肺氧合(ECMO)支持治疗中的监测价值,分析抗Xa因子活性与APTT的相关性,分析抗凝血酶(AT)、总胆红素和血红蛋白对抗Xa因子活性的影响。方法 回顾性分析2018年1月至2021年1月就诊于广州市妇女儿童医疗中心的17例ECMO支持治疗患者,收集患者临床资料,采集患者静脉血并检测抗Xa因子活性、APTT、AT、血红蛋白和总
骨缺损的修复一直是骨科医师临床面临的难题之一。现阶段骨缺损的治疗主要分为骨移植技术和骨组织工程技术,但存在治疗时间长、难度大及费用高等不足。近年来随着中药及其有效成分修复骨缺损研究的不断深入,发现补肾活血类中药及复方具有修复骨缺损作用。文章基于近年来中药修复骨缺损的研究成果从实验研究、临床研究和机制研究三个方面展开综述,以期为中药应用于骨缺损修复提供参考和依据。
公共安全对于人民生命财产和国家社会稳定至关重要。文章针对现有的违禁品安检技术阐述了金属探测技术、毫米波检测、太赫兹检测和X光检测4种主流安检,并对比了各自技术的优劣,同时总结了深度学习在安检图像中的相关研究进展。最后,指出了未来安检值得关注的4个研究热点:检测技术互补化、网络集成化、探索更先进的安检技术以及深度学习与安检图像。
随着我国科技信息化的高速发展、人工智能技术的广泛应用,计算思维作为人工智能教育和编程教育的培养核心越来越受到人们的关注。然而,由于思维具有“隐性化”特征,当下小学信息技术教学在培养学生计算思维的过程中存在诸多问题。本文基于苏科版小学五年级信息技术Scratch板块中的《小猫出题》为研究课例,以“WPS流程图”软件为工具,从问题识别与分解、流程图绘制、脚本设计、创意拓展这四个关键环节探讨了培养学生计
随着居民人均可支配收入的不断提高,汽车逐渐成为我国人民日常生活中不可替代的交通工具。由于汽车使用量的逐年攀升,安全驾驶、交通拥堵等问题也愈发加剧,而大力发展汽车产业的智能化转型正是解决类似问题的关键。车辆检测作为目标检测中的重要方向,可应用于无人驾驶、交通流量信息统计、智能停车等新型智慧交通领域,最大限度地缓解交通问题,提高人民的生活质量。在目标检测算法中,基于无锚框的检测算法可以减少网络中超参数