使用注意力机制和交互式标注的声音事件检测

来源 :桂林电子科技大学 | 被引量 : 0次 | 上传用户:yuanwenrui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
声音事件检测是检测一段音频中发生的声音事件和对应的时间戳。由于环境声往往重叠交织,加上复杂的噪声环境都使得识别变得棘手。通常检测被当成多类别分类问题,即将一帧音频划为固定类别中的多类,一帧音频出现多类声音即为重叠;当连续多帧音频被划分为某类别时就确认了该类声音事件的时间戳。因此声音事件检测问题实际上是连续的多标签分类问题。而处理分类问题,神经网络有着从音频数据中提取模式的能力从而成为了学界主流方法。众多神经网络模型中注意力机制在决策时能为不同音频帧分配不同比重因而受到广泛关注,这种机制在自然语言处理和声音事件检测中都有广泛的成功应用。本研究立足于注意力机制,探讨该机制能多大程度上完善声音事件检测效果。具体地,此项研究贡献如下:1)由于环境声音不如自然语言有着特定语法、语义结构,囊括时间间隔过远的帧计算注意力得分是一种记忆力浪费。针对传统注意力机制声音事件检测缺乏控制记忆机制这一特点,本研究提出了使用记忆力宽度控制的注意力模型,在两个环境下的数据集评估结果证明了该方法的有效性。2)不同数据集的注意力宽度选取是一个启发式的过程,此项研究提出了注意力记忆宽度自适应机制,实验结果表明,该机制达到了人为注意力宽度调节优化最好效果的相近水平。3)在训练检测模型时,大量使用了容易获取的合成强标签数据、真实环境录制的弱标签和无标签数据。在利用多实例学习框架处理强标签和弱标签数据时,本研究在两个评估场景下测试了多种池化方法。实验发现,注意力池化方法的优势在DCASE Challenge 2021 Task4中没有充分显示出来,综合分析后提出使用更大嵌入空间的特征级别注意力池化方法,实验表明,该池化方法下的注意力机制改进了声音事件的检测效果,即使是较小的嵌入空间,对检测的所有评估指标都有所提升。
其他文献
在数字经济背景下,充分发挥数字基础设施的多维减贫效应已成为推动共同富裕的重要路径,但已有文献少有探讨数字基础设施对家庭多维贫困的影响,更缺乏微观层面的经验证据。基于中国家庭追踪调查(CFPS)2014—2018年的面板数据,借鉴A-F方法构建多维贫困状态指标,分析数字基础设施建设对家庭多维贫困的影响。结果显示,数字基础设施建设显著降低了家庭陷入多维贫困的概率,有助于实现共同富裕。机制检验发现,弥合
<正>平日查房,看到几位肿瘤患者都存在顽固性呃逆的情况,非常痛苦,看着让人心痛。恶性肿瘤患者化疗后出现顽固性呃逆的概率为2%,严重的顽固性呃逆会对患者进食及正常呼吸运动造成严重的不良影响。那么,出现顽固性呃逆该如何处理呢?呃逆可分为4种呃逆是指反复的、不自主的膈肌、肋间肌等痉挛,伴声门突然关闭,引起气流受阻而产生的一种特有声音。呃逆可发生在呼吸周期的任何瞬间,以吸气峰值后产生更为典型。
期刊
为厘清金融支持农业产业链延伸减贫的内在逻辑,基于耦合协调发展视角,采用2008—2017年省级面板数据,建立普惠金融与产业链延伸的系统评价指标体系,分析普惠金融与农业产业链延伸对农村贫困的非线性影响,构建门限模型讨论二者协同减贫效果的异质性;利用交乘项研究金融支持产业扶贫的实现路径。研究结果表明,普惠金融与农业产业链延伸独立发挥减贫作用的门槛较高,但金融资源通过支持设施农业发展、促进农产品精细加工
文章以湖北省蕲春县特色艾草产业扶贫模式为研究对象,推出“互联网+药旅结合+蕲艾产业”的新模式,对当地特色艾草产业扶贫模式问题“对症下药”,帮助当地不断放大特色产业扶贫成效,为其他地区特色产业扶贫模式的探索提供参考价值。
脱贫攻坚是中国式现代化的重要组成部分,其成功经验将为全面建设社会主义现代化国家提供行动借鉴。社会福利供给(社会保障)既是促进贫困县脱贫摘帽的重要因素,也是推动实现共同富裕的关键要素。笔者运用空间计量分析方法,利用2015—2017年中国地级市社会福利供给数据,检验其与贫困县脱贫摘帽的关系及空间溢出效应。结果表明:中国社会福利制度具有共享性和不完全排他性,本市社会福利供给量的增加能促进贫困县脱贫摘帽
双碳背景下,对可再生能源的研究进一步加深。作为消纳可再生能源的载体,微电网发展迅速,区域内逐渐呈现出多个微电网联合运行的模式,提高了系统运行的可靠性与经济性,而多微网系统中各子微网属于不同的利益个体,个体利益与系统成本优化过程中产生的冲突矛盾亟需解决。在微网中引入需求响应,通过对负荷端的调整,促进了可再生能源的就地消纳,现有研究对需求响应所产生的效益较少量化,未能充分反映需求响应优势,同时电动汽车
业务与财务两者的融合程度是体现固定资产投资财务管理水平的重要标识。为适应国家关于基本建设财务规则的要求,符合基建项目竣工财务决算审计的相关管理规定,"业财融合"对基建财会和管理人员的综合业务素质、政策掌握能力、组织协调能力的要求已经成为必备条件。本文结合实际工作中的一些经验对"业财融合"在基建项目财务管理中的必要性和基建项目财务管理工作中业财融合应采取哪些措施进行分析。
本文从业财融合视角,分析基本建设项目全过程财务管理内容及要点,在此基础上提出了提升基建财务管控水平的保障措施建议,以期为企业构建项目全过程财务管理体系,保障项目资金安全、有效控制投资成本、提高投资效益提供借鉴。
为了解决各个信任应用域之间的跨域安全问题,保证隐私数据的跨域共享,利用区块链技术构建了基于主从链的隐私数据跨域共享模型。首先构建了主从链,并提出基于主从链的跨域共享模型架构;设计了基于智能合约的跨域访问机制,并基于跨域访问机制提出了面向隐私数据的跨域安全共享方案;最后,对模型的稳定性、吞吐量、存储开销等方面进行了实验及对比分析。实验结果表明,该模型同最新的单链跨域模型相比,吞吐量提升了270 TP
高校贫困生的就业是减轻家庭重担的一个重要因素,一直备受各界人士的关注。文章利用“实证调查+量化测算”的研究方法,对江西五所高校的贫困生进行调查研究,发现高校贫困生的性别、所学专业、致贫原因等方面在其家庭经济减贫效应上存在异质性。因此,国家应持续发展高等教育,同时加强贫困生群体心理健康教育,树立正确的就业观;贫困生应主动提高自我发展能力,增强致富本领。