【摘 要】
:
声事件检测(Acoustic Event Detection,AED)技术用于检测和确定音频信号中包含的特殊信息,如哭泣、爆炸、玻璃破碎、敲门等。声事件检测是音频监控、智能家居、机器人和工业
论文部分内容阅读
声事件检测(Acoustic Event Detection,AED)技术用于检测和确定音频信号中包含的特殊信息,如哭泣、爆炸、玻璃破碎、敲门等。声事件检测是音频监控、智能家居、机器人和工业探伤等领域的关键技术。本文从提升声事件检测系统的性能入手,研究和探索了深度学习技术在声事件检测中的应用。首先,本文提出了一种基于卷积循环神经网络的多特征融合声事件检测算法。该算法基于卷积循环神经网络和深度神经网络两个并行的深度学习模块,将梅尔频率倒谱系数特征和频谱特征进行了融合。算法弥补了基于梅尔频率倒谱系数特征的声事件检测系统噪声鲁棒性差的缺点,进一步提升了声事件检测系统性能。实验结果表明,本文提出的声事件分类算法具有更好的性能。其次,针对声事件检测系统在噪声干扰的场景下鲁棒性差的问题,本文提出了一种基于循环神经网络的噪声抑制算法。该算法通过循环神经网络对音频信号活动和噪声频谱增益进行建模和估计,并引入深度聚类算法提升噪声频谱估计的精度。相对于传统的谱减法和基于维纳滤波法的噪声抑制算法,该算法不仅对平稳噪声具有更好的抑制效果,对于传统噪声抑制算法无法抑制的非平稳噪声也能很好地抑制。实验结果表明,本文提出的噪声抑制算法能够更好地提升声事件检测系统的性能。最后,本文总结了声事件检测的研究重点和研究热点,对声事件检测的研究趋势进行了展望。本文分别讨论了声事件检测系统中的分类算法、噪声干扰、弱监督问题和数据标注问题,并分别介绍了针对以上问题的研究方法和研究趋势,为声事件检测的进一步研究奠定了基础。
其他文献
晶体产品由于晶型不同而存在诸多理化性质的差异,因此,设计合理的结晶控制过程以确保目标晶型的稳定是晶体产品制造过程中的重要目标。乙交酯是一种重要的用于聚合形成可降解
相机标定是计算机视觉中获取三维测度信息的关键步骤,圆形模式平面标靶是最常见的一种标定工具,具有制造简单且对图像质量要求较低等优点。唯一的不足是由于镜头畸变和透视偏
放射治疗是目前治疗肿瘤的主要手段之一,放射治疗过程的核心部分是治疗计划系统的应用。剂量计算是治疗计划系统中的关键,其准确性直接影响到患者治疗,进而影响患者健康。本
舰船在服役期间会不可避免的受到水下爆炸冲击载荷的作用,导致船体结构和舰载设备产生冲击破坏,而水下爆炸载荷作用下舰船以前三阶低频总振动为主,因此低频冲击环境的准确性对舰载设备抗冲击研究具有重要意义。通过对实测冲击响应数据分析,发现其应变响应对低频总振动具有较高的准确性,因此提出采用应变响应对低频冲击环境进行修正方法。本文采用模态叠加法对水下爆炸载荷作用下总振动位移响应进行计算分析,根据弹性力学分析加
司法解释出台前,由于法律规定的缺失,二审中原审原告申请撤回起诉的相关问题,不仅导致司法实践中处理方式的分歧,也引发法学理论界的争论。司法解释出台后,虽然为处理相关争
舰载设备良好的抗冲击性能对保障舰船安全性有重要意义,而大型浮动冲击平台作为舰载设备抗冲击研究的重要试验系统,有必要分析其冲击动力特性,以掌握平台具备的考核能力。鉴于当前浮台的结构形式及考核范围有限,考虑设计一种水下附体辅助结构调节平台冲击环境,改变传统平台横垂向冲击环境较大的差异。通过建立对应的数值计算模型,以实船试验和数值方法探讨水下附体的作用,校核仿真与试验的冲击相似性,完善大型浮动冲击平台的
三江源地区的畜牧业是该区域的支柱产业,牦牛养殖是产业发展不可或缺的部分。随着养殖规模的扩大与技术的发展,牦牛的养殖与研究取得了不菲的成绩,但仍然面临着成本高,收益差
跨模态检索问题指的是给定某一形式的数据,在另一形式的数据中检索到与其语义相似的样本,例如在常用搜索引擎如百度、谷歌等中,用户可以输入文字来检索相关的网页、图像或视
利用自主研发的微机控制多通道轴压水压联合作用岩石流变试验系统,对真实水环境下高水材料试样进行了不同轴压和不同水围压下的长期蠕变试验,研究不同条件下高水材料的蠕变规
影响学习者学习成效的关键要素之一是语言学习焦虑,学习者是否使用了语言学习策略对二语习得的学习效果有十分重要的影响,受新冠肺炎疫情的影响,国际学生线上汉语授课成为常态,本文主要研究初中级汉语水平的国际学生在线上汉语课堂中学习焦虑与元认知策略的使用情况二者之间的关系。本文在前人研究的基础上,根据线上汉语教学的特点,设计和编制了《线上汉语课堂焦虑量表》和《线上汉语课堂元认知策略量表》,对上海各高校共计1