基于深度学习的异常音频检测方法

来源 :沈阳建筑大学 | 被引量 : 0次 | 上传用户:renj19861123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能技术的发展,深度神经网络应用场景日益广泛,在音频数据处理中引入深度学习方法也成为研究热点之一。由于传统视频检测方法存在监控死角,受到物体遮挡及恶劣天气的影响,异常事件视频检测容易出现漏检和误检等问题。本文研究分析异常音频特征提取方法,将深度前馈神经网络引入异常音频检测系统中,提出了一种基于深度神经网络的异常音频检测方法。本文主要工作如下:(1)查阅有关音频数据处理和深度神经网络相关论文和文献资料,分析目前国内外相关领域的研究现状和未来发展趋势,明确本文研究方案和内容。(2)研究了音频数据预处理方法。从音频采集硬件采集音频数据信息,并将模拟信号转换为数字信号,将数字信号进行音频数据的预加重处理,并对比分析小波降噪法、同态滤波法和Wiener滤波法等音频降噪算法。在音频数据进行降噪处理以后,对连续的降噪音频数据进行端点检测,将有效音频片段从连续音频信号中分离出来。(3)研究了音频数据特征提取方法。在音频特征提取的处理中,首先对经过预处理的有效音频片段进行分帧及加窗,使其具有稳定的短时特征,然后对比分析音频数据的时域特征、音频数据的频域特征和采用人工神经网络进行特征提取等方法的优势和缺陷。经过对比分析,本文采用音频数据的频域特征进行音频信号的特征提取,音频信号数据进行分帧加窗以后,对于每个音频信号帧计算其对应的梅尔频率倒谱系数,其具有计算复杂度低、音频数据特征提取效果较好等优势,并将提取到的低维度特征进行分类,得到最终的分类结果。(4)研究了异常音频数据分类方法。本文采用深度前馈神经网络作为分类器,分析深度前馈神经网络的基本单元和架构,对比分析不同的激活函数、损失函数和优化算法之间的优势和缺陷。本文设计了两种深度前馈神经网络模型架构,分别应用于拥有较强算力的高性能服务器和低功耗嵌入式设备,与传统算法进行对比实验,结果表明本文提出算法具有良好的分类效果。
其他文献
在对外汉语教学课堂中,语言教学和文化教学一直都是同样重要的两个教学重点,教授汉语不仅要教给学习者汉语拼音、词语、语法等等语言知识,同时汉语教师也应该帮助学习者了解
事务所简介WOHA建筑设计事务所由来自新加坡的黄文森和来自澳洲的理查德哈斯尔于1994年共同创立,至今已发展成为了一个以不懈追求设计创新与演化而享誉国际的顶尖设计团体。
现代经济快速发展的实证分析主要是通过产业结构的优化升级来实现的,产业结构的优化升级取决于产业结构的调整。产业结构调整的基础主要包括影响因素和影响程度这两个方面,只
为了实现从“中国制造”到“中国创造”的转变,2015年国务院发布《中国制造2025》,提出了实施制造强国战略的第一个十年行动纲领,助推制造业提质增效取得显著成果。研发创新质量的提高仍然面临诸多限制,其中来自市场方面的市场分割问题一直为社会各界所诟病。市场分割到底对绿色创新全要素生产率增长及分解产生了怎样的动态冲击影响尚无明确的答案。这些问题的解答对中国绿色创新全要素生产率的提高具有重要的政策参考价
越南语和汉语同属于孤立语,在语法上具有很大的相似性,但是也存在一些差异。比如,汉语和越南语常见动词分类都包括根据动词意义分类、根据动词及物性分类等,但越南语常见动词分类除了根据动词的意义分类、根据动词的及物性分类以外,还有包括根据动词的独立性分类。文献多为把这两种语言中某一类动词进行对比,而从宏观的角度对两类动词分类的情况进行对比分析的研究则非常罕见。本文将汉越两种语言异同的动词分类进行了比较分析
本文根据有限元理论,提出了相似刚度矩阵的概念,并依此实现复合材料模型实验中模型与原型位移的相似转,从而进一步求出原型的应变应力分布。
杆系结构是一类应用广泛的工程结构,作为杆系结构的基本元素-杆件,常常受到拉、压、弯、扭的联合作用。裂纹杆件的扭转和弯曲,是现代工程结构中一类重要的问题。对于横截面带有裂
本文建议以重现期为环境荷载“量”的标准,提出了用已有弹性分析程序对复杂环境下导管架式海洋平台结构进行极限承载能力分析的近似方法,即在且依次累加每一步增量荷载而进行结
随着电力体制的改革和国家的宏观控制,火电企业的经营形势日益严峻,不少企业出现了亏损的现象。由于国家大力发展低碳环保的政策提倡,各类新能源发电兴起,比如生物质能力发电
目的:1.了解老年高血压病人的社会资源利用现状;2.了解老年高血压病人自我管理行为现状及其影响因素;3.探讨老年高血压病人社会资源利用状况对自我管理行为的影响。方法:2018