基于深度学习的环境声识别方法研究

来源 :桂林理工大学 | 被引量 : 0次 | 上传用户:zhangzhubin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
环境声识别是声信号处理领域的研究方向之一,其主要通过分析声信号中包含的组成成分,实现对环境声的识别。环境声识别技术可用于安全监控、医疗看护、生态保护等各种领域,以弥补视频监控容易受到监控视角、光线强弱等不利因素而造成监控效率较低的问题。但环境声具有很大的非平稳性且容易受到各种复杂背景噪声的影响,进而导致对环境声的识别较为困难。本文针对复杂的环境声进行环境声识别研究,主要完成工作如下:针对单一声学特征无法对复杂的环境声进行有效的表征问题,采用梅尔频率倒谱系数、对数梅尔谱和短时能量三种特征进行特征融合的方式,提高对环境声的表征能力。通过对比实验发现,不同的特征融合方式对识别结果的影响较大。实验结果表明,采用基于三输入的卷积神经网络对三种不同输入特征进行特征提取后的后融合方式,其识别效果要优于采用前融合的方式。主要原因在于三输入卷积神经网络模型为每个输入特征都配置了不同的卷积与池化操作,有利于各自特征的提取,避免了不同特征却采用相同权重参数进行特征提取的问题。环境声识别算法中常采用的声学特征最初都是为语音识别和乐音识别而设计的,能较好的拟合语音和乐音,但这些声学特征可能无法充分表达环境声中的某些特定信息。针对这一问题,设计一种双输入卷积神经网络,采用对数梅尔谱与原始音频信号作为输入特征。从原始音频信号中直接提取的特征与对数梅尔谱特征形成互补,提高了融合特征对环境声的表征能力,并且实验结果表明该方法的识别效果优于采用组合多种声学特征的方式。参与研发了集音频信号采集、数据处理与识别、环境声地图展示于一体的环境声监测系统。该监测系统由音频采集单元、数据处理单元、环境声地图展示单元三个部分组成,其中数据处理单元包括数据存储单元与音频识别单元,本人主要负责音频识别单元的研究。同时为了使得该监测系统能更好的适用于实际场景,使用音频采集单元采集所需的环境声,自建环境声数据集,最终完成网络模型的训练。通过对环境声监测系统的实际测试发现,该环境声监测系统具有较高的鲁棒性,可以应用于实际的环境声监测。
其他文献
近年来,“万宝路”、“爱喜”等国外品牌卷烟越来越受我国烟草制品消费者喜爱,电子烟也如雨后春笋般涌现出来,再加上受控烟履约的国际大环境影响,我国烟草行业的潜在竞争愈发激烈,面临着严峻挑战。破解行业四大难题的紧迫感,和较好的完成烟草行业转型升级的使命感,都要求烟草公司必须改进管理模式从而提升管理质效。经过一百多年的发展,全面预算管理体系日趋成熟,1999年起,我国越来越多的企业开始使用全面预算管理模式
黑暗面研究近年来逐步受到学者的关注。该类研究认为,与积极面研究相比,剖析隐藏路径的黑暗面研究更具有研究价值。目前聚焦于如何促进员工实现职业成功的积极面研究较多,但实践中仍存在不少通过不正当方式去获取职业成功的饮鸩止渴式行为。为什么会有人铤而走险去追求虚无的成功?其背后的机制尚未有学者探讨。本文首先通过对采取不当行为从而实现成功的实践案例的研究提取出主要研究变量,然后梳理与归纳了相关变量的理论研究,
当今社会的工业发展水平已经处于非常先进的水平,大多数生产活动也具有了自动控制、网络交互等特点,现代化水平大大提高。工业控制系统是工业生产活动中非常重要的一环,可以实现工业行为的自动化控制,工人可以不用身处复杂危险的环境中工作,也极大提高了工作效率。工业控制系统目前已经广泛应用于各种工业生产场景,例如水电、交通、市政等领域,在提高生产效率、维持系统稳定、维护设备运转、保障人身安全等方面扮演了非常重要
沙地云杉(Picea mongolica)是我国特有的珍稀树种,天然林现仅存3万多亩,集中分布在内蒙古自治区克什克腾旗白音敖包自然保护区。沙地云杉具有适生沙地生长特性,是我国干旱、半干旱区治沙造林的优良树种。在近年来的研究中发现,沙地云杉更新困难、凋落物较厚而不易分解、林分结构单一等问题,但对于沙地云杉林更新特征及天然更新影响因素等方面研究较少。因此,本文依据沙地云杉的生物学和生态学特性,以不同群
采用急性毒性法将文蛤暴露于不同Cd2+浓度(0、1.5、3、6、12mg/L)中染毒5天,用形态学、生化及分子生物学手段和方法检测Cd2+对文蛤鳃细胞凋亡程度以及金属硫蛋白(MT)的作用特点。
数字图像修复是一项自动地对图像中丢失、受损区域修复重建或者移除指定目标对象的技术。在这个数字化、智能化的时代,图像修复过程完全可以交由计算机来处理。数字图像修复已经发展了二十年,不同类型的图像修复方法层出不穷,诸如TV模型、低秩矩阵填充模型和生成对抗网络修复模型。在现有的几种修复算法模型中,本文主要介绍了基于样本块填充的修复模型,该模型由于将图像的结构和纹理信息进行了综合考虑,且对于较大缺失区域的
为了解朝阳市羊场寄生虫病的流行情况,进而制定针对性的防治措施,我们于2018年11月至2019年5月在本市某羊场进行了寄生虫的流行情况调查,即通过尸体剖检和粪便检查法对羊场蠕虫的感染现状进行了调查,并以间接血凝试验和普通PCR法确定了弓形虫和隐孢子虫的感染情况。由调查结果得知,由该羊场共检出捻转血矛线虫、肝片吸虫、毛尾线虫、莫尼茨绦虫、弓形虫和隐孢子虫六种寄生虫,其中捻转血矛线虫的感染最为严重;粪
非光滑动力系统广泛存在于航天结构、工程机械、土木建设等工业领域。近年来,国内外众多学者以理论分析或数值计算的方法对非光滑动力学展开了深入研究,以探索并解决非光滑动力系统中复杂的动力学问题。悬臂梁碰撞振动系统作为一类典型的非光滑动力系统,近年来越来越多地被应用于复杂的大型结构中,因此对悬臂梁碰撞振动系统的动力学研究具有十分重要的理论及工程意义。基于悬臂梁碰撞模型,对碰撞类非光滑系统的动力学行为进行了
泛娱乐时代,IP作为泛娱乐的核心受到国家和相关行业的重视,发展速度极快。IP剧作为IP开发的重要业态,其发展依次经历了积淀与萌芽、元年与升温、热播与井喷、洗牌与调整四个阶段,形成了不同层面的热播现象,本文基于此结合传播学、心理学、符号学、文学等相关知识,重点考察媒介的变化、受众的变化和青年亚文化的变化对IP剧传播、消费和产业发展带来的影响,以期更理性地把握IP剧的热播及其背后的文化逻辑。本文的研究
互联网金融的发展促使传统银行不得不加快经营转型。无人银行的出现,自助银行对传统网点的替代,手机银行等电子银行业务的发展,物理网点不断减少和消失等,都直接或间接引发L支行人力资源管理上各种不适应的问题,根据互联网金融发展对L支行人力资源管理新的需求,来优化其人力资源管理体系,是迫在眉睫的一个课题。互联网金融通过对L支行在服务渠道、盈利能力、同业竞争等业务发展上的影响,进而影响到L支行的人力资源管理。