基于循环神经网络的声音识别

来源 :重庆三峡学院 | 被引量 : 3次 | 上传用户:woshishagua6
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
声音是一种最常见的信息载体,可以作为信息传递的媒介。并且声学传感器相比于其他类型的传感器来说,在隐蔽性上做的更好,成本很低,在受到电磁干扰的情况时,抗外界干扰能力比其他类型的传感器更强。现在,声音识别在各行各业中都得到了广泛应用。因此,对于声音目标识别的研究具有重大意义。特征提取和分类两个模块是研究声音识别的两个核心部分,在传统方法中,一般是通过人工方式提取特征,这对个人的经验要求很高。另外,一些特定环境中复杂的声音特征很难被人工提取出来。这就会导致无法进行分类器的构建以及复杂声音的分类。深度学习算法,其作为智能感知算法,可以高效的挖掘类别属性与深层特征。基于深度学习的理论基础,本文提出了利用深度学习中不同神经网络的算法来构建分类器,用来实现声音目标的识别。由此,本文基于对声音特征提取与分类识别两个主要模块,设计了适用于处理音频信号的卷积神经网络(CNN)和循环神经网络(RNN)两种不同的深度学习算法来对声音信息进行特征提取,训练,最后实现正确分类。本文的创新主要有以下4点:(1)利用深度学习模型设计了发动机噪声识别系统。(2)利用卷积神经网络对多噪声源多时长的声音特征进行提取。(3)在训练网络和训练方式上进行了优化。(4)设计了不同种深度学习网络模型进行实验比较,从而得出最好的一种网络模型。基于以上内容,实验成果有望应用于自适应的多目标声音的识别。论文内容包括以下几个方面:1、介绍了课题的研究背景,简述了声音识别的应用领域和此方面的研究现状。2、介绍了声音识别的相关理论基础,以及深度学习中的相关算法,CNN和RNN包括长短时记忆模型(LSTM)和门控循环单元(GRU)的一些基础知识。3、基于深度学习网络设计了发动机噪声识别系统。介绍了系统的整体架构,和设计流程。着重介绍了多时长的MFCC特征提取方法,以及不同深度学习训练网络的结构和训练方法。4、对比使用不同深度学习网络训练的结果,并给出分析,得出结论。5、总结全文的工作,并探讨未解决的问题以及未来发展的方向。
其他文献
肝母细胞瘤(Hepatoblastoma,HB)是小儿最常见的肝脏恶性肿瘤,近年来,随着外科技术的进步、化疗方案的改善以及多个儿童肿瘤组织的共同努力,肝母细胞瘤的诊断和治疗取得了显著的进展,但有远处转移或复发病例病死率仍较高。肿瘤复发、转移是HB患儿死亡的首要原因,亦是影响HB患儿长期生存的关键所在。研究发现,上皮细胞粘附分子(epithelial cell adhesion molecule,E
足球运动的发展与特定的历史时期有着密不可分的联系,不同的历史阶段对足球后备人才的影响也不尽相同。我国足球大致经历了4个发展阶段,每一个阶段都从不同程度上推动或遏制
随着经济社会的发展和科学技术的进步,地铁已经成为人们出行的重要交通工具之一,但是地铁环控系统的能耗巨大。地铁车站是一个客流集中且量大、设备多、全天运行时间长、环境
目的:以依从性和满意度作为评价指标,探讨个性化护理对于小儿肠炎护理的临床效果及推广价值。方法:随机选取2014年4月-2016年3月我院收治的62例罹患小儿肠炎患儿作为观察对象,
体检已经成为人们保持健康的一种重要手段,一是能够使顾客及早发现潜在的健康隐患,二是及时治疗早期病症;对于个人来说能够保障自身的身体健康,对于社会来说能够减轻社会医疗
以聚氧化丙烯二醇为初始原料,通过酯化和胺化两步反应合成了分子结构中含有氨基甲酸酯基团的脂肪族端伯氨基的端氨基聚醚,通过凝胶色谱、红外光谱、核磁共振分析证实了所得端
患者,女,68岁。胸闷、气短3个月,不能平卧15天入院。发病以来无恶寒、发热,胸部X线示“右侧大量胸腔积液”。20年前发现右足根部“黑痣”,4年前局部破溃、疼痛,伴右腹股沟部肿物在我院就诊,经
规模化蛋鸡舍中不同机械设备运行所产生的噪声会干扰蛋鸡声音提取。为了分析分类识别蛋鸡发声与机械噪声的可行性,该研究以蛋鸡产蛋发声、鸣唱声和规模化蛋鸡舍中通风系统、饲
随着我国社会经济体制的转变,国企职工的思想观念也应随之转变。但目前国企职工的思想道德观念仍存在一些问题,应引起国企管理者的重视。国企管理者应加强对职工的思想政治教
<正>具有改善排便功能的复方北冬虫夏草食品(以下简称"复方北冬虫夏草食品")是以北冬虫夏草为主要原料,配以"药食兼用"中药材紫苏子、莱菔子、杏仁等精制而成。蛹虫草别名北冬