基于神经网络的音频场景识别算法研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:whnbj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
音频场景识别是近年来数字音频研究的一个新领域,旨在通过分析背景声音对所处场景进行分类。智能设备可以利用当前音频中提取的背景环境信息来调整系统或应用程序的参数,以满足使用者的个性化需求。音频场景通常表现出高度的变异性,这种高变异性不仅表现在不同场景之间,在相同场景内也同样存在。因此,音频场景识别可以说是模式识别任务中最具挑战性的任务之一。目前,音频场景识别分类的准确率相比于传统的音频处理领域,如语音识别领域,依然存在差距。音频场景识别系统按照一定流程进行搭建,分别为信号预处理、信号表示、特征提取与选择和分类器设计与使用。针对目前音频场景识别中存在分类准确率较低的问题,本文按照以上流程设计一种基于神经网络的音频场景识别系统,并在实验室环境中采用合适的音频数据集对系统进行评估。具体研究工作主要体现在以下几个方面:(1)在信号处理方面,采用三种数据增强方法来增加数据量:将传统的左右双声道立体声变换为中央/边侧声道的立体声;将单声道音频分离出谐波源和冲击源;使用不同中值滤波尺寸的背景差法生成多种频谱图。(2)在特征提取方面,对梅尔倒谱系数进行提取,设计相应的帧长、帧移以及滤波器数量,从而在确保特征有效性的同时大大减少特征维数,降低计算复杂度。(3)在设计分类系统方面,根据输入信号通道数的不同,提出两种基于卷积神经网络的分类器,一种用于输入的单通道信号,另一种用于输入的双通道信号。实验表明,相比于采用高斯混合模型的分类器,新提出的两种分类器具有更好的性能。(4)在集成学习方面,经过单个分类器网络后,采用硬加权投票法对所有单个分类器的分类结果进行集成学习,设置最佳的权重参数,获得较好的分类性能。经过以上几个部分,完成音频场景识别系统的搭建。实验评估表明,数据增强部分增加了音频数据量,为特征提取和分类器训练提供了更多的实验样本;相比于传统模式识别方法GMM,提出的两种分类系统性能最高提升了5.4%;相比于单个分类器网络,基于集成学习法的分类器具有更好的分类性能。
其他文献
Hessian方程是一类完全非线性偏微分方程,它在形式上只依赖于Hessian矩阵的特征值.本文主要研究一类抛物型k-Hessian方程-utSk(λ(D2u))=ψ(x,t,u).该类方程广泛应用于各种曲
复杂网络作为复杂系统的一种抽象表现形式和描述方式,广泛存在于自然界和社会中。复杂网络的研究已经涉及到各个学科,即任何一个复杂系统都能够作为复杂网络来研究,如计算机
给定有向无环图G,G的传递归约是和G有相同传递闭包的最小唯一子图。传递归约是图论中的经典问题之一,并广泛应用于实际中简化问题的求解,包括传递闭包、背包问题、可达性问题
学位
复杂网络作为一门交叉学科引起了许多领域研究者的广泛关注,尤其在生物领域、工程领域以及社会学研究领域等等。从初夏的夜晚萤火虫的闪烁发光,到群体的同步闪烁;从放映厅中
本文主要讨论了一类时标高阶泛函动力方程非振动解的存在问题。全文共分为三章。在第一章,我们介绍了时标动力方程的研究背景、意义和研究现状,并且给出了本文需要的定义,概
本论文针对淡水鱼前处理加工过程主要完成了淡水鱼体长与比例测量、鱼头定向装置设计和鱼头切除装置设计等研究内容。淡水鱼体长与比例的数据能为鱼头定向和切除装置提供设计参考和自动调整依据;鱼头定向装置能够自动调整鱼头方向以满足鱼头切除装置正常工作需要;鱼头切除装置是淡水鱼自动化前处理生产线的一个模块化核心装置。针对以上问题,首先是利用python图片处理功能研究了草鱼体长和头尾比例关系。首先对草鱼图片进行
目的:观察通阳泄浊法配合西医常规治疗冠心病稳定性心绞痛痰浊闭阻证的临床疗效。方法:选取60例符合诊断标准的住院患者,随机分为治疗组和对照组,两组各30人。对照组运用西医综合治疗,治疗组在对照组基础上加用通阳泄浊汤,治疗4周。比较两组患者治疗前后的心绞痛发作情况、中医单项症状积分、中医症候疗效、心电图改变情况、硝酸甘油停减情况及治疗前后的血清血脂水平变化。结果:治疗组在改善心绞痛症状、减少中医单项症
随着我国城市化的不断推进,常规公交系统已逐渐无法满足人们出行的需求,而城市轨道交通凭借其运量大、能耗低的特点在各大城市中得以迅速发展。但是随着城市轨道交通的建设不断扩大,其耗电量仍然是城市总耗电量中不可忽视的一部分,因此城市轨道交通运行方案的节能优化研究有着重要的意义。本文基于城市轨道交通列车的性能参数、线路条件及运营策略等多方面因素,建立列车能耗模型,并结合萤火虫算法进行优化,使用MATLAB软
粗糙脉孢菌(Neurospora crassa)是脉孢菌属的一种多细胞丝状真菌,其菌丝透明,并有分隔和分枝,菌丝疏松,呈网状,能产生桔色分生孢子。粗糙脉孢菌生长快,易培养,遗传背景清晰,