【摘 要】
:
声音分类是机器学习领域的一个重要分支,一般将它细分为环境声分类,人声分类、音乐分类三个大类。近年来随着DCASE等比赛的举办,也让越来越多的学者开始重视这一领域的研究。目前这项技术在医疗诊断、场景分析、声者识别、生态环境分析等场景中都被广泛使用。传统声音分类方法主要使用神经网络来实现,虽然它们的准确性不断提高,但是这种方式目前还有两个问题。首先是在数据的预处理方面,使用神经网络进行声音分类任务一般
【机 构】
:
中国科学院大学(中国科学院上海技术物理研究所)
【出 处】
:
中国科学院大学(中国科学院上海技术物理研究所)
论文部分内容阅读
声音分类是机器学习领域的一个重要分支,一般将它细分为环境声分类,人声分类、音乐分类三个大类。近年来随着DCASE等比赛的举办,也让越来越多的学者开始重视这一领域的研究。目前这项技术在医疗诊断、场景分析、声者识别、生态环境分析等场景中都被广泛使用。传统声音分类方法主要使用神经网络来实现,虽然它们的准确性不断提高,但是这种方式目前还有两个问题。首先是在数据的预处理方面,使用神经网络进行声音分类任务一般要先将声音文件提取成声谱图,从而把声音分类任务转换成图片分类。这种方式在处理大样本数据集时,转化后的图片数据集会很大,从而需要庞大的存储空间以及很高的计算性能来处理。其次,若没有足够的数据,使用神经网络训练时很容易产生过拟合,并且需要进行大量的参数调整、模型设置,这些步骤十分繁琐导致获得最好效果模型的时间成本非常高。基于以上两点不足,本文提出了新模型Deep LightGBM。它是基于深度森林思想改进的LightGBM深度学习模型,有效的提升了分类的准确性以及泛化能力,同时保证了模型的简洁,减少了算法对参数依赖程度,从而大幅降低了训练模型的时间成本。并且因为使用向量法来提取数据特征,不仅降低了所需存储空间,而且也加快了模型的训练速度。在公开的环境声分类数据集Urban Sound8K上进行算法验证,当使用向量法来提取声音特征时,新模型准确性达到了95.84%。将CNN提取的特征与向量法特征融合后再用新模型进行训练,准确率达到了97.67%。实验结果表明采用合适的声音特征提取方法配合Deep LightGBM模型参数易于调整、准确性高且不会产生过拟合。在多个其它类型的声音分类数据集上进行了泛化性能验证,分类准确性表现都很好。同时本文也将训练好的模型在嵌入式平台ZCU102上做了模型算法的迁移,在PS端对模型进行了优化,使用C++实现并做了针对性的代码改进,最终的预测算法运行时间低于PC,并且分类准确性保持一致;在PL端针对算法实现的关键步骤——LightGBM模型的读取和预测,基于Vitis和Vivado软件设计了相应的加速IP并且也设计了PS与PL通信的高速AXI通信模块。
其他文献
为进一步研究西宁盆地黄土区植物水文效应及植物护坡机理,本项研究通过在西宁盆地长岭沟流域自建试验区,筛选出适宜当地气候环境生长的4种草本植物老芒麦(Elymus sibiricus Linn.)、垂穗披碱草(Elymus nutans Griseb.)、细茎冰草(Agropyron trachycaulum Linn.Gaertn.)和芨芨草(Achnatherum splendens(Trin.)
本文针对高校学生党员发展过程中存在的问题,立足支部实际,创新采取"六方意见制度"全方位考察发展对象,力求建立起科学规范的党员发展机制,不断加强学生党员的教育管理,提高学生党员整体素质。
通化县委组织部以实施"红色领航新发展行动"为重要抓手,深入推进"红色细胞"工程,着力构建发展党员动态培养、全程管控、责任追究三项体系,通过控源头、抓程序、定责任,不断提升发展党员工作质量。一、构建教育培养体系,提升发展党员"含金量"坚持以壮大队伍为出发点,
发展党员是加强党的组织建设和完善党的组织体系的一项基础性工作。党的十九大通过的《中国共产党章程(修正案)》第一章第五条增写:"发展党员,必须把政治标准放在首位……"深刻认识和把握"发展党员,必须把政治标准放在首位"这一基本原则和要求,对于新时代党员队伍建设和全面从严治党具有重要的理论意义和现实意义。充分认识政治标准对高质量党建的重要意义贯彻落实新时代党的组织路线的生动体现。2018年7月,习
当今工作环境所面临的挑战之一是增强企业创新力,从而提高员工的创造力。领导行为对创造力的产生有重大影响。赋权领导行为是一种未被意识到的重要领导类型之一。为此,本研究将结合领导行为、赋权和创造力的理论,深入研究这种类型的领导力。关于领导力的研究通常涉及一位对团队或员工群体拥有管理权的特定领导者。赋权领导行为是对领导力的一种逐渐发展的感知,认为这是一种集团层面的现象。它建立在诸如自我领导、半自主性和自我
脓毒症是一种由感染导致的危重症,是ICU中患者死亡的主要原因之一。脓毒症病情发展迅速,有效抢救时间较短,越晚发现患者生存率就越低,救治的关键在于及时确诊并进行干预治疗。本文根据临床诊断的实际需求基于深度学习和机器学习技术开展了不同场景下对早期脓毒症进行预测诊断的研究,主要包括:根据入院首次检验数据对患者进行脓毒症预测、根据部分检验数据进行分阶段实时脓毒症预测、根据患者住院期间检查的数据对脓毒症进行
多变价态的钒元素造就了种类繁多、特性各异的钒氧化合物体系,而金属-绝缘体转变无疑是该体系的基础研究和应用备受关注的特性之一。该转变过程中,飞秒级的电导转变速率促进了氧化钒材料在探测、开关、存储等先进电子器件中应用。值得关注的是,关于氧化钒材料金属-绝缘体转变的研究在上世纪60年代就已展开。然而,转变的物理机制一直是氧化钒材料体系中未能解决的关键问题之一。其研究难点一方面在于金属-绝缘体转变通常伴随
光在人类认知这个世界过程中扮演着重要的角色,也一直是物理学中重要的研究方向。随着人类对光的本质的不断理解加深,从最初微粒说到波动说再到最终光的波粒二象性的准确描述,引发了多次光学上的重大突破。然而,构成这些光学系统的自然材料的可调控自由度有限,无法对光的振幅、相位以及偏振等诸多性质都进行精确操控,也难以满足现代化高性能、多功能以及小型化的需求。上述问题的出现,促使了人们开始尝试利用由亚波长人工设计
目的探讨家属赋能教育模式在骨质疏松脊柱压缩性骨折(OVCF)患者健康教育中的应用效果,为优化此类患者护理模式提供参考依据。方法选取2020年6—12月某医院收治的骨质疏松脊柱压缩性骨折患者116例为研究对象,按照组间基线资料匹配的原则将患者分为对照组和干预组,每组58例,两组均给予常规护理及健康教育,干预组同时给予家属赋能教育模式。比较两组入院时、出院前日常生活能力(Barthel指数)评分、健康
量子阱-发光二极管(QWIP-LED)上转换红外探测器将中波红外信号转换为近红外光,并由大面阵硅基CCD直接读出,因此具有制备成为大规模、高质量、低功耗红外探测器的潜力,成为红外探测的一种新途径。目前基于QWIP-LED的量子效率的研究主要集中在提高QWIP的光响应上。但由于近红外LED的光读出效率受全内反射效应影响,有效出光效率仅为1%至2%左右,因此QWIP-LED的探测效率和成像质量受限于L