小样本场景下音频信号分类模型研究

来源 :武汉轻工大学 | 被引量 : 0次 | 上传用户:mzybbs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
音频信号分类是信号处理领域的基础技术之一,广泛应用在自然语言处理、多媒体技术等领域,占据重要地位。欧盟《通用数据保护条例》等法令出现后,音频样本变得不易搜集,与此同时互联网、大数据、5G通讯等科学技术的发展使音频数据进入快速迭代的新时期,在此背景下小样本场景逐渐成为音频信号分类的研究重点。卷积神经网络(Convolutional neural network,CNN)、或综合运用数学、图像、声学等领域的相关技术构建分类模型是当前小样本音频信号分类领域的主流方法,但现有方法的分类精度仍不高。鉴于小样本场景下音频信号分类领域存在的不足,本文主要做了以下工作和创新:(1)论述梅尔滤波的生理学基础并指出其朴素过程的不足,分析小样本下深度神经网络衰减的原因,并在10层和24层的卷积神经网络上验证ESC数据集中该问题的存在。(2)基于梅尔滤波提出自适应梅尔滤波(Adaptive Mel Filter,AMF)算法,以“反向传播”优化朴素梅尔滤波过程的可变参数,提取具有更高区分度的梅尔频谱。(3)以深度残差网络(Deep Residual Network,DRN)为框架,使用微调和迁移按音频信号分类的实际需要调整输入和输出层、同时适当增加池化和全连接层,并将DRN在image net上的权重作为初始权重建立用于频谱分类的迁移深度残差网络(T ransfer Depth Residual Network,TDRN)。(4)将AMF算法作为前置频谱提取模块,TDRN作为后置频谱分类模块,融合两者构建自适应梅尔滤波-迁移深度残差网络(Adaptive Mel Filter-Transfer Depth Resi dual Network,AMF-TDRN)小样本音频信号分类模型。引入ESC-10、music speech等数据集分别模拟等时长多分类和等时长二分类小样本场景,混合ESC-10和music speech生成music speech&ESC-10数据集模拟不等时长多分类小样本场景。以MF-TDRN、AMF-inception v3、10 layers CNN、MVGG16、m-mobile net、PEFBEs、CRBM等模型为参照,在各类小样本场景下进行验证和对照实验。实验结果表明AMF-TDRN模型在各场景中的分类精度依次为91.14%、96.00%、95.24%,与其他模型相比均有不同程度的提升,具备一定的应用价值。
其他文献
人类日益频繁的空间活动正产生着越来越多的空间碎片。这类空间碎片数目多,速度大,运行轨迹无规律,且主要分布在人类活动最为频繁的近地轨道。它们的存在,对人类航天活动有严
乙酰乳酸合酶(也称乙酰羟酸合酶acetohydroxyacid synthase,AHAS)是植物、真菌和细菌细胞内支链氨基酸Val、Leu、Ile生物合成过程中关键酶,是乙酰乳酸合酶抑制剂类除草剂如磺酰
目的:检测外周血T淋巴细胞亚群、NK细胞在早期潜伏梅毒患者与早期有症状梅毒患者发病中及其自身治疗前后的表达,初步探讨其在早期潜伏梅毒发病中的作用。方法:2017年9月至2018年9月在河北北方学院附属第一医院皮肤科门诊收集早期梅毒患者92例为观察组,健康体检者30例为对照组。其中一期梅毒患者30例,二期梅毒患者30例,早期潜伏梅毒患者32例;早期潜伏梅毒患者经正规治疗后1年血清RPR转阴设立为A组
近年来,慕课平台得到了空前的发展,可以提供来自著名大学的数百万门高质量的课程,因此受到了越来越多用户的欢迎。尽管用户可以自由学习丰富的知识,但其可能很容易因信息过载而感到迷茫,因此,在慕课平台中采用推荐技术是一种有效的解决方案。与许多其它在线推荐系统不同,在慕课平台中向用户推荐课程面临着许多特有的挑战。首先,用户的教育背景千差万别,由于其知识背景的差异性导致他们的学习目标也是不一样的;第二,各知识
全球经济的高速发展导致以石油为代表的不可再生的各类矿物质资源日益短缺,寻找可再生性能源成为必然的趋势。燃料乙醇是公认的最有发展前景的可再生清洁能源之一。以木质纤
吸附法是一种简便温和的固定化酶策略,能较大程度维持酶活。一种“理想”的固定化酶吸附剂需具备以下三个特征:i)较强的结构稳定性,包括水稳定性和酸碱稳定性,ii)较高的比表面和发达的孔结构以实现酶高效吸附和反应物质快速传递,iii)适宜的吸附剂-酶相互作用,保证酶不泄露且维持酶构象稳定。本研究基于金属配位作用制备了铜基和锆基两种纳米多孔材料及其固定化酶。重点解析了酶-载体间相互作用对提升酶负载及活性、
J-蛋白是一个包含J-结构域的蛋白质家族,它的一些成员具有分子伴侣的功能。基因组序列分析表明,拟南芥中有90多种J-蛋白基因,其中大多数基因的功能还不知道。AtJ70是拟南芥J-
J-蛋白是一类包含J-结构域的蛋白质,其中一些成员具有分子伴侣或热激蛋白的功能。拟南芥中存在94种J-蛋白,如此多的J-蛋白的存在预示它们可能在植物的生命活动中发挥重要的功
心脏是胚胎发育过程中最早形成器官之一。心脏病是影响人类健康与生命的第一大杀手。因此研究心脏发育和心脏病发生的分子机制意义重大。我们研究室的前期研究表明,RMND5B的
中海油收购尼克森是迄今为止中国企业完成的规模最大的一次跨境并购。本文通过多种衡量手段,发现这项收购对于中海油的股东而言存在明显的价值损失。通过敏感性分析,证明了收