【摘 要】
:
音乐流派分类技术能够基于音乐内容对音乐添加类别标签。近年来,随着越来越多的流派在世界范围内出现,音乐流派分类已经成为一个非常流行的概念。基于传统机器学习的音乐流派分类方法需要基于音乐领域知识的额外特征工程,而深度学习技术则可以将标记数据直接传输到神经网络,而无需为每个问题开发新的特征提取器。另外,深度神经网络的可解释性仍然是机器学习领域的主要挑战之一。尽管现在的深度学习技术已经成功应用到很多领域,
论文部分内容阅读
音乐流派分类技术能够基于音乐内容对音乐添加类别标签。近年来,随着越来越多的流派在世界范围内出现,音乐流派分类已经成为一个非常流行的概念。基于传统机器学习的音乐流派分类方法需要基于音乐领域知识的额外特征工程,而深度学习技术则可以将标记数据直接传输到神经网络,而无需为每个问题开发新的特征提取器。另外,深度神经网络的可解释性仍然是机器学习领域的主要挑战之一。尽管现在的深度学习技术已经成功应用到很多领域,如图像分类。然而,研究人员始终担忧当前的许多深度学习模型无法得到合理的解释,从而使得人与模型之间建立起真正的信任。本文对深度学习和像素归因解释在音乐流派分类任务上的应用进行了研究,主要工作内容如下:目前,对于深度神经网络的可解释性的研究主要集中在传统图像分类的背景下,而在音频领域几乎没有涉及。为了更好地理解音乐流派分类任务中多输入深度学习模型的决策,我们使用基于像素归因的梯度加权类激活映射(GradCAM)方法对并行卷积结构的优异性进行了验证。并且创造性地提出了将Grad-CAM方法与其他像素归因解释方法相结合,来对梅尔频谱图中纹理信息对模型最终决策的重要性进行了验证。传统多输入深度学习模型会分模块并且独立地对每种类型的输入特征进行特征提取,然后将最终提取的学习特征连接后送入分类器进行分类。但这种方式割裂了不同类型特征之间的内部联系,从而无法进一步提供区分信息更加突出的学习特征用于分类。为了使不同类型的特征之间产生内部联系,本文考虑在模型中间层的位置将不同类型的学习特征连接后送入多输入模型的其中一个分支进行进一步训练。进而提出了一种基于多输入深度学习模型的中级学习特征交互的方法,并根据送入分支的不同,提出了该方法下的三种交互模式。实验结果表明,所设计的方法可以显著提高音乐流派分类的准确性。其中,在GTZAN和FMA-Small数据集下的分类准确率分别可达93.92%和76.80%,均优于目前的绝大多数方法。
其他文献
综述中药干预肺部疾病/低氧所致肺动脉高压药理作用机制的研究进展。研究发现,促进肺血管收缩及肺血管重构有多条分子信号通路,包括低氧诱导因子/瞬时受体电位阳离子通道(TRPC)、丝裂原活化蛋白激酶(MAPK)、Rho蛋白/Rho激酶(Rho/ROCK)、磷脂酰肌醇3-激酶/蛋白激酶B(PI3K/AKT)、骨形态生成蛋白/转化生长因子-β(BMP/TGF-β)和核因子κB(NF-κB)等信号通路,中药复
近年来,我国跨境电子商务平台的交易量一直保持高速增长的态势。跨境电子商务已成为中国对外贸易蓬勃发展的重要引擎。当前,中国卖家选择进行跨境出口业务的跨电子商务平台包括亚马逊“全球开店”、阿里巴巴国际站、wish、虾皮等,卖家们在选择平台的过程中,除了平台活跃用户量、平台站点辐射范围、开店成本、网站设计等角度以外,也越来越注重于自身的体验。在跨境电商发展如火如荼的背景下,我国跨境电商的交易规模越来越大
液滴撞击固体表面的场景广泛存在于微流控、防结冰、强化传热等诸多工业领域和高新技术中,因此,液滴在与表面相互作用过程中的动态特性已成为众多领域研究和关注的热点。随着微纳加工技术的不断发展,目前在制造领域已经可以加工制备出各式各样的非均匀单一表面,其中主要分为非均匀润湿性表面和非均匀宏观结构表面,这些表面可以有效调控液滴撞击固体表面的动态特性。因此,现阶段亟待揭示出非均匀润湿性表面和非均匀宏观结构表面
随着社会经济的高速发展与环境恶化、能源危机等问题的显现,大力发展清洁能源已成为能源行业的重要趋势。然而,随着清洁能源电力比重不断增长,其就地消纳已难以实现,导致弃风弃光率较高、清洁能源消纳压力过大等问题。因此,亟需寻求新的市场机制,开展省间交易,拓展消纳范围。发电权交易作为发电主体之间转移发电指标进行电量替代的方式,可以作为促进清洁能源消纳的有效途径。但目前,省间发电权交易存在壁垒严重以及市场机制
高速永磁电机相较于普通电机具有功率密度高、运行效率高、动态响应快等优点,广泛应用于航空航天、飞轮储能、高速空压机、高速数控机床等领域。但是随着电机转速与频率的不断升高,硅钢材料的铁心损耗也会急剧增加,导致电机运行效率下降。非晶合金作为一种新型的软磁材料,具有高磁导率、低损耗等特点,非常适用于高速电机。但非晶合金较为轻薄、脆,对机械应力非常敏感。因此,本文对非晶合金高速永磁电机进行优化设计,以减低谐
由于来自堆芯不同类型组件冷却剂的温度和流速各不相同,快堆堆芯出口处冷却剂的搅混会引发流体温度振荡现象。流体的温度振荡会传递到堆芯出口处的中心测量柱等部件的固体内部,同时,固体温度的变化又反过来会影响到流体的温度振荡,流体与固体之间有较强的流固热耦合效应。中心测量柱等部件由于这种效应可能发生高周疲劳损伤。为了确保反应堆的安全运行,有必要对这种流固热耦合流体温度振荡开展研究。为了评估固体部件由于温度振
目的 探讨布拉氏酵母菌联合熊去氧胆酸胶囊治疗乙肝肝硬化内毒素血症的效果及对患者肠黏膜屏障功能的影响。方法 选取2018年2月—2020年1月在河北中石油中心医院就诊的60例乙肝肝硬化内毒素血症患者作为研究对象,采用随机数字表法分为2组(对照组和观察组),每组30例。对照组采用布拉氏酵母菌治疗,观察组在对照组基础上联合熊去氧胆酸胶囊治疗,比较2组治疗前、治疗8周后血清内毒素和炎性因子水平、肠黏膜屏障
REBCO带材具有较强的载流能力而且制备成本也相对较低,故其具有较好的应用条件。在实际工程中,一般将REBCO带材拼接成股线以获得更大的载流能力,而目前的制造水平不足以制造足够长的股线来应用到实际工程中,迄今为止采取的措施是将许多短距离的股线相互焊接来实现长度的增加。在焊接过程中,焊接长度的选取影响着电流转移的过程和制作成本,在保证电流完全转移的前提下降低制作成本。焊接长度一般取自股线端部的电流转
随着智能电网建设不断推进,“高比例可再生能源并网”以及“高比例电力电子装备并网”的“双高”特性愈发显著,电力系统的暂态稳定特性也愈加复杂,如何快速准确的进行电力系统暂态稳定评估成为了研究的热点。大电网在运行过程中会产生海量数据,并随着电网中同步测量单元的增加,所能收集的数据信息也愈发丰富。传统的暂态稳定评估方法不能很好的适应新环境下大电网暂态稳定评估的任务,建立稀疏堆叠自编码器模型,充分挖掘数据之
配电网作为电能输送的末端,与用户直接相连,是影响用户用电水平的重要一环。如今人民生活水平提高,对于用电水平的要求也随之增大,配电网也越发受到人们的重视。我国目前提出双碳目标,分布式能源的消纳问题越发重要,主动配电网作为解决分布式能源消纳问题的重要技术,围绕其进行研究就有了重要的现实意义。本文针对主动配电网的评估,主要围绕以下方面进行研究:(1)基于系统评价理论,参考国家电力标准信息以及国内外现行指