基于多层次局部特征编码的特征融合算法及其在音乐流派识别中的应用研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:wm3033
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数字音乐和在线音乐服务的快速增长,音乐信息检索(MIR)已成为一个重要的研究领域。特别地,音乐流派识别(MGR)是MIR中的一个重要分支,因为MGR在音乐索引和检索的上下文中起着基础作用,提高音乐自动分类的准确性是部署强大的音乐信息检索系统的基石。在音乐流派识别这一任务中,大多数现有机器学习方法的特征工程阶段存在信息丢失或提取的特征不充分的问题。机器学习阶段则严重依赖于特征工程阶段中提取的特征,缺乏利用信息的能力。在这些方法中由领域专家设计的某些人工特征,往往缺乏通用性,无法很好地迁移到其他领域使用。随着深度学习模型在其他领域的广泛使用,MRG也开始出现了使用深度学习模型的方法。目前用于MRG的算法存在一些局限性。首先,音乐流派识别区别于图像识别,它具有复杂的内在模式,这些模式具有高度的多样性和不同的抽象层次。大多数深度学习方法只局限于全局特征而忽略了不同的抽象层次的局部特征及它们的依赖关系。其次,某些方法只使用单一的特征而忽略不同特征之间的互补性,无法为模型提供足够的区分信息。最后,一些集成学习的方法在结合多种特征的优点时只在决策级别对特征融合,这可能会忽略特征在早期时的交互关系。本文提出一种高效的基于多层次局部特征编码的特征融合算法用于音乐流派识别任务。在该方法中,受到Net VLAD和自注意力机制的启发,本文设计了一个特征编码网络去捕获音乐中不同层次的局部信息并学习它们之间的依赖关系。这是因为流派通常分布在音乐流的不同层次或时间尺度上。本文还考虑了散射转换特征和迁移特征相对于典型特征的互补性,丰富了特征的多样性,使模型学习到更充分的特征表示。散射转换特征是一种平移不变的特征表示,它对时间扭曲变形稳定的。迁移特征则是将源任务上训练学到的知识迁移到目标任务上。最后在模型集成时,本文使用元卷积神经网络来学习不同特征之间的交互关系,从而进行特征级别的数据融合,而不是组合来自独立分类器的决策。本文分别在GTZAN,ISMIR2004和Extended Ballroom数据集上进行了实验分别获得了96.50%,92.46%和95.50%的测试准确率,超过了其他模型达到了领先的水平。这证明了本文的模型网络的有效性和先进性。
其他文献
川南坳陷仁怀区块仁页1井在施工中存在着地层出水、井壁垮塌、膏岩卡钻以及机械钻速低等问题。根据该井的工程设计及地层特点,总结分析了钻进过程中存在的主要技术难点,同时
结合教学实践,浅谈小学低段识字教学。
<正>众所周知,没有美术的教育是不完整的教育,没有写生画的教学是不完全的美术教育。为了全面贯彻美术课程改革精神,让每个学生都能接受完整的美术教育,笔者对小学生写生能力
繁殖是进化的一个中心问题,为实现繁殖成功,植物进化出多种繁殖策略。此外,植物的繁殖成功还受其它外界因素的影响,如动物传粉的植物,其繁殖成功还受传粉者影响。在长期的进
公益海报作为社会的晴雨表和精神的净化器,已经无处不在,渗透在公民生活的方方面面,它作为公益广告的一种重要形式,近年来在我国发展势头良好,而且作为一种隐性教育的手段,日
黄土广泛分布在世界上的许多地方,而中国是世界上黄土分布最广泛的国家。由于黄土特殊的性质和结构特征,在加载和变湿过程中常易发生变形破坏,形成了大量的滑坡等地质灾害、
本文简述了一种新型冰箱门体发泡线,由于该线具备结构紧凑、操作简单、传动平稳、安全可靠及生产效率高等特点,广泛应用于冰箱(柜)门体的批量发泡生产。
改革开放以来,河南省城镇化先后经历了缓慢起步、快速推进、加速推进和协调推进等四个阶段。河南省城镇化的空间结构非常稳定,各省辖市城镇化率的高低与人均GDP成正比、与人
暴力革命思想作为科学社会主义的重要组成部分,占据着重要的理论地位,对无产阶级夺取政权具有重要的指导意义。改革开放之后,我们从革命的价值观逐步变为发展的价值观,提倡和
法律思想作为法律文化中的一个重要方面,对于每个时代法律理论的发展和法治实践的开展都发挥着或推动或阻碍的现实作用,无讼的思想时至今日还在影响我国的法律理念、法律制度