论文部分内容阅读
音乐(这里特指独奏音乐)是文化娱乐活动中不可缺少的一部分,然而,人们只能够通过实时试听的方式才能够了解音乐信息,从中获取自己感兴趣的内容。伴随着科技的发展,人们能够接触到的信息正以指数级增长着,因此,在海量的数据中通过实时试听来搜索某一类音乐不是一件容易的事,这就迫切地需要寻找到一种自动的音乐分类方法来有效地管理数据。 音乐大多需要依赖于乐器才能表达出来,本文即是针对乐器信号的分类展开研究工作。通过对现有分类技术进行深入研究,提出了几种新的乐器特征参数和一套监督学习分类算法,并最终将乐器分类应用在检索系统中验证其高效的性能。 本文的主要研究成果体现为如下几个方面: 1.通过检验不同乐器信号的区别性信息在各个频带中的分布情况,在具有可分性的区域上增加滤波器的个数,有效地提高了这些区域的频率分辨率,突出了各个频带中的区别性信息。实验表明,所提方法对单个乐器的分类准确率有5.46%的提升; 2.将非线性动力学理论引入乐器信号的分类研究中,提出了一种基于非线性动力学的乐器信号分析方法。该方法对不同乐器产生的时间序列进行了相空间重构,从而揭示了管乐器、弦乐器和键盘乐器三类乐器家族的特有属性,通过实验发现:管乐器的相空间轨迹表现出明显的周期环状运行轨迹,并且每一条轨迹分布都十分紧密;弦乐器的相空间轨迹依然能够看到周期递归的性质,但是每条轨迹分布比较松散;键盘乐器的相空间轨迹分布杂乱无章,但仍然遵循一定的规律,轨迹分布在相对稳定的范围内,这一发现为区分不同家族的乐器提供了新的方法; 3.为了定量地表示上述结论,本文引入递归图和定量递归分析的概念,通过分析管乐器、弦乐器和键盘乐器的递归特性,提出了一个新的定量递归参数:密集度,它能够表征三类乐器家族在相空间中的差异。实验表明,加入该参数能够使乐器家族和单个乐器的分类准确率有3%-7%的提高; 4.提出一种基于投影非负矩阵分解的监督学习算法用于乐器分类,该算法以投影非负矩阵分解为理论基础,以Bregman散度为度量形式,通过矩阵分解获得每一类乐器信号的基矩阵,随后,将测试数据投影到训练好的基矩阵上,并通过余弦相似准则来判断测试数据所属的类别,最后将此算法应用到乐器分类的研究中。通过实验证明,此方法能够与传统分类模型的性能相媲美。与标准的非负矩阵分解算法相比,本文提出的算法还具有以下优势:1)较少的迭代参数;2)基矩阵的正交性更强,从而保证基矢量之间的冗余达到最小;3)运行时间明显减少; 5.构建了一套乐器分类检索平台,将本文提出的乐器分类算法应用到检索系统中,对用户提交的一段乐曲,不再使用传统方法直接在数据库中检索,而是先判断其所属的类别,然后从该类的数据库中进行检索,相比较而言,加入了分类模块的检索系统效率更高。