论文部分内容阅读
随着越来越多的音乐资源被上传到互联网上,使得用来处理音乐数据库的音乐信息检索系统受到了越来越多的关注。目前,很多音乐网站都是根据流派信息来组织数据库中的音乐资源,因此,音乐流派的准确分类对于现代的音乐信息检索系统来说是至关重要的。 本文针对传统的基于声学特征的音乐流派分类方法,从众多声学特征中精心挑选了14个特征来表征音乐的音色、节奏和音高内容,明确了每个声学特征的数学定义和提取方法;针对特征选择环节,提出了两种新的特征选择算法,分别是基于特征间相互影响的前项特征选择算法和基于特征贡献度的特征选择算法。在分类过程中选择了国际上公认的分类效果较好的分类器SVM。经过音乐信息检索领域顶级竞赛MIREX2009的检验,本文提出的音乐流派分类系统具有较好的分类效果。 本文还创新性地使用社会化标签对音乐流派进行分类。通过对音乐社区网站 Last.fm提供的 API接口的研究使我们获得了大量的标签资源并最终选择音乐标签和艺术家标签这两类标签对音乐进行流派分类。文章使用LDA对音乐标签建模,将得到的标签属于每个音乐流派的概率通过计算转换为对应音乐属于每个流派的概率。通过计算艺术家标签向量间的余弦距离找到与当前艺术家最相似的且已知流派信息的艺术家,并以此推断音乐所属的流派。对于具有标签的音乐来说,使用标签资源对其进行流派分类的准确率要明显高于使用声学特征得到的准确率。 最后,基于上述两种方法本文提出多模态音乐流派分类的概念,并给出多模态音乐流派分类的具体方法,并通过模拟数据的实验验证了该方法的高效性。