论文部分内容阅读
随着网络技术和大规模数据库技术的不断发展,今天人们已经可以通过互联网访问包含数以百万计的音乐的在线乐库。这些音乐不仅数量庞大,而且风格各异,如何有效地管理这些音乐库,提供协助用户访问和检索的功能,使他们能够从大量不了解的音乐中有效地找到他们所喜爱的,是目前急需解决的一个重要课题。通常使用的方法是通过可以区别音乐的标志性信息,例如风格流派,音乐家的姓名,地区,所使用的乐器等。但是这些信息往往并不完整,而通过听者的意见来添加这些标志性信息所需要的工作量也过于庞大。更先进的方法是运用信号处理和模式识别技术,借助计算机的处理能力来自动分析音乐文件,提取出标志性信息。在这类技术中,以音乐流派自动分类技术发展地较为成熟。本文首先对目前主流的音乐流派自动分类技术做了阐述。这类技术一般包含两个部分,第一步是通过基于信号处理技术的音乐文件分析技术获得能够表征音乐流派特性的数字化特征,第二步是采用通用的模式识别和机器学习技术对这些数字特征依照流派分类。其中音乐文件分析技术包括两个阶段,第一个阶段是将波形文件分割为短时间片段,对每个片段做频谱分析,获得表征音色特征的信息,第二个阶段是在整个音乐文件的尺度上对这些音色特征做统计分析,最终获得该音乐文件的流派特征。流派分类技术主要分为两类,分别为有监督的学习和无监督的学习,有监督的学习需要用包含类目标签的训练数据集训练分类器,完成训练的分类器才能用于分类,无监督的学习无需训练数据集,但是分类准确率一般低于有监督的方法。本文的研究基于主流的音乐流派分类技术,构建了对大型在线音乐数据库进行分类管理以便于用户检索的解决方案,该方案主要包括音乐文件分析模块,分类模块,呈现模块和用户界面。本系统可以将未标明流派的音乐片段分类到不同的流派类目,便于组织管理,用户也可以通过输入流派名查询音乐,也可以将音乐的风格相似与相异关系表现在平面网格上,通过将听觉信息转化为视觉信息,便于用户更直观地了解音乐收藏的情况,并且系统性能可以根据用户反馈的数据进行改良,使之更适应用户的需求。