论文部分内容阅读
伴随着信息化和数字化时代的到来,海量数字化音乐数据的涌现,如何组织这些海量的音乐数据,便成为了工业界和学术界急需攻克的难题。音乐标注以生成音乐标签的形式对音乐语义进行描述,从而实现对大量音乐信息的快速检索、高效管理以及个性化推荐,进而解决可这个难题。当前,音乐标注主要有专家标注、社会化标注以及基于机器学习的自动标注三种方式:其中专家标注具有标签准确率较高的优点,但其成本高,且标签丰富度不足;而社会化标注标签丰富度很高,但是标签的准确率较低。基于机器学习的自动标注可以有效地解决前两种方法中的问题,因此该方法便成为了目前工业界和学术界的一个研究重点。歌词,作为歌曲的重要组成部分,具有丰富的语义信息;因此,通过歌词信息来实现对音乐歌曲的自动标注引起了研究者们的广泛关注。本文将基于歌词的音乐自动标注问题转化为基于短文本的多标签分类问题。在传统的中文文本分类方法的基础上,本文提出了改进的文本分类方法,利用字袋模型(bag-of-characters)替代了传统的词袋模型(bag-of-words)以进行短文本特征提取,从而减少了中文分词等文本预处理过程中引入的特征噪声;然后利用n-gram bag-of-characters的特征提取方法更加充分的利用中文文本信息,通过引入联合n-gram bag-of-characters的方法弥补了传统n-grams单元的稀疏性缺陷。同时,本文在利用字袋模型提取短文本特征的基础上进一步采用深度神经网络模型自动提取短文本深层语义特征,从而优化了基于歌词的中文音乐自动标注算法。本文所使用的深度神经网络模型主要是基于深度置信网络框架和卷积神经网络模型框架,通过实验进一步验证了基于深度神经网络模型的音乐标注算法的优良性能。最后,本文进一步将歌曲的音频信息引入到基于深度神经网络模型的音乐自动标注算法中搭建出基于混合语义特征的音乐自动标注算法,通过分别提取歌词和音频的深层语义特征,然后将两类语义特征联合起来共同训练音乐歌曲的深度混合特征以用于音乐的自动标注。实验证明,该基于混合特征的分类方法相比于仅利用歌曲音频信息或仅利用歌词信息进行音乐标注,效果均有所提高。