论文部分内容阅读
目前大多基于时间特征的音乐风格识别问题分类性能不佳.鉴于卷积神经网络(CNNs)捕获信息特征能力较强,本文使用CNN提取音乐信号中的多种特征并进行分类.首先采用harmonic/percussive sound separation(HPSS)算法把原始音乐信号谱图分离成时间特征谐波分量和频率特征冲击分量,并联合原始谱图一起作为CNN的输入;其次对生成图像作仿射变换以及使用PCA改变训练图像中RGB通道的像素值从而扩大数据集;最后设计了CNN的网络结构以及研究了该网络结构中不同参数对识别率的影响.在GTZAN数据集上的实验表明本文的方法可以有效改善使用单一特征的音乐风格识别.