论文部分内容阅读
互联网的发展使得人们能够轻松的向网上上传自己的音乐作品,导致翻唱歌曲在互联网上大量存在,促使基于内容的翻唱歌曲识别得到了广泛的关注。 在目前的翻唱歌曲识别领域中,基于节拍同步的音级轮廓(Pitch Class Profile,PCP)是一种常用特征。它通过估计歌曲的节拍位置,在一个节拍内求取PCP特征的平均来完成翻唱歌曲之间的节拍对齐。然而由于节拍估计的误差,使得使用该特征的翻唱歌曲识别系统识别准确率不高。为了提高系统的识别准确率,本文提出了两类解决方案: 第一类方案是通过改进相似度计算的方法来提高系统识别的准确率。Qmax算法是一种序列局部匹配算法,计算两首歌曲之间最大的局部相似度,在翻唱歌曲识别中获得了很高的识别准确率。基于传统Qmax算法,本文提出了两种方式改善翻唱歌曲识别系统。第一种方法是将Qmax和Needleman-Wunsch(NW)算法进行相似度融合,通过NW算法弥补节拍估计误差,通过Qmax算法克服NW算法不能适应仅局部相似的翻唱歌曲对的问题;第二种方法是改变Qmax算法在递归量化分析时使用的步长条件,增大Qmax算法的适应范围,从而弥补节拍估计的误差。 第二类方案是通过使用三种参数进行节拍估计并获得相应的基于节拍同步的PCP特征,再在每种参数下计算歌曲之间的相似度,通过加权融合对得到的三个相似度进行融合,并提出使用果蝇算法进行权系数的调整。这样做是由于在节拍估计时,使用不同的参数对完成翻唱歌曲特征对之间节拍对齐的效果不同。 实验结果表明,上述方案均能使翻唱歌曲识别系统获得更高的识别准确率。