基于时间序列匹配和相似度融合的翻唱歌曲识别算法研究

来源 :华东理工大学 | 被引量 : 0次 | 上传用户:xialiaoj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网的发展使得人们能够轻松的向网上上传自己的音乐作品,导致翻唱歌曲在互联网上大量存在,促使基于内容的翻唱歌曲识别得到了广泛的关注。  在目前的翻唱歌曲识别领域中,基于节拍同步的音级轮廓(Pitch Class Profile,PCP)是一种常用特征。它通过估计歌曲的节拍位置,在一个节拍内求取PCP特征的平均来完成翻唱歌曲之间的节拍对齐。然而由于节拍估计的误差,使得使用该特征的翻唱歌曲识别系统识别准确率不高。为了提高系统的识别准确率,本文提出了两类解决方案:  第一类方案是通过改进相似度计算的方法来提高系统识别的准确率。Qmax算法是一种序列局部匹配算法,计算两首歌曲之间最大的局部相似度,在翻唱歌曲识别中获得了很高的识别准确率。基于传统Qmax算法,本文提出了两种方式改善翻唱歌曲识别系统。第一种方法是将Qmax和Needleman-Wunsch(NW)算法进行相似度融合,通过NW算法弥补节拍估计误差,通过Qmax算法克服NW算法不能适应仅局部相似的翻唱歌曲对的问题;第二种方法是改变Qmax算法在递归量化分析时使用的步长条件,增大Qmax算法的适应范围,从而弥补节拍估计的误差。  第二类方案是通过使用三种参数进行节拍估计并获得相应的基于节拍同步的PCP特征,再在每种参数下计算歌曲之间的相似度,通过加权融合对得到的三个相似度进行融合,并提出使用果蝇算法进行权系数的调整。这样做是由于在节拍估计时,使用不同的参数对完成翻唱歌曲特征对之间节拍对齐的效果不同。  实验结果表明,上述方案均能使翻唱歌曲识别系统获得更高的识别准确率。
其他文献
在通信网络发展到如此成熟的今天,现有通信网络日益完善,功能日益强大,当有自然灾害或者其他灾难发生致使现有网络瘫痪时,能迅速建立起通信网络变的越来越重要。而在应急通信
随着新课程改革的不断深入,教育现代化水平的不断提高,职业高中学校对教育装备的配置也越来越重视,我校(新安县职业高级中学)积极配备各种先进的教育装备。交互式电子白板也越来越
积极的情感教育会对学生的数学教学产生重大的促进作用,本文根据《新课程标准》的要求,从培养学生主动学习的愿望,创设愉悦乐学的教学氛围,提高学生的学习兴趣,激发学生的学习动力
解决问题的策略多种多样,其中画图是一种最基本的解决问题的策略。因为图形比较直观,通过画图能够把一些抽象的数学问题具体化,把一些复杂的问题简单化。
移动通信的快速发展,以及移动用户对多媒体业务需求的不断增加,加速了流媒体业务在移动网络中的开展。同时,随着移动流媒体业务用户数的快速增加,为了提高系统容量扩展性,使
稀缺的频谱资源得不到高效利用是当前无线通信面临的主要问题之一,异构无线网络融合是未来无线通信发展的重要趋势。为了充分发挥各种接入技术的优势并灵活利用以频谱资源为
课堂教学是学校教育的主体,教育思想的渗透引导、教学过程的科学展开、教育目标的完满实现,大多是在课堂教学这一特定的时空中完成的,而在课堂教学规定的时间中,学生掌握知识的多
非二进制BCH码中最重要、最常用的子类是RS码。RS码在纠正随机符号错误和随机突发错误方面非常有效,因此被广泛应用于通信和数据存储系统中以进行差错控制,应用领域涵盖从深
构建知识系统高考试题的设计,重视数学知识的综合和知识的内在联系,尤其重视在知识网络的交会点设计试题。而一轮复习结束后,知识点在我们的意识形态中还是孤立的,二轮复习的过程
针对初中信息技术课程教学过程中存在的一些主要问题,提出了相应的解决策略。在此过程中,应结合学生的认知特点去选择教学内容,采取真正有效、合理的教学方式。对于初中信息技术