歌曲中相似片段的检测及其应用

来源 :复旦大学 | 被引量 : 0次 | 上传用户：abcprint

【摘要】

：

随着互联网的普及,几乎所有的音乐作品都对应的其数字化版本,且作品数量正飞速增长。追随着这种潮流,各大互联网服务供应商都推出了自己的在线歌曲库,内含海量歌曲作品。因此

【作者】

：

沈迤淳

【机构】

：

复旦大学

【出处】

：

复旦大学

【发表日期】

：

2014年期

【关键词】

：

歌曲借用递归图状态空间嵌入相似片段检测相似度计算

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着互联网的普及,几乎所有的音乐作品都对应的其数字化版本,且作品数量正飞速增长。追随着这种潮流,各大互联网服务供应商都推出了自己的在线歌曲库,内含海量歌曲作品。因此,怎样对大量的歌曲进行分类整理、信息提取,以便提供更好的检索、查询、欣赏等服务,成为近些年的热门研究课题。早期的歌曲库管理和歌曲检索功能依赖大量的人工标注,比如手工录入每首歌的年代、作者、流派等信息。这样的方法虽然可以保证信息标注的准确度,但成本非常大,且并不能满足很多常用的需求。由此,大量基于信号级别的歌曲信息处理相关的研究课题便大量涌现,如翻唱检索、哼唱检索、歌曲摘要提取、音频片段认证等。在所有这些研究课题中,歌曲相似片段检测与定位是一个非常重要的基础技术和子课题。音乐作品中相似片段是十分常见的：例如同一首歌曲中的副歌部分通常有着一样的旋律；又如同一首歌曲被多个歌手分别演唱所产生的不同版本。这里的相似可以是指某一特定方面的相似,如旋律、节奏、音色等。在很多情况下用人耳可以轻易辨别出相似的歌曲片段,然而对于计算机而言这个任务却很困难。由于直接基于歌曲信号提出的特征本身包含着大量的噪音,因此目前现有的相似片段检测算法有着诸多问题：首先,所有的算法准确度普遍不高；其次,每个算法都只能大致检测出两个给定片段的相似程度,但却不能精确定位；另外,现有算法无法检测出两段较短的相似片段。综上,目前的相似片段检测算法还有相当大的改进空间。为解决和改进上述提到的相关算法存在的问题,本文提出了一种新的相似片段检测算法。该算法吸收了现有的音乐信号处理研究中所用到的多种技术,如相似度矩阵、递归图、状态空间嵌入等,并在此基础上引入了数种创新技术,如局部阈值策略、基于递归图的相似片段提取技术等。本文提出的算法解决了先前类似算法中的多个缺陷：无法较准确定位相似片段位置；无法检测较短的相似片段。在此基础上,该算法还通过采用改进的阈值策略来提高相似片段检测的准确度。为检测该算法的有效性,本文将该算法应用于三个具体的系统中：改进的翻唱检索系统；基于该相似片段检测算法的歌曲摘要提取系统；歌曲借用检测系统。其中,歌曲借用检测是一个尚未有相关研究的课题。由于本文提出的算法可以检测歌曲中较短的相似片段,因此该课题得以第一次被进行尝试性的研究。针对上述三个系统的实验证明了本文所提出算法的有效性。

其他文献

一种兼具实时性和鲁棒性的广告拷贝检测系统

随着多媒体和互联网技术的不断创新与进步,数字媒体正逐渐成为人们工作生活中非常重要的信息载体。广告是一种非常重要的商业宣传手段,而且是多媒体应用的重要组成部分。电视

学位

广告拷贝检测音频匹配平滑静音段图像特征

基于组件的肠胃道微生物信息分析系统的研究

二十世纪尤其是末期，生物科学技术得到迅猛发展，生物科学的数据资源也急剧膨胀。人们开始寻求各种强大的工具来协助人脑完成这些信息的处理、分析工作。如今，生物科学的重点已由

学位

微生物信息分析系统软件复用肠胃道微生物生物信息生物科学

虚拟空间会议若干关键技术研究

虚拟空间会议系统是在视频会议的基础上发展起来的，与会者以替身的形式出现在计算机生成的虚拟会议空间中，通过替身在虚拟空间中定位、观察、操纵虚拟空间的物体，与其他用户进行

学位

虚拟空间会议视频分割立体视觉IBRDirectShowOpenGL

空域多通道盲水印算法的设计实现与应用研究

课题《空域多通道盲水印算法的设计实现与应用研究》内容涉及密码学、网络安全、数据通信、数字水印、数字指纹等领域。主要包括： 1.设计并实现了一种基于多重差错控制的空

学位

知识产权保护空域多通道盲水印公文流转数字水印多重差错控制信息隐藏密码学

粒子群优化算法在局部体样条函数法建模中的区域分割问题中的应用研究

科学计算可视化是运用计算机图形学和图像处理技术,将科学计算过程中及计算结果的数据转换为图形或图像在屏幕上显示出来并进行交互处理。当前,它作为新一代的发现工具,正在

学位

科学计算可视化散乱体数据数据建模粒子群优化算法特征可视化水团分析

Hop完整性协议及其实现技术的研究

近年来拒绝服务攻击活动频繁,对网络供应商造成不小损失。研究表明,拒绝服务攻击是众多网络攻击中较难防御的一种攻击方式。拒绝服务攻击现有的防范的方法有很多,但大部分是

学位

网络安全拒绝服务攻击跳完整性协议回溯追踪NetfilterLinux

复杂背景下的多表情人脸检测

人脸研究，主要包括人脸检测、人脸跟踪、人脸识别以及衍生出来的姿态和表情分析等几个主要领域，其中人脸检测是人脸信息处理领域中的一项关键技术。最初的人脸研究主要集中在人

学位

人脸检测YCrCb色彩空间肤色分割

周围神经三维可视化原型系统的设计与实现

以2001年第174次香山科学会议为标志，我国科学家提出了中国数字化虚拟人计划，以期建造具有东方人特征的中国数字人，并应用于生命科学、服装、航空、航天和汽车制造等广泛领域的

学位

周围神经原型系统拓扑结构束组分类三维可视化

动静态结合的图像编码

随着多媒体技术与网络技术的飞速发展和广泛应用,对数字多媒体信号的存储,处理以及传输变得越来越方便和快捷,同时由于通用计算处理单元CPU和各种专用处理器的处理能力的提高

学位

静态图像压缩编码动态图像压缩编码峰值信噪比边缘检测

基于时间窗口的数据流频繁项挖掘算法

数据流上的频繁项挖掘是数据流上的一项重要技术,它在各个研究和应用领域都起着重要的作用。现有的数据流上的频数挖掘算法主要包括基于计数的算法和基于摘要的算法,前者常用

学位

数据流Top-K频繁项时间窗口频数统计

歌曲中相似片段的检测及其应用

与本文相关的学术论文