稳定哼唱特征提取研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:wang525659571
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
哼唱检索是一种基于内容的多媒体检索技术,是信息检索领域的研究热点之一。特征提取是哼唱检索中的关键技术之一,也是本文的研究重点。特征提取部分一直存在哼唱特征不稳定的问题,造成这个问题的主要因素是哼唱人声个性化的差异,包括哼唱人的哼唱音调不同、哼唱人的音域不同、哼唱节奏变化三个方面。而在这三个问题中,以往的研究提出的方法,如局部音高统计直方图特征,已经能够较好的解决音调与音域不同带来的问题,而哼唱节奏变化的问题一直得不到有效的解决。本文针对哼唱检索中特征提取部分的特征不稳定问题,特别是哼唱节奏变化带来的不稳定问题,进行了以下几点研究,希望从旋律中挖掘本质的、稳定的信息,从而进一步增强哼唱特征的稳定性。1、改进了基于局部统计的哼唱特征提取方法音高统计直方图特征是通过将音高向纵向音域上进行区间分布投影统计,从而得到对音调、音域差异相对稳定的特征。在此基础上,本文对音高投影统计的算法进行了改进,提出了一种基于所处区间位置的投影权重分配方法。为了解决节奏变化带来的不稳定问题,并提出了节奏统计特征,作为音高统计特征的补充,首先提出了基准节奏的概念以及估计算法,然后使用基准节奏对旋律片段的音符长度进行规整,使得规整后的旋律片段对哼唱节奏的变化不敏感,最后将节奏序列进行投影统计,得到与局部音高统计直方图类似的特征。实验结果表明,通过音高特征与节奏特征的联合,有效的提高了哼唱特征的稳定性与区分性,对于不同用户在哼唱中表现的音调、音域、节奏变化等方面的差异有很好的鲁棒性。2、提出了一种基于旋律极值点的哼唱特征提取方法音高与节奏的局部统计特征在一定程度上解决了哼唱特征提取中存在的问题,但哼唱节奏变化不仅影响了特征本身的稳定性,还影响了特征提取基元的选择。针对这个问题,本文提出了基于旋律极值点的特征提取基元选择方法。旋律极值点存在提取错误的问题,本文从优化极值提取方法和设计鲁棒性特征结构两方面来解决该问题,并根据旋律极值点的特性对特征扩展方法进行了调整。旋律极值点对哼唱节奏的变化有很强的鲁棒性,通过旋律极值点来定义特征提取基元,可以使得特征提取基元本身就对节奏变化具备很强的鲁棒性。同时通过旋律极值点对旋律结构进行分析,与以往的线性伸缩加滑动窗的穷举法相比,能够大大降低索引量,从而节约计算资源,减少检索时间消耗,提高哼唱检索系统的实时性。最后,通过实验验证了本文提出方法的有效性。在包含5000首MIDI的音乐库中,用1153首哼唱片段进行查询,在基于局部敏感哈希的哼唱检索实验中,本文算法的top1准确率达到88.6%,top5准确率达到92.8%,MRR达到0.908,平均检索时间消耗为1.92s,与基于线性伸缩与滑动窗的穷举法的哼唱检索系统相比,能够保证检索准确率相差很小的基础上,大幅度减少检索时间消耗,说明了本文算法的有效性。
其他文献
随着互联网技术的高速发展和信息时代的到来,互联网相关应用已经深深影响到到人类社会生活的方方面面。网络的大量使用造成了互联网数据的爆发式增长,加重了网络安全和网络监
可见光通信(Visible Light Communication,VLC)作为一种新兴的无线通信技术,可以在满足照明的同时实现通信功能。VLC可以利用巨大的且无需注册的免费可见光频谱资源,从而缓解
无线通信技术的普及和智能终端的发展,为用户的工作学习娱乐提供了极大的便捷,绝大多数的移动智能终端都可以进行WiFi连接,通过监测用户智能终端的WiFi信号,可以获得用户手机
认知无线电的主要技术就是动态利用处于空闲状态的频谱,频谱检测就是检测通信环境中的可用频谱,将频谱分配给认知用户通信。认知无线电(CR)终端对于特定区域的频段进行分析,
超级电容器作为新型储能装置,可以提供比可充电电池高1-2个数量级的功率密度,并且比传统的静电电容器存储更多的能量。结合其快的充放电速率、长的使用寿命、高的库伦效率、低的维护成本和安全操作的优点,超级电容器可以为便携式电子设备、电动汽车和大型智能电网等各种应用提供多种供电解决方案。在众多超级电容器材料中,二氧化锰因其高的理论电容(1370 F g-1)、丰富的储量、相对低廉的成本,近些年受到研究者的
随着移动终端数量的爆发式增长,传统的基于宏基站的蜂窝网络已无法完全满足用户的流量需求。异构网络(Heterogeneous Networks,HetNets)作为一种灵活、经济的无线网络架构,能
随着室内无线系统在办公楼,工厂,展览馆以及相关环境中使用的增加,可以应用于多种室内环境的高效传播模型的需求也随之被提出。为了解决室内分布的相关问题,室内传播损耗模型
随着社交网络的兴起,信息扩散已成为近几年热门的研究领域。信息扩散的定义是信息通过用户间的交互行为而到达个体的过程。信息扩散一般可以分成突发话题检测、社区发现、信
汽车发动机冷却系统,是汽车发动机中的一套非常重要的系统。随着电子、信息技术的发展,汽车发动机控制系统中电子化程度越来越高,发动机冷却系统控制系统中,电子化产品的运用,能为发动机的运行提供良好的安全性和经济性。同时,当前汽车嵌入式软件的开发方式和开发平台在汽车电子行业快速发展的同时也受到了一定的限制,在上述背景下,提出本课题的主要研究内容如下。本文首先对发动机冷却系统的各个组成、工作原理、零部件的性
互联网应用正在逐渐改变着人们生活。随着网络用户的增多,对用户的接入管理越来越复杂。AAA通过网络设备对用户进行认证授权计费管理,其作用越来越被人们重视。目前,国内外通