基于感知哈希的音乐声纹检

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:lulubukule
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,基于内容的音乐声纹检索成为研究的热点。它的主要优点在于从音乐信号自身的特征出发,能够在不知道音乐信号的文本信息的情况下,快速找到音乐相关信息,有着巨大的应用空间。基于内容的音乐信息检索系统主要分为两部分:音乐特征提取(即声纹的提取)和音乐检索。感知哈希在声纹提取上有着广泛的应用,运用此方法提取的声纹有着很好的鲁棒性。  本文对基于感知哈希的音乐声纹检索的背景知识和研究现状进行介绍,重点介绍改进了的声纹提取算法和检索算法,并对实验结果做出分析。本文主要的工作集中表现在以下几个方面:  (1)提出了基于感知哈希的音乐声纹提取的方法。感知哈希作为声纹具有很好的鲁棒性,能够提高系统的鲁棒性。感知哈希的提取主要是结合人耳听觉系统。根据人耳听觉特性设置阈值,将声压级低于听觉阈值的声音信号过滤掉,提高系统的鲁棒性。这个算法当中,阈值的确定是至关重要的,本文以人耳听觉掩蔽效应来确定阈值的大小。  (2)提出了给子声纹设置优先级,按照优先级作为索引检索匹配。在利用能量提取声纹时,能量差的分布符合高斯分布,根据较大的能量差计算的比特位具有更好的抗噪性能,用于检索能够提高系统的准确性。通过设置阈值,统计落入区间之外的个数,作为优先级的大小,优先级大的优先作为索引。  (3)利用本文提出的算法,通过对比实验,证实了该算法的有效性。
其他文献
近年来,随着第四代移动通信技术的迅速发展,诸多业务对于数据传输速率的要求日益增高。正交频分复用(OFDM)凭借其较高的频谱利用率以及对抗多径效应等优势,成为了无线通信的关键技
随着智能化监控技术的进一步发展,人们对室内场景理解以及室内安全问题的重视程度越来越高,大量的监控系统被应用到家庭、办公室等实际的室内场景中。作为监控系统中的两个关
无线传感器网络是由大量的同构或者异构传感器结点所构成的自组织网络,这些结点通过相关的路由算法形成网络,进行数据采集并处理,将数据发送给观察者。无线传感网络广泛应用
图像融合是一种对图像进行处理的技术手段,是指将不同传感器在同时刻(或不同时刻)采集到的关于某一具体场景的不同角度、不同层次的多幅图像根据某种特定的算法进行处理,得出
高光谱遥感图像因其精细的光谱分辨能力而广泛应用于地物分类及目标探测等领域。然而,高光谱成像光谱仪在获得大量精细光谱的同时,必然会使空间分辨率降低。尽管近年来随着遥感
视频监控技术在安全领域发挥着重要作用,以其直观、方便和信息内容丰富而广泛应用于城市交通、民用安全等各个领域,特别是重要安全部门或重大事件中。伴随移动通信技术的快速发
脑肿瘤分割是一种从灰质、白质和脑脊液等正常的脑组织中,分离水肿、活跃和肿瘤坏死组织等不同的脑肿瘤结构的一种脑肿瘤辅助诊断技术。由于肿瘤在颅内产生,只能通过非侵入式
超短波通信具有抗干扰性能好、传输距离远、安全性高等优点,因此超短波电台广泛应用于战场环境、灾难救助,野外科考、临时会议以及协同合作等特殊场合。在实际应用场景中,通常是
高频地波雷达是一种利用高频波段垂直极化电磁波沿海面绕射的特性而设计出来的一种既可以进行海面目标检测又可以从事海态遥感的设备。目前电离层杂波干扰抑制是高频地波雷达
视觉目标跟踪作为计算机视觉的重要研究课题,具有十分重要的科研价值。而其又作为智能监控、运动识别、人机交互等智能化得以实施的基础性技术,在实际应用上也具有非凡的意义