论文部分内容阅读
近年来,基于内容的音乐声纹检索成为研究的热点。它的主要优点在于从音乐信号自身的特征出发,能够在不知道音乐信号的文本信息的情况下,快速找到音乐相关信息,有着巨大的应用空间。基于内容的音乐信息检索系统主要分为两部分:音乐特征提取(即声纹的提取)和音乐检索。感知哈希在声纹提取上有着广泛的应用,运用此方法提取的声纹有着很好的鲁棒性。 本文对基于感知哈希的音乐声纹检索的背景知识和研究现状进行介绍,重点介绍改进了的声纹提取算法和检索算法,并对实验结果做出分析。本文主要的工作集中表现在以下几个方面: (1)提出了基于感知哈希的音乐声纹提取的方法。感知哈希作为声纹具有很好的鲁棒性,能够提高系统的鲁棒性。感知哈希的提取主要是结合人耳听觉系统。根据人耳听觉特性设置阈值,将声压级低于听觉阈值的声音信号过滤掉,提高系统的鲁棒性。这个算法当中,阈值的确定是至关重要的,本文以人耳听觉掩蔽效应来确定阈值的大小。 (2)提出了给子声纹设置优先级,按照优先级作为索引检索匹配。在利用能量提取声纹时,能量差的分布符合高斯分布,根据较大的能量差计算的比特位具有更好的抗噪性能,用于检索能够提高系统的准确性。通过设置阈值,统计落入区间之外的个数,作为优先级的大小,优先级大的优先作为索引。 (3)利用本文提出的算法,通过对比实验,证实了该算法的有效性。