论文部分内容阅读
针对音频检索应用,提出一种使用提升小波变换和非负矩阵分解的稳健音频指纹方案。原始音频按固定长度分帧,对每帧进行小波提升变换得到低频近似分量和高频细节分量;对细节分量作非负矩阵分解得到可近似表示音频子帧的基矩阵和系数矩阵;将系数矩阵各列元素累加,对各列累加和进行量化得到表示分帧音频指纹序列的1bit信息。实验结果表明该方案对常见音频处理操作具有良好的稳健性,对音频的局部变化不敏感,能较好地区分不同音频,可用于面向对象的音频检索。