论文部分内容阅读
随着计算机网络技术与多媒体技术的高速发展,尤其是数字音频压缩技术的成熟,使得数字音频的传播更加容易与广泛,从而引起了版权保护等一系列安全问题。音频水印技术的发展提供了解决这一问题的新思路,而鉴于音频水印技术自身的局限性,人们提出了音频指纹技术。音频指纹(Audio Fingerprinting)是基于内容的紧凑的签名,概括了音频片断固有的本质特征。由于音频指纹技术可以在独立于音频格式且无需元数据或者水印嵌入等额外信息的条件下进行音频识别,其已经引起了研究者的广泛关注。
本文通过对国内外音频指纹算法的分析,提出了两种鲁棒的变换域音频指纹算法,并将其应用于音频检索中。首先,阐述了选题背景及研究意义,并对现有音频指纹算法进行总结综述。其次,介绍本论文中所涉及的基础理论知识。接着提出以下两种鲁棒的变换域音频指纹算法:1.改进了基于短时傅里叶变换的频率域音频指纹算法。该算法引入了每帧音频信号的能量,利用频谱带能量(SBE,Spectral Band Energy)替换频率子带能量进行指纹提取。2.提出了一种基于Daubechies小波变换的时频域音频指纹算法,通过对音频信号进行8层小波分解得到1个逼近分量和8个细节分量,根据每个分量小波系数的方差之间的关系提取音频指纹。最后,阐述了两种算法在音频检索中的应用。
实验结果表明,本文所提出的两种音频指纹算法对常见的保留信号内容的攻击处理及加性高斯白噪声具有很好的鲁棒性,降低了指纹存储空间、减少了指纹提取运算时间。此外,基于Daubechies小波变换的时频域音频指纹算法对线性速度变化攻击也具有良好的鲁棒性,其指纹存储空间较改进的频率域音频指纹算法大大减少。