论文部分内容阅读
多媒体技术和网络技术的飞速发展使得数字音频的复制、修改和传播变得极其方便,但同时音频的真实性也受到了极大的威胁。为了得到安全的多媒体应用,对音频内容的真实性和完整性进行有效保护和认证已变得越发重要。现有的大多数音频认证算法主要集中在对语音信号的认证或包含音乐数据的一般音频信号认证,而有关音乐内容认证的研究并没有受到足够的重视。本文主要研究基于音乐内容分析的音频认证算法,致力于保护音乐这一特殊类型音频信号内容的真实性与完整性。首先介绍了音频内容认证技术的产生背景及应用场景,与传统认证的区别,音频认证的相关概念以及认证算法的分类等;接着对近年来出现的数字音频认证算法进行全面的综述,并归纳总结了现有算法的主要问题;针对这些问题,提出了两种新颖的基于音乐内容分析的认证算法,详细阐述了算法思想、内容和创新点,并给出了实验结果与结论。第一种认证算法将音乐信号分割成一系列不等长的音符片段,使得每个认证单元都包含了完整的语义信息,同时有效解决了现有算法存在的时间域失同步问题。对每个音符片段提取包含丰富旋律信息的Chroma中层特征,在此基础上计算鲁棒Hash值,根据与原始音乐Hash值差异的统计特性和时间分布特性定义度量指标,为符合音频认证的内在模糊性,利用模糊逻辑方法进行分类,最终作出认证决策。第二种认证算法基于音乐节拍对音乐信号进行非均匀分割以起到抵抗同步的作用,采用现有的动态规划节拍追踪算法定位出音乐中的节拍点。与第一种算法相比,加长了Chroma计算时的窗口长度,使得提取的特征能够更精确地反映出音乐的语义内容。对音乐鲁棒Hash码进行两层置乱加密以减小矢量量化攻击带来的威胁,进一步提高认证系统的安全性。最后,通过观察DTW节拍对齐结果中各节拍点的“弯折”现象对三种常见的篡改操作(剪切,添加,替换)进行分类。实验结果表明,两种算法对保持内容操作和恶意篡改处理都具有很强的区分能力,并且能够精确地定位篡改区域,第二种算法还能以较高的准确率对三种常见类型的篡改操作进行分类。