论文部分内容阅读
MPEG-4音频编码标准具有基于对象编码、允许用户交互等特性,随着网络技术,特别是3G/4G无线通讯网络的发展,与MPEG-4音频相关的应用将拥有更加广阔的发展空间。因而,MPEG-4音频数字版权保护成为当前非常重要的研究课题。本文探讨了MPEG-4音频应用中的数字水印技术和版权保护机制,对MPEG-4音频数字版权保护中的扩频水印、多模式和多水印等问题进行了深入的研究,取得了以下研究成果:(1)基于音频时域的扩频水印技术:基于变换域的扩频水印一般都具有较高的时空复杂性,很难达到MPEG-4音频数字版权保护的实时性要求。并且当扩频水印与量化编码在相同的频域上实现时,音频编码算法有可能破坏嵌入的水印消息而使之检测不到。此外,语音和音频具有不同的声学特性,应该采用不同的技术保证水印信号的不可感知性。因此,可以抵御量化噪声、裁剪等攻击的、鲁棒的、不可见的音频扩频水印算法研究是MPEG-4音频数字版权保护最基本的关键问题。本文在详细讨论扩频水印的嵌入和提取、非对称扩频水印和公开检测扩频水印的基础上,提出了一种基于音频时域的扩频水印技术。该方案利用冗余同步和同步码增强其抵御同步攻击的能力,同时依据语音和音乐不同的声学特性,分别采用线性预测分析和心理声学模型以实现水印信号的不可感知性。Stirmark音频攻击[204]、量化攻击的测试结果表明该方案可以抵御滤波、加入噪声、数据压缩等攻击。(2)融合编码算法的量化水印技术:MPEG-4音频标准集成了多种编码工具集来满足不同应用的需求,为每一种编码工具定义与之相适应的量化水印模式是MPEG-4音频版权保护最基本的需求,即多模式(multi-scheme)问题[99]。多种水印模式的存在给水印性能的分析带来必然的困难,如何从统一的角度看待和分析这些不同的量化水印模式,是多模式问题的另一方面。本文将量化水印看作一种基带传输系统,利用基带传输的技术和理论(如码型)提出了与MPEG-4多种自然音频编码相融合的量化水印模式[99],包括AAC量化水印、TwinVQ量化水印和SGVQ量化水印。通用音频编码量化水印的信道容量和自然语音编码量化水印的信号失真测试结果表明本文提出的算法是十分有效的,实现了水印技术与编码算法的紧密结合。理论分析表明:将量化水印视作一种基带传输系统,有利于鲁棒性、信道容量和不可感知性三者之间的权衡与控制等。(3)多水印模型:基于数字水印的MPEG-4音频数字版权保护需要在同一媒体对象中同时嵌入多个独立的水印信息,或者在不同的媒体对象中嵌入不同的版权信息,即多水印(multi-watermark)问题[99]。多水印的应用必然会存在相互之间的矛盾冲突以及对传统的单水印模式的冲击,如何利用网络信息论、通讯理论等建立合理的多水印模型来控制相互之间的矛盾冲突、优化水印嵌入和检测算法是MPEG-4音频版权保护不容忽视