论文部分内容阅读
随着音频技术的广泛应用,保护音频作品成为信息安全领域的一个研究热点。音频水印是保护音频作品的有效方法之一,有着广阔的应用前景。尽管音频水印在近十年获得了长足的发展,但仍存在许多尚待解决的问题。音频的安全性是多方面的,除了音频水印,语音取证也是其中一个重要的研究领域。在司法领域里面,语音取证具有重要的应用价值。
目前很多非压缩域音频水印算法无法抵抗同步攻击或者只能抵抗某类同步攻击。
本论文针对这个问题,对音频水印的鲁棒性进行了深入的研究,提出了基于二进小波变换几何不变性和特殊纠错编码的鲁棒音频水印算法。所提出的算法对各类同步攻击和幅度攻击都具有良好的鲁棒性。在压缩域音频水印方面,目前已有的算法主要是基于MPEG音频。信息技术先进音视频编码(简称AVS)中的音频标准是我国提出的音频压缩标准,但目前尚未有基于此种标准的音频算法。为此,我们设计了一种鲁棒的AVS音频算法。在语音取证方面,变调后说话人识别取证的问题尚未得到学界的足够注意。我们利用语音的基频、美频率倒谱系数等特性以及动态时间规整等方法,设计了一种变调后的说话人识别取证方法。
论文的主要工作如下:
工作(1):通过推导和实验比较了几种主流变换域与二进小波变换在几何不变性方面的性能,证明了二进小波变换具有更加优良的几何不变性,更适合作为水印的嵌入域。我们利用二进小波变换的峰值能量转折的几何不变性,提出了一种对时域线性伸缩、音调不变时域伸缩、音调伸缩、抖动等同步攻击和幅度攻击都鲁棒的音频算法。同时,我们设计了一种基于重复编码的纠错编码方案,对插入、删除和替换错误具有较强的纠错能力。所提出的水印算法在鲁棒性、不可察觉性和嵌入量等方面,都具有较好的性能。特别在鲁棒性方面,能较为全面地抵抗各类同步攻击和普通攻击,在一定程度上解决了众多已有音频水印算法无法抵抗同步攻击或者只能抵抗某类同步攻击的问题。但所提算法在提取水印时需要边信息,且所提的纠错编码方案对裁剪攻击较为脆弱。
工作(2):针对工作(1)中尚存的问题,即提取水印需要边信息及纠错编码方案对裁剪攻击较脆弱的问题,通过对二进小波变换几何不变性更深入的探讨,我们提出了一种对同步攻击和幅度攻击都鲁棒的音频算法。该算法利用二进小波变换低频子带波峰的宽度作为水印定位的标准,利用波峰的高度作为提取水印时0-1判决的依据,较好地利用了二进小波变换的几何不变性。利用调制方式将水印能量扩散到一段系数中,提高了鲁棒性。同时设计了一种对插入、删除和替换错误具有极强纠错能力的纠错编码方案并实现了简单实用的译码方法。与工作(1)中的纠错编码相比,本工作中所提的纠错编码方案能够有效地抵抗裁剪攻击。实验证明,本算法能全面地抵抗各类同步攻击和普通攻击。与1)相比,本算法为完全的盲检测算法;其纠错编码方案能有效纠正插入、删除和替换错误外,还能成功地阻止误码扩散。
工作(3):提出了一种AVS音频鲁棒水印的算法。该算法是一种压缩域鲁棒水印算法。我们将水印的嵌入算法整合到AVS音频压缩算法中,利用AVS压缩过程中使用的帧类型控制环节使得水印被编码到压缩流里面。提取端可直接从压缩比特流中提取水印。嵌入是通过修改某些小片段的样本点达到的,而提取则无须对压缩流解码,因此嵌入与提取过程的复杂度非常低,适用于对实时要求较高的场合。实验证明所提算法对解压/重压缩(AVS重压缩和MP3重压缩)都非常鲁棒。目前已有的压缩域水印算法都是基于MPEG音频,我们所提的本算法弥补了AVS音频水印的空白。
工作(4):提出了一种变调后的说话人识别取证方法。本项工作基于音调伸缩变调原理和说话人识别的基本技术,提出了一种综合利用语音的基频、美频率倒谱系数和时间动态规整等特性和技术的变调识别取证方案。所提方案利用语音的基频特性估计变调系数,并对美频率倒谱系数提取算法进行了改进,即利用线性插值伸缩将估计的变调系数整合到美频率倒谱系数提取算法中,使其能近似计算出变调语音在变调前的美频率倒谱系数。最后利用时间动态规整作为匹配方法,计算语音之间的相似度。实验结果表明,在语音经过较大的变调后,常规的识别取证方案会造成较高或极高的漏检率和虚警率,对于取证完全失效;而我们所提的在识别性能上相比常规识别取证方法有极大的提高,在一定程度上能作取证之用。