音频水印与语音变调取证

来源 :中山大学 | 被引量 : 0次 | 上传用户:chenshu541775136
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着音频技术的广泛应用,保护音频作品成为信息安全领域的一个研究热点。音频水印是保护音频作品的有效方法之一,有着广阔的应用前景。尽管音频水印在近十年获得了长足的发展,但仍存在许多尚待解决的问题。音频的安全性是多方面的,除了音频水印,语音取证也是其中一个重要的研究领域。在司法领域里面,语音取证具有重要的应用价值。   目前很多非压缩域音频水印算法无法抵抗同步攻击或者只能抵抗某类同步攻击。   本论文针对这个问题,对音频水印的鲁棒性进行了深入的研究,提出了基于二进小波变换几何不变性和特殊纠错编码的鲁棒音频水印算法。所提出的算法对各类同步攻击和幅度攻击都具有良好的鲁棒性。在压缩域音频水印方面,目前已有的算法主要是基于MPEG音频。信息技术先进音视频编码(简称AVS)中的音频标准是我国提出的音频压缩标准,但目前尚未有基于此种标准的音频算法。为此,我们设计了一种鲁棒的AVS音频算法。在语音取证方面,变调后说话人识别取证的问题尚未得到学界的足够注意。我们利用语音的基频、美频率倒谱系数等特性以及动态时间规整等方法,设计了一种变调后的说话人识别取证方法。   论文的主要工作如下:   工作(1):通过推导和实验比较了几种主流变换域与二进小波变换在几何不变性方面的性能,证明了二进小波变换具有更加优良的几何不变性,更适合作为水印的嵌入域。我们利用二进小波变换的峰值能量转折的几何不变性,提出了一种对时域线性伸缩、音调不变时域伸缩、音调伸缩、抖动等同步攻击和幅度攻击都鲁棒的音频算法。同时,我们设计了一种基于重复编码的纠错编码方案,对插入、删除和替换错误具有较强的纠错能力。所提出的水印算法在鲁棒性、不可察觉性和嵌入量等方面,都具有较好的性能。特别在鲁棒性方面,能较为全面地抵抗各类同步攻击和普通攻击,在一定程度上解决了众多已有音频水印算法无法抵抗同步攻击或者只能抵抗某类同步攻击的问题。但所提算法在提取水印时需要边信息,且所提的纠错编码方案对裁剪攻击较为脆弱。   工作(2):针对工作(1)中尚存的问题,即提取水印需要边信息及纠错编码方案对裁剪攻击较脆弱的问题,通过对二进小波变换几何不变性更深入的探讨,我们提出了一种对同步攻击和幅度攻击都鲁棒的音频算法。该算法利用二进小波变换低频子带波峰的宽度作为水印定位的标准,利用波峰的高度作为提取水印时0-1判决的依据,较好地利用了二进小波变换的几何不变性。利用调制方式将水印能量扩散到一段系数中,提高了鲁棒性。同时设计了一种对插入、删除和替换错误具有极强纠错能力的纠错编码方案并实现了简单实用的译码方法。与工作(1)中的纠错编码相比,本工作中所提的纠错编码方案能够有效地抵抗裁剪攻击。实验证明,本算法能全面地抵抗各类同步攻击和普通攻击。与1)相比,本算法为完全的盲检测算法;其纠错编码方案能有效纠正插入、删除和替换错误外,还能成功地阻止误码扩散。   工作(3):提出了一种AVS音频鲁棒水印的算法。该算法是一种压缩域鲁棒水印算法。我们将水印的嵌入算法整合到AVS音频压缩算法中,利用AVS压缩过程中使用的帧类型控制环节使得水印被编码到压缩流里面。提取端可直接从压缩比特流中提取水印。嵌入是通过修改某些小片段的样本点达到的,而提取则无须对压缩流解码,因此嵌入与提取过程的复杂度非常低,适用于对实时要求较高的场合。实验证明所提算法对解压/重压缩(AVS重压缩和MP3重压缩)都非常鲁棒。目前已有的压缩域水印算法都是基于MPEG音频,我们所提的本算法弥补了AVS音频水印的空白。   工作(4):提出了一种变调后的说话人识别取证方法。本项工作基于音调伸缩变调原理和说话人识别的基本技术,提出了一种综合利用语音的基频、美频率倒谱系数和时间动态规整等特性和技术的变调识别取证方案。所提方案利用语音的基频特性估计变调系数,并对美频率倒谱系数提取算法进行了改进,即利用线性插值伸缩将估计的变调系数整合到美频率倒谱系数提取算法中,使其能近似计算出变调语音在变调前的美频率倒谱系数。最后利用时间动态规整作为匹配方法,计算语音之间的相似度。实验结果表明,在语音经过较大的变调后,常规的识别取证方案会造成较高或极高的漏检率和虚警率,对于取证完全失效;而我们所提的在识别性能上相比常规识别取证方法有极大的提高,在一定程度上能作取证之用。
其他文献
腭裂是较为常见的先天畸形,新生儿发生比例约为1:1000。随着社会生活水平的提高,医疗健康成为人们生活中最为重视的服务之一,所以研究腭裂患儿的发音,即腭裂语音,从而找到改善
近年来,随着无线通信技术的快速发展和交通领域信息化的迫切需求,催生了人们探索无线通信在智能交通方面的应用研究——车载自组织网络(Vehicular Ad Hoc Networks, VANET)。
随着数字电视技术的发展,数字电视(DTV)广播技术也变得越来越完善,在城市中,人们获得定位信息的来源已不局限于以往的定位系统和设施,已开始考虑基于DTV信号进行定位。而在城市中
2006年8月30日,国家标准化管理委员会发布了《数字电视地面广播传输系统帧结构、信道编码和调制》标准,标准号为GB20600-2006。本标准为国家强制性标准,批准日期为2006年8月18日
三维重建是计算机视觉研究的一个重要分支,在日常生活、医疗领域、军事测量等行业具有广泛应用价值。三维重建方法可分为主动式方法和被动式方法。主动式方法需要测量设备主
随着无线移动通信技术的飞速发展,各种新兴的无线接入技术层出不穷。它们具有不同的实现技术、不同的控制方式、不同的覆盖范围和不同的数据传输速率,它们既相互补充又相互竞
耳语音说话人识别在公共场合下的通讯、安全场所的身份鉴定、罪犯识别、电话网络查询与电话银行等领域都有着一定的实用价值。它是一个较新的研究课题,有许多问题尚待解决。
乙烯是石油化工的基本原料之一,也是石油化工产业的核心,乙烯的化学性质活跃,属于易燃易爆气体,检测空气及设备中的乙烯浓度是保证安全的必要条件。   光纤传感器与传统的传感
学位
无线传感器网络(WSN)是由部署在被监测区域内的大量廉价的微型无线传感器节点组成的、通过无线通信方式组成的一种多跳的自组织网络。它是一种新颖的信息获取平台,能够实时地
认知无线电具备灵活使用频谱的能力,极大提升无线频谱的使用效率,因而成为近十年来无线通信领域的一个研究热点。OFDM技术由于能够适应机会频谱接入的频谱成形要求,因而成为认知