基于离散小波变换和复倒谱的音频水印算法

来源 :安徽理工大学学报·自然科学版 | 被引量 : 0次 | 上传用户:gouchiren424
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要: 离散小波变换和复倒谱的数字音频盲水印算法首先对原始音频数据进行分段处 理并对每个音频数据段进行二级离散小波变换,然后对二级小波近似系数做复倒谱变换 并修改复 倒谱的统计均值以嵌入水印。为了便于观察,水印选用二值可视图像,并利用混沌技术进行 了加密处理,加强其安全性。算法提取水印时不需要原始音频信号,实现了水印的盲检测。 仿真实验证明了算法的鲁棒性和不可感知性。
  关键词:音频水印;统计均值;混沌;离散小波变换;复倒谱
  中图分类号:TP309文献标识码:A 文章编号:1672-1098(2010)01-0042-04
  
  Audio Watermarking Based on DWT and Complex Cepstrum
  HUANG Xiong-hua1,JIANG Wei-zhen2
  (1. Practice and Experiment Station, Guilin University of Electronic Technol ogy, Guilin Guangxi, 541004, China;2. College of Information Science and Techno logy, Jinan University, Guangzhou Guangdong 510084, China)
  Abstract: In the digital audio blind watermarking algorithm based on DWT(discret e wavelet translate) and complex cepstrum transform, firstly original audio is d ivided into several segments and each audio segment is transformed by two levelsDWT. Secondly, complex cepstrum transform is performed in the second level appr oximate coefficients and watermarks were embedded in complex cepstrum coefficien ts statistical mean value. In order to observe conveniently, two values image wa termark was selected and the chaos technology was made used of encrypting the im age for the sake of security. The watermarking could be extracted without the or iginal audio signal and realized blind detection. Experimental results demonstra ted that the algorithm was robust and imperceptible.
  Key words: audio watermarking; statistical mean value; chaos; DWT; complex cepst rum
  复倒谱分析是语音信号处理中的一种强有力的分析手段。倒谱分析是同态系统的理论基础, 在语音识别、地震检测、声纳分析等有广泛的应用。在倒谱域研究倒音频水印,文献[1-2 ]提出了倒谱域统计均值修改算法;文献[3]提出了倒谱域BCH纠错 码的鲁棒音频水印算法;文献[4-5]提出了根据人类听觉感知特性,和心理声学 模型定性 控制 水印嵌入的倒谱域音频水印算法。这些算法的共同问题在于复倒谱均是针对时域的,复倒谱 变换本身是一个时域的数学变换过程,频域比时空域具有更好的鲁棒性[6]。因此 ,本文首 先对音频进行两级小波分解,然后对二级近似小波系数进行复倒谱的数学变换处理,并将水 印嵌入复倒谱的统计均值中。实验结果表明,按文献[1-2]的方法选择嵌入强度系数明 显影 响到音频听觉的情况下,按文中的方法取得了较好的听觉效果,并且有较好的鲁棒性,实现 了水印音频透明性和鲁棒性的更好折中。算法实现了水印的盲检测,水印的提取不需要原始 音频。
  1 复倒谱变换
  复倒谱的变换过程如图1所示。
  图1 复倒谱变换的过程={xi|0≤i  ={Ci|0≤i  复倒谱域的变换是可逆变换(见图2)。
  图2 复倒谱的逆变换过程
  复倒谱的能量主要集中在零点附近;时域一定的扰动对复倒谱统计均值影响很小[1-2 ]。
  实数的复倒谱为实数,语音信号的样点值均为实数,避免了复数运算。实信号的复倒谱 两端较大(不考虑偏移),中间部分较小,从本文实验音频随机选择的一段的复倒谱曲线( 见图3)中可以看出,左右两端有明显的脉冲(偏移调整前),中间部分在零附近波动。
  样点
  图3 文中实验用部分语音信号复倒谱图
  2 水印的预处理
  为了文中的水印直观,选用二值可视图像作为水印。所以,首先需要将二维的水印信号降 到一维。
  w(i×P+j)=I(i,j)(1)
  式中: I(i, j)为原始水印的像素点, 1≤i≤P,1≤j≤Q; P, Q分别为水印图像的宽度和高度; w(k)为降维后的水印信号,k∈[1,P×Q] 。
  为了安全起见,对降维后的水印信号作进一步的加密处理。文中采用混沌加密的方法。Lo gistic是一类简单却广泛研究应用的动力系统。定义为
  xk+1=uxk(1-xk)(2)
  其中,0  图4 原始水印图5 置乱的水印
  3 水印嵌入
  首先将音频信号分帧。帧长l=L/(P× Q),
  L是音频文件长度,P×Q是水印信号长 度;分帧后的音频记为A(m,n),表示第m帧的第n个样点,m∈[1,P×Q],n∈[1,l]。
  其次,对每帧作二级小波分解,二级小波近似系数记为cA2;
  然后,对cA2作复倒谱变换,相应的第m帧第s个复倒谱系数记为cc(m,s),s∈[1,l ′],l′为二级小波系数近似分量cA2的 长度;实验证明倒谱系数的统计均值趋于零,即ave=mean(cc(m,:)),趋于零。mea n是求 平均值函数,cc(m,:)为第m帧所有的倒谱系数。因此,利用这一性质按下式嵌 入水印
  cc′(m,s)=cc(m,s)-ave+aw′(k)=1
  cc′(m,s)=cc(m,s)-ave-aw′(k)=0
  (3)
  式中:w′(k)为混沌加密后的水印比特;a为水印嵌入强度,由经验数据和实验获得 最佳值。
  考虑到复倒谱两端倒谱系数有脉冲,中间倒谱系数绕零波动的特点,为了减少误差,提高精 度;在式(3)中,只取中间部分的复倒谱系数作为嵌入水印的载体;同时,研究也表明,脉 冲部分的改变对音频质量的影响较为明显,不宜作改动。因此,选取了中间的二分之一倒谱 系数作为嵌入水印的载体,前面的四分之一和后面的四分之一不作改变。
  最后,作逆倒谱变换及逆小波变换得到含水印的音频帧,连接各帧得含水印音频。
  4 水印提取
  文中的算法实现了水印的盲检测。
  水印的提取基本上是水印嵌入过程的逆过程。分帧并作二级小波变换及复倒谱变换后的 复倒谱系数为cc″(m,s), 假设ave′=mean(cc″(m,:)), 从式(3) 知, 嵌 入水印的音频帧, 如果其统计均值大于零, 对应的是水印比特“1”, 反之对应的是水印 比特“0”。 因此,可按下式提取水印比特并连接为比特串。
  w″(k)=1ave′≥0
  w″(k)=0ave′<0(4)
  然后用三元组密钥key=(u,x0,T)解密,最后升维到二维图像,得到提取的水印图像。
  5 仿真实验结果
  实验音频采样频率为44.1 kHz,精度为16比特,其波形如图6所示;原始水印采 用图4所示的32×32二值图像;小波变换选用了`haar’小波基,水印嵌入强度选择了a= 0.005,嵌入水印后的音频如 图7所示,视觉上难看出变化。为进一步验证含水印音频的透明性。选择了5个听力正常的实 验者作SDG(subjective difference grades)打分。SDG分值的含义如表1所示。5个测试者 的打分均为0分,进一步证明了水印音频的不可听性。
  样点
  图6 原始音频
  样点
  图7 含水印音频表1 SDG主观测试区分度表
  SDG描述0.0不可感觉-1.0可感觉但不刺耳-2.0轻微刺耳-3.0刺耳-4.0非常刺耳
  为比较文中算法和相关算法,用文献[1]的算法思想作了水印嵌入实验(见图8),与原始 音频比较可以看到明显的差异。SDG测试中,5个实验者均给出了-1分。表明了在同样的参数 条件下,文中的算法具有更好的透明性。
  样点
  图8 按文献[1]嵌入水印后的音频
  为进一步验证算法的鲁棒性,模拟了多种信号处理攻击:MP3有损压缩,压缩至64k bps,解压后提取的水印如图9a所示;低通滤波,截止频率为5kHz,滤波后提取的水印如 图 9b所示;45dB的高斯白噪声攻击后提取的水印如图9c所示;重采样,先向下采样至22050 Hz,再向上至44 100 Hz,提取的水印如图9d所示;重量化,量 化至8比特精度,提取的水印如图9e所示。9f是未受攻击提取的水印。
  图9 模拟各种攻击后提取的水印
  表2列出了攻击前后水印归一化相关系数和各种攻击下的误码率。表2 水印归一化系数和误码率表
  攻击类型归一化系数误码率/%无攻击10MP3压缩0.973 44.10低通滤波0.991.56高斯噪声10重采样0.999 40.1重量化10
  上述的实验结果表明算法具有较好的鲁棒性和较好的透明性,实现了水印的鲁棒性和透 明性的折中。
  6 结论
  文中算法对小波二级系数进行倒谱的数学变换,将水印嵌入倒谱系数中,水印实现了盲检 测。实验结果表明了算法的鲁棒性和透明性的折中,能抵抗常规的信号处理攻击。算法采用 了混沌对水印图像进行加密,具有较高的安全性。
  参考文献:
  
  [1] XIN L,HEATHER Y H. Transparent and Robust Audio Data Hidingin Cepstrum Doma in[C]//Proceedings of IEEE International Conference on Multimedia and Expro 2 000,New York,2000:397-400.
  [2] KWANG LS,SUNG H Y.Digital Audio Watermarking in the CepstrumDomain[J].IEEE Trans. On Consumer Electronics 2000,46(3):744-750.
  [3] SHI-CHENG LIU,SHINFENG D LIN. BCH Code-Based Robust AudioWatermarking in th e Cepstrum Domain[J].Journal of Information Science and Engineering 2006,22: 535-543.
  [4] KALIAPPAN GOPALAN. Audio Stegnography by Cepstrum Modifica tio n[C]//Conference on Acoustice, Speech, and Signal Processing.Philadelphia,2005 :481-484.
  [5] 年桂君,王树勋,唐笑年.倒谱域自适应音频水印算法[J].吉林大学学报 ,2008,26(1):55-61.
  (责任编辑:何学华,吴晓红)
  
其他文献
福建农垦经济体制改革动向刍议○陈论生一、改革的五个动向社会主义市场经济体制的逐步建立,给传统的农垦经济体制带来了新的挑战。为适应新形势的要求,我省农垦从上到下,从沿海
非规范名规范名   白蛋白清蛋白  白血球白细胞  搏出量每搏输出量  成骨骨化  耳廓耳郭  甘油三酯三酰甘油  荷尔蒙红血球  机能功能  机理机制  解码译码  局群,繁群种群  抗菌素抗生素  可更新资源可再生资源
期刊
错误用法 存贮器 影象 连结 登陆 取样,抽样
2009年9月的PETS三级考试即将开考,广大考生最关心的问题都是如何准备考试。在笔试部分的听力、英语知识运用、阅读理解、写作这四大板块中阅读的分值是最重的,原始赋分达到了3
、植胶农场的现状和问题我国以生产天然橡胶为主的国有农场(以下简称植胶农场)是在特定的历史条件下建立起来的农业企业。这些农场在开发建设我国热带农业资源,特别是建立我国天
奇迹是什么?奇迹是“极难做到的,却做到了”,奇迹是“不太可能发生的,却发生了”,奇迹是“绝处逢生”,奇迹是“起死回生”。而创造一个个奇迹的是人类坚忍不拔的毅力、顽强不屈的生
摘 要:针对所研制的纳米三坐标测量机的具体结构,运用现代精度保障理论和技术,结合动、静力学相关知识,进行了纳米量级水平的误差源全面分析,对各误差的表现形式和影响进行了详细的描述,为后续的误差分配和结构优化设计打下基础。根据纳米坐标测量机的精确环境要求和所研制的纳米三坐标测量机结构、误差分布特征和精度要求,利用微型三光束平面干涉仪,设计了相关的支架组成了误差分离实验装置,实现标准量示值误差、导轨直线
五星农场始建于1951年冬,现有土地37000多亩,人口3600多人,在职职工500多人,离退休职工620多人,负债6000多万元,是一个退休人员多,社会性支出大,债务沉重的企业,多年以来,一是观念陈旧,二是退休费负担重,三是企业
巷道围岩控制是深部资源开采中的关键问题,而要攻克深井软岩巷道支护的难关,就必须首先研究底鼓的机理及其防治措施。巷道底臌有挤压、压曲、膨胀和剪胀等形式,压曲底臌是最