论文部分内容阅读
摘 要: 离散小波变换和复倒谱的数字音频盲水印算法首先对原始音频数据进行分段处 理并对每个音频数据段进行二级离散小波变换,然后对二级小波近似系数做复倒谱变换 并修改复 倒谱的统计均值以嵌入水印。为了便于观察,水印选用二值可视图像,并利用混沌技术进行 了加密处理,加强其安全性。算法提取水印时不需要原始音频信号,实现了水印的盲检测。 仿真实验证明了算法的鲁棒性和不可感知性。
关键词:音频水印;统计均值;混沌;离散小波变换;复倒谱
中图分类号:TP309文献标识码:A 文章编号:1672-1098(2010)01-0042-04
Audio Watermarking Based on DWT and Complex Cepstrum
HUANG Xiong-hua1,JIANG Wei-zhen2
(1. Practice and Experiment Station, Guilin University of Electronic Technol ogy, Guilin Guangxi, 541004, China;2. College of Information Science and Techno logy, Jinan University, Guangzhou Guangdong 510084, China)
Abstract: In the digital audio blind watermarking algorithm based on DWT(discret e wavelet translate) and complex cepstrum transform, firstly original audio is d ivided into several segments and each audio segment is transformed by two levelsDWT. Secondly, complex cepstrum transform is performed in the second level appr oximate coefficients and watermarks were embedded in complex cepstrum coefficien ts statistical mean value. In order to observe conveniently, two values image wa termark was selected and the chaos technology was made used of encrypting the im age for the sake of security. The watermarking could be extracted without the or iginal audio signal and realized blind detection. Experimental results demonstra ted that the algorithm was robust and imperceptible.
Key words: audio watermarking; statistical mean value; chaos; DWT; complex cepst rum
复倒谱分析是语音信号处理中的一种强有力的分析手段。倒谱分析是同态系统的理论基础, 在语音识别、地震检测、声纳分析等有广泛的应用。在倒谱域研究倒音频水印,文献[1-2 ]提出了倒谱域统计均值修改算法;文献[3]提出了倒谱域BCH纠错 码的鲁棒音频水印算法;文献[4-5]提出了根据人类听觉感知特性,和心理声学 模型定性 控制 水印嵌入的倒谱域音频水印算法。这些算法的共同问题在于复倒谱均是针对时域的,复倒谱 变换本身是一个时域的数学变换过程,频域比时空域具有更好的鲁棒性[6]。因此 ,本文首 先对音频进行两级小波分解,然后对二级近似小波系数进行复倒谱的数学变换处理,并将水 印嵌入复倒谱的统计均值中。实验结果表明,按文献[1-2]的方法选择嵌入强度系数明 显影 响到音频听觉的情况下,按文中的方法取得了较好的听觉效果,并且有较好的鲁棒性,实现 了水印音频透明性和鲁棒性的更好折中。算法实现了水印的盲检测,水印的提取不需要原始 音频。
1 复倒谱变换
复倒谱的变换过程如图1所示。
图1 复倒谱变换的过程={xi|0≤i ={Ci|0≤i 复倒谱域的变换是可逆变换(见图2)。
图2 复倒谱的逆变换过程
复倒谱的能量主要集中在零点附近;时域一定的扰动对复倒谱统计均值影响很小[1-2 ]。
实数的复倒谱为实数,语音信号的样点值均为实数,避免了复数运算。实信号的复倒谱 两端较大(不考虑偏移),中间部分较小,从本文实验音频随机选择的一段的复倒谱曲线( 见图3)中可以看出,左右两端有明显的脉冲(偏移调整前),中间部分在零附近波动。
样点
图3 文中实验用部分语音信号复倒谱图
2 水印的预处理
为了文中的水印直观,选用二值可视图像作为水印。所以,首先需要将二维的水印信号降 到一维。
w(i×P+j)=I(i,j)(1)
式中: I(i, j)为原始水印的像素点, 1≤i≤P,1≤j≤Q; P, Q分别为水印图像的宽度和高度; w(k)为降维后的水印信号,k∈[1,P×Q] 。
为了安全起见,对降维后的水印信号作进一步的加密处理。文中采用混沌加密的方法。Lo gistic是一类简单却广泛研究应用的动力系统。定义为
xk+1=uxk(1-xk)(2)
其中,0 图4 原始水印图5 置乱的水印
3 水印嵌入
首先将音频信号分帧。帧长l=L/(P× Q),
L是音频文件长度,P×Q是水印信号长 度;分帧后的音频记为A(m,n),表示第m帧的第n个样点,m∈[1,P×Q],n∈[1,l]。
其次,对每帧作二级小波分解,二级小波近似系数记为cA2;
然后,对cA2作复倒谱变换,相应的第m帧第s个复倒谱系数记为cc(m,s),s∈[1,l ′],l′为二级小波系数近似分量cA2的 长度;实验证明倒谱系数的统计均值趋于零,即ave=mean(cc(m,:)),趋于零。mea n是求 平均值函数,cc(m,:)为第m帧所有的倒谱系数。因此,利用这一性质按下式嵌 入水印
cc′(m,s)=cc(m,s)-ave+aw′(k)=1
cc′(m,s)=cc(m,s)-ave-aw′(k)=0
(3)
式中:w′(k)为混沌加密后的水印比特;a为水印嵌入强度,由经验数据和实验获得 最佳值。
考虑到复倒谱两端倒谱系数有脉冲,中间倒谱系数绕零波动的特点,为了减少误差,提高精 度;在式(3)中,只取中间部分的复倒谱系数作为嵌入水印的载体;同时,研究也表明,脉 冲部分的改变对音频质量的影响较为明显,不宜作改动。因此,选取了中间的二分之一倒谱 系数作为嵌入水印的载体,前面的四分之一和后面的四分之一不作改变。
最后,作逆倒谱变换及逆小波变换得到含水印的音频帧,连接各帧得含水印音频。
4 水印提取
文中的算法实现了水印的盲检测。
水印的提取基本上是水印嵌入过程的逆过程。分帧并作二级小波变换及复倒谱变换后的 复倒谱系数为cc″(m,s), 假设ave′=mean(cc″(m,:)), 从式(3) 知, 嵌 入水印的音频帧, 如果其统计均值大于零, 对应的是水印比特“1”, 反之对应的是水印 比特“0”。 因此,可按下式提取水印比特并连接为比特串。
w″(k)=1ave′≥0
w″(k)=0ave′<0(4)
然后用三元组密钥key=(u,x0,T)解密,最后升维到二维图像,得到提取的水印图像。
5 仿真实验结果
实验音频采样频率为44.1 kHz,精度为16比特,其波形如图6所示;原始水印采 用图4所示的32×32二值图像;小波变换选用了`haar’小波基,水印嵌入强度选择了a= 0.005,嵌入水印后的音频如 图7所示,视觉上难看出变化。为进一步验证含水印音频的透明性。选择了5个听力正常的实 验者作SDG(subjective difference grades)打分。SDG分值的含义如表1所示。5个测试者 的打分均为0分,进一步证明了水印音频的不可听性。
样点
图6 原始音频
样点
图7 含水印音频表1 SDG主观测试区分度表
SDG描述0.0不可感觉-1.0可感觉但不刺耳-2.0轻微刺耳-3.0刺耳-4.0非常刺耳
为比较文中算法和相关算法,用文献[1]的算法思想作了水印嵌入实验(见图8),与原始 音频比较可以看到明显的差异。SDG测试中,5个实验者均给出了-1分。表明了在同样的参数 条件下,文中的算法具有更好的透明性。
样点
图8 按文献[1]嵌入水印后的音频
为进一步验证算法的鲁棒性,模拟了多种信号处理攻击:MP3有损压缩,压缩至64k bps,解压后提取的水印如图9a所示;低通滤波,截止频率为5kHz,滤波后提取的水印如 图 9b所示;45dB的高斯白噪声攻击后提取的水印如图9c所示;重采样,先向下采样至22050 Hz,再向上至44 100 Hz,提取的水印如图9d所示;重量化,量 化至8比特精度,提取的水印如图9e所示。9f是未受攻击提取的水印。
图9 模拟各种攻击后提取的水印
表2列出了攻击前后水印归一化相关系数和各种攻击下的误码率。表2 水印归一化系数和误码率表
攻击类型归一化系数误码率/%无攻击10MP3压缩0.973 44.10低通滤波0.991.56高斯噪声10重采样0.999 40.1重量化10
上述的实验结果表明算法具有较好的鲁棒性和较好的透明性,实现了水印的鲁棒性和透 明性的折中。
6 结论
文中算法对小波二级系数进行倒谱的数学变换,将水印嵌入倒谱系数中,水印实现了盲检 测。实验结果表明了算法的鲁棒性和透明性的折中,能抵抗常规的信号处理攻击。算法采用 了混沌对水印图像进行加密,具有较高的安全性。
参考文献:
[1] XIN L,HEATHER Y H. Transparent and Robust Audio Data Hidingin Cepstrum Doma in[C]//Proceedings of IEEE International Conference on Multimedia and Expro 2 000,New York,2000:397-400.
[2] KWANG LS,SUNG H Y.Digital Audio Watermarking in the CepstrumDomain[J].IEEE Trans. On Consumer Electronics 2000,46(3):744-750.
[3] SHI-CHENG LIU,SHINFENG D LIN. BCH Code-Based Robust AudioWatermarking in th e Cepstrum Domain[J].Journal of Information Science and Engineering 2006,22: 535-543.
[4] KALIAPPAN GOPALAN. Audio Stegnography by Cepstrum Modifica tio n[C]//Conference on Acoustice, Speech, and Signal Processing.Philadelphia,2005 :481-484.
[5] 年桂君,王树勋,唐笑年.倒谱域自适应音频水印算法[J].吉林大学学报 ,2008,26(1):55-61.
(责任编辑:何学华,吴晓红)
关键词:音频水印;统计均值;混沌;离散小波变换;复倒谱
中图分类号:TP309文献标识码:A 文章编号:1672-1098(2010)01-0042-04
Audio Watermarking Based on DWT and Complex Cepstrum
HUANG Xiong-hua1,JIANG Wei-zhen2
(1. Practice and Experiment Station, Guilin University of Electronic Technol ogy, Guilin Guangxi, 541004, China;2. College of Information Science and Techno logy, Jinan University, Guangzhou Guangdong 510084, China)
Abstract: In the digital audio blind watermarking algorithm based on DWT(discret e wavelet translate) and complex cepstrum transform, firstly original audio is d ivided into several segments and each audio segment is transformed by two levelsDWT. Secondly, complex cepstrum transform is performed in the second level appr oximate coefficients and watermarks were embedded in complex cepstrum coefficien ts statistical mean value. In order to observe conveniently, two values image wa termark was selected and the chaos technology was made used of encrypting the im age for the sake of security. The watermarking could be extracted without the or iginal audio signal and realized blind detection. Experimental results demonstra ted that the algorithm was robust and imperceptible.
Key words: audio watermarking; statistical mean value; chaos; DWT; complex cepst rum
复倒谱分析是语音信号处理中的一种强有力的分析手段。倒谱分析是同态系统的理论基础, 在语音识别、地震检测、声纳分析等有广泛的应用。在倒谱域研究倒音频水印,文献[1-2 ]提出了倒谱域统计均值修改算法;文献[3]提出了倒谱域BCH纠错 码的鲁棒音频水印算法;文献[4-5]提出了根据人类听觉感知特性,和心理声学 模型定性 控制 水印嵌入的倒谱域音频水印算法。这些算法的共同问题在于复倒谱均是针对时域的,复倒谱 变换本身是一个时域的数学变换过程,频域比时空域具有更好的鲁棒性[6]。因此 ,本文首 先对音频进行两级小波分解,然后对二级近似小波系数进行复倒谱的数学变换处理,并将水 印嵌入复倒谱的统计均值中。实验结果表明,按文献[1-2]的方法选择嵌入强度系数明 显影 响到音频听觉的情况下,按文中的方法取得了较好的听觉效果,并且有较好的鲁棒性,实现 了水印音频透明性和鲁棒性的更好折中。算法实现了水印的盲检测,水印的提取不需要原始 音频。
1 复倒谱变换
复倒谱的变换过程如图1所示。
图1 复倒谱变换的过程={xi|0≤i
图2 复倒谱的逆变换过程
复倒谱的能量主要集中在零点附近;时域一定的扰动对复倒谱统计均值影响很小[1-2 ]。
实数的复倒谱为实数,语音信号的样点值均为实数,避免了复数运算。实信号的复倒谱 两端较大(不考虑偏移),中间部分较小,从本文实验音频随机选择的一段的复倒谱曲线( 见图3)中可以看出,左右两端有明显的脉冲(偏移调整前),中间部分在零附近波动。
样点
图3 文中实验用部分语音信号复倒谱图
2 水印的预处理
为了文中的水印直观,选用二值可视图像作为水印。所以,首先需要将二维的水印信号降 到一维。
w(i×P+j)=I(i,j)(1)
式中: I(i, j)为原始水印的像素点, 1≤i≤P,1≤j≤Q; P, Q分别为水印图像的宽度和高度; w(k)为降维后的水印信号,k∈[1,P×Q] 。
为了安全起见,对降维后的水印信号作进一步的加密处理。文中采用混沌加密的方法。Lo gistic是一类简单却广泛研究应用的动力系统。定义为
xk+1=uxk(1-xk)(2)
其中,0
3 水印嵌入
首先将音频信号分帧。帧长l=L/(P× Q),
L是音频文件长度,P×Q是水印信号长 度;分帧后的音频记为A(m,n),表示第m帧的第n个样点,m∈[1,P×Q],n∈[1,l]。
其次,对每帧作二级小波分解,二级小波近似系数记为cA2;
然后,对cA2作复倒谱变换,相应的第m帧第s个复倒谱系数记为cc(m,s),s∈[1,l ′],l′为二级小波系数近似分量cA2的 长度;实验证明倒谱系数的统计均值趋于零,即ave=mean(cc(m,:)),趋于零。mea n是求 平均值函数,cc(m,:)为第m帧所有的倒谱系数。因此,利用这一性质按下式嵌 入水印
cc′(m,s)=cc(m,s)-ave+aw′(k)=1
cc′(m,s)=cc(m,s)-ave-aw′(k)=0
(3)
式中:w′(k)为混沌加密后的水印比特;a为水印嵌入强度,由经验数据和实验获得 最佳值。
考虑到复倒谱两端倒谱系数有脉冲,中间倒谱系数绕零波动的特点,为了减少误差,提高精 度;在式(3)中,只取中间部分的复倒谱系数作为嵌入水印的载体;同时,研究也表明,脉 冲部分的改变对音频质量的影响较为明显,不宜作改动。因此,选取了中间的二分之一倒谱 系数作为嵌入水印的载体,前面的四分之一和后面的四分之一不作改变。
最后,作逆倒谱变换及逆小波变换得到含水印的音频帧,连接各帧得含水印音频。
4 水印提取
文中的算法实现了水印的盲检测。
水印的提取基本上是水印嵌入过程的逆过程。分帧并作二级小波变换及复倒谱变换后的 复倒谱系数为cc″(m,s), 假设ave′=mean(cc″(m,:)), 从式(3) 知, 嵌 入水印的音频帧, 如果其统计均值大于零, 对应的是水印比特“1”, 反之对应的是水印 比特“0”。 因此,可按下式提取水印比特并连接为比特串。
w″(k)=1ave′≥0
w″(k)=0ave′<0(4)
然后用三元组密钥key=(u,x0,T)解密,最后升维到二维图像,得到提取的水印图像。
5 仿真实验结果
实验音频采样频率为44.1 kHz,精度为16比特,其波形如图6所示;原始水印采 用图4所示的32×32二值图像;小波变换选用了`haar’小波基,水印嵌入强度选择了a= 0.005,嵌入水印后的音频如 图7所示,视觉上难看出变化。为进一步验证含水印音频的透明性。选择了5个听力正常的实 验者作SDG(subjective difference grades)打分。SDG分值的含义如表1所示。5个测试者 的打分均为0分,进一步证明了水印音频的不可听性。
样点
图6 原始音频
样点
图7 含水印音频表1 SDG主观测试区分度表
SDG描述0.0不可感觉-1.0可感觉但不刺耳-2.0轻微刺耳-3.0刺耳-4.0非常刺耳
为比较文中算法和相关算法,用文献[1]的算法思想作了水印嵌入实验(见图8),与原始 音频比较可以看到明显的差异。SDG测试中,5个实验者均给出了-1分。表明了在同样的参数 条件下,文中的算法具有更好的透明性。
样点
图8 按文献[1]嵌入水印后的音频
为进一步验证算法的鲁棒性,模拟了多种信号处理攻击:MP3有损压缩,压缩至64k bps,解压后提取的水印如图9a所示;低通滤波,截止频率为5kHz,滤波后提取的水印如 图 9b所示;45dB的高斯白噪声攻击后提取的水印如图9c所示;重采样,先向下采样至22050 Hz,再向上至44 100 Hz,提取的水印如图9d所示;重量化,量 化至8比特精度,提取的水印如图9e所示。9f是未受攻击提取的水印。
图9 模拟各种攻击后提取的水印
表2列出了攻击前后水印归一化相关系数和各种攻击下的误码率。表2 水印归一化系数和误码率表
攻击类型归一化系数误码率/%无攻击10MP3压缩0.973 44.10低通滤波0.991.56高斯噪声10重采样0.999 40.1重量化10
上述的实验结果表明算法具有较好的鲁棒性和较好的透明性,实现了水印的鲁棒性和透 明性的折中。
6 结论
文中算法对小波二级系数进行倒谱的数学变换,将水印嵌入倒谱系数中,水印实现了盲检 测。实验结果表明了算法的鲁棒性和透明性的折中,能抵抗常规的信号处理攻击。算法采用 了混沌对水印图像进行加密,具有较高的安全性。
参考文献:
[1] XIN L,HEATHER Y H. Transparent and Robust Audio Data Hidingin Cepstrum Doma in[C]//Proceedings of IEEE International Conference on Multimedia and Expro 2 000,New York,2000:397-400.
[2] KWANG LS,SUNG H Y.Digital Audio Watermarking in the CepstrumDomain[J].IEEE Trans. On Consumer Electronics 2000,46(3):744-750.
[3] SHI-CHENG LIU,SHINFENG D LIN. BCH Code-Based Robust AudioWatermarking in th e Cepstrum Domain[J].Journal of Information Science and Engineering 2006,22: 535-543.
[4] KALIAPPAN GOPALAN. Audio Stegnography by Cepstrum Modifica tio n[C]//Conference on Acoustice, Speech, and Signal Processing.Philadelphia,2005 :481-484.
[5] 年桂君,王树勋,唐笑年.倒谱域自适应音频水印算法[J].吉林大学学报 ,2008,26(1):55-61.
(责任编辑:何学华,吴晓红)