论文部分内容阅读
感知哈希算法是多媒体信息安全领域的一个新课题,已应用于多媒体检索、多媒体索引、数字水印、多媒体认证和拷贝检测等方面。从本质上而言,它是一种单向映射函数,可把任意的多媒体数据转换成一个长度固定的、短小的序列,该序列简称为哈希。对于数字图像,感知哈希算法将任意一幅图像映射成一串短小的比特、字符或数字序列。如果两幅图像的视觉内容相同,用感知哈希算法提取得到的两个图像哈希将一致或十分相似,即,感知哈希算法具有鲁棒性。该性质确保感知哈希算法能够正确识别那些经历过JPEG压缩、滤波操作、几何变换、图像增强等处理的图像拷贝。如果两幅图像的视觉内容不同,它们对应的图像哈希将有很大差异,即,感知哈希算法具有唯一性,能有效区分不同的图像。除鲁棒性和唯一性外,感知哈希算法在特定应用领域还有特殊性质要求。例如,认证应用要求具备安全性,即,哈希由密钥控制,不同的密钥将得到不同的哈希。 本文选取数字图像为研究对象,以离散余弦变换(DCT)、离散小波变换(DWT)和主成分分析(PCA)等技术为嵌入点,研究感知哈希算法并探讨在图像拷贝检测中的应用,取得了三项有意义的研究结果,即,基于DCT和DWT的图像哈希算法、基于重要DCT系数的图像哈希算法和基于PCA的图像哈希算法。论文具体研究结果如下。 1.提出基于DCT和DWT的图像哈希算法 考虑到CIEL*a*b*颜色空间中的亮度分量L*与人类视觉系统的感知一致,提出联合使用DCT和DWT,在亮度分量L*上提取感知稳健的图像哈希。具体而言,先预处理图像获取规范化图像的亮度分量L*,接着进行非重叠分块并对每个图像块执行DCT,提取每个图像块的低频DCT系数构造特征矩阵,最后用DWT对特征矩阵进行分解,用LL子带系数的均值构造图像哈希。该算法对JPEG压缩、滤波操作、图像增强、小角度旋转等常见数字处理鲁棒,对视觉内容不同的图像有较好的唯一性。 2.提出基于重要DCT系数的图像哈希算法 研究二维DCT系数,提出利用DCT结果的第一行和第一列的重要系数构造图像哈希。该算法先对图像预处理,再对图像进行非重叠分块,然后提取每个图像块的二维DCT结果的第一行和第一列的重要系数构造两个特征矩阵并进行数据归一化处理,最后随机对两个特征矩阵的列进行一一配对,用列间距离生成哈希值。实验结果表明,该算法对JPEG压缩、亮度调整、对比度调整等正常图像处理稳健并且有较好的唯一性。 3.提出基于PCA的图像哈希算法 PCA是一种有用的数据降维方法,可从输入数据中计算出一组相互独立的低维向量来表示原有的、相关性较高的高维向量。考虑到图像的局部像素存在较强相关性,提出将图像块看做高维向量,进而用PCA进行降维处理,并将低维向量压缩成图像哈希。具体而言,该算法先将输入图像转换成固定尺寸的亮度分量,在此基础上,对图像进行非重叠分块,把每个图像块的像素排成一个新的列,进而构造出一个二次图像。接着,用PCA对二次图像进行降维,得到一组低维向量,最后通过计算向量间的距离生成哈希值。实验结果表明,基于PCA的图像哈希算法对常见的保持图像视觉内容不变的数字处理具有良好的鲁棒性,对不同内容的图像具有较好的唯一性。 用接收机操作特性曲线图分析上述三种感知哈希算法在鲁棒性与唯一性上的分类性能,并与GF-LVQ哈希方法、RT-DCT哈希方法等经典哈希方法作对比。实验结果表明,本文提出的三种算法的分类性能均优于对比的文献算法。为了测试算法的拷贝检测性能,构造了一个含1200幅不同图像的数据库,接着将十余种操作处理得到的图像拷贝加入该图像数据库,在此基础上检索图像拷贝,检测结果表明,在误判率较低时,本文提出的三种哈希算法均可查找出原图像的所有拷贝,检测性能较好。