论文部分内容阅读
多媒体信息安全是多媒体领域与信息安全领域的交叉研究课题,在近年引起了研究人员的广泛关注。作为一项重要的多媒体信息安全保护技术,多媒体哈希已被成功应用到多媒体信息检索、多媒体内容认证以及多媒体篡改检测等方面。多媒体哈希是从多媒体中提取出来的、基于内容的一种简洁表示。通过多媒体哈希算法可将任意的多媒体数据映射成一串短小的哈希序列。在实际应用中,用哈希序列来代表多媒体本身,能够有效降低多媒体数据的存储代价和多媒体相似计算的复杂度。一般而言,多媒体哈希必须满足两个基本条件,即鲁棒性和唯一性。鲁棒性指是即使两个多媒体的具体数据表示不同,如果它们在视觉上相同,那么它们应该具有相同或非常相似的哈希。换言之,多媒体哈希需要具备对抗正常数字操作的能力,例如数据压缩和几何变换等。而唯一性则要求不同的多媒体应该有不同的哈希,这意味着不同多媒体的哈希之间的距离应该足够大。此外,多媒体哈希在一些实际应用中可能还需要具备其他的特性。例如,在多媒体内容认证中,多媒体哈希的提取需要密钥来控制并且多媒体哈希需要对内容变化敏感。本文研究多媒体哈希算法,主要研究对象是多媒体中的视觉媒体,即图像和视频。具体而言,本文利用张量分解(Tensor Decomposition,TD)和非负矩阵分解(Non-negative Matrix Factorization,NMF)设计出两种新的视觉哈希算法。第一种算法是基于TD的图像哈希算法,通过从图像中构造张量,将张量分解应用于图像哈希提取。第二种算法是基于离散余弦变换(DCT)和NMF的视频哈希算法,通过联合DCT和NMF来提取视频哈希序列,实现较好的分类性能。主要研究结果总结如下。1.提出基于张量分解的图像哈希算法张量是一种泛化的高阶矩阵形式。目前,张量分解已经成功应用在多个领域,包括数据挖掘、图像分析、信号处理和计算机视觉等。本文将图像哈希计算被看作是从一个张量中提取出来的一个紧凑的表示,提出了一种基于张量分解的新型图像哈希算法,简称TD哈希算法。为了提高TD哈希算法的鲁棒性,先从规格化的图像中构造出一个稳定的3阶张量,然后运用一种名叫Tucker分解的张量分解方法将3阶张量分解成1核心张量和3个正交因子矩阵。由于因子矩阵可以反映原始张量的内在结构,因此TD哈希算法利用因子矩阵来构造哈希序列,确保算法具有较好的唯一性。选取14551幅图像作为实验数据来测试算法性能,接收机操作特性(ROC)曲线的对比实验结果表明,TD哈希算法的分类性能和哈希长度均优于多种文献的图像哈希算法。2.设计基于DCT和NMF的视频哈希算法本文联合使用DCT和NMF来提取视频哈希序列,设计出一种新的视频哈希算法。该算法先对输入视频进行预处理,得到规格化的视频,然后将视频帧进行分组,对于每个帧分组,用随机分块策略提取帧数据并计算DCT系数,通过DCT系数来构造帧分组的特征矩阵,最后利用NMF从特征矩阵中学习短小的特征码,串联所有分组的特征码即可生成最终视频哈希。实验使用2050段视频数据来验证哈希算法性能,结果表明本文提出的视频哈希算法对常见数字操作鲁棒并有较好的唯一性。ROC曲线对比实验结果显示,本文视频哈希算法在鲁棒性和唯一性方面的分类能力优于多种文献的视频哈希算法。