基于张量分解和非负矩阵分解的视觉哈希算法

来源 :广西师范大学 | 被引量 : 1次 | 上传用户:huanhuan40705
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多媒体信息安全是多媒体领域与信息安全领域的交叉研究课题,在近年引起了研究人员的广泛关注。作为一项重要的多媒体信息安全保护技术,多媒体哈希已被成功应用到多媒体信息检索、多媒体内容认证以及多媒体篡改检测等方面。多媒体哈希是从多媒体中提取出来的、基于内容的一种简洁表示。通过多媒体哈希算法可将任意的多媒体数据映射成一串短小的哈希序列。在实际应用中,用哈希序列来代表多媒体本身,能够有效降低多媒体数据的存储代价和多媒体相似计算的复杂度。一般而言,多媒体哈希必须满足两个基本条件,即鲁棒性和唯一性。鲁棒性指是即使两个多媒体的具体数据表示不同,如果它们在视觉上相同,那么它们应该具有相同或非常相似的哈希。换言之,多媒体哈希需要具备对抗正常数字操作的能力,例如数据压缩和几何变换等。而唯一性则要求不同的多媒体应该有不同的哈希,这意味着不同多媒体的哈希之间的距离应该足够大。此外,多媒体哈希在一些实际应用中可能还需要具备其他的特性。例如,在多媒体内容认证中,多媒体哈希的提取需要密钥来控制并且多媒体哈希需要对内容变化敏感。本文研究多媒体哈希算法,主要研究对象是多媒体中的视觉媒体,即图像和视频。具体而言,本文利用张量分解(Tensor Decomposition,TD)和非负矩阵分解(Non-negative Matrix Factorization,NMF)设计出两种新的视觉哈希算法。第一种算法是基于TD的图像哈希算法,通过从图像中构造张量,将张量分解应用于图像哈希提取。第二种算法是基于离散余弦变换(DCT)和NMF的视频哈希算法,通过联合DCT和NMF来提取视频哈希序列,实现较好的分类性能。主要研究结果总结如下。1.提出基于张量分解的图像哈希算法张量是一种泛化的高阶矩阵形式。目前,张量分解已经成功应用在多个领域,包括数据挖掘、图像分析、信号处理和计算机视觉等。本文将图像哈希计算被看作是从一个张量中提取出来的一个紧凑的表示,提出了一种基于张量分解的新型图像哈希算法,简称TD哈希算法。为了提高TD哈希算法的鲁棒性,先从规格化的图像中构造出一个稳定的3阶张量,然后运用一种名叫Tucker分解的张量分解方法将3阶张量分解成1核心张量和3个正交因子矩阵。由于因子矩阵可以反映原始张量的内在结构,因此TD哈希算法利用因子矩阵来构造哈希序列,确保算法具有较好的唯一性。选取14551幅图像作为实验数据来测试算法性能,接收机操作特性(ROC)曲线的对比实验结果表明,TD哈希算法的分类性能和哈希长度均优于多种文献的图像哈希算法。2.设计基于DCT和NMF的视频哈希算法本文联合使用DCT和NMF来提取视频哈希序列,设计出一种新的视频哈希算法。该算法先对输入视频进行预处理,得到规格化的视频,然后将视频帧进行分组,对于每个帧分组,用随机分块策略提取帧数据并计算DCT系数,通过DCT系数来构造帧分组的特征矩阵,最后利用NMF从特征矩阵中学习短小的特征码,串联所有分组的特征码即可生成最终视频哈希。实验使用2050段视频数据来验证哈希算法性能,结果表明本文提出的视频哈希算法对常见数字操作鲁棒并有较好的唯一性。ROC曲线对比实验结果显示,本文视频哈希算法在鲁棒性和唯一性方面的分类能力优于多种文献的视频哈希算法。
其他文献
自电致变色效应第一次被报道以来,在这几十年里,电致变色效应得到了很多的研究,很多电致变色材料被陆续发现和研究,各种各样的电致变色器件也被发明和研究,应用到科研、军工
车牌筛选可以看做是一种对车牌识别的预处理过程。通过筛选出能够被识别的车牌图像,以及分析不能够识别的图像,修正车牌图像采集系统误差,来达到提高车牌识别准确率的目的。
随着微电子、嵌入式和通信等技术的发展,无线传感器网络以其无限应用前景得到了广泛关注。由于硬件设备、通信质量和周围环境等因素的影响,传感器节点所采集的感知数据具有不
图像特征提取是图像识别及机器视觉应用的关键,快速、准确提取图像特征是图像处理的首要任务。而传统的图像处理技术不够完善,存在由于特征提取算法的计算量巨大而导致整个系
集成电路(integrated circuit,IC)测试是IC产品制造过程中不可缺少的环节。它既要保证IC芯片的正确逻辑,又要保证IC芯片在规定的时间内做出正确的响应。随着IC系统工作频率的
在大数据时代,我们每天都会有数以万计的信息急需处理。作为一种直观的信息表达方式,图像早已普遍应用到各行各业中。如何快速且高效地实现图像分类是值得探究的热点问题之一
数据持有者经常需要将数据库对外发布以供研究或其它用途,而发布的数据中往往会包含有大量个体的隐私信息。在正常情况下这些发布的数据会被合理使用,但是与此同时这些数据也
近年来,机器视觉技术发展迅速,图像特征提取作为计算机机器视觉处理中的一个热门领域,在残缺字符处理、字符信息恢复等方面应用广泛,为古籍研究以及近现代残损书籍的还原和留
随着社会经济的发展,车辆越来越多。早晚高峰期城市道路出现过饱和的交通状态越来越频繁,交通拥堵日益严重,造成了车辆延误和行程时间的增加。过饱和交通状况引起的交通拥堵带来巨大的经济损失和社会代价。因此,有必要寻求一种高效的交通信号控制方法来协调城市交通流。交叉口作为交通信号控制的瓶颈,是交通协调控制的基础,而主干道作为城市交通的重要承担者,是交通协调控制的主要对象。因此,本文通过对交通流演化规律进行分
哺乳动物能够将它们所处的环境在大脑内部表示出来。位于海马体中的位置细胞只对环境中的某几个位置放电。位于内嗅皮层的栅格细胞对环境中的许多位置放电,其放电在二维空间