面向图像检索和分类的监督哈希方法研究

来源 :山东大学 | 被引量 : 0次 | 上传用户：cs_200901

【摘要】

：

近年来,随着社会和经济的快速发展,互联网技术在我们的日常工作和生活中扮演着越来越重要的角色,而且随着电子设备和社交媒体的普及,多媒体数据(文字、图像和视频等)增长迅速

【作者】

：

冯璐

【机构】

：

山东大学

【出处】

：

山东大学

【发表日期】

：

2017年期

【关键词】

：

哈希学习图像检索图像分类近似近邻检索

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

近年来,随着社会和经济的快速发展,互联网技术在我们的日常工作和生活中扮演着越来越重要的角色,而且随着电子设备和社交媒体的普及,多媒体数据(文字、图像和视频等)增长迅速。图像因其丰富的内容和强有力的表达形式更是深受人们的喜爱,并呈现指数型的增长趋势,这就为图像的检索和存储带来一定的挑战。最近邻算法是信息检索中的经典方法,但是在大规模的数据中进行精确的最近邻查找是非常困难的。为了解决这一问题,近似近邻查找算法得到广大研究者的青睐。这种算法因其效率比较高,复杂度相对较低,结果相对准确,在近些年来成为学术研究的热点。对于相似性检索,传统的方法是利用数据的原始特征进行相似性度量。当数据量较小时,这种方法效果比较好。但随着数据量的增大和特征维数的增高,特征匹配因其极高的计算复杂度变得不再适用,同时对设备的存储性能带来了极大的挑战。于是,哈希方法应运而生。基于哈希的方法因其优越的计算和存储性能在近些年来发展迅速,受到越来越多学者和研究人员的关注。基于哈希技术的相似性检索方法将原始空间的数据特征信息映射到二维的海明空间,同时尽可能的保持原始数据的局部特性、语义信息等。通过计算哈希码两两之间的海明距离,近似近邻检索能够很快的返回检索结果。哈希方法具有线性的检索复杂度并且通过将数据转化为紧致的二进制哈希码,大大的降低了存储代价,更有效的利用存储空间,提高了存储设备的性能。因此,由于哈希方法具有很高的性能,进而能够更好的应用到大规模的数据检索任务中。哈希方法可以根据学习过程中是否利用标签分为两类:非监督方法和监督方法。监督哈希方法目的是在哈希码学习过程中充分利用训练数据的特征以及标签,使得学到的哈希码能够保持原始数据的语义特性,因而相对于非监督哈希方法来说具有更高的准确性,更能运用到一些实际的应用中。如今有很多监督哈希方法被研究出来,有一些也有不错的效果。但是大部分的哈希方法都是用来做检索任务而不能用来分类。也就是说,我们并不能够利用哈希码来预测数据的类别,即使哈希码本身含有丰富的语义信息。这是一种极大的信息损失。并且如果我们可以直接利用哈希码进行分类,哈希方法则在实际项目中发挥更高的价值。针对这一问题,我们提出了一种可以进行标签预测的监督哈希学习方法,称为类图保持哈希。这种哈希方法能够将语义标签信息与哈希码融合在一起,学到的哈希码具有丰富的语义信息,并利用学到的映射矩阵和哈希码,直接预测检索数据的标签。该方法首先通过同时保证标签的一致性和保持类图相似性学习到哈希函数,再通过最小化哈希码跟哈希函数之间的量化误差学到哈希码,同时提出了一种迭代的优化方法。该方法在三个图像数据集上进行了实验,并与当前效果比较好的集中哈希方法进行了对比。实验结果表明无论在图像检索还是分类任务上,类图保持哈希都有着比较好的效果。但是,现实生活中只有极少的图片是本身就带有标签的,而大部分图片都没有标签信息。如何能利用少量的标签信息在大规模图像中做检索,是半监督哈希方法所关注的问题。如今很多半监督的哈希方法为了能更好的对目标函数进行优化,往往采用先松弛再对连续数据阈值化的方法,这样会有一些信息损失。并且,为了更好地利用图像本身的特征,很多方法都用了相似性矩阵来保持相似性,而相似性矩阵一般都是n×n的,计算和存储都相当耗时,甚至在大规模的数据集上无法运行。为此,我们提出了一种半监督图割哈希算法,能够利用图割的优化方法直接对哈希码进行优化,减少了因松弛带来的信息损失。同时,我们将相似性矩阵用稀疏嵌入的方法进行了降维,加快了计算的速度。我们在两个数据集上进行了实验,实验结果说明了我们提出的半监督图割哈希在部分标签上与其他几种哈希方法相比,具有比较好的效果。

其他文献

植物启动子识别算法研究

随着人类基因草图的绘制完成,基因组学研究已进入了“功能基因组学"时代,如何在海量的序列数据中确定基因及它们的调控网络已经成为目前最具挑战性的任务。启动子作为控制基

学位

植物启动子识别GC偏好SVM分类器结构特征信号特征DNA双链特征

一种基于扩展WSDL的Web服务测试数据自动生成方法

随着互联网时代和技术的发展进步，以高度可集成性、松耦合性、可复用性和数据信息规范性为特点的SOA应运而生，并获得了人们的青睐。WEB服务是SOA的实现方式之一，它以XML、WSDL、

学位

Web服务测试数据生成扩展WSDLIPOG算法

多租户软件中动态个性化配置与定制技术研究

随着互联网技术的成熟,“软件即服务”的思想在软件行业中得到了确认,软件由传统意义上的产品转变为服务。在SaaS技术的发展过程中,多租户软件的发展尤为引人注目,其最主要的

学位

SaaS多租户约束依赖可变点模型个性化定制点定制管理引擎

支持向量机在非球形分布数据集和肿瘤基因中的应用研究

支持向量机是利用最优化方法来解决机器学习问题的新工具,是20世纪90年代中期由Vapnik[1]等人提出的。仅十几年的时间,不论是在理论上还是在应用上都有了突破性的进展。支持

学位

支持向量机噪声等价类基因表达谱肿瘤分类基因选择

基于多传感器融合的三维目标跟踪

三维目标跟踪是计算机视觉领域的基础性问题,一直以来都是国内外学者们的研究热点。经典的基于模型的三维跟踪方法是将三维模型投影出的边与图像中的边进行对齐的配准过程,而

学位

三维目标跟踪惯性测量传感器姿态估计粒子滤波

物流领域本体关系数据库的构建研究

本文的主要研究工作来源于河南省重点科技攻关项目(No.102102210409)“物流公共信息平台领域本体的构建”与河南省教育厅基础研究项目(No.2009B520014)“基于语义Web本体学习

学位

物流本体OWL关系数据库本体存储本体查询

上近似的近似信息挖掘及应用研究

粒计算（Granular Computing）是近年来智能研究领域中的一门新兴学科，是解决复杂问题和模拟人类思维的一种新方法。众多学者对该问题的兴趣以及各方面研究成果的出现，使得对其的研

学位

粒计算n阶粒划分上近似数据识别不精确推理

基于形状的非均匀光学层析图像重建算法研究

光学层析成像是近年来广为关注的一种新型医学成像技术。它以近红外光作为光源照射生物组织，对组织体的光学属性参数进行成像。由于组织的光学属性参数与组织中的血流量以及血

学位

光学层析成像扩散方程有限元形状重建算法图像重建

A Dissertation Submitted to Zhejiang University for the Degree of Doctor of Philosophy

随着图形硬件的飞速发展和虚拟现实系统、电影游戏制作等领域对高真实感图片的需求增加，关于高性能图形绘制技术的研究变得更加重要和迫切。高性能的图形绘制要求在保证绘制质

学位

加速结构光线跟踪图形处理器运动模糊并行计算图形绘制

网络安全状态演化动力学研究

随着计算机网络规模的不断扩大和应用的不断深入，影响网络安全和性能的因素变得越来越多，相互之间的关系也越来越复杂。如何使网络更加安全和稳定的运行已经成为网络管理者所面

学位

网络安全传播动力学同步动力学社团结构复杂网络

面向图像检索和分类的监督哈希方法研究

与本文相关的学术论文