论文部分内容阅读
伴随着计算机技术突飞猛进地发展,互联网中的文字、图像和视频信息与日俱增。由于图像信息具有丰富性、直观性的特点,使得图像成为研究者获取信息的重要工具。从海量图像中获取有用信息的图像检索技术已引起越来越多人的关注。目前最流行的图像检索技术是基于内容的图像检索,其利用“按图索骥”的思想查询相似图像。哈希方法可将高维浮点型数据映射成二值编码,其存储成本低、查询速度快,已被广泛应用于大规模数据集的近似近邻检索任务中。在实际应用中,监督哈希比非监督哈希的性能表现更优。本文主要研究监督哈希算法,监督哈希算法根据标签信息,生成紧凑二进制编码,且保留基于原始标签信息的相似性。本文提出一种新的基于学习的监督离散哈希算法,旨在生成线性分类的最佳二进制编码,然而二进制编码的离散约束条件导致目标优化为NP-hard问题。因此,基于监督的哈希算法本质上是离散优化问题。目前,很多哈希方法致力于解决离散优化问题,本文在前人对监督离散哈希研究的基础上进行改进,提出新的算法。原监督离散哈希方法通过引入一个辅助的二进制哈希变量,使用正则化算法解决二进制相关的优化问题,该方法通过交替优化和离散循环梯度下降算法高效地解决了混合整数优化问题,但是操作过程复杂,使得整个过程的时间消耗比较大。本文所提出的算法旨在提高原监督离散哈希方法的计算效率和检索性能。通过分析原监督离散哈希算法,发现该方法中二进制编码进行优化的解决方案依赖于初始值,所得到的二进制编码并不是最优的,而且离散循环梯度下降算法具有贪婪性,使其在迭代期间容易产生局部最小值。本文根据近似偏差项逼近的思想提出简化方案,并证明原监督离散哈希框架可以被简化。改进后的算法不依赖初始值,不再使用交替机制优化算法,并且优化后的算法只为每个类分配二进制编码。通过引入哈达码矩阵获得改进后算法在数学上的精确解。不过新的算法也有一定的局限性:(1)二进制编码的位数是2的幂;(2)数据集比特位的个数大于类的个数;(3)适合处理单标签问题;(4)近似偏差项逼近的思想。本文在三个大型数据集CIFAR-10、MINST和SUN-10上进行实验分析。实验结果表明,在图像检索方面,本文所提出的优化算法较其他方法时间成本低、精确度更高,并且新算法的学习时间和检索性能不依赖于编码长度。另外验证了新算法的位可扩展性、处理多类别的数据集的适用性。