论文部分内容阅读
随着智能手机的普及、社交平台的发展以及数据存储技术的提高,人们每天在互联网生活中产生了海量数据,特别是图片、视频为主的多媒体数据。如何高效存储这些数据并对数据进行快速检索,引发了众多科研人员的关注。其中,哈希学习通过将图像从高维特征转换为低维的二值码,大大减少了图像存储所需的存储空间、增强了图像检索的效率,并缓解了图像高维特征所带来的维度灾难问题。哈希学习算法有两大类别,分别为数据独立哈希算法和数据依赖哈希算法,其中数据依赖哈希算法又非为非监督学习算法和监督学习算法。相比其他算法,监督哈希算法因为同时利用到数据的特征信息和类别信息,因而获得了更好的性能表现。但是在监督哈希算法中,需要人们预先标注大量待编码的图片,供哈希学习算法进行预训练。在大数据时代,随着不断涌现的新数据,昂贵的人工标注和耗时的预训练过程阻碍了哈希学习算法在实际图片检索过程中的应用。另一方面,哈希算法也存在着计算机视觉中的一大经典问题,即语义鸿沟问题。语义鸿沟指的是计算机所理解的低层次的图片特征信息和人类所理解的高层次的图片语义信息往往是不一致的。针对哈希学习中的问题,本论文提出一种新颖的哈希学习算法,称为属性哈希算法。属性哈希算法在训练过程中通过已知类别学习哈希模型,在测试阶段的时候未知类别通过属性信息构建起和已知类别的关联,然后利用已经学习好的哈希模型对图片进行正确的编码。属性哈希算法规避了传统哈希算法的人工标注过程和预训练过程,为实际应用哈希算法进行图片检索带来了希望。属性哈希算法通过构建图片在特征空间、哈希码空间、属性信息空间、类别空间之间的关联,将属性信息融入到哈希学习过程中,降低了哈希学习中的语义鸿沟问题。因为离散条件的限制,哈希算法的求解过程往往是一个NP难问题。一些哈希算法通过松弛离散条件,得到一个次优解。属性哈希算法直接求解图片对应的0和1哈希二值码,而不是求取其近似解,因而有更高的精度。本文将属性哈希算法与一些经典的哈希算法在AWA,CIFAR10,IMAGENET数据集上进行对比,实验结果表明属性哈希算法在一些实验指标上远超其他算法,显示了优秀的图片检索性能。