论文部分内容阅读
近年来,二值编码快速的处理速度和低廉的存储空间,使得哈希方法的探索与改进获得了研究者们的广泛关注。二值编码法常应用于图像检索领域,它的主要目的是通过汉明距离为输入图像返回数据库中最近似的图像。哈希作为最常见的二值编码法,可简单地将它分为随机型哈希和学习型哈希两个类别。随机型哈希通过随机生成映射向量来获得哈希函数,生成的哈希函数能够大概率地让近邻样本得到近似的二值编码。尽管随机型哈希得到了统计学理论的支持,但是在实际应用当中需要高维度的二值编码才能获得可观的检索精度。相对而言,学习型哈希的主要能力是让二值编码提炼样本中的相似性信息、分布信息、语义信息等,从而获得更好的性能。在视觉目标跟踪的应用中,外观模型的主要任务是为跟踪算法提供选取候选样本的方式。模板匹配是一种常用的置信计算方式,然而模板与候选样本之间相似度计算耗时巨大,令跟踪方法很难取得快速的处理速度。利用二值编码表示图像物体可以显著降低相似度计算的时间。有鉴于此,在文章中作者提出了能够应用于目标跟踪算法的多特征语义鉴别哈希算法。算法融合了多个具有鉴别力的特征来生成哈希函数,并通过函数将样本和模板都映射为二值编码,接着利用汉明距离来计算候选样本的置信。除此之外,为了使哈希模型适应场景变换和提高更新速率,算法还利用增量学习的方法来实时更新哈希函数。对比实验揭示:在不同场景下,多特征鉴别哈希跟踪法能够鲁棒地对视觉目标实施跟踪。在最近邻图像检索领域,大多数学习型哈希通过学习样本间的相似性,例如邻域结构,来获得哈希函数,并获得了非常可观的检索精度。然而,度量样本间的相似性依然使得模型很难区分近似类别的样本。为了解决这一问题,文章中提出了旨在降低语义信息损失的类别关系度量。基于传统的样本间相似性度量和提出的类别关系度量,文中设计了语义编码与相似性保持映射框架,其主要思想是构建一个统一的映射空间来同时度量样本相似性和语义信息。此模型包含两个重要组件:(1)相似性保持;(2)语义编码。基于这两个组件,将样本特征和语义编码映射到统一的空间中,优化得到的低维映射可以很好保持样本的相似性信息和语义信息。利用提出的映射框架,作者通过将映射空间逼近于汉明空间的方式进一步提出了一个有效的哈希方法。充足的实验证明了所提出的哈希方法能够取得良好的检索精度,对比近几年所提出的哈希方法有明显的性能优势。最近邻图像检索仅能完成单一语义的图像检索任务。实际情况下图像经常含有多层次的语义信息,而传统的哈希方法并没有很好利用这样的层次语义信息。举例来说,boxer狗图像有两个层次的标签“boxer”和“dog”。鉴于这种现象,文章中提出了一种由精到粗相关性图像检索法,其主要目标是:首先返回与输入样本最近似的样本;接着返回弱相关的样本。为了度量算法在由精到粗相关性图像检索上的性能,设计了一种能同时度量各个语义层次检索精度的新指标,即FC(Fine to Coarse)度量。考虑到目前的哈希方法并不能有效处理语义层次相关性的图像检索问题,作者提出了一个简单有效的语义编码哈希方法。语义编码哈希通过生成和调整输出编码达到植入层次语义信息的目的。多样化的实验表明了由精到粗相关性图像检索的实用性,以及所提出的哈希方法能够很好地完成按语义相关性顺序检索的任务。随着互联网数据量的不断增长,图像数据也呈现大规模增长的趋势。数据的不断涌入会使得数据分布产生变化,因而初始训练的哈希函数会逐渐缺乏鉴别力。近年来在线更新的哈希模型被提出,一定程度解决了哈希在线学习的问题。然而随着数据规模的不断加大,样本二值编码的更新将变得非常耗时。为了降低这部分耗时,文中提出了一个加快更新速度的方法,称之为局部哈希更新。局部哈希更新法的基本思想:选择部分哈希函数进行更新,从而减少了哈希函数以及对应编码的更新数量,达到节约处理时间的目的。作者提出了一个贪婪式的哈希函数选取框架,并利用相似性保持的损失函数来选取部分哈希函数。实验揭示局部哈希更新法两大特性:(1)该方法能够有效地提高更新速度;(2)该方法能够最大程度地保持原有函数的鉴别力。最后,本文总结了所提出的哈希方法的特点及其应用场景,同时讨论了方法的优劣并给出了未来可能的拓展工作。