论文部分内容阅读
近年来,随着移动互联网技术和移动设备的大发展,媒体数据的规模越来越大,大规模媒体检索任务已经成为一个紧要的问题。因为其快速的检索速度以及十分低的存储消耗,所以哈希学习技术非常适合用来进行大规模媒体检索,已经获得越来越多的关注。并且研究表明,监督哈希方法在实际应用中比无监督哈希方法的效果更好。尽管基于监督哈希方法的媒体检索研究已经有一定的进展,但仍有一些问题需要去解决。比如,大部分的监督哈希方法因为使用了大小为数据量平方的成对相似性矩阵,使得其复杂度高,存储消耗大,不利于应用在大规模数据上。又比如,有一些哈希方法,在模型学习的时候先松弛掉哈希码二进制约束,优化一个松弛后的损失函数进而得到一个实值的解,最后把该解量化成最终的哈希码,这样的学习策略会引入大量的量化误差。本文在基于哈希学习的大规模媒体检索研究方面进行了深入研究。更具体的,我们设计了四种监督哈希模型来进行大规模媒体检索。本文的主要工作和贡献如下:(1)通过分析与观察之后,我们发现属于相同类别的数据的哈希码应相同。在此基础上,我们只需要为每一个类别学习出一个类别哈希码,并使之保持住类别之间的相似性即可。这样,训练的时候便无需考虑具体的样本,从而使得我们的训练时间及空间消耗不再受数据量的限制,因此我们可以在极短的时间内以及极低的内存使用下完成模型的训练,并且可以扩展到大规模媒体数据上。(2)监督哈希学习通用的目标函数涉及到一个数据量平方大小的样本间成对相似性矩阵,这个矩阵的存在使得哈希学习的时间复杂度很高,从而无法进行大规模媒体检索任务。为了解决这个问题,且不采用会导致信息损失的采样技术,我们通过替换目标函数中的一个哈希码项,进而引入了一个大小只与数据量线性相关的中间项。这个中间项是成对的相似性矩阵与标签矩阵的乘积,且是一个可以在优化前预先计算的常数项。通过在优化中直接使用该中间项,我们避免了使用成对相似性矩阵造成的很高的时间复杂度及很大的空间消耗。并且我们使用了离散优化算法去求解哈希码,这样得到的哈希码可以避免引入较大的量化误差。(3)尽管我们已经可以用一个中间项来规避直接使用数据量平方大小的样本间成对相似性矩阵,但是这个中间项是与数据量成线性相关的,当数据量足够大的时候,仍会有很高的消耗。在第四章中,我们提出了另外一种监督哈希方法。类似的,该方法也引入了一个中间项,可以在不采用会导致信息损失的采样技术的情况下,避免在优化过程中直接使用样本间成对的相似性矩阵。这个中间项的大小与数据量无关,只与类别数及特征的维数有关,因此其远小于样本间成对的相似性矩阵。除此之外,哈希码的生成不仅受益于监督信息,还会考虑到数据的特征信息,并且我们采用了一步优化所有位哈希码的离散优化算法。因此,本章提出的方法可以准确并高效地完成哈希码的更新。实验及理论分析均显示了该方法优于现有的监督哈希方法及上一章所提出的方法。(4)除了单个模态内的媒体数据检索,跨模态媒体检索也是值得研究的方向,并且在现实生活中有着广泛的应用。因此我们设计了一种跨模态监督哈希方法。该方法充分考虑了数据的流形结构及语义信息,并且使用离散优化策略以保证哈希码能被准确地学出。我们在公用的数据集上进行了大量的实验,实验的结果表明我们设计的跨模态哈希检索技术是十分有效的。