论文部分内容阅读
近年来,随着社会和经济的快速发展,互联网技术在我们的日常工作和生活中扮演着越来越重要的角色,而且随着电子设备和社交媒体的普及,多媒体数据(文字、图像和视频等)增长迅速。图像因其丰富的内容和强有力的表达形式更是深受人们的喜爱,并呈现指数型的增长趋势,这就为图像的检索和存储带来一定的挑战。最近邻算法是信息检索中的经典方法,但是在大规模的数据中进行精确的最近邻查找是非常困难的。为了解决这一问题,近似近邻查找算法得到广大研究者的青睐。这种算法因其效率比较高,复杂度相对较低,结果相对准确,在近些年来成为学术研究的热点。对于相似性检索,传统的方法是利用数据的原始特征进行相似性度量。当数据量较小时,这种方法效果比较好。但随着数据量的增大和特征维数的增高,特征匹配因其极高的计算复杂度变得不再适用,同时对设备的存储性能带来了极大的挑战。于是,哈希方法应运而生。基于哈希的方法因其优越的计算和存储性能在近些年来发展迅速,受到越来越多学者和研究人员的关注。基于哈希技术的相似性检索方法将原始空间的数据特征信息映射到二维的海明空间,同时尽可能的保持原始数据的局部特性、语义信息等。通过计算哈希码两两之间的海明距离,近似近邻检索能够很快的返回检索结果。哈希方法具有线性的检索复杂度并且通过将数据转化为紧致的二进制哈希码,大大的降低了存储代价,更有效的利用存储空间,提高了存储设备的性能。因此,由于哈希方法具有很高的性能,进而能够更好的应用到大规模的数据检索任务中。哈希方法可以根据学习过程中是否利用标签分为两类:非监督方法和监督方法。监督哈希方法目的是在哈希码学习过程中充分利用训练数据的特征以及标签,使得学到的哈希码能够保持原始数据的语义特性,因而相对于非监督哈希方法来说具有更高的准确性,更能运用到一些实际的应用中。如今有很多监督哈希方法被研究出来,有一些也有不错的效果。但是大部分的哈希方法都是用来做检索任务而不能用来分类。也就是说,我们并不能够利用哈希码来预测数据的类别,即使哈希码本身含有丰富的语义信息。这是一种极大的信息损失。并且如果我们可以直接利用哈希码进行分类,哈希方法则在实际项目中发挥更高的价值。针对这一问题,我们提出了一种可以进行标签预测的监督哈希学习方法,称为类图保持哈希。这种哈希方法能够将语义标签信息与哈希码融合在一起,学到的哈希码具有丰富的语义信息,并利用学到的映射矩阵和哈希码,直接预测检索数据的标签。该方法首先通过同时保证标签的一致性和保持类图相似性学习到哈希函数,再通过最小化哈希码跟哈希函数之间的量化误差学到哈希码,同时提出了一种迭代的优化方法。该方法在三个图像数据集上进行了实验,并与当前效果比较好的集中哈希方法进行了对比。实验结果表明无论在图像检索还是分类任务上,类图保持哈希都有着比较好的效果。但是,现实生活中只有极少的图片是本身就带有标签的,而大部分图片都没有标签信息。如何能利用少量的标签信息在大规模图像中做检索,是半监督哈希方法所关注的问题。如今很多半监督的哈希方法为了能更好的对目标函数进行优化,往往采用先松弛再对连续数据阈值化的方法,这样会有一些信息损失。并且,为了更好地利用图像本身的特征,很多方法都用了相似性矩阵来保持相似性,而相似性矩阵一般都是n×n的,计算和存储都相当耗时,甚至在大规模的数据集上无法运行。为此,我们提出了一种半监督图割哈希算法,能够利用图割的优化方法直接对哈希码进行优化,减少了因松弛带来的信息损失。同时,我们将相似性矩阵用稀疏嵌入的方法进行了降维,加快了计算的速度。我们在两个数据集上进行了实验,实验结果说明了我们提出的半监督图割哈希在部分标签上与其他几种哈希方法相比,具有比较好的效果。