论文部分内容阅读
信息爆炸式增长导致信息呈现规模大、模态多、特征维度高的特点,这些特点对信息处理带来新的挑战。在信息检索领域,寻找样本的最近邻是核心工作。然而,由于数据这些新特点导致最近邻检索出现计算复杂度高、存储量大的问题。哈希技术由于其存储量低、检索速度快的优点,受到越来越多的重视。同时多媒体数据呈现多源异构特点,跨模态检索方法也成为热门研究课题。最近越来越多的跨模态哈希方法涌现出来。然而它们主要存在几个问题:(1)算法训练复杂度高。主要原因有:一方面,模型训练需要学习各个模态的哈希函数,使得迭代优化更加困难。另一方面,单个模态内部获得理想的哈希函数也需要消耗大量计算资源。(2)忽视哈希量化损失。常见的算法主要将异构的多媒体数据映射到一个共同连续低维子空间,然后量化处理获得哈希码。由于哈希码的离散特点,该问题是一个整数规划问题,直接将哈希码离散约束条件放松的优化方法会带来较大的量化损失,进而影响检索准确率。(3)算法数据库适应能力差。常见的跨模态哈希算法对单标签、多标签、大规模数据库和高维度数据库中的一种或者几种性能良好。但很少有算法能适应各种数据库。针对以上问题,本文以图文检索为例研究跨模态哈希算法的模型设计和优化方法,具体工作如下:(1)针对训练复杂度高的问题,本文提出一种简洁而有效的跨模态哈希算法。该算法首先利用单模态哈希算法从样本的一个模态中获得理想统一哈希码,然后应用线性回归获得其他模态的哈希函数。显然这个非迭代的方法能极大降低计算复杂度。(2)针对哈希量化损失,本文提出离散跨模态哈希方法。该方法通过每次求解一个维度的哈希码直接学习获得离散的哈希码。通过重构语义相似矩阵设计跨模态哈希函数。同时利用监督信息对获得的哈希码进行分类。(3)验证优化方法对结果的影响。跨模态哈希函数的设计非常重要,然而越来越多的论文证明对同一个问题使用不同优化方法,也会极大影响检索效果。因此本文进一步研究传统放松离散约束条件的优化方法和(2)中提到离散优化方法的差别。