论文部分内容阅读
随着时代的高速运转,网络图像和视频数据与日俱增,哈希技术因存储效率高、查询速度快在图像检索领域应用广泛。由于在计算机视觉中卷积神经网络表现突出,深度哈希模型走进人们的视野。然而,目前的深度哈希方法捕获图像特征严重依赖于一阶卷积特征统计,忽略全局结构。为了解决这个问题,论文从模型构建和约束优化的角度循序渐进,利用协方差估计建立有效的深度二阶哈希方法,摆脱图像特征的片面性,为哈希研究开拓了新的方向,具体工作如下:(1)提出了基于类别监督的深度二阶哈希检索模型。以深度哈希方法为基础,利用幂归一化来估计稳健协方差,形成独立结构层,然后按照逐点标签的方式将其嵌入深度网络探索二阶统计信息,并分别借助基于软分配和二分配的交叉熵约束端对端训练实现类别监督,获得全局性和针对性兼备的哈希码。该模型根据top-k精度、准确率-召回率、平均准确率均值三种指标在四个哈希编码位上进行评估,在MNIST、CIFAR-10及NUS-WIDE三个数据集上的表现均优于其他一阶深度哈希算法,说明了所提方法的有效性,有力解决深度哈希捕获图像特征的弱全局性问题。(2)提出了基于双标签的深度二阶哈希检索模型。在基于类别监督的深度二阶哈希检索模型基础上,进一步利用成对标签信息,同时采用两张图像作为网络的输入对,在双输入网络流下进行协方差估计,执行全局的成对哈希特征交互,整个网络在成对相似约束下端对端训练,生成鲁棒的深度二阶哈希码。三个数据集上的结果表明所提方法较其基础网络有明显提升,也优于基于类别监督的深度二阶哈希算法,证明了利用成对标签有助于生成更具判别性的哈希码;同时,与其它代表性深度哈希方法的比较结果再一次证明了方法的先进性,它是深度二阶哈希模型的又一次成功探索。(3)提出了基于类别监督和相似性保持的深度二阶哈希算法。在模型构建的基础上进行约束优化角度的探索,以成对输入的深度高阶哈希码为特征表达,将语义信息添加至双路深度二阶哈希框架,建立类别监督和相似性保持共同约束的机制;此外,为了解决哈希的离散优化问题,采用类哈希码近似二值化,在保证联合优化的同时,极大避免量化误差。实验结果优于基于双标签的深度二阶哈希模型,能够达到先进深度哈希方法的水平,证明了所提出的约束目标和联合优化方法是有效的。