论文部分内容阅读
随着人工智能和计算机视觉的快速发展,图像处理和分析已经成为现代科学研究中不可忽视的重要环节。尤其是在大数据时代,随着电子商品和互联网的普及,几乎每时每刻都会产生大量的图像数据,那么对这些图像大数据进行分析和处理则显得尤为重要。分析和运用这些数据的关键在于图像的特征提取,这也是计算机视觉任务必不可少的一个环节,获得的图像表征则供后续的计算机视觉任务进行分析和计算。本文将对这一关键因素进行研究,主要集中于图像数据的特征提取算法。具体来讲,本文以图像检索为例,探讨了图像检索任务中,如何获得更鲁棒的图像表示,主要的研究内容将围绕以下问题展开:1)在大规模数据集下,如何解决无标签数据集的图像表示;2)如何获得一个轻量型的图像表示;3)在基于内容的图像检索任务下,如何学习一个增量型的特征表示。针对这3个问题,本文分别进行了探索和研究,并最终将本文所研究的部分成果和技术部署到京东人工智能结算台的实际应用中。本文的主要创新点如下:1.旨在以无监督的方式实现有效的图像表示,以用于图像检索。为此,提出了一种交叉维度的加权池化方法。此外,为快速获得权重参数,提出了一种初步的策略来修剪权重的搜索空间,并通过基于网络层的相关性,根据先验知识设计约束规则来实现。基于所提出的权重策略和池化方法,提出了加权多层特征融合的方法来解决相似图像的特征表示问题。2.对于超大型数据集,浮点型格式的高维特征图不仅会导致较高的计算复杂性,而且会占用大量的存储空间。为此,提出了一种通过聚合卷积核的新型图像表示,通过亮化并激活特定的卷积核来实现。卷积核的前n个索引号直接作为离散序列的图像表示元素,从而重建了卷积核与图像之间的关系。本文通过构造图像表示之间的位置敏感相似度定义了离散序列的距离度量方法。3.现有的商品搜索系统主要在固定商品类别的预定义数据库上执行商品识别任务。但是,在实际应用中,通常需要扩展新类别或更新商品数据库中的现有商品。为此,本文提出了一个具有元学习的渐进式商品搜索框架,该框架仅需要较少的带标注的图像和合理的训练时间。本文提出的框架包含一个基于多尺度特征的商品语义提取器,以学习每种商品的区分表示。基于元学习的功能适配器被设计,保证少样本特征的鲁棒性。此外,当在商品搜索过程中批量扩展新类别时,将通过增量权重结合器重构批次少样本特征以适应增量搜索任务。在本文中,首先主要研究了两种不同的图像表示,以及特征融合方法和新的度量距离方法。然后使用了部分工作来解决新定义的图像检索问题,即少样本增量学习任务。最后将本文提出的部分方法和技术部分署到京东人工智能结算台的实际应用中。