论文部分内容阅读
随着数字时代的发展,每个人都可以成为多媒体资源的发布者,每时每刻都有海量的图像被上传到分布在世界各地的服务器中,图像检索也逐渐成为各个搜索引擎不可或缺的一部分。其中基于内容的图像检索(CBIR)使用图像本身作为查询数据,在数据库中搜索并返回与图像视觉内容或语义最为相似的图像,由于其便利的操作和图像本身包含的更多信息,相比于仅使用文字进行检索,CBIR更有机会和潜力返回用户所需的结果,是当前多媒体检索的主要研究方向之一。触屏设备的普及带来了交互方式上的巨大变革,基于手绘轮廓的图像检索(SBIR)是CBIR的一个分支,SBIR使用用户的手绘图像作为检索数据进行图像检索。相比于CBIR,用户无需去寻找特定的图像,可以更加自由地创造心中所想的内容进行检索。同时,物体的轮廓是人类主观感知的重要组成部分,是对物体的高度抽象的描述,检索数据符合人类的直觉。手绘轮廓草图内容抽象且有明显的不规则形变,为图像的检索带来了困难。本文首先针对手绘草图与现实世界图像之间存在的旋转、尺度、位移(RST)等差异,以及草图线条的形变现象提出了一种具有RST不变性的SBIR方法。为了消除尺度与位移的影响,本文通过显著性图与图像轮廓的结合来确定图像的主体区域,并只对主体区域进行匹配。利用局部图像特征的压缩与近邻搜索匹配来减轻线条不规则形变带来的影响。通过图像区域的分割和最小权值完美匹配的使用来获得旋转不变性。在三个数据集上的实验验证表明,本文的方法在自然图像与商品图像的检索上均获得了比现有方法更好的准确性。由于手绘草图高度抽象的特性,部分手绘草图如果仅使用轮廓上的匹配难以检索到正确的结果。如果可以识别出用户绘制的具体内容,那么就可以用图像的语义信息辅助检索。本文针对这种现象,通过手绘草图底层特征和中层特征的结合,利用不同类别之间的相似性训练获得两轮分类器。本文将视觉上的相似性与手绘图像想表达的隐藏含义相结合,实验表明本文的方法不仅提高了手绘草图分类的准确率,也提高了对应的检索效果。