手绘草图内容识别与检索的研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:a5477011266
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数字时代的发展,每个人都可以成为多媒体资源的发布者,每时每刻都有海量的图像被上传到分布在世界各地的服务器中,图像检索也逐渐成为各个搜索引擎不可或缺的一部分。其中基于内容的图像检索(CBIR)使用图像本身作为查询数据,在数据库中搜索并返回与图像视觉内容或语义最为相似的图像,由于其便利的操作和图像本身包含的更多信息,相比于仅使用文字进行检索,CBIR更有机会和潜力返回用户所需的结果,是当前多媒体检索的主要研究方向之一。触屏设备的普及带来了交互方式上的巨大变革,基于手绘轮廓的图像检索(SBIR)是CBIR的一个分支,SBIR使用用户的手绘图像作为检索数据进行图像检索。相比于CBIR,用户无需去寻找特定的图像,可以更加自由地创造心中所想的内容进行检索。同时,物体的轮廓是人类主观感知的重要组成部分,是对物体的高度抽象的描述,检索数据符合人类的直觉。手绘轮廓草图内容抽象且有明显的不规则形变,为图像的检索带来了困难。本文首先针对手绘草图与现实世界图像之间存在的旋转、尺度、位移(RST)等差异,以及草图线条的形变现象提出了一种具有RST不变性的SBIR方法。为了消除尺度与位移的影响,本文通过显著性图与图像轮廓的结合来确定图像的主体区域,并只对主体区域进行匹配。利用局部图像特征的压缩与近邻搜索匹配来减轻线条不规则形变带来的影响。通过图像区域的分割和最小权值完美匹配的使用来获得旋转不变性。在三个数据集上的实验验证表明,本文的方法在自然图像与商品图像的检索上均获得了比现有方法更好的准确性。由于手绘草图高度抽象的特性,部分手绘草图如果仅使用轮廓上的匹配难以检索到正确的结果。如果可以识别出用户绘制的具体内容,那么就可以用图像的语义信息辅助检索。本文针对这种现象,通过手绘草图底层特征和中层特征的结合,利用不同类别之间的相似性训练获得两轮分类器。本文将视觉上的相似性与手绘图像想表达的隐藏含义相结合,实验表明本文的方法不仅提高了手绘草图分类的准确率,也提高了对应的检索效果。
其他文献
目标跟踪是计算机视觉研究领域重要的一环,在日常生活生产中也有广泛应用,但是由于视频序列中往往存在光照变化、遮挡、尺度变化、旋转、背景纷杂等技术难点,开发鲁棒的目标
火灾已成为我国常发性、破坏性和影响力最强的灾害之一,一旦发生将造成人员和财产的巨大损失,因此开展对火灾的预警研究,具有非常重要的意义。为了及早的发现和控制火灾的蔓
人类拥有在任意复杂图像中快速识别显著目标或区域的能力,为人类视觉神经系统进一步处理图像做出准备。视觉显著性的任务是使用计算机模拟人的视觉系统,检测出图像中的显著目
近来,认知无线电被认为是无线通信的“下一个大事件”,它能有效地使用利用率较低的授权频谱资源,从而提高频谱使用率以解决无线电频谱资源紧缺的问题。认知无线电技术研究的
极化干涉SAR综合了干涉SAR和极化SAR的优点,能够反映目标的物理特性和空间分布特性,从而大大拓展了SAR在微波遥感领域的应用。极化干涉SAR技术利用全极化数据,通过相关矩阵特
移动通信技术发展至今,数据信息传输的可靠性和高效性一直是研究的热点问题,能在低功耗情况下保持信息高速正确的传输是通信系统的主要目标,而信道编解码技术可以有效的解决
随着车辆的不断增加,交通问题越来越受到关注。其中,因为疲劳驾驶产生的交通事故成为了一个重大社会问题。因此,寻求一种车载、实时、客观的疲劳驾驶检测技术,对于减少因为疲
作为计算机视觉、图像处理和模式识别领域最活跃的研究方向之一,目标跟踪技术在军事、安全监控、人机交互和机器人等多种领域都有着极其重要的应用价值。目前,国际上目标跟踪
随着多媒体技术和互联网技术的快速发展,互联网上的图像数量呈爆炸式增长。同文字信息相比,基于视觉的图像更加生动、易于理解,这种优势使得数字图像的应用范围非常广泛,比如
随着宽带业务发展和智能终端设备的广泛普及,网络服务已经逐渐融入社会各个行业,业务种类更加趋于多样化和宽带化。传统光网络采用WDM技术实现端到端业务的通道化“透明”传