基于手绘草图的跨域图像检索技术研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:lalabingku
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于草图的跨域图像检索旨在根据输入的手绘草图与数据库中彩色图像的相似性度量返回彩色图像排序结果。该检索可以在基于文本的图像检索不准确或基于内容的图像检索中彩色图像难以获得的情况下,通过输入手绘草图完成图像检索任务。虽然相对于传统的图像检索算法,现有的草图检索算法效果得到了较好的提升。但是草图与彩色图像的特征映射与跨域检索等问题仍然没有得到较好的解决。因此,本文从网络结构与多损失函数优化两个方面,提出了两种基于草图的跨域图像检索算法。
  在网络结构优化方面,本文提出了一种基于混合网络的草图检索算法。该模型由一个草图特征提取网络分支和两个相同的彩色图像特征提取网络分支构成。彩色图像特征提取网络分支由异构特征融合网络组成,将彩色图像及其草图近似图(彩色图像轮廓)输入两支并行特征提取网络并在全连接层进行特征融合。通过这种方式,异构融合网络可以学习到同时包含图像细节与轮廓信息的跨域共享表示特征,将共享特征作为彩色图像特征以减小草图与彩色图像的跨域差异。此外,本文使用草图数据扩充方法,同时结合三元组损失函数与多步训练方式对网络进行训练。最后通过对模型参数分析与网络结构设置等探索优化检索结果。
  在多损失函数优化方面,本文提出了一种基于多监督学习的草图检索算法。该算法采用多子网络联合监督优化的方式最大化域内和域间特征的相关性,学习跨域特征间的公共表示。针对域内学习,本文提出在特征提取网络后加入分类子网络与重建学习子网络,以实现域内类别可区分性以及域内高层语义特征一致性;针对域间学习,本文提出在特征提取网络后加入跨域同分布学习子网络与三元组排序子网络,以保证草图与彩色图像在同一空间中的同分布映射以及域间同类特征的聚类。最后通过对模型分析并与其他方法对比总结,证明该算法的有效性。
其他文献
纳米材料具有非常广泛的用途--比如日常用到的碳黑、钛白粉颜料(TiO)或者通讯中的光学纤维等,其制备方法的研究越来越受到重视.其中化学沉淀法(CVD)是制备纳米粉体的一种很有效的方法.由于颗粒尺寸、尺寸分布状况以及形态等特性对颗粒产品的性能都产生极大的影响,必须对生产装置的结构和操作参数要有很好的了解和控制,这也是该文研究的重点.该文应用CFD商业软件FLUENT,对火焰CVD法合成二氧化钛纳米颗
学位
干法、半干法烟气脱硫工艺与传统的湿法烟气脱硫工艺相比具有投资费用低、能耗小、脱硫产物为干态、易于处理等优点.该文通过阅读大量的文献发现:吸收剂利用率低是限制干法、半干法烟气脱硫应用的重要原因.因此提高石灰的利用率是完善干法、半干法烟气脱硫技术并使其具有经济性上的竞争力关键技术之一.该文首先利用飞灰和Ca(OH)经水合反应制取钙基吸收剂,并测定吸收剂样品的比表面积.水合后吸收剂比表面积大约是飞灰及纯
学位
剩余电流监测在各类用、配电系统是必不可少的一项安全措施,近些年来,随着开关器件的创新与发展,产生的剩余电流波形变得越来越复杂,并逐渐向高频化发展,给剩余电流检测技术带来了更大的挑战。  传统的AC型剩余电流保护器只能对低频交流进行检测,而A型保护器能对低频交流及脉动直流进行检测,面对剩余电流高频化的趋势,两者已经不能满足电力系统保护要求,B型保护器应运而生。在非接触式微弱电流检测中,磁通门技术由于
本文设计并制作了一款用带状纳米材料修饰的基于微波带阻滤波器的超高速、高灵敏度湿度传感器。应用所设计的交指电容,在2GHz到12GHz的频段内确定了两个水蒸汽敏感检测频率。优化后的双频段微带带阻滤波器获得了更高的响应和更好的品质因数,提高了湿度传感器灵敏度。为了研究微波湿度传感器的性能,将修饰了氧化钼敏感材料的传感元件置于湿度测试腔中,在室温环境下实现了对五个湿度等级的测试。测量结果表明,插入损耗从
随着激光技术的飞速发展,激光测距技术已被广泛应用于各个领域,激光测距技术具有大量程、高精度等特点,是高精度距离测量中最重要的技术之一。本文主要研究两种激光测距技术:基于单光子探测的激光测距技术和基于线性调频连续波的激光测距技术;第一种适用于远程激光测距和探测微弱回波信号,第二种适用于高精度、无合作目标配合的大型空间精密测量;两种激光测距技术对于航空航天以及大型制造领域具有重要意义。  本文基于以上
学位
3D视频通过增加视点数目、深度数据等方式提供立体深度感知。作为3D视频的重要组成部分,深度视频反映了场景中物体的远近和分布状况。与传统的平面彩色视频相比,深度视频具有显著的差异,因此需要研究更为高效的深度视频压缩编码方法。近年来,以卷积神经网络为代表的深度学习技术快速发展,在视频处理和计算机视觉理领域取得了丰硕的成果,为进一步提高深度视频编码性能提供了新的思路。本文以卷积神经网络技术为基础,基于深
雨是最常见的气候现象,在雨天环境下,视觉传感器拍摄到的图像和视频会严重退化,出现模糊、细节丢失、颜色失真等现象。这些现象在影响视觉效果的同时,也会导致视觉处理算法如图像分类、目标检测、图像分割等性能的下降。因此,研究图像去雨对提升室外计算机视觉系统的稳定性有重要的意义。单幅图像去雨方法缺少图像序列之间的时间信息,相对于视频去雨具有更大的挑战性。本文围绕单幅图像去雨任务展开工作,主要工作内容和研究成
目标跟踪是指在第一帧中利用矩形框手工标注跟踪目标,计算机通过特有算法框架,精确定位出后续视频帧中目标位置。近年来随着计算机硬件及图像处理能力的提高,目标跟踪吸引了越来越多的关注。由于卷积神经网络在特征提取中的强大能力,目标跟踪领域的前沿研究主要基于深度学习和神经网络。现有的方法存在以下两个问题:1)目前目标跟踪任务中,由于训练数据集中困难样本缺少且覆盖的情况太少,导致基于“数据驱动”的深度学习网络
学位
协同显著性检测是指从一组图像中检测出共有的、显著的前景目标,在场景分割和目标跟踪等领域起着重要的作用。如何计算图像内和图像间显著值是算法中最关键的步骤,然而现有很多算法没有探索更多的表征图像内和图像间关系的特征信息,故当图像组背景环境复杂、前景目标混乱不易区分时,无法准确地检测出前景目标。  为了探索更有效的特征信息、弥补颜色特征的局限性,本文提出了一种基于对象性和多层线性模型的协同显著性检测算法
随着多媒体技术和互联网的发展,图像逐渐成为一种简单高效的信息承载方式,在人们的日常生活中发挥着至关重要的作用。然而,图像在获取、处理、传输和存储的各个阶段都有可能产生质量退化效应,不仅影响用户的视觉体验,而且不利于后续的应用。因此,通过分析和建模提出有效的图像质量评价方法具有重要意义。图像信号通过人眼接收并传递给视觉皮层,人眼视觉系统决定了图像以何种形式被解释和理解,从而产生美观与糟糕等主观判断。