基于深度学习的手绘草图图像检索方法研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:pangyaoyu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于草图的细粒度图像检索(Fine-grained Sketch-based Image Retrieval,FG-SBIR)旨在解决实例级别的草图和自然图像匹配问题。当前FG-SBIR的主要难点在于:(1)草图的构图抽象,而且绘图者水平不一,导致绘图结果差异大。(2)草图标注需要耗费大量的时间和精力,所以草图数据集依旧缺失,目前公开的几个草图数据集中样本数量较少。(3)草图和自然图像差异非常大,而FG-SBIR模型不仅需要学习不同模态的特征,还要将二者映射到同一空间进行距离计算,实现跨模态的检索。(4)FG-SBIR需要解决细粒度的匹配问题,要求模型具有高度的识别能力,能够区分不同的实例图像。本文针对FG-SBIR的相关问题进行了深入研究。在特征学习方面,通过草图识别的方法来寻找最优的草图特征提取模型。针对草图差异性大和数据量少等问题,我们采用基于整形变换的草图数据增广方法进行数据扩充,在草图识别任务中取得了有效的提高。结合草图的视觉信息和时序信息,我们探索了基于卷积神经网络(Convolutional Neural Networks,CNN)、基于坐标序列和基于笔画序列等多种不同的草图识别方法,并分析不同方法的识别效果。在图像检索方面,为了提高模型的辨识能力,本文提出了一种增强式困难三元组构建方法,并通过大量的对比实验证明该方法能够显著提高检索准确率。此外,本文分析了类别信息、权值共享方式对跨模态检索结果的影响,探索更优的FG-SBIR解决方法。
其他文献
目的探讨课题达成型品管圈活动在降低ICU机械通气患者约束率中的效果。方法按时间段将118例ICU行机械通气患者分为对照组57例,研究组61例。对照组实施约束常规护理;研究组针
肌节作为骨骼肌的结构和功能单元,主要由粗肌丝和细肌丝构成,粗肌丝上伸出多个II型肌球蛋白。在骨骼肌收缩时,肌球蛋白会周期性地结合于细肌丝,并对其施加力作用,致使肌丝间
目的:观察单纯GP方案和艾迪注射液联合GP(吉西他滨+顺铂)化疗方案治疗老年晚期非小细胞肺癌(NSCLC)的效果,阐明艾迪注射液对老年晚期NSCLC化疗的效果。方法:将68例60岁以上晚期NSCLC
圆端形不锈钢管混凝土桥墩是一种新型的高性能钢-混凝土组合桥墩,由圆端形截面形式的外钢管以及核心混凝土组成。这种桥墩形式具有抗震性能优越、自重轻、施工方便以及耐腐蚀
我国银行开展中间业务特别是新兴的投资银行业务,可以提升中间业务的利润占比,优化国内银行利润结构体系,为国内银行的稳健经营提供保障。另外它还能提升国内银行的核心竞争力,提
本文以藏汉史料为基础,对第三世达赖喇嘛赴蒙古讲讲说法这一史实进行了细致的补遗和考证,并进而评述了这一史实对16世纪蒙藏关系史的深刻影响。
分析了我国PET瓶成型设备的现状,研究了国际上先进的PET瓶成型设备的技术进展和发展趋势,提出了我国PET瓶成型设备的科学发展方向。以科学发展观为指导,重新认识符合市场发展规
基于提升爆炸箔类火工品一致性与可靠性的目的,结合换能元制备过程,采用故障树分析法(FTA)建立了换能元失效模型,并在此基础上通过感度试验,对各类失效模式进行了验证与分析
本文依据科技进步与居民消费行为的内在机理,构建2001—2010年全国31个省(市、自治区)的面板数据模型,分析了科技进步对全国及不同区域居民消费增长的影响。研究发现:科技进
本文在分析“了”的专家语法规则的基础上,提出了教学语法编写的四原则,并据此对“了”的专家语法规则做了教学上的两级改造:第一级确定了对外汉语教学中“了”的语法项目,第二级