基于跨模态语义引导的视觉零样本检索研究

来源 :天津大学 | 被引量 : 0次 | 上传用户：ricky1281214

【摘要】

：

面对着快速增长的多媒体数据,如何对其进行快速、精准地检索成为了一个亟待解决的问题。传统的图像检索技术对于模型的训练需要大量的标注数据,然而,标注数据的获取十分耗费

【作者】

：

孙裕鑫

【出处】

：

天津大学

【发表日期】

：

2004年期

【关键词】

：

零样本学习跨模态哈希图像检索属性引导语义嵌入

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

面对着快速增长的多媒体数据,如何对其进行快速、精准地检索成为了一个亟待解决的问题。传统的图像检索技术对于模型的训练需要大量的标注数据,然而,标注数据的获取十分耗费人力和物力。为此,学界提出了能够对在训练阶段没有出现的类别进行搜索的零样本检索技术。针对零样本检索技术,本文分别提出了基于嵌入语义损失的零样本检索(Semantic Softmax Loss,SSL)算法和基于属性引导的跨模态零样本检索(Attribute-Guided Network,AgNet)算法。不同于当前的零样本学习方法直接使用线性或双线性方式建立视觉和语义信息的映射,SSL算法充分发掘不同模态之间的数据信息。通过将类别语义描述嵌入到softmax层中,使之成为解决零样本问题的非线性方法。同时,为了减少视觉空间和类别语义描述空间之间的差异,SSL提出对视觉特征和由类别描述生成的视觉特征之间施加L2约束。本文将所提的SSL算法应用于零样本检索任务中,在AwA、CUB和SUN等主流数据集上的实验证明了相比于当前的算法,所提SSL算法对性能有了很大提升。同时,为了进一步验证算法的有效性,本文也将SSL应用于零样本分类任务中,同样取得了很好的分类结果。本文针对零样本学习与哈希检索的结合也进行了探究。当前的零样本哈希算法只关注在未见类上进行基于图像的图像检索,是对单一模态的检索。然而,零样本检索问题可以看做是跨模态检索任务,本文提出基于属性引导的跨模态零样本哈希(Attribute-Guided Network,AgNet)检索算法,对跨模态零样本哈希任务进行了深入研究。AgNet算法将不同模态的数据转化为更高级别的属性语义空间,并利用类别相似度损失函数和属性相似度损失函数构建不同模态数据之间的近邻关系。为了验证所提算法的有效性,本文将AgNet应用于跨模态和单模态的零样本哈希检索任务,在AwA、SUN和ImageNet等三个主流数据集上的实验证明了AgNet算法性能超过当前主流算法。同时,进一步的实验来探究了属性对AgNet算法性能的影响。此外,通过利用可视化手段,进一步分析了AgNet在各个类别间的性能表现,以及在各数据空间中的性能变化,充分证明AgNet算法是一种行之有效的跨模态零样本哈希算法。

其他文献

介质阻挡放电降解2,4-二氯酚的研究

氯酚类污染在环境中广泛存在,在低浓度下即可对生物体健康造成严重危害。低温等离子体作为一种新兴的水处理技术,可以产生多种活性组分,以及紫外光、局部高温等多种物化效应,

学位

DBD等离子体24-二氯酚电导率过硫酸钠过碳酸钠

低噪声车轮腹板开孔最优参数研究

我国高速铁路经过多年的发展,已取得世界领先地位,同时也面临着更多的技术挑战。在现代,高速铁路事业的发展更需要满足智能、高效、环保等一系列的可持续发展理念,所以在高速

学位

高速铁路轮轨噪声开孔腹板腹板强度

基于MOFs复合型催化剂的制备及其光催化性能研究

利用可见光催化降解环境有机污染物是解决未来能源和环境问题的一种有效的方法,这方面的研究受到了研究者们广泛地关注。到目前为止,人们已经设计了许许多多的半导体光催化剂

学位

MOFsFe掺杂ZnIn2S4可见光催化光降解

船舶主海水系统状态预测的研究

船舶设备检修是保障船舶安全可靠运行的关键所在。在传统的检修作业中,轮机员根据船舶系统及其设备的运行状态便可做出准确的判断。然而随着船舶自动化和智能化水平的提高,对

学位

ARIMA模型加权马尔可夫链RBF神经网络模糊综合评判

三维粘滞声波方程有限差分算法研究

正演作为反演的基础,一直是计算数学和地球科学工作者的重点研究对象。每一个地球科学研究人员都希望可以在尽可能符合实际地层复杂度的条件下,使用一种准确、高效、低频散的

学位

粘弹性声波方程ONADM方法并行计算数值模拟

群决策视角下跨海斜拉桥主塔承台施工风险模糊评价与控制

跨海斜拉桥海上承台施工环境复杂、施工不确定性因素多,所以在跨海斜拉桥承台施工期间会有大量不安全因素存在。因此对跨海桥梁施工风险进行评估与控制,提前辨识潜在风险、改

学位

跨海桥梁施工风险评估模糊综合评价群决策

贮料种类对筒仓动态侧压力的影响研究

筒仓在卸料过程中,仓内贮料对仓壁的动态压力是导致仓壁环向破坏的主要原因。然而,目前国内外尚未见准确预测仓壁动态压力的理论。动态压力的形成机理复杂,影响因素众多,其中

学位

大豆小麦深仓浅仓动态压力超压系数流态颗粒流程序

受激布里渊散射快速频率测量的性能优化和实现

瞬时频率测量技术(IFM)作为一种测量未知微波信号的重要手段,被广泛地应用于雷达和电子侦察领域。随着雷达信号带宽的快速增加,传统的电模数转换器(ADC)和超外差接收机面临着

学位

瞬时频率测量模拟信号处理受激布里渊散射微波光子学

miR-30d靶向SOCS1抑制BMSCs成骨分化的实验研究

研究目的在临床上,由于种植体周围炎,拔牙创伤,肿瘤术后等造成的大面积骨缺损修复一直是治疗的难题。许多研究表明微小RNA(miRNAs)参与调控成骨分化的过程。因此,本研究从miR-30d入手,探讨其在骨再生中的调控机制,为骨缺损的修复提供新的治疗思路。材料与方法1.分离培养大鼠骨髓间充质干细胞(BMSCs);实时荧光定量PCR(RT-PCR)明确miR-30d inhibitor转染BMSCs的浓

学位

miR-30d骨再生BMSCs

TiO2改性光催化剂的制备及其光催化降解甲苯的机理探讨

随着能源化工行业的快速发展,大气中挥发性有机污染物（Volatile Organic Compounds,VOCs）排放量逐年增加,给生态安全以及人体健康带来严重威胁。以二氧化钛（TiO2）为基础的光催化

学位

甲苯光催化降解D-TiO2银氮改性碳量子点

基于跨模态语义引导的视觉零样本检索研究

与本文相关的学术论文