【摘 要】
:
随着计算机视觉领域的飞速发展,图像识别作为其中的经典任务取得了惊人的成绩,人脸识别、物体识别都被广泛地应用到了实际的生活场景中。图像识别的发展离不开深度神经网络,然而,深度模型需要通过大量的数据来学习视觉特征与类别之间的映射关系,随着应用范围的扩大,这种学习方式已经难以满足实际场景的应用需求。近些年,零样本学习成为研究的热点,未见组合识别作为该任务的一种特殊情况因为其数据集的结构而具有重要的研究意
论文部分内容阅读
随着计算机视觉领域的飞速发展,图像识别作为其中的经典任务取得了惊人的成绩,人脸识别、物体识别都被广泛地应用到了实际的生活场景中。图像识别的发展离不开深度神经网络,然而,深度模型需要通过大量的数据来学习视觉特征与类别之间的映射关系,随着应用范围的扩大,这种学习方式已经难以满足实际场景的应用需求。近些年,零样本学习成为研究的热点,未见组合识别作为该任务的一种特殊情况因为其数据集的结构而具有重要的研究意义。未见组合识别问题主要面临着两个难点:(1)未见组合与可见组合之间的域差异,导致训练集上学习的模型无法有效的应用于测试集;(2)属性概念的视觉表象和与之组合的类别密切相关,导致模型难以学习到对属性概念具有高度判别性的特征。本文针对以上问题,借鉴人类学习视觉概念的思维模式,通过解耦的思想构建模型处理未见组合识别问题。主要研究内容如下:1.本文提出基于解耦的未见组合识别模型。研究发现,过去的方法要么分别考虑属性和类别,要么只考虑“属性-类别”这个组合概念,无法实现组合简单概念以学习复杂概念的目的。鉴于已有方法利用组合标签过程中产生的分歧,本文构建两个子空间来实现属性和类别的解耦。在属性空间将同属性不同类别的视觉特征拉近,模拟人类根据共性认知事物的过程,以学习属性概念,类别空间同理。为了实现对未见组合的识别,我们将标签通过语言编码模型得到其语义特征,然后分别映射到两个子空间并与视觉特征对齐。训练过程中通过选择三元组输入解决困难样本的问题,同时,解耦子空间上对组合标签的合并削弱了训练集和测试集之间的域差异带来地影响。测试过程中,综合两个子空间上的特征距离预测测试样本的组合标签,能够考虑到任意不同标签特征间的差异性。本文所提出识别模型利用解耦的思想同时对视觉特征之间的共性和差异性进行学习,以获得属性和类别概念,进而实现对复杂概念的判别。2.本文提出基于判别和重建的未见组合识别模型。为了保证子空间上特征针对特定概念的判别性,不同模态特征的语义一致性,以及解耦过程中视觉特征的完备性,进一步优化整个识别模型,本文引入了判别模块和重建模块。基于解耦的未见组合识别模型目的是分别学习属性概念和类别概念,但是只使用相对距离对视觉特征进行约束,无法保证两个子空间上的特征在特定概念上的判别性。因此,本文引入判别模型,分别对属性空间和类别空间上的视觉特征进行属性和类别的分类,以增强子空间上的特征的判别性。此外,本文引入语义重建模块和视觉重建模块。语义重建模块通过两个子空间上的视觉特征分别重建属性和类别的词向量,以确保该空间上语义特征和视觉特征之间的语义一致性。视觉重建模块将解耦后的特征组合和交叉组合以重建输入的视觉特征,从而保留输入视觉特征的判别性,促进模型对复合概念的理解。论文在数据集MIT-States和UT-Zappos上进行了大量的实验,结果表明本文提出的模型可以很好的解决未见组合识别的问题,并且结果远远优于当前最高水平。
其他文献
低共熔溶剂(Deep eutectic solvents,DESs)自2003年Abbott等人提出后便因诸多优点(易合成、价廉、可生物降解、不易挥发、不易燃等)而广受关注,成为新一代“绿色溶剂”。近年
中国共产党历来关心、重视青年。习近平继承这一优良传统,对新时代青年的价值、教育、工作等问题,提出了诸多新观点、新思想和新要求,形成了具有鲜明时代特色和价值的新时代
为了改善图像的分辨率和质量,图像超分辨率重建技术应运而生,这一技术既可以满足人们的视觉需求,也可以便于图像在诸多工程领域的后续应用。近年来,随着机器学习和人工智能等
石油和天然气是现代社会的驱动能源。近年来,随着科学和技术的不断进步,人们的消费结构发生了革命性变化,对油气的需求有了较大增长。但传统油气资源逐步枯竭,页岩气作为一种
从复杂路况中提取出车道线信息是高级辅助驾驶技术的关键任务,研究多场景下结构化车道线的检测方法具有重要意义。本文通过对比分析国内外车道线的研究现状发现,大部分车道线
异构平台是指具有不同架构(系统&软件)的计算平台,它们支持很多种开发语言,各平台对应的开发者背景差异也十分巨大,这就使得在各平台上运行着多种不同类型的任务,比如AI任务,MySql等。传统方式下,各平台的管理人员通过系统提供的Cron对任务进行触发,对于具有多项依赖的任务组来说,需要人工设定执行时间与方式,一旦出错需要整体推倒重试,随着集群规模的扩大、任务量的增加,传统方式的弊端愈发明显。
铁路是近代社会最为先进有效的陆路运输方式,铁路的建设、运营对经济和国防都有至关重要的影响。近代史上,修筑铁路是日本对东北进行殖民经营的重要手段之一。北满地区拥有丰富的自然资源和重要的地缘位置,日本控制中国东北后便加紧在这一区域拓展铁路、修筑新线,构建铁路运输网。1931年到1945年的十四年间,北满地区新建铁路超过三千公里,形成了覆盖北满大部分地区的铁路运输网络,其中大部分线路经多次修缮改造后,至
随着动态主机配置协议(DHCP)等机制的广泛应用,许多互联网服务提供商为其客户分配定期更改的动态IP地址,为用户流量的长期追溯带来诸多挑战。DNS访问记录反映了“人”对站点的访问行为,若将其放大到较大时间范围内,其中又蕴含了网络用户的访问意图与访问习惯。因此DNS访问记录在追溯用户行为方面处于有利地位,且它在现实中更易获得,便于我们进行存储以供长期分析。如果收集某个用户大量的DNS访问记录进行行为
荥巩煤田位于河南省省会郑州的西部,主要分布在荥阳、巩义境内,具有独特的地理优势和丰富的煤层气资源,加强该煤田的煤层气赋存规律和开发研究,将会为中原经济区经济建设提供一定的后备资源。在充分利用煤田地质勘探资料和煤矿生产地质资料的基础上,以现代煤层气地质理论为指导,采用数值模拟和物理实验相结合的方法,对矿区的煤层气地质条件、构造特征与演化、煤层气赋存规律及控制地质因素、煤层气开采可行性及开采方式进行研
工程结构在设计、施工、使用的过程中常常受到不确定因素的影响,结构的安全性、适用性、耐久性或多或少会发生变化。结构可靠性分析正是基于结构不确定因素的影响来评估结构可靠的程度。目前,结构可靠性分析通常以元件和系统两个层级作为研究对象。以概率理论为基础的元件层级可靠性分析已发展得较为成熟,它根据结构功能函数求解失效概率或可靠度指标。事实上,现代工程结构正朝着更复杂、更庞大的方向发展。这些高度非线性的结构