自然场景视觉关系检测算法研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:cs_200901
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在自然场景理解中,视觉关系检测(Visual Relationship Detection,VRD)是机器理解图像的一个重要的任务,它旨在检测图像中的对象并识别对象间的关系(如人骑着马,杯子在桌上)。图像中往往包含很多的对象以及复杂繁多的对象之间的关系,然而,从人的角度观察,我们通常会关注一些重要的对象和关系,而忽略一些不重要或者次要的信息。现有的视觉关系检测方法对图像中的所有对象和关系没有区分重要性,导致在复杂的真实图像中检测效果差。另外,由于视觉关系呈长尾分布,即大部分关系在数据集中数据量很少甚至没有,因此模型需要具有少样本或者零样本的学习能力。为了解决这些问题,本文提出了一个基于注意力机制的多模态视觉关系检测模型(Attention based Visual Relationship Detection,AVR),模型通过融合视觉,空间和语义特征检测图像中的视觉关系,并基于注意力机制识别对象和关系的重要性。对对象或者关系的注意力越大,表明其在图像中就越重要。对象和关系的注意力将用来增强视觉关系检测,以提高模型检测关系的召回率。另外,本文基于对象间的语义相似性,利用图随机游走算法得到视觉关系的先验分布。关系的先验将用来调整模型的关系预测输出,以提升关系预测的准确率,并提高模型少样本的学习能力。为了能够更好地挖掘模型的关系预测概率,对象和关系的注意力,以及关系先验等变量之间的联系和依赖,本文提出了基于遗传编程算法的启发式学习框架,并应用于视觉关系检测任务,来自动化的进化学习出好的启发式规则结合这些变量,从而得到更好的视觉关系检测结果,进一步提高模型的召回率。通过在几个真实数据集上的综合实验,本文提出的模型在视觉关系检测任务中的表现优于最新的视觉关系检测方法,其中关系和对象的注意力极大地提高了关系检测任务的召回率。同时,基于随机游走的关系先验知识也有效地提高了关系预测的准确率。另外,通过启发式学习框架进化学习到的启发式规则,很好地结合了关系预测,对象和关系的注意力,以及关系先验等因素,进一步提升了模型的召回率。
其他文献
目的细胞分裂周期蛋白14A(cell division cycle 14A,Cdc14A)磷酸酶作为高度保守的丝/苏氨酸双特异性磷酸酶家族中的一员,最初是由L.Hartwell在筛查调控出芽酵母细胞周期基因时意外发现并命名[1]。它在真核生物(从单细胞真菌中的酵母菌到人类)G2期阻滞中发挥着稳定的保守性作用[2]。Cdc14在G2/M转换时能下调Cdk1的活性,其功能涉及有丝分裂后期的调控及退出有
目的:基于全转录组芯片测序技术及生物信息学筛选缝隙连接蛋白CX43(connexin 43,CX43)的下游差异基因并进行功能预测及生存分析,为探究原发性肝癌发展机制及寻找新的药物作用靶点提供理论支持。方法:采用TransIntroTM EL转染试剂转染重组质粒至人肝癌SMMC-7721细胞,构建CX43过表达组,其中对照组仅转染空载质粒。通过采用qRT-PCR、Western blot来检验转染
土地的不合理利用严重破坏了土壤结构,土壤结构的好坏直接影响作物对养分的吸收利用,进而影响作物产量。最大限度地提高养分利用效率和尽量减少土地利用对环境的影响是世界范
目的:对不同阶段羊膝关节软骨退变模型进行磁共振T2-mapping检查,揭示各阶段羊膝关节软骨退变MRI表现的特点和规律,分析与其软骨内蛋白多糖含量的相关性,探讨不同阶段软骨退变MRI表现的分子病理学机制。方法:选择健康的蒙古羊15只,随机分为A组、B组、C组、D组、E组共5组,每组3只,通过在羊膝关节内注射木瓜蛋白酶溶液的方法来制作蒙古羊左膝关节软骨退变的模型。A组不进行处理作为对照组,B组、C
目的:观察头痛舒缓颗粒对肝气郁结型紧张型头痛的临床疗效及安全性。方法:本研究利用随机、对照的方法,选取2017年10月至2018年10月期间,就诊于本院脑病科门诊,符合纳入标准的紧张型头痛患者60例,按随机数字表法,分为治疗组和对照组各30例。对照组予单纯西药(盐酸阿米替林片)治疗;治疗组在对照组基础上加服头痛舒缓颗粒;两组患者均连续服药4周,计为一个疗程。观察治疗前后两组患者的紧张型头痛积分、中
在智能视频监控中,前景目标检测的目的是提取感兴趣前景目标并将其用于中高层视频分析技术。因此,视频前景检测具有重要的研究价值,也是智能视频监控的核心内容。针对目前尚
今年2月7日,厦门《海峡导报》一篇题为《英雄,你在哪里?》的报道,震动了正在忙于过春节的市民。文中说,沈阳龙翔高科技有限公司孙总经理无端被一伙歹徒殴打,面临生命危险的
目的:改良加工小牛冻干松质骨技术,通过数字化模型精准设计股骨头骨支架及将其在自主研发的灌注生物反应器内加载肌腱干细胞诱导分化。为股骨头坏死再生提供材料基础。方法:通过对SD大鼠的股骨头MicroCT的数据进行分割重建,设计股骨头骨支架模型。采用改良的小牛冻干松质骨加工方法,将小牛新鲜松质骨数控雕刻成股骨头骨支架,并采用酶消化法进行去抗原后冻干。依据股骨头骨支架模型设计制造12轴灌注生物反应器模型,
目的:通过腺病毒载体上调和下调大鼠心肌组织中miR-327的表达,探讨其在心肌缺血再灌注损伤(MIRI)中的作用及其分子机制。方法:(1)腺病毒转染:将60只健康雄性SD大鼠随机分为5组,分别为假手术组(Sham组,生理盐水+假手术)、缺血/再灌注损伤组(I/R组,生理盐水+I/R)、miR-327抑制组(Ad-miR-327-i组,Ad-miR-327-RNAi+I/R)、腺病毒空载组(Ad-N
不同于监督学习,多示例学习的数据集由“包”组成,每个包中含有若干个以向量形式表示的示例。多示例学习数据集中包的标签明确,其基本假设为:正包中至少含有一个正示例,但具体是哪一个或哪几个未知;负包中全是负示例。随着多示例学习分类算法在图像和文本等领域应用越来越广泛,多示例学习降维算法也逐渐成为研究热点。本文主要研究工作如下:一、提出了一种对于多示例学习问题通过使用支持向量机实现线性降维的算法。首先,假