基于图像序列和深度学习的场景语义图构建研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:yan8108
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
场景语义图是一种包含图像主体信息的一种图结构,在场景语义图中,不但可以包含物体、物体间关系的信息,还可以包含物体的属性信息,甚至可以包含区域字幕的信息。由于场景语义图是图结构,与普通图像相比,不但可以在保留图像主体信息的同时大幅度降低存储开销,并且对于计算机来说图结构会更加利于语义相关任务的检索。当前现有的研究主要关注于包含物体和物体间关系这两个层次的场景语义图的生成,并且生成场景语义图的数据源仅限于单张图像。本文的研究目标有两个:1、将属性识别纳入到了场景语义图生成网络中;2、将单张图像生成场景语义图的网络模型拓展到了序列图像上。在图像生成场景语义图的任务中,本文扩展了图像生成场景语义图生成网络包含的语义层次,将属性识别纳入到了场景语义图生成网络中。本文以VGG-16为基础模型,使用常见的RPN和多分类器方法进行物体识别,使用多分类器预测每个关系中的谓词,然后使用了基于GRU的方法对每个物体具有的多个属性进行预测,使模型最终生成包含物体、物体间关系和物体自身属性在内的三个语义层次的场景语义图。此外,本文还通过对不同语义层次的特征进行融合提炼的方式提高了每个任务的性能,使生成的场景语义图准确度更高。本文还与多种现有方法在单张图像生成场景语义图的子任务上分别进行了比较,本文提出的方法在每个任务上均有较好的效果,与其他方法相比均有提升。本文还进一步对属性识别任务进行了详细的烧蚀分析,说明本文使用的多种特征组合和特征融合提炼方法在属性识别上的有效性。在序列图像生成场景语义图的任务中,本文在第一部分中提出的单张图像生成场景语义图网络的基础上进行了进一步的扩展,将图像序列整体作为网络的输入,使用基于光流网络的方法对物体候选框进行跟踪,解决了不同帧中属于同一个物体的候选框的映射的问题,还设计了基于消息传递和自编码器的两种不同的帧间特征融合提炼方式,使用不同帧中不同视角下的信息对每个任务使用的特征进行融合提炼,提高序列图像生成场景语义图任务中的性能。在测试分析中,本文对帧内和帧间特征融合提炼的作用进行了详细的对比分析,通过组合帧内和帧间特征融合提炼的方式得到了四个模型变体,并进行了训练和测试,不但说明了帧内特征融合提炼对每个任务的提升作用,并且说明了序列图像可以使用不同帧中不同视角的信息来进一步提高模型的性能。此外,在综合考虑召回率和准确率的情况下,通过对比分析得到基于自编码器的特征融合提炼方法比消息传递的方法性能更高的结论。
其他文献
螺纹零件在很多行业领域都有着非常广泛的应用,例如机械制造行业、汽车电子行业和航空航天领域等。由于螺纹零件的互换性、可靠性、密封性等性能主要受螺纹零件的机械加工精
人脸表情自动识别是情感计算和计算机视觉领域的一个研究热点。最近几年,人工智能技术飞速发展,表情识别作为智能化人机交互中必不可少的一部分,在多媒体娱乐、人机交互、机
重金属造成的环境污染越来越严重,人类的健康和环境保护面临着巨大挑战。由于重金属具有生物毒性高、难以降解的特性,如果人体摄入过量重金属,会损害甚至改变人体内的蛋白质结构,影响细胞功能,进而引发各种不易治愈的疾病。其中,铅和镉污染对环境的影响尤为严重。因此,针对铅离子和镉离子进行准确、快捷的分析检测,能极大提升治理重金属污染的效果。本论文采用电化学检测技术,以氨基化石墨烯为基底材料,设计和制备了一系列
焊接技术是较常见的制造工艺方法,随着科学技术的发展,焊接技术已广泛应用于工业金属及非金属结构设计制造中,如船舶制造、汽车制造、轨道车辆、压力容器、电子电路等。CT/12
企业财务风险研究是国内外学术界研究的热点议题,财务风险的预警研究是财务风险研究的必然延伸。本文以中国防雷行业专业化运营公司——KL公司为例,通过对样本企业多维度的财务指标数据的收集,并结合KL公司所属的行业特性,运用改进了的功效系数法对KL公司的风险预警状况进行了实地考察和深入研究。通过构建风险预警指标体系的方法,辅之以KL公司近三年的财务数据为支撑,从而对KL公司所处的风险等级进行判定和预警,进
随着我国公共基础设施PPP项目的不断增多,政府在监管的过程中也暴露出很多问题,比如政府的监管力度不够全面,监管组织系统不够完善。这样不仅使政府的监管效率降低了,还导致项目进展的效率变得低下。所有这些政府监管中存在的问题,都可能使得政府的投资收益降低,最终难以取得成效,进而影响了社会公共利益。BY县生活垃圾焚烧发电PPP项目是BY县“263”环境专项整治行动的一部分,不仅做到了将生活垃圾的分类和治理
随着科学技术的进步,现代战争对武器装备的信息化、智能化提出了新的要求。炮控箱作为坦克武器系统的中枢,其性能的高低直接决定了武器系统的性能状况。由于坦克的工作环境复
双边生灭过程是一类重要的Markov链,它在概率论的诸多应用领域如排队论,场论,统计物理,物理化学以及控制论中有重要的应用.在本文中,我们将讨论一类具有“爆炸”的且无穷大具有粘性的双边生灭过程的轨道结构极其指数遍历性,并给出它的遍历常数的估计.
在汽车传动系统中,汽车变速箱是非常重要的一个部件,只有保证汽车变速箱的工作良好性能才能够保证整车性能。从传动系统整体来看,变速箱中的工作环境对于齿轮要求很高,如果齿轮长时间在恶劣环境下工作,那么必然会导致变速箱工作产生噪音和振动问题。现在,群众对于汽车的要求发生转变,对于汽车的品质要求越来越高,所以汽车工作噪声就成为每个车企重点关注的问题。本文以某车型的变速箱为研究对象,通过整理了大量的关于国内外
阿魏酸酯酶(EC 3.1.1.73,ferulic acid esterase,FAE)能够水解植物细胞壁中阿魏酸与多糖之间的酯键,释放阿魏酸。阿魏酸具有多种生理活性,如抗氧化、抗肿瘤、抗动脉粥样硬化