基于多模态知识图谱的图像描述

来源 :河北科技大学 | 被引量 : 0次 | 上传用户:cnaxnn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像描述模型需要识别图像中的对象并给出描述,传统模型可以为训练集中出现过的对象生成良好的描述,结合目标检测器可以进一步描述传统模型无法识别的对象。但要描述目标检测器未见过的对象,就必须再次训练以增加目标检测器可识别对象的类别。为了克服过去图像描述模型对预训练目标检测器的依赖问题,本文提出使用小样本目标检测器来检测待描述图像中的对象,并且结合多模态知识图谱提出了一种新的图像描述模型,无需为识别新对象而再次训练模型,并且利用知识图谱中的语义信息提升描述语句的质量。本课题主要完成了以下研究工作:1)设计实现了一种基于小样本目标检测器和语义信息的图像描述模型。利用小样本目标检测器来检测传统描述模型无法识别的对象,并且给出对象的名称,利用知识图谱来提供这些对象的背景知识,结合这些信息,通过引入注意力机制来引导模型选取合适的单词,进而生成包含这些对象的描述语句。实验结果表明,该模型较基线模型在各项评测标准上均有所提升。2)构建了为图像描述模型提供背景信息的多模态知识图谱。在多模态知识图谱中每个对象包含多张样本图像,并且为每个类别加入相关的三元组信息,通过增加三元组中实体的同义词信息进一步扩大知识图谱的规模。为了充分利用多模态知识图谱中为每个对象提供的多张样本图像,小样本目标检测器会使用这些图像进行检测,根据检测结果中的置信度计算待描述图像中是否包含该对象。根据确定对象类别时所用的样本图像,查找到在多模态知识图谱中相链接的三元组信息,提供给图像描述模型用于生成描述语句。3)设计实现了一种基于多模态知识图谱的图像描述模型。通过扩大样本图像的规模提高了目标检测器的检测能力;结合本文构建的多模态知识图谱,为图像描述模型提供待描述对象的图像特征信息、三元组信息和同义词信息;使用卷积神经网络将多模态知识图谱提供的三种信息进行整合,作为待描述对象的背景知识信息提供给描述生成模块,帮助模型图像的描述。另外,提出了一种新的对图像描述结果进行评价的方法,用来判断模型是否对图像中的重点对象进行了描述。
其他文献
基层网点的全面深化转型是现代商业银行面临的系统性管理问题,也是目前被金融机构所广泛采取的未来改革方式之一。随着互联网金融爆发式发展,银行同业竞争加剧,传统的客户需求呈现出个性化、多元化转变。在“互联网+”时代背景下,网点将继续选择通过持续性的改善来不断降低运营成本,进一步优化客户服务质量,最终有效提升网点的产能及核心竞争力。本文选取的研究对象为笔者所熟悉的T支行辖内的基层网点,目前T支行已完成了阶
当下中国处于经济高速发展与产业结构升级换代的时期,我国体育产业发展势头正猛,体育产业被誉为朝阳产业、绿色产业。我国体育产业作为新兴产业具有旺盛的生命力和稳健的增长力,体育产业规模日益壮大,相关布局日益精细化,这些现象标志着中国体育产业进入了高速发展时期。体育明星是体育产业中不可或缺的部分,作为体育竞技赛场上的主体,不仅是社会大众关注的焦点,更是众多市场资本、企业商家所青睐的投资对象。当下我国一系列
何首乌为蓼科植物何首乌(Polygonum multiflorum Thunb.)的干燥块根,具有多种药效活性,在临床和民间都有广泛应用。近年来由何首乌导致的肝损伤病例时有发生,引起国家和专家学者高度重视,但是由何首乌导致肝毒性的化学成分和作用机理仍然不十分清楚。本课题利用斑马鱼模型,对何首乌不同萃取部位斑马鱼肝毒性和化学成分进行研究和分析,为探索何首乌肝毒性物质基础提供一定科学依据。首先,以斑马
由于丁坝自身特性,使得在河道整治过程中经常被用作挡水建筑物使用。其主要作用是保护岸基及局部抬高上游水位保证上游引水量,与此同时它在改善航道、维护河床稳定及保护生态
目的:1.增龄对大鼠睾丸支持细胞(Sertoli cell)损伤和自噬水平的影响;2.研究淫羊藿苷(Icariin)对衰老大鼠睾丸Sertoli细胞损伤和自噬水平的调节作用;3.体外探究淫羊藿苷对小鼠睾丸Sertoli细胞株TM4细胞损伤的调节作用及机制。方法:1.分4批购买2月龄的SPF级SD♂大鼠饲养至同一时间至各组大鼠分别为6、12、18和24月龄,每组10只,称重,腹腔注射20%乌来糖(5
德国数学家Wille教授于1982年正式提出形式概念分析(FCA).形式概念分析理论主要包括形式背景、形式概念和相应的概念格.FCA的重要数据结构是概念格,它反映了形式概念之间泛化与特化的关系.概念格的每个节点是形式概念,它由两部分组成:外延(对象集合)和内涵(属性集合).在现实生活中,从形式背景中获得不确定的概念(即近似概念)是重要的研究方向之一.本文在相关研究的基础上讨论如何从形式背景中获取近
光子晶体光纤相比传统的光纤有着其优越的性质,比如单模特性、高度色散可调的特性、高非线性等特性,在非线性光纤光学等一些领域的研究产生了重要的意义。色散波的产生是指在
本文主要利用WRF模式中多种云微物理方案对2014年5月22日发生在中国华南地区的一次飑线过程进行了数值模拟研究。尽管大部分云微物理方案能够模拟出本次飑线过程的形态、移动
2009年起,我国的征兵制度进行了改革,首次将大学生作为征集对象的重点,促使众多地方高校的在读和毕业大学生投身军营。随着时间的推移,应征入伍大学生占总征集新兵的比例逐年上升。同其他应征群体相比,大学生知识丰富、领悟能力强,思维活跃、善于创新,民主意识和参与意识较强,起到了改善军人知识结构,提升综合素质的作用,为部队输送了高素质人才,是军队现代化建设的需要。但是必须承认,新时代的大学生除了这些优势外
发动机紧凑性、重量和效率对现代直升机用涡轴发动机至关重要。单级高压比离心压气机具有结构简单、紧凑的特点,因此在发动机压缩系统中通常被选用。采用该压气机的难点在于