基于语义推理的图文匹配方法的研究

来源 :天津工业大学 | 被引量 : 0次 | 上传用户:danielddy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能,深度学习越来越多的引人注目,图文匹配就是其中的一项任务。图文匹配任务是指给定一个图像和众多文本内容,要求机器在对图像理解的基础上对图像和文本进行匹配,选出和图片最接近的一段文字。图文匹配涉及语义理解、图像检测与识别、知识推理等相关技术,要求机器以人类的方式来理解图像,这也是人们对人工智能的期望。因此对提升机器人等人工智能系统的智能程度具有十分重要的作用。通常来说,图文匹配任务需要同时处理图像的视觉信息和文本信息,并以特征融合的方式将提取的视觉特征和文本特征映射到相同高维空间内,这需要图文匹配模型能正确解析出文本的语义,从而结合视觉特征给出正确的答案。对于复杂的图像,由于图像复杂度各不相同,现有的模型往往对图像中物体之间的关系的捕捉产生偏差,这导致现有的图文匹配模型难以推断图像中真实的关系。本文的工作创新点在于加入了常识判断推理模块,把图像各部分区分开并以此建立图像之间的关系,再根据常识推理来判断关系是否可靠,加强了推理结果的合理性和准确性。还添加了排序优化模块,为结果提供了多样性,在模型失败的情况下提供了一定的应对方案。本文在两个基准数据集MS COCO和Flickr30k上将本文的方法与现有方法进行了比较。在MS COCO数据集上,本文方法与最新的成果相比,精度平均提高了1.3%左右,在flickr30k数据集上,本文的方法精度也比现有方法高1.5%。实验证明本文的方法有效提高了准确度,可以有效提高其实用性。
其他文献
自动文本摘要技术是人们从互联网的海量数据上快速获取文本信息的有效途径之一。本文通过对自动摘要任务的研究背景调研,发现该任务在实际生产和生活中都有许多的应用场景。就目前国内外的自动文本摘要任务的现状来看,主要分为抽取式文本摘要和生成式文本摘要。相较于前者,生成式文本摘要可以生成更符合人们阅读的摘要文本,无论从摘要的语法上还是从摘要的质量上都有一定的优势。因此,本文主要研究了基于序列到序列的生成式文本
短文本分类就是在给定的分类体系下,让计算机根据给定文本的内容,将其判别为事先确定的若干个文本类别中的某一类或者几类的过程。短文本分类在冗余过滤、智能检索、构建索引、文本过滤等方面有重要的作用。可以方便用户快速、高效的解决问题。正因为人们对短文本分类越来越大的需求,所以如何更高效的提高短文本分类精度变成为当前面临的一大挑战。最近几年随着BERT模型的出现,NLP任务中很多其他模型解决不了的问题都得以
基于磁流体动力学效应(Magnetohydroynamics,MHD)的角速度传感器具有低噪声、宽频带、抗冲击等特性,适合于宽频带、低幅值空间结构微角振动的测量。由于MHD传感器低频(<1Hz)带宽内微角振动测量性能不佳,需同其他低频陀螺仪组合进行信号融合的方法测量低频带宽信号,极大限制着传感器的应用。为了实现低频(<1Hz)微角振动的准确测量,本文研究改进MHD角速度传感器的机械结构,在流体通道
分切机是纺织材料加工流程中的精整设备,主要作用是将上游厂商生产的宽幅材料进行纵向分切,最后复卷成一定长度和宽度的小卷装。系统运行张力较大容易造成材料的撕扯及内部组织损伤,张力太小会引起材料的滑移、走偏,复卷后端面出现不齐和毛边现象。保证材料在运行过程中张力稳定是分切机的核心要素,针对目前市场上分切机张力控制系统存在的问题,设计合理的控制策略及方案,对提高纺织设备自动化和工业智能控制具有重要意义。材
随着时代进步科技发展,控制理论从经典控制理论发展到现代控制理论再到现如今与人工智能技术的结合,无不是人类科技进步史上重要的里程碑。本文意在通过一种通用的技术手段,将先进的控制算法应用到可编程逻辑控制之中,解决控制实践和控制理论脱节问题,做好衔接从而促进两方面共同发展。本文对过程控制中的液位控制系统相关理论进行介绍,基于质量守恒定律完成了单容和双容液位系统控制模型的建立并推导出传递函数和状态空间方程
施工升降机作为高层建筑施工中主要的载人载货机械设备,其运行状态的健康状况直接决定了高层建筑施工的效率和安全性。随着物联网与“工业4.0”时代的到来,对施工升降机进行健康化、智能化管理的需求也日趋迫切。因此,面向分布在异地的各种类型施工升降机设计通用的远程监控系统,并进一步对监控平台采集到的数据进行深层次数据挖掘,通过建立行之有效的健康评价模型,评估设备的运行状态,给出设备维护、更新的科学性指导意见
经过近几十年的发展,我国终于跻身于世界制造与出口大国的行列。五轴数控技术是航空航天、船舶、模具、高精密仪器等军用与民用装备领域的关键技术,也是我国由世界制造大国迈向世界制造强国的重要基石。五轴数控技术的出现能充分发挥数控技术在自动化加工方面的潜力与优势,但它同时也是数控领域中实现难度较高的技术之一。我国五轴数控技术总的来看仍然落后于发达国家,比较典型的如面向五轴数控加工的NURBS样条插补技术。因
随着现代制造业的高速发展,人们对于数控机床加工精度的要求也越来越高,电主轴作为数控机床的核心部件,其固-热耦合特性的好坏影响了机床加工精度的高低。本文以传热学、热弹性力学、摩擦力学等理论为基础,分析了电主轴单元的固-热耦合机理,并在固-热耦合特性的基础上提出了电主轴冷却系统的改进方案。得到成果如下:基于Jones轴承模型,建立了综合考虑热效应和离心力效应的角接触球轴承载荷-位移模型,对轴承的固-热
如今,目标识别算法在计算机视觉研究的领域中依然是热门的方向,但目标识别算法的应用面临着巨大的挑战。现有的目标识别算法大多数是在高功耗、高性能的GPU平台上应用,才能达到高识别速度的要求。而针对一些功耗和资源受限的特定场景,尤其是要求强实时性的场景。部署目标识别算法就变得非常困难。为了解决这一问题,一部分研究者通过优化目标识别算法,减少目标识别算法的参数量和降低目标识别算法的计算量,这一类的算法被称
建筑行业在我国经济发展中占据重要地位,它创造了大量的GDP,同时也提供了大量的就业岗位。然而传统的建设工程领域中存在诸多问题。如因为设计不足导致的变更频繁,生产效率较低,资源浪费较为严重等问题突出。因此在我国的建设工程项目中,有75%以上的项目超支严重,70%以上的项目进度超期。针对上述问题,本课题提出了针对BIM技术的项目管理,将BIM技术引入到EPC项目的成本管理中,有针对性的解决EPC项目设