【摘 要】
:
最近十几年,大规模训练数据集以及高性能计算机硬件的出现带动了深度学习技术的迅速发展,深度学习技术在许多领域得到了广泛应用。随着互联网的快速发展以及摄像设备的普及,网络中的图片数量成几何倍增长,仅靠人力已无法对图片内容进行鉴别。所以,如何让计算机自动描述一副图像是当前图像理解领域的研究热点。该任务涉及到计算机视觉与自然语言处理两大人工智能领域,其基本原理就是对要描述的图像进行信息提取,识别出其中的人
论文部分内容阅读
最近十几年,大规模训练数据集以及高性能计算机硬件的出现带动了深度学习技术的迅速发展,深度学习技术在许多领域得到了广泛应用。随着互联网的快速发展以及摄像设备的普及,网络中的图片数量成几何倍增长,仅靠人力已无法对图片内容进行鉴别。所以,如何让计算机自动描述一副图像是当前图像理解领域的研究热点。该任务涉及到计算机视觉与自然语言处理两大人工智能领域,其基本原理就是对要描述的图像进行信息提取,识别出其中的人物,感知场景内容以及人物之间的关系,最后用一段逻辑语言表达出来。本文对近些年来图像描述方法在国内外的研究发展状况进行研究,研究中发现,传统的图像描述方法在提取图像特征信息的过程中忽视了图像中目标之间的相互依赖关系。本文提出了一种基于区域相关性的图像特征提取优化方法,将VGG与RPN结合起来进行图像特征提取和候选区域选取,对每一个候选区域计算它与其他所有区域的空间距离之和,以此作为该区域与其他区域总体相关性的度量,基于这个度量值来对候选区域对应在特征图上的部分进行加权优化,最终将加权优化后的图像特征图作为输入,送给语言模块参与文本的生成。然后,本文对Attention机制在图像描述任务中的应用进行了研究。传统的Attention关注于图像的空间位置,却忽视了对语义信息的关注,本文提出了一种改进的语义Attention机制,不需要额外的语义信息提取操作,Attention机制是作用在图像特征图上的,而基于CNN的图像特征提取过程中,卷积层输出的图像特征图由多通道图叠加生成,其蕴含了多个层级的抽象语义信息,因此本文提出了一种对图像特征图的通道层进行关注的Attention,形成了一种语义Attention。语言生成模块以NIC模型为基础,同时将Attention融合进来,引入的Attention模块可同时关注图像空间和语义信息,前文加权优化后的图像特征图作为语言模块的输入,一同进行图像描述文本的生成。最后,本文进行了实验并与前人的研究进行比较,模型的图像描述训练采用的是MS COCO数据集。实验结果表明本文提出的基于区域相关性与Attention的图像描述方法能够显著的提升图像描述的质量。
其他文献
以高强钢绞线网加固RC柱低周反复荷载作用下的试验研究为基础,采用ANSYS有限元软件,建立了加固柱的有限元计算模型,进一步分析加固柱的抗震性能,得到加固柱的滞回曲线、骨架
盐酸曲马多(tramadol hydrochloride,TMD)是阿片受体激活剂,无抑制呼吸作用,依赖性小,镇痛作用显著。适用于急性和慢性各种原因引起的疼痛。目前对其各种剂型的含量测定,血
2018年6月23日,由海南省医学会心身医学专业委员会和海南省睡眠研究会主办、海南省安宁医院承办的"海南省医学会心身医学专业委员会暨海南省睡眠研究会2018年学术年会"在陵水顺
2018年12月23日,由中国医学科学院主办、中国医学科学院医学信息研究所承办的“2018年(2017年度)中国医院科技量值发布会暨第六届中国医学科学发展论坛”在北京举行.会上公布
目的探讨PDCA提高妇科腹部术后患者踝泵运动落实率的临床效果。方法以2018年4月-9月本院妇科256例腹部手术患者为研究对象。改进前2018年4月-6月128例为对照组,术后予以患者
目的:探讨中药大黄复方对SAP患者胃动素(MTL)、胃泌素(GAS)的影响.方法:对严格按标准选入的病人分为实验组和对照组,分别采用大黄复方疗法或常规疗法,于治疗前后以放射免疫分
为了满足当前电力调度的要求,需要引入智能化的电力调度系统,并且根据当地实际的用电需求制定电力建设方案,使得后期的电力调度更加具有科学性。文章根据实际经验以及相关理
目的探讨泻肝凉血解毒方治疗银屑病的作用机制。方法将豚鼠随机分为空白组、模型组、泻肝凉血解毒方组和阿维A胶囊组。采用普萘洛尔乳剂外涂豚鼠耳背皮肤复制银屑病模型。各
对细晶Ti-2Al-2.5Zr合金进行了室温/低温(77 K)疲劳实验及微观组织观察.结果表明:室温低应变幅△εt/2(= 0.5%,1.0%)下,合金表现为循环软化;室温高应变幅(1.5%,2.0%)下,则表
随着大数据时代的到来,政府部门越来越重视运用技术手段深度挖掘政府数据资源的价值。与此同时,政府部门对于政府数据共享的需求也在不断提高。然而,目前政府数据共享中存在